地獄のハイウェイ

科学・技術や趣味のことなど自由気ままに書き散らしています。

自民党総裁選の支持率調査のサンプリングバイアスは?

 今回の自民党の総裁選について、各種マスコミによるどの候補者の支持率が高いのかといった調査が色々と出てきているが、ちょっと疑問を持ったので書いておく。

 自民党の総裁選なので、投票権は党員に限られるので普通の世論調査はあまり意味がないと思う。もちろん次の衆議院選挙の「顔」を選ぶ面もあるので、一般人の人気の有無の情報が、国会議員なり党員なりの投票行動に影響を与えるかもしれないが、それは党員の中での支持率という直接知りたいデータそのものではない。調査対象を自民党支持層に絞っても事態は似たようなものだ。総裁選協においてどの候補の支持率が高いかを知りたければ、自民党員を調査対象にしなければならない。

 マスコミの中では、党員・党友を対象にした調査をしているところがあるにはあるのだが、そこに自分は疑問を覚えるのだ。この種の調査では、サンプリングのバイアスをどのように避けるかが非常に重要なのだが、そこがすごくよろしくないのだ。

 世論調査などでサンプリングバイアスを避けるのに使われている層化二段階無作為抽出法といったサンプリング法だと、自民党員を母集団とした調査は難しい。なぜなら調査前に自民党員全体の名簿が得られていて、それに対して住所なり所属支部なりで層化操作(支部員数に基づくか?)を行う必要があるからだ。個人情報保護法があるのにも拘らずその種の情報がマスコミが入手できるとしたらちょっと恐ろしい。国民全体を対象とした世論調査だと電話番号(局番を使って自治体単位の層化が可能)を使って無作為化を行うことができるのに対して、自民党員全体を対象にした場合には難しいだろう。

 マスコミが自民党員の支持率を調べようとしたら、普通の世論調査をする際に、「あなたは自民党員ですか?」という項目を加えて、世論調査のサンプルの中から自民党員を抽出するというのが簡単だと思うが、これだとサンプルの偏りを避けることが困難で非常に誤差が大きいものになる。 例えば日本テレビ自民党の党員、党友を対象に独自に電話調査したと言っているが、記事を見ると「全国の有権者のうち自民党員・党友と答えた1010人が回答」となっているので、普通の世論調査をして、その中から自民党員と答えた回答者を選んでいるのではないだろうか?日本テレビだと河野太郎が40%で一番人気のようだが、共同通信(こちらは「固定電話で「自民党員・党友」と答えた1028人の回答を集計」とある)では河野太郎が48.6%でトップとの報道である。両社の河野太郎支持率の数字の差が、野田聖子の支持率(日テレ5%、共同3.3%)よりも大きいところから見ても誤差が相当に大きいだろうということだけは確かなようだ。