読者です 読者をやめる 読者になる 読者になる

ポレンタ天国

ちょいデブおやじのダイエット奮闘記です(笑)

台湾・香港・韓国の日本語学習者数に関して国際交流基金・電通が共同で行った調査の質について

日本語教育日本語教師 日本語日本文化 勉強

 先日、このような表を見ました。


http://yasashii-nihongo-tourism.com/wp-content/uploads/2016/12/survey-1024x594.png*1


 韓国の勤労世代はおよそ六人に一人の割合で日本語を学習しているとの推定を見て、そんな莫迦なと思ったのは私だけではないでしょう。「3人集まれば70~80%の確率で1人は日本語を話せる人がいるという結果も出ています」*2と述べていますが、これも日本国内で外国人観光客を見るにつけ、実感に乏しいのでは。


 当該ウェッブ・ページに一般公開用資料が貼付してありましたから、調査方法を見てみました。それによると、手法は「現地調査会社が保有するパネルによる、Webアンケート」*3で、回収サンプル数は千件だそうです。*4で、「割付は対象地域の性年齢別の人口比率と分析に充分な回収数を考慮し、全体サンプル数1000件を10または5の単位で割り当て。(15歳-24歳は18-24歳に按分)」*5と。


 この調査は「無作為抽出法」で標本を選んでいないようです。この点については、こちらをご高覧ください。

「無作為抽出」=「でたらめ」ではない
では、単に「でたらめ」に調査対象を選んだ場合には、どんな問題があるのでしょうか。


ここで一つの事例を考えてみましょう。ある町で、住民を対象に標本調査を行うとします。「でたらめ」に調査対象を選ぶために、簡単な方法として、その町の一番大きな駅の前に立って、通行する人に誰でもかまわず無作為に(でたらめに)声をかけて、調査してみたとしましょう。


この方法は、無作為抽出法となっているでしょうか。


この方法は、次のような理由から、これは無作為抽出法となりません。


駅前を歩いている人は、町の住民すべてを代表しているとは限りません。住民の中には、その駅を使わない人もいるでしょう。また、調査をしている時間帯に、住民すべてが駅前を歩いているわけではないので、ほかの時間帯にしか出歩かない人は調査されません。さらに、忙しい人は、呼びかけても立ち止まって調査に協力してくれないかも知れませんので、立ち止まって協力してくれる人は、時間に余裕のある人だけかも知れません。


つまり、この方法で調査に回答してくれる人たちは、その町の住民全体の中から選ばれたというよりは、むしろ、その町の住民のうちで、その駅を利用する人で、かつ、調査の時間帯に駅前を歩いていて、さらに、立ち止まって答えてくれた人、ということになります。したがって、調査に協力してくれる人は、町の住民の中でも、上述のような特定の特徴を持った人たちと考えられます。そのような人たちが、その町の実態を反映した縮図になっているとは言えません。


したがって、このような方法で統計調査を行っても、その結果が何を意味するのか、わからないものとなってしまいます。 *6


 これをもってこれをみれば、今回の調査では、台湾・香港・韓国に在住している人のうち、インターネットを利用していて、かつ調査会社にすでに登録されていた人(?)という特徴を持った人たちが回答したと考えられます。


 ところで、この調査方法を見て、昨年に産経・FNN合同世論調査がちょっとした騒動を引き起こしたことを思い出したのは私ひとりではないはずです。安保法案反対デモに参加した人は全体の3.4%にすぎないと主張したかったようですが、それだと日本全体で三百四十万人もいる推計になってしまった「世論調査」です。今回の国際交流基金電通との共同調査も回収サンプル数がきっちり千人となっていることからすると、同じ問題をはらんでいるように思われます。どんな問題かは以下の通りです。

また、産経新聞世論調査を見てみると、どうやら電話をかけて回答してくれた人がちょうど1,000人になるまで聞いているようだ。ということは、回答してくれた人が1,000人になった時点で調査を打ち切っている可能性が高い。電話をかける回数はあらかじめコントロールできるのだけれども、かかった相手が回答してくれるかどうかは実際にやってみるまで分からないので、ちょうど1,000人が回答するタイミングをコントロールすることができない。例えば、朝から調査を始めてたまたま午後3時に1,000人になったとしたら、そこで調査が終わることになる。


もしそのようなやり方をしていたら、偏りが生じる。例えば、朝から仕事に出ていて、午後7時ぐらいに家に帰ってくるような人は、午後3時に調査を打ち切っていたとしたら、調査の対象にならない。すると、昼間留守にするような人のデータがとれなくなり、偏った結果となってしまう。それこそ、安保法案反対集会に出ていて留守だったらどうするのだろうか。


真っ当な世論調査だと、調査対象になった人が留守の場合、何度も電話をかけなおす。例えば、午前10時に電話をかけて、対象者がいなかったとしよう。そうしたら時間を改めて同じ人にかけなおすのだ。朝日新聞なんかは以下に引用したように何度も電話をかけて、偏りがなくなるようにしている。*7


 というわけで、今回発表された調査の標本は、1)インターネットを利用できる 2)現地調査会社が保有している 3)調査開始後早めに回答できた 人たち、だと言えるでしょうから、標本に偏りがありそうです。もしそうであるならば、標本誤差を考慮して母集団を推計したところで、精度の高い推定とは言えないのではないでしょうか。「12月20日に発表した国際交流基金電通共同台湾・香港・韓国日本語学習者調査は、日本語教育関係者から驚きの目で見られているようです。」*8はい、たしかに驚きました。


 かねがね統計学を勉強したいと願いながらものんべんだらりと過ごす日々が続いておりました。それが、今回の発表を受けて、入門程度の知識を得ることができました。関係各位に感謝の念を述べたいと思います。これを契機に学習を継続できるとよいのですが。



ダメな統計学: 悲惨なほど完全なる手引書

ダメな統計学: 悲惨なほど完全なる手引書

pluit-lapidibus.hatenablog.com
pluit-lapidibus.hatenablog.com

*1:吉開章(2016)「台湾・香港・韓国の日本語学習者は推定800万人規模(国際交流基金電通共同調査発表)」『やさしい日本語ツーリズム研究会』(2016年12月23日閲覧) http://yasashii-nihongo-tourism.com/2016/12/20/275

*2:ibid.

*3:株式会社電通「20161220台湾香港韓国日本語学習者調査_一般公開用.pdf」(2016年12月23日閲覧) https://drive.google.com/file/d/0B_YYwiD-_l6lblRNVElULUpwS28/view

*4:ibid.

*5:ibid.

*6:総務省統計局(2010)「標本調査とは?:調査のしくみと設計」『統計学習の指導のために(先生向け)』 http://www.stat.go.jp/teacher/c2hyohon.htm

*7:西原史暁(2015)「産経・FNN世論調査の安保法案反対集会参加を問う質問に表れた世論調査の質」『Colorless Green Ideas』(2016年12月23日閲覧) http://id.fnshr.info/2015/10/25/sankei/

*8:吉開章(2016)「国際交流基金電通の共同日本語学習者調査結果の読み方補足。」『やさしい日本語ツーリズム研究会』(2016年12月23日閲覧) http://yasashii-nihongo-tourism.com/2016/12/22/290