「ひとつの嘘のためには、三十の嘘を用意しなさい」 サルバトーレ・ワコン (from 約三十の嘘) 卒論,修論で忙しいこのシーズン,あなたの論文に嘘はありませんか? 【統計という嘘】
僕のお気に入りのサイトの1つに「Simple -憂鬱なプログラマによるオブジェクト指向な日々-」というサイトがあります.このサイトでは日々身近な社会問題に対して,サイト作者(現役プログラマ)がいろいろと意見を述べているのですが,毎回様々な統計データや参考文献による裏づけがなされていて非常に興味深く読めます. この「データや文献に基づく理論武装」というやり方が理系らしくて好感が持てるのですが,過去の記事の中に「統計という嘘」という作者自身への警鐘ともとれる記事があります.その記事中に次のような言葉が出てきます.
「嘘には3種類ある。嘘、みえすいた嘘、そして統計だ」 イギリスの政治家 ベンジャミン・ディズレーリ ここで言う「統計の嘘」というのは,数値的な捏造(*1)のことではなく,その因果関係(相関)に対する誤解(あるいはそれを利用した嘘)のことを意味します.
<抜粋・中略> -------------------------------------------------------------- ニュースで、驚くべき統計の嘘を見たことがある。「食事の時のおかずの数が多いほど、子供の学校の成績が良い」というものだった。そして、「おかずの量を増やして、子供の成績アップにつなげよう」と結んでいた。一般に、年収の高い家庭の子供ほど、学校の成績は良い。かけている教育費が違うのである。家庭の環境も良いだろう。そして、裕福な家庭は食事も裕福で、おかずの数も多いのである。だから、「おかずの数が多い家庭ほど、子供の成績が良い」のである。「おかず」が子供に影響を与えているわけではないのだ。 --------------------------------------------------------------
まるで「風が吹けば桶屋が儲かる」みたいな話ですが,統計データをそのまま鵜呑みにするな,ということですね.こうなると昨今騒がれている「ゆとり教育の弊害による学力低下」という統計データもどこか怪しく見えてきますね.本当の原因は,実は学校ではなく家庭環境のほうにあるのかもしれませんよ? 実験データの解析についても同じことが言えますね.良い結果が出たとしてもそれが本来の意図した結果なのか,別な要因によるものなのか,本質を見抜かなくてはなりません.
【ネット情報の疑わしさ】
われわれ理系の人間が論文を書くときに絶対に当てにしてはいけないのがインターネットで拾った情報です.なにしろ信憑性がありません.むしろ憶測や捏造(ネタ)である可能性すらあります.また,誤植だらけで文責なんかあったもんじゃない情報もあります.そんな情報を引用したり参考文献にしてしまった日には大恥をかきます.特にエイプリルフール(4月1日)前後に出回った情報には細心の注意が必要です(笑). ネット上で得られる情報で信頼できるのは,ジャーナル(論文誌)に載った論文のPDFファイルくらいです.こうした論文は専門家による「査読」という審査が行われているため信用がおけます.万が一捏造でもあった日には大騒動ですからね! ちなみにネット上に転がってる卒論や修論にはけっこう誤植や怪しい式が書いてあることが多いので注意が必要です.また,得てして論文には都合の悪いデータやツッコんで欲しくないことは(わざと)書いてないので,それを見抜く目を持ちたいものです.
「論文には3つの疑わしさがある.捏造,秘匿,そしてネットの参考文献だ」
(*1) 余談ですが,僕のバイト先では『商品売り上げランキング』の情報操作が時々されています.ランキングほど当てにならないデータはないなぁといつも思います.
|