akiyoko blog

akiyoko の IT技術系ブログです

「ヤバい統計学」と「ナンバーセンス」(カイザー・ファング著)を読んだ

カイザー・ファング著の統計学関連の本二冊「ヤバい統計学」と「ナンバーセンス」を読み終わりました。

先に「ナンバーセンス」の方を読み始めたのですが、何度も前著「ヤバい統計学」への言及が出てきたので、急遽こちらから読み始めることに。


まず、原題は「Numbers Rule Your World: The Hidden Influence of Probabilities and Statistics on Everything You Do」(世の中は数字でできている: 確率統計があらゆるものにひっそりと影響を与えている)なのですが、タイトルが「ヤバい統計学」と訳されていて、少し違和感を感じました。

ヤバい経済学」「ヤバい社会学」などの「ヤバい」シリーズ(?)としてタイトルを付けたのかもしれませんが、そういった「あぶない統計学」などといった意味ではなく、これまでに統計学で世の中を良くしてきた「すごい統計学」のエピソードの数々を取り扱った本です。「ヤバい」の意味合いが今風なのですね。。まさか、翻訳者の矢羽野氏の名前から取ったのではないとは思うのですが。。


内容としては、統計学が世の中にもたらした成果(良い側面)を紹介した本ですが、高速道路やディズニーランドの渋滞、食中毒の発生源特定、クレジットカードや保険の審査、ドーピング検査やウソ発見器の検出率、ロトくじや飛行機墜落事故の発生確率などの例を挙げながら、統計学者のこれまでの苦労を統計学者の目線から分かりやすく解説しています。中でも、ドーピング検査の章は、大変読みやすく且つ興味深かったです。

また、全体を通して小難しい専門用語がほとんど使われておらず、統計学に詳しくない人にも読めるように工夫されているように感じました。例えば、「第一種の過誤」(帰無仮説が実際には真であるのに棄却してしまう過誤。「慌て者の誤り」とも)や「第二種の過誤」(対立仮説が実際には真であるのに帰無仮説を採用してしまう過誤。「ぼんやり者の誤り」とも)は、それぞれ「間違った警告」「逃したチャンス」というふうに表現されていたりします。



前著「ヤバい統計学」がどちらかというと統計学者側の視点で書かれたものであるのに対して、「ナンバーセンス」は、データやその分析を消費する我々の側の視点で書かれた一冊です。「ナンバーセンス」とは、ビッグデータ時代に誰もが持っておくべき統計リテラシーという意味で付けられた造語です。

ビッグデータの時代には、より多くの分析が生まれると同時に、問題のある分析も多くなる。専門家や数字の天才と言えども完ぺきはあり得ない。そして問題のあるデータは、よからぬ輩が悪意をもってあおるだけでなく、善意のアナリストも騙されかねない。データがあふれるこの世界で、消費者はことさら数字を見抜く力を磨かなければならないのだ。

ビッグデータはすでに現実であり、今後も多大な影響を及ぼすだろう。少なくとも私たちの誰もがデータ分析を消費している。だからこそ、より賢い消費者にならなければならない。そのためには統計のリテラシー、すなわち「ナンバーセンス」が必要なのだ。


こちらの本でも、ロースクール全米ランキング、肥満の判定基準、グルーポンのターゲティング、失業率と物価の変動、ファンタジー・フットボールといったように様々な例が挙げられているのですが、前作よりもさらに日本人に馴染みの薄い例が多く、特に「ファンタジー・フットボール」の章では、アメリカンフットボールについてほとんど知識がない私としては「置いてけぼり感」が半端なかったです。。

http://nfljapanblog.com/blog/nflclub/2014/09/p.html

野球だったらもっと分かりやすかったのに。。



ともあれ、「ヤバい統計学」と「ナンバーセンス」は両著作とも、小難しい専門用語や計算式を敢えて排除した初学者向けの統計学のエピソード集です。

さらっと読める内容ですので、夏休みの読書にピッタリなのではないでしょうか。