コース: 統計学の基礎:データセットの利用

仮説検定の基礎

ときに異常と思われるデータセットや 結果を目にすることがあります。 たとえば、女性が51%を占める都市で、 無作為に選ばれているはずの 陪審員 50 人のうち、女性がたった 8人しかいないという場合です。 ほかにも、こんな例があります。 あるコーヒーチェーンが顧客に景品が 当たるキャンペーンをおこなっています。 顧客が飲み物を購入すると 一回につき一度チャンスがもらえます。 100 万人が参加し、 1万ドル以上の景品が 10 個ありますが、 そのうち2つの景品を従業員の親族が 獲得した場合です。 もっと恐ろしい例では、 500 人が働く化学工場で、 2年間で2人の従業員が悪性脳腫瘍と 診断された場合です。 どの場合も私たちは、 一度立ち止まって、「何かおかしい」、 と考えるでしょう。 直ちにおかしいと 判断してしまうかもしれません。 ですが、データセットによって 潜在的な機会が示される場合もあります。 たとえば、ある薬品会社は一般的な 風邪を治すための薬を開発しています。 平均的な成人が風邪をひいた場合、 約 8.5 日風邪の症状が現れると 言われています。 新薬の効果を検証するために 風邪に罹患した成人 250 人を 無作為に抽出したところ、 新薬を試したグループは、 新薬を飲んでいないグループより、 症状のあった期間が 7.3 日と 1.2 日短くなっていました。 これらすべてのケースについて、 私たちは多くの疑問を持ちます。 陪審員の男女比率が偏るのは 起こりうる結果なのか、 コーヒーチェーンのキャンペーンは 公平だったか、 化学工場の従業員は、 健康について懸念すべきなのか、 新しい風邪薬については、 この結果に基づいて承認されるべきなのか。 この新薬はさらなる臨床試験が必要なのか。 このように、こうしたシナリオは、 私たちのキャリアや仕事にも 影響を与えます。 データの解釈方法を理解することは、 意思決定に役立ちます。 また、リーダーシップや ときには人びとの健康に影響を 与えることもあります。 そのため、仮説検定が 重要になってくるのです。 仮説検定は結果を検証するために 一般的に使われる手法です。 通常、仮説検定をおこなうさい、 統計学者は母集団についての 仮説を立てます。 そして、その仮説を棄却する基準となる 閾値を設定します。 そのご、母集団から無作為に サンプルを抽出します。 そのサンプルを測定して、 最終的にサンプルの測定結果が その仮説を支持するかどうかを判断します。 適切におこなえば、仮説検定は非常に 強力な統計手法となりますが、 少し難しい場合もあります。 仮説検定では、統計学の基本的な知識を ほぼすべて使う必要があります。 平均値、割合、標準偏差、正規分布、 Z(ゼット)スコア、3シグマのルール、 サンプリング、サンプルサイズ、 信頼区間の知識です。 でも、自由に使えるようになれば、 科学、医学、ビジネス、教育、公共政策、 あるいはスポーツや エンターテイメントなど、 あらゆる分野の職業において、 有益な情報を提供できるように なるでしょう。 どの分野であっても、仮説検定の基本となる 要素を理解しておく必要があります。

目次