コース: 統計学の基礎:データセットの利用

無料トライアルでこのコースを視聴する

今すぐ登録して、25,300件以上登録されている、業界エキスパート指導のコースを受講しましょう。

95%信頼区間を設定する

95%信頼区間を設定する

ある大きな都市の次期市長選挙には 2人の候補者が立候補しています。 単純に候補者 A と 候補者 B と呼びましょう。 あなたは 候補者 A の選挙チームに所属し、 候補者 A の支持率を 知りたいと考えています。 そこで、世論調査をおこなうため、 単純無作為抽出で 有権者 100 人のサンプルを取ります。 候補者 A と候補者 B の どちらに投票するかを尋ねます。 100 人の有権者のうち、 55%が候補者 A に 投票すると回答しました。 50%以上を獲得すれば、 選挙に勝てるため、 候補者 A に有利な状況に見えます。 ただ、この都市は大きく、 サンプルはたった1つで、 サンプルサイズは 100 です。 選挙前の世論調査は完璧ではありません。 でも、この小さな調査でも 有益な情報を得ることができます。 この調査結果を使用して、 95%の信頼区間を設定しましょう。 つまり、選挙当日の候補者 A の 得票率が含まれる可能性が高い区間を 設定するということです。 まず、正規分布曲線を見てみましょう。 これは、サンプル比率を 中心とした曲線です。 曲線の領域のうち 95%を 捉えたいと思います。 極端な結果については求めていないため、 曲線の右側の上位 2.5%と、 左側の下位 2.5%を排除します。 そして、間の領域を求めたいと思います。 まず、中央から右側の上限を求めます。 それには、Z スコアを 使用する必要があります。 0.975 の Z スコアを見つけます。 0.975 である理由は、 その点の左側に 97.5%のデータが存在し、 右側に 2.5%が存在するからです。 Z スコアテーブルで 0.975 を見つけます。 列の上部と行の左側を見ると、 Z スコアが 1.96 であることが分かります。 Z スコアが 1.96 というのは、 曲線の中心から 1.96 標準偏差分右に進むと、 その左側にデータの 97.5%が含まれ、 右側に 2.5%が含まれる、 ということを意味しています。 曲線の中心から負の方向に 1.96 標準偏差分進んでも、 同じことが起こります。 つまり、データの 2.5%が その下限より下に含まれ、 上限より上に 2.5%、 その間に 95%のデータが 含まれることになります。 サンプル比率は 0.55 で、 これが、区間の中心です。…

目次