p値を計算する方法

「p値(有意確率)」とは、科学者が仮説が正しいかどうかを判断するのに役立つ統計的尺度のことです。p値は、実験結果が観測している現象に対する正常な範囲内にあるかどうか判定するために使用されます。一般的に、ある一連のデータのp値があらかじめ設定されていた値を下回った場合、科学者は、「帰無仮説」を棄却します。言い換えると、実験変数が結果に対して有意な効果を「与えなかった」という仮説を排除します。p値は、まず「カイ二乗」値を計算してから、参照表で見つけることができます。

ステップ

  1. 1
    実験の「期待している」結果を特定します。科学者が実験を行い、結果を観測する場合はほとんど、「通常」または「典型的な」結果がどのようなものであるか事前にわかっています。結果は、過去の実験結果、信用できる一連の観察データ、科学文献やその他の資料などに基づいています。p値を求めたい実験に対して、自分が期待する結果を特定して、数字で表しましょう。
    • 例:以前の調査で、全国的に、青い車よりも赤い車が頻繁にスピード違反の切符を交付されていたとしましょう。平均的な調査結果によると、全国的には、赤い車と青い車の比率が2:1になっているとします。ここで、地元の警察によって交付されたスピード違反の切符を分析して、地元の警察にもこの偏り(バイアス)が発生するのかどうかを知りたいと思います。地元の警察が全国的な偏りに従い切符を交付しているとすると、交付されたスピード違反切符を無作為に150枚取り出した場合、交付された切符は、赤い車に対して100枚、青い車に対して50枚であることが期待できます。
  2. 2
    実験の「観測された」結果を特定します。期待値を特定したので、実験を行い、実現値(または「観測値」)を得ることができます。ここでも、結果を数字で表しましょう。実験条件をいくつか操作して、観測された結果が期待された結果とは「異なった」場合、この現象は偶然起こった、または、実験変数の操作によって差異が発生した、という2つの可能性が考えられます。基本的に、p値を求める目的は、観測された結果と期待された結果に「帰無仮説」(実験変数と観測された結果には関連がないという仮定)を棄却できない程度の差があるかどうかを判断するためです。
    • 例:地元で、赤い車または青い車に交付された150枚のスピード違反切符を無作為に選んだとしましょう。90枚が赤い車に、60枚が青い車に交付されていたことがわかりました。それぞれ100枚と50枚という期待された結果とは異なります。実験に対する操作(今回の例では、データの参照元を全国から地元に変更したこと)が、結果の変化の原因となったのでしょうか?それとも、全国的な平均が示唆しているように地元警察にも偏りがあり、可能性の変動が発生しているだけでしょうか?p値は、これを判断するのに役立ちます。
  3. 3
    実験の「自由度」を特定します。自由度とは、調査に関わる変化量の尺度で、調査を行う分類の数によって決まります。自由度の計算式は、自由度 = n-1と表され、「n」は、分類や実験で分析されている変数を示します。
    • 例:今回の実験では、赤い車と青い車という2つの結果の種類があります。よって、実験は、2-1 = 自由度1となります。赤い車、青い車、そして緑の車を比較していれば、自由度は「2」となっていたでしょう。
  4. 4
    期待される結果と観測された結果を「カイ二乗」で比較します。カイ二乗(「x2」と表記します)とは、実験の「期待値」と「観測値」間の差を評価する数値のことです。カイ二乗の計算式は、次のとおりです。 x2 = Σ((o-e)2/e)。「o」が観測値、「e」が期待値です。[1]すべての起こりうる結果について、この計算式の結果を合計します(下記参照)。
    • この計算式には、「Σ」(シグマ)記号が含まれていることに注意しましょう。つまり、すべての起こりうる結果に対して、((|o-e|-.05)2/e)を計算し、計算結果を合計してカイ二乗値を得る必要があるということです。今回の実験では、切符を受け取った車の色が赤か青という2つの結果があります。よって、((o-e)2/e)を2回計算します。1回は赤い車について、そしてもう1回は青い車についてです。
    • 例:期待値と観測値を計算式x2 = Σ((o-e)2/e)に当てはめましょう。シグマの記号があるので、((o-e)2/e)を赤い車と青い車について1回ずつ、合わせて2回計算しなくてはならないことを忘れないようにしましょう。計算は次のとおりです。
      • x2 = ((90-100)2/100) + (60-50)2/50)
      • x2 = ((-10)2/100) + (10)2/50)
      • x2 = (100/100) + (100/50) = 1 + 2 = 3
  5. 5
    「有意水準」を選択します。実験の自由度とカイ二乗値を得たので、p値を求める前に必要なことがあと1つあります。「有意水準」を決定しなくてはなりません。有意水準とは、結果について確信できる程度を示す尺度のことです。有意水準が低ければ、実験結果は偶然起こったという可能性も低くなります。逆もまた同様です。有意水準は、小数値(0.01など)で示され、母集団に根本的な違いが無ければ、観測した結果と同程度の差が無作為抽出によって偶然発生する確率に相当します。
    • p=0.01は、科学者の実験変数の操作によってその結果が発生した確率が99%であることを意味する、というのはよくある勘違いです[2]。これは、事実ではありません。1週間お守りを身につけて、毎日株価が上昇したとすれば、p<0.01となりますが、それでも、株価の上昇は、株価とお守りの関係によって起こったのではなく、偶然起こっただけだと信じることは理にかなっています。
    • 科学者は通常、実験の有意水準を0.05、または5%と設定します。[3]この有意水準を満たす実験結果を無作為抽出で再現できる確率は、多くても5%であるということを意味します。ほとんどの実験では、偶然起きたとは考えられない結果が出た場合、実験変数の変化と観測された影響の関連性を示すことができたとみなされます。
    • 例:今回の赤い車と青い車の例において、科学的な慣例に従い、有意水準を0.05としましょう。
  6. 6
    カイ二乗分布表を用いて、p値の概算値を求めます。科学者や統計学者は、大きな分布表を用いて実験のp値を計算します。一般的にこの表は、自由度に対応した縦軸と、p値に対応した横軸から成り立っています。この表を用いて、まず自由度を見つけます。そして、カイ二乗値よりも「大きい」値を見つけるまでその行を左から右に向かって進みます。列の上にある対応するp値を見てみましょう。求めるp値は、このp値と次に大きな値(対応するp値のすぐ左にある値)の間にあります。
    • カイ二乗分布表は、さまざまなソースから入手できます。インターネット上、または科学や統計学の教科書などで簡単に見つけることができます。手元に表が無い場合は、上記の画像の表やmedcalc.orgで提供されている表など、インターネット上の無料の表を使用しましょう。
    • 例:今回のカイ二乗値は、3でした。上記の画像のカイ二乗表を使って、おおよそのp値を見つけましょう。今回の実験で、自由度は「1」しかないので、一番上の行から始めます。カイ二乗値「3」よりも大きい値が見つかるまで、この行を左から右に進みます。最初に見つかる値は、3.84です。この列の上を見ると、対応するp値は0.05であることがわかります。つまり、今回の例のp値が「0.05から0.1の間」(0.1は表上で0.05の次に大きなp値)であることを意味します。
  7. 7
    帰無仮説を棄却するか、保持するか決定します。実験に対するおおよそのp値を得たので、実験の帰無仮説を棄却するかどうか決定できます(帰無仮説とは、操作した実験変数が観測結果に影響を「与えなかった」という仮説です)。p値が有意水準よりも小さい場合は、おめでとうございます!操作した変数と観測した効果との間に関連性がある可能性が高いと示すことができました。p値が有意水準よりも大きい場合は、関連性があることを堂々と主張することはできません。
    • 例:今回のp値は、0.05と0.1の間でした。0.05よりも小さい値ではないので、残念ながら帰無仮説を棄却することはできません。つまり、地元警察が全国平均とはかなり異なる割合で赤い車と青い車に切符を交付していると断言できる基準には達しなかったということになります。
    • 言い換えると、偶然、全国平均から10枚少ない結果が得られる確率が5〜10%あるということです。5%未満の割合を求めていたため、地元警察は赤い車に対して偏りが小さいことが確実であるとは言えません。

ポイント

  • 関数電卓を使うと、計算がずっと簡単にできます。オンラインの関数電卓を見つけることもできます。
  • 一般的に使用されている表計算ソフトウェアやより専門的な統計用ソフトウェアなど、パソコンのプログラムを用いてp値を計算することができます。

記事の情報

カテゴリ: 学び・コミュニケーション

他言語版:

English: Calculate P Value, Español: calcular el p valor, Italiano: Calcolare il Valore P, Русский: посчитать величину P или значение вероятности, Français: calculer la valeur P, 中文: 计算P值, Nederlands: Een P waarde berekenen, Deutsch: Den P Wert berechnen, Português: Calcular o Valor P, Bahasa Indonesia: Menghitung Nilai P, العربية: حساب القيمة الاحتمالية, 한국어: P값을 계산하는 방법, Tiếng Việt: Tính Trị số p

このページは 2,408 回アクセスされました。

この記事は役に立ちましたか?