コンテンツにスキップ

「正規分布」の版間の差分

出典: フリー百科事典『ウィキペディア(Wikipedia)』
削除された内容 追加された内容
誤記訂正
202.221.224.18 (会話) による ID:25290252 の版を取り消し
2行目: 2行目:
名前 =正規分布|
名前 =正規分布|
型 =密度|
型 =密度|
画像/確率関数 =[[画像:Normal distribution pdf.png|325px|正規分布の確率密度]]<br /><small>緑は標準正規分布</small>|
画像/確率関数 =[[file:Normal distribution pdf.png|thumb|325px|正規分布の確率密度:緑は標準正規分布]]|
画像/分布関数 =[[画像:Normal distribution cdf.png|325px|正規分布の分布]]<br /><small>色は確率密度数と同じ</small>|
画像/分布関数 =[[file:Normal distribution cdf.png|thumb|325px|正規分布の分布:色は確率密度数と同じ]]|
母数 =<math>\mu</math> 位置([[実数]])<br/><math>\sigma^2>0</math> スケールの2乗 (実数)|
母数 =<math>\mu</math> 位置([[実数]])<br/><math>\sigma^2>0</math> スケールの2乗 (実数)|
台 =<math>\mathbb{R} = (-\infty,+\infty)</math>|
台 =<math>\mathbb{R} = (-\infty,+\infty)</math>|
23行目: 23行目:


==概要==
==概要==
(一次元)正規分布は、その[[平均]]を &mu;, [[分散]]を &sigma;<sup>2</sup> とするとき、次の形の[[確率密度数]]
(一次元)正規分布は、その[[平均]]を &mu;, [[分散]]を &sigma;<sup>2</sup> とするとき、次の形の[[確率密度数]]


:<math>f(x)=\frac{1}{\sqrt{2\pi}\sigma} \exp\!\left(-\frac{(x-\mu)^2}{2\sigma^2} \right)</math>
:<math>f(x)=\frac{1}{\sqrt{2\pi}\sigma} \exp\!\left(-\frac{(x-\mu)^2}{2\sigma^2} \right)</math>
30行目: 30行目:
:<math>f(x)=\frac{1}{\sqrt{2\pi}} \exp\!\left(-\frac{x^2}{2} \right)</math>
:<math>f(x)=\frac{1}{\sqrt{2\pi}} \exp\!\left(-\frac{x^2}{2} \right)</math>


なる確率密度数を持つ確率分布として与えられる。
なる確率密度数を持つ確率分布として与えられる。


正規分布の確率密度数をグラフ化した'''正規分布曲線'''は左右対称な[[つりがね]]状の[[曲線]]であり、[[鐘]]の形に似ている事から'''ベル・カーブ'''とも呼ばれる。直線 ''x'' = &mu; を軸に左右対称であり、''x''-軸が[[漸近線]]である。なお、曲線は &sigma; の値が大きいほど扁平になる。
正規分布の確率密度数をグラフ化した'''正規分布曲線'''は左右対称な[[つりがね]]状の[[曲線]]であり、[[鐘]]の形に似ている事から'''ベル・カーブ'''とも呼ばれる。直線 ''x'' = &mu; を軸に左右対称であり、''x''-軸が[[漸近線]]である。なお、曲線は &sigma; の値が大きいほど扁平になる。


なお、[[中心極限定理]]により、巨大な ''n'' に対する[[二項分布]]とも考えることができる。
なお、[[中心極限定理]]により、巨大な ''n'' に対する[[二項分布]]とも考えることができる。
46行目: 46行目:
となることが知られている。
となることが知られている。


また、多変量の[[統計]]として[[共分散]]まで込めた[[多次元]]の正規分布も定義され、平均 '''&mu;''' = (&mu;<sub>1</sub>, &mu;<sub>2</sub>, ..., &mu;<sub>''m''</sub>) の ''m'' 次元正規分布の同時密度数は次の式で与えられる。
また、多変量の[[統計]]として[[共分散]]まで込めた[[多次元]]の正規分布も定義され、平均 '''&mu;''' = (&mu;<sub>1</sub>, &mu;<sub>2</sub>, ..., &mu;<sub>''m''</sub>) の ''m'' 次元正規分布の同時密度数は次の式で与えられる。


:<math>\frac{1}{(\sqrt{2\pi})^m \sqrt{|S|}}\exp\!\left(-\frac{1}{2}S^{-1}[\mathbf{x}-\boldsymbol{\mu}]\right)</math>
:<math>\frac{1}{(\sqrt{2\pi})^m \sqrt{|S|}}\exp\!\left(-\frac{1}{2}S^{-1}[\mathbf{x}-\boldsymbol{\mu}]\right)</math>
74行目: 74行目:
不連続値をとる確率変数についての検定の場合でも、連続変数と同様の考え方で正規分布を近似的に用いることがある。これは標本の大きさ ''n'' が大きく、かつデータの階級幅が狭いほど、近似の精度が高い。
不連続値をとる確率変数についての検定の場合でも、連続変数と同様の考え方で正規分布を近似的に用いることがある。これは標本の大きさ ''n'' が大きく、かつデータの階級幅が狭いほど、近似の精度が高い。


確率密度数から実際に値を求める場合は少なく、'''標準正規分布表'''とよばれる、変量に対応した確率をあらわす一覧表から値を算出する場合がほとんどである。
確率密度数から実際に値を求める場合は少なく、'''標準正規分布表'''とよばれる、変量に対応した確率をあらわす一覧表から値を算出する場合がほとんどである。


== 正規分布の適用 ==
== 正規分布の適用 ==

2009年4月9日 (木) 09:33時点における版

正規分布
確率密度関数
正規分布の確率密度函数:緑は標準正規分布
累積分布関数
正規分布の分布函数:色は確率密度函数と同じ
母数 位置(実数)
スケールの2乗 (実数)
確率密度関数
累積分布関数
期待値
中央値
最頻値
分散
歪度 0
尖度 0または3
エントロピー
モーメント母関数
特性関数
テンプレートを表示

正規分布せいきぶんぷ英語: normal distribution)は、ド・モアブル二項分布の近似として発見した確率分布である。 その後、ラプラスルジャンドル等の誤差最小二乗法に関する研究を経て、ガウスの誤差論で詳細に論じられた。 ガウス分布 (Gaussian Distribution) とも呼ばれる。

概要

(一次元)正規分布は、その平均を μ, 分散を σ2 とするとき、次の形の確率密度函数

を持つ。この正規分布を N(μ, σ2) と表す(N は「正規分布」を表す英語 "Normal Distribution" の頭文字から取られている)。特に μ = 0, σ2 = 1 の時、この分布は(一次元)標準正規分布(または基準正規分布)と呼ばれる。つまり標準正規分布 N(0, 1) は

なる確率密度函数を持つ確率分布として与えられる。

正規分布の確率密度函数をグラフ化した正規分布曲線は左右対称なつりがね状の曲線であり、の形に似ている事からベル・カーブとも呼ばれる。直線 x = μ を軸に左右対称であり、x-軸が漸近線である。なお、曲線は σ の値が大きいほど扁平になる。

なお、中心極限定理により、巨大な n に対する二項分布とも考えることができる。

平均値の周辺の n-次中心化モーメントは、各次数 n に対して

となることが知られている。

また、多変量の統計として共分散まで込めた多次元の正規分布も定義され、平均 μ = (μ1, μ2, ..., μm) の m 次元正規分布の同時密度函数は次の式で与えられる。

ここで、S = (σij) は分散共分散行列と呼ばれる正値対称行列で、冪指数に現れる記号 A[x] は(対称)行列 A とベクトル x に対して二次形式 xTAx を意味するもの(ジーゲル記号)とする。 この多次元分布を(一次元の場合と同様に)N(μ, S) と表す。特に一次元の場合、平均 μ = (μ) と分散共分散行列 S = (σ2) はともに一次元の平均と分散を意味する一つの実数値であり、記号 N(μ, S) = N((μ), (σ2)) は単に N(μ, σ2) と書かれる(先に述べた一次元の場合の記号と同じものと理解してよい)。

自然界の事象のなかには正規分布に従う数量の分布をとるものがあることがしられている[1]。また、そのままでは変数が正規分布に従わない場合もその対数をとると正規分布に従う場合がある。

統計的な意味

確率変数 XN(μ, σ2) に従う時、平均 μ からのずれが ±1σ 以下の範囲に X が含まれる確率は 68.26%, ±2σ 以下だと 95.44%, さらに ±3σ だと 99.74% となる。

正規分布は、t分布F分布といった種々の分布の考え方の基礎になっているだけでなく、実際の統計的推測においても、仮説検定区間推定など、様々な場面で利用される。

なお、実際に検定などにおいて正規分布を用いる時は、確率変数 x標準化した変数 z = (x − μ)/σ が標準正規分布に従うことを利用する場合がほとんどである。

不連続値をとる確率変数についての検定の場合でも、連続変数と同様の考え方で正規分布を近似的に用いることがある。これは標本の大きさ n が大きく、かつデータの階級幅が狭いほど、近似の精度が高い。

確率密度函数から実際に値を求める場合は少なく、標準正規分布表とよばれる、変量に対応した確率をあらわす一覧表から値を算出する場合がほとんどである。

正規分布の適用

前述のごとく"自然界"の事象(無機的なそれ)の中には、正規分布に従う数量の分布をとるものがあることが知られている。しかしそれは必ずしも"多数派"というわけではない。19世紀ではさながら「正規分布万能主義」といったものがまかり通っていたが、20世紀以降そういった考え方に修正が見られた。今日においては社会現象、生物集団の現象等々、種別から言えば、正規分布に従うものはむしろ少数派であることが確認されている。例えば、フラクタルな性質を持つ物は正規分布よりも、パレート分布になることが多い。

人間は自然界の事象とはちがって自分の意思をもっているため、たとえば、子供の成績などは決して正規分布にはならない[1]

何らかの事象について法則性を捜したり理論を構築しようとしたりする際、その確率分布がまだ分かっていない場合にはそれが正規分布であると仮定して推論することは珍しくないが、誤った結論にたどりついてしまう可能性がある。

本当にその事象が正規分布であるかどうかは実際のデータから確認するしかない。

脚注

  1. ^ a b 遠山啓『数学入門(下)』(初版)岩波書店岩波新書〉(原著1960年10月20日)、p. 87頁。 

関連項目