MENU
61,352

スレッドNo.707

予測

去年の年末に放送大学で、機械学習と深層学習をみました。また、先日BSフジのガリレオXでも、「運」をみました。

機械学習は、
1)教師あり学習
2)教師なし学習
3)強化学習
の3つがあります。まあ、統計学です。

さて、地震が1000年に1回起きるとすると、ばらつきがあるので、10万年とか100万年のデータがないと統計的な結論は出ないでしょう。でも、統計学では、それらのデータたちの特徴で、未来の事案については、目安にしかなりません。

さて、1000年1回だから、1年を365日として、1/(365x1000)がその日起きる確率です。起きない確率は
1-1/(365x1000)ですね。ですから100日連続して起きない確率は{1-1/(365x1000)}^100=99.9726%です。
100年連続して起きない確率は{1-1/(365x1000)}^(100x365)=90.4837294%です。
500年連続して起きない確率は{1-1/(365x1000)}^(500x365)=60.65%です。
700年連続して起きない確率は{1-1/(365x1000)}^(700x365)=49.658%です。

ですから、700年以内に地震は起こる確率は50%ですね。

でも、1000年に一度じゃなかったですか?

でもこれは、統計的に意味がありません。でも、予測には使えます。そこで、機械学習では、ベイスの定理を使って、いるようです。

引用して返信編集・削除(編集済: 2023年03月19日 14:10)

>さて、1000年1回だから、1年を365日として、1/(365x1000)がその日起きる確率です。

■御参考
http://shochandas.xsrv.jp/relax/time7.html

引用して返信編集・削除(未編集)

らすかるさんの解答を参考にすると、
 地震が1000年間に1回起こるので、その確率は、1/1000
 700年間で地震が起こる確率を p とすると、1000年間で地震が起こらない確率は、
(1-p)^(10/7)=1-1/1000=999/1000 から、 p≒0.00070011
でいいのかな?

引用して返信編集・削除(未編集)

Dengan kesaktian Indukmuさま、HP管理者さま、こんばんは。

1年に起きる確率は、1/1000=0.1%、起きない確率は、1-(1/1000)=99.9%
100年間起きない確率は、(1-(1/1000))^100=90.47921%
500年間起きない確率は、(1-(1/1000))^500=60.637984%
700年間起きない確率は、(1-(1/1000))^700=49.6411%

らすかる様の計算では、700年間起きない確率は1-pです。
したがって、1-pは(1-(1/1000))^700=49.6411%となりますから、p=50.3589%です。

700年間で起きる確率がpで1000年間で起きる確率は1より、残り300年間で起きる確率は1-pです。

また、700年間起きない確率は1-pで1000年間で起きない確率は0なので、残り300年間で起きない確率は0-(1-p)=p-1より、p-1となります。

となるはずでは、ないでしょうか?

引用して返信編集・削除(編集済: 2023年03月19日 23:30)

dengan さんが持ってきた記事は、関連はあるものの似て非なる問題なような。

平均して 1000 年に 1 回起こることは平均して 700 年に 0.7 回起こるので、
ポアソン分布の λ=0.7, k=0 を計算して、700 年間地震が起こらない確率は
0.7^0*e^(-0.7)/0! = 0.49658530……
つまり、700 年の間に地震が起こる確率は
1-0.49658530…… = 0.50341469 ……
になりますね。

尤も、ある瞬間の地震の発生率と別の瞬間の地震の発生率が独立であると仮定して計算していますが、実際にはその独立性は怪しいような気がします。
実際には地震は前震とか余震とかで立て続けに起こるものですし。

なお、
1 年以内に起こる確率は 1-0.001^0*e^(-0.001)/0! = 0.0009995001666……
1000 年以内に起こる確率は
1-1^0*e^(-1)/0! = 0.6321205588……
です。

引用して返信編集・削除(編集済: 2023年03月19日 23:38)

DD++様、おはようございます。

>1000 年以内に起こる確率は
1-1^0*e^(-1)/0! = 0.6321205588……
です。

おや、1,000年に一度じゃないんですね。

データ達の特徴から得られた1000年に一度という結果と予測から得られた結果が食い違うんですね。

タグチメソッド(品質工学)https://takuminotie.com/blog/quality/%E3%82%BF%E3%82%B0%E3%83%81%E3%83%A1%E3%82%BD%E3%83%83%E3%83%89/
も統計学者たちと田口博士の討論会で、統計学ではないとされています。

教員もタグチメソッドの考えを取り入れて、ばらつきの少ないことを目標にすれば、あとは、中心値を少しずらすだけで、すみますね。

タグチメソッドは、実験計画法でもある・・・・

引用して返信編集・削除(編集済: 2023年03月21日 08:19)

> おや、1,000年に一度じゃないんですね。

どういう意味でしょう。

1000 年間に k 回発生する確率を P[k] として、
1000 年間の発生回数の期待値が
1*P[1] + 2*P[2] + 3*P[3] + …… = 1
で、1000 年間の発生確率は
P[1] + P[2] + P[3] + …… = 1/e

何もおかしいところはないと思いますが。

引用して返信編集・削除(未編集)

>おや、1,000年に一度じゃないんですね。
データ達の特徴から得られた1000年に一度という結果と予測から得られた結果が食い違うんですね。

タグチメソッドもそういう結果あがり、予想と統計とは、違うのだそうです。機械学習もベイズ統計を使って、事前確率から事後確率という「予想」を導き出しているそうです。

統計はデータ達の特徴であり、予想にはならないそうです。

例えば、バレンタインデーにチョコレートをもらったのだけど、これは本命チョコのか、義理チョコなのかは、統計では、バレンタインデーが終わったあとに、調査結果として、確率何%が決まるのです。

でも、ベイズ統計では、確率何%で本命であると、過去の調査結果を利用して、もらった時に計算できるのです。でもそれは予想にしかすぎませんけどね。BSフジのガリレオXの「運」でそう言っていたと思います。

引用して返信編集・削除(編集済: 2023年03月21日 16:43)

いや、だから「何と何に食い違いが発生しているのか」と聞いています。
具体的に答えてください。
「自分が食い違っていると思うからだ」ではただの妄想です。

引用して返信編集・削除(未編集)

DD++様、おはようございます。
700年起きない確率は
%i1) float((1-(1/1000))^700);
(%o1) 0.4964114134310993
800年起きない確率は
(%i2) float((1-(1/1000))^800);
(%o2) 0.4491491486100754
900年起きない確率は
(%i3) float((1-(1/1000))^900);
(%o3) 0.4063866225452045
1000年起きない確率は
(%i4) float((1-(1/1000))^1000);
(%o4) 0.367695424770964
2000年起きない確率は
(%i7) float((1-(1/1000))^2000);
(%o7) 0.1351999253974996
3000年起きない確率は
(%i8) float((1-(1/1000))^3000);
(%o8) 0.0497123939980363
となって、データたちの特徴から得られた結果と予測が合わないと言うことです。
まあ、頻度と指数関数では収束は当然違いますね。

引用して返信編集・削除(編集済: 2023年03月22日 08:02)

無限ではないような気もします。http://www.math.kobe-u.ac.jp/HOME/saji/mathyomi/probability.html

引用して返信編集・削除(未編集)

それら8個の数値(若干間違ってますが)が何と矛盾するんです?

引用して返信編集・削除(未編集)

DD++様、こんにちは。

データ達の特徴から得られた1000年に一度は起きるという結果と1000年経っても起きる確率は63.23%(36.77%は起こらない)という予測と矛盾しませんか?

予測の根拠は1000年に一度は起きるという前提から出発したのです。

とおりすがり様、こんにちは。

700年起きない確率は、
(%i1) float((1-(1/1000))^700);
(%o1) 0.4964114134310993
3000年起きない確率は、
(%i2) float((1-(1/1000))^3000);
(%o2) 0.0497123939980363
10000年起きない確率は、
(%i3) float((1-(1/1000))^10000);
(%o3) 4.517334597704865E-5
50000年起きない確率は、
(%i4) float((1-(1/1000))^50000);
(%o4) 1.88109746912366E-22

どんどん小さくなりみたいですよ。

引用して返信編集・削除(編集済: 2023年03月22日 12:34)

> 1000年に一度は起きる

「平均して 1000 年に一度起こる」は、1000 年あったら絶対に起こるわけじゃありませんよ?

もっとわかりやすくコインで話しましょう。
コインは「平均して 2 回に 1 回表が出る」ようになっています。
でも、「2 回投げたら絶対に 1 回表が出る」わけではありません。
2 回投げて両方裏ということは十分にあり得て、その確率は (1-1/2)^2 = 0.25 です。
つまり、「2 回投げる間に表が出る確率」は 1-0.25 = 0.75 です。

では、これが「平均して 2 回に 1 回表が出る」と矛盾するか? という話をしましょう。
2 回投げる間に k 回表が出る確率を P(k) と書くと、
P(0) = 0.25, P(1) = 0.5, P(2) = 0.25
となります。
「2 回投げる間に表が出る確率」は、表が 1 回だろうと 2 回だろうと区別なく「表が出た」と考えるので
P(1) + P(2) = 0.75
という計算になります。
「2 回投げる間に表が出る平均回数」は、表が 2 回出たら当然 2 倍数えるので、
1*P(1) + 2*P(2) = 1
となります。
考えているものがそもそも違うので、異なる数値が出てくるのは当然の話です。
だから、「平均して 2 回に 1 回起こる」ことが 2 回の間に起こる確率が 1 にならなくても何も矛盾はしていないのですよ。

地震の話の場合もこれと同じです。
1000 年間に複数回発生した場合をどう考えるかに差があるので、「平均して 1000 年に 1 回起こる」ことが 1000 年の間に起こる確率が 1 にならなくても何も矛盾はしていないのですよ。
はちべえさんはおそらくこの 2 つの数値の区別をつけられていないのではないかと思うのですがどうでしょう。

引用して返信編集・削除(未編集)

ついでに。
これ、私もよくやらかすミスなのですが、

「平均して 1000 回に 1 回起こることが最初の 1 回で発生しない確率」
1 - (1/1000) = 0.999

「平均して 1000 年に 1 回起こることが最初の 1 年で発生しない確率」
e^(-1/1000) = 0.9990004998333……

前者は「最初の 1 回でその現象は最大 1 回しか発生しない」のに対し、
後者は「最初の 1 年でその現象が複数回発生する場合がある」という違いがあります。
確率の数値自体も変わってくるので、この 2 つはちゃんと区別して適切な方を使用しないといけません。
今回の地震の話は後者です。

引用して返信編集・削除(未編集)

DD++様、こんばんは。

非常にわかりやすい説明でした。

私の間違いがわかりました。

ありがとうございます。

引用して返信編集・削除(未編集)

ポアソン分布で誤差が出ないか裏を取ってみました。

■御参考
http://shochandas.xsrv.jp/relax/time7.html

こちらの、

問題
ある道路では、1時間以内に車が通る確率は、95%であるという。では、10分以内に車が通る確率は?

解答
10分以内に車が通る確率を p とすると、1時間以内で車が全く通らない確率は、
(1-p)^6=1-0.95=0.05 から、p≒0.393

を厳密に計算すると、p=0.3930377

一方、ポアソン分布で求めると、

ポアソン分布
Pp(x)=e^(-μ)・(μ^x/x!)(x=0,1,2,…)

1時間以内に車が1台も通らない確率はx=0(0台だから)として、
Pp(x)=e^(-μ)・(μ^0/0!)=e^(-μ)=0.05
∴e^(-μ)=0.05(μは1時間以内に通る平均台数)
この両辺の自然対数を取ると、
-μ=log0.05=-2.9957323
∴μ=2.9957323 
よって、10分以内に通る平均台数はμ/6=0.4992887
これとx=0をポアソン分布の式に代入すると、
Pp(0)=e^(-0.4992887)・(0.4992887^0/0!)=e^(-0.4992887)=0.6069622
これは10分以内に車が1台も通らない確率より、10分以内に車が通る確率は、1-0.6069622=0.3930378

最後の1桁は8桁の電卓なので仕方がありません。よって、全く誤差がないのでOKですね。

というのは、例えば、コインを60回投げて表が丁度30回出る確率は、60C30(1/2)^30(1/2)^30=0.1026・・・ですが、正規分布で近似すると、0.1034・・・と誤差が出るからです。もっとも、この場合は、29.5~30.5でやるから誤差が出るのかもしれませんが。

引用して返信編集・削除(未編集)

通りすがり様、こんばんは。

わかりやすく、ご解説ありがとうございました。

http://www.math.kobe-u.ac.jp/HOME/saji/mathyomi/probability.html

も、
10回連続して外れる場合、
(%i1) float((1-(1/10))^10);
(%o1) 0.3486784401
100回連続して外れる場合、
(%i2) float((1-(1/10))^100);
(%o2) 2.656139888758747E-5
1000回連続して外れる場合、
(%i3) float((1-(1/10))^1000);
(%o3) 1.747871251722651E-46
で、100,1000回も連続して外れることはないということですね。

****************************
さて、コインを投げて、表を1裏を0とすると、何回かをやった結果を横に並べると、2進数ですね。

10回やれば、10桁の2進数で、表が、5回連続するということは、10桁の2進数で1が連続して5個並ぶので、
1111100000
0111110000
0011111000
0001111100
0000111110
0000011111
の6通りですね。
10桁の2進数は2^10=1024個ありますから
確率6/1024=0.005859375
という計算は、どこで間違っているのでしょう?

ああ、そうか、xは0か1
111110xxxx  16通り
0111110xxx  8通り
x0111110xx  8通り
xx0111110x  8通り
xxx0111110  8通り
xxxx011111  16通り

合計 64通り

ところで10C5=252

まだ、どこかおかしい・・・・

引用して返信編集・削除(編集済: 2023年03月22日 20:06)

コインを 10 回投げて、連続で表が出る最大回数がぴったり 5 回になる確率なら、64/1024 であっているような。

引用して返信編集・削除(未編集)

通りすがりさん

二項分布を正規分布に近似する場合、事象が発生した回数(本来は整数しか取らない)を実数として連続値を取るとみなして連続的な確率分布にしています。
だからその過程で誤差が生じるわけですね。

ポアソン分布は試行回数(本来は整数しか取らない)を試行期間という連続値にする極限をとっていますが、事象が発生した回数の方はちゃんと整数値であることを保ったまま離散的な確率分布を出しています。
だから実は近似は行われていないので厳密に正しい……はず。だと思います。

引用して返信編集・削除(未編集)

DD++さん、返信ありがとうございます。

>二項分布を正規分布に近似する場合、事象が発生した回数(本来は整数しか取らない)を実数として連続値を取るとみなして連続的な確率分布にしています。
だからその過程で誤差が生じるわけですね。

ポアソン分布は試行回数(本来は整数しか取らない)を試行期間という連続値にする極限をとっていますが、事象が発生した回数の方はちゃんと整数値であることを保ったまま離散的な確率分布を出しています。
だから実は近似は行われていないので厳密に正しい

ええ、私も「確率統計 キャンパス・ゼミ」馬場敬之著で導き方から確認しました。

>「平均して 1000 回に 1 回起こることが最初の 1 回で発生しない確率」
1 - (1/1000) = 0.999

「平均して 1000 年に 1 回起こることが最初の 1 年で発生しない確率」
e^(-1/1000) = 0.9990004998333……

前者は「最初の 1 回でその現象は最大 1 回しか発生しない」のに対し、
後者は「最初の 1 年でその現象が複数回発生する場合がある」という違いがあります。

これは大変勉強になりました。関係ありませんが、0.05の6乗根とe^(-0.4992887)が一致するのはちょっと不思議ですね。(勿論、他の例も同様ですね。)

引用して返信編集・削除(未編集)

このスレッドに返信

このスレッドにはこれ以上返信できません。

ロケットBBS

Page Top