読者です 読者をやめる 読者になる 読者になる

日本株式(東証上場株)のベンフォードの法則からのズレを記録するブログ

東証上場株式の株価と出来高のベンフォードの法則からのズレを日夜記録し続けているブログです

ベンフォードの法則をご存知ですか?

みなさまはベンフォードの法則をご存知ですか?

 

この世の中に現れてくる数字の多くにはある法則があって、出現する数字の分布は一様ではなく対数的に分布するという法則なのですが、電気料金の請求書、住所の番地、株価、人口の数値、死亡率、川の長さ、物理・数学定数など様々な数字の分布にこの法則があてはまります。

 

このブログで扱う日本株の株価や出来高の数字の出現頻度もこの法則に従っていて、もし、この分布から大きく外れているとすれば、そのズレは「そこには通常起こりえないなにかが起こっているという何か特別な「意味」(=理由)がある」ということを統計学的に教えてくれる法則のことなのですが、

 

詳細は難しいので、詳細はWikipediaを参照頂くとして、一部引用

 

ベンフォードの法則 - Wikipedia

ベンフォードの法則(ベンフォードのほうそく、英語: Benford's law)は、自然界に出てくる多くの(全てのではない)数値の最初の桁の分布が一様ではない、ある特定のものになっているというものである。

 

この法則によれば、最初の桁が1である確率はほぼ3分の1にも達し、大きな数値ほど最初の桁に現れる確率は小さくなり、9になると最初の桁に現れる確率は20分の1よりも小さくなる。数理的には、数値が対数的に分布しているときは常に最初の桁の数値がこのような分布で出現する。

 

以下に示したような理由により、自然界での測定結果はしばしば対数的に分布する。別の言い方でいえば、対数的な測定結果があらゆる場所に存在する。 この直感に反するような結果は、電気料金の請求書、住所の番地、株価、人口の数値、死亡率、川の長さ、物理・数学定数、冪乗則で表現されるような過程(自然界ではとても一般的なものである)など、様々な種類の数値の集合に適用できることがわかっている。この法則はその数値の基底によらず(十進法ではない場合でも)適用できるが、その場合1桁目の各数値の取る比率は変化する。

 

それで、このブログで扱う日本株の株価や出来高の数字もこの法則に従ってまして、この法則によると、日本株の銘柄毎の株価や出来高の最上位の数字(株価が4,519円の場合、「4,519」という数字の列の一番左の数字。この場合ですと「4」)が出現する確率は以下の表やグラフの通りになっていて、

 

最上位の数字が1になる確率は30.10%、最上位の数字が2になる確率は17.61%と、その確率は log10(1 + 1/最上位の数字の値) にならなければおかしいという物です。

 

最上位の数字その数字の出現確率
1 30.1%
2 17.6%
3 12.5%
4 9.7%
5 7.9%
6 6.7%
7 5.8%
8 5.1%
9 4.6%

f:id:memomemokun:20161225132313p:plain

そして、この法則は、最上位の数字の分布だけでなく、2桁目、3桁目、4桁目……もある分布に従っていて、例えば、最上位から2桁目の数字が「2」になる確率については

 

https://wikimedia.org/api/rest_v1/media/math/render/svg/fc7f89ded596acefd4ae8ba5132f08797fb41844

 

として求まり、 そこから大きく外れることがあるとすればなにか理由がある筈だという事を教えてまして、

 

日本株の株価や出来高の動きに何かおかしな所がないかとベンフォードの法則から予想される数字の分布からのズレを日々淡々と記録していくブログを目指してます。(基本的には自動的に記録していく事を目指してます。ただいま、自動計算とブログへの自動投稿のプログラムを作成中)

 

なお、ベンフォードの法則から予想される分布からのズレをよりハッキリさせる為に、統計学では予想される分布からどのくらいありえない確率でズレているのかを計算する手法にカイ二乗検定という物がありますので、

 

ここでは、実際の株価と出来高のベンフォードの法則からのズレをカイ二乗検定を使い、それが実際に起こりえる確率、あるいは、おおよそどのくらい起こりえないのか、その確率を日々記録していこうと思います。

 

ということで、2016年12月22日の東証1部上場株式の最終確定の銘柄毎の株価をベンフォードの法則で予想される株価の分布からのズレを計算してみると以下の通り。

 

あれ!最上位1桁目が、2016年12月22日の東証1部株式結果になることは「0.0068638%」しかありえないという結果になってしまいました?

 

銘柄数 = 1830

O=最上位が「1」で始まる銘柄数 636件(34.8%) (理論値=30.10%, E=550.88), (O-E)^2/E= 13.15

O=最上位が「2」で始まる銘柄数 355件(19.4%) (理論値=17.61%, E=322.25), (O-E)^2/E=  3.33

O=最上位が「3」で始まる銘柄数 201件(11.0%) (理論値=12.49%, E=228.64), (O-E)^2/E=  3.34

O=最上位が「4」で始まる銘柄数 161件( 8.8%) (理論値= 9.69%, E=177.35), (O-E)^2/E=  1.51

O=最上位が「5」で始まる銘柄数 133件( 7.3%) (理論値= 7.92%, E=144.90), (O-E)^2/E=  0.98

O=最上位が「6」で始まる銘柄数 101件( 5.5%) (理論値= 6.69%, E=122.51), (O-E)^2/E=  3.78

O=最上位が「7」で始まる銘柄数  91件( 5.0%) (理論値= 5.80%, E=106.13), (O-E)^2/E=  2.16

O=最上位が「8」で始まる銘柄数  74件( 4.0%) (理論値= 5.12%, E= 93.61), (O-E)^2/E=  4.11

O=最上位が「9」で始まる銘柄数  78件( 4.3%) (理論値= 4.58%, E= 83.74), (O-E)^2/E=  0.39

(O-E)^2/Eの合計(カイ二乗値) =   32.74   自由度 = 8   出現確率(p-value) = 0.0068638%

 

 

銘柄数 = 1830

O=二桁目が「0」で始まる銘柄数 224件(12.2%) (理論値=11.97%, E=219.01), (O-E)^2/E=  0.11

O=二桁目が「1」で始まる銘柄数 207件(11.3%) (理論値=11.39%, E=208.42), (O-E)^2/E=  0.01

O=二桁目が「2」で始まる銘柄数 200件(10.9%) (理論値=10.88%, E=199.14), (O-E)^2/E=  0.00

O=二桁目が「3」で始まる銘柄数 193件(10.5%) (理論値=10.43%, E=190.92), (O-E)^2/E=  0.02

O=二桁目が「4」で始まる銘柄数 189件(10.3%) (理論値=10.03%, E=183.56), (O-E)^2/E=  0.16

O=二桁目が「5」で始まる銘柄数 188件(10.3%) (理論値= 9.67%, E=176.92), (O-E)^2/E=  0.69

O=二桁目が「6」で始まる銘柄数 173件( 9.5%) (理論値= 9.34%, E=170.88), (O-E)^2/E=  0.03

O=二桁目が「7」で始まる銘柄数 158件( 8.6%) (理論値= 9.04%, E=165.34), (O-E)^2/E=  0.33

O=二桁目が「8」で始まる銘柄数 143件( 7.8%) (理論値= 8.76%, E=160.25), (O-E)^2/E=  1.86

O=二桁目が「9」で始まる銘柄数 155件( 8.5%) (理論値= 8.50%, E=155.55), (O-E)^2/E=  0.00

(O-E)^2/Eの合計カイ二乗値) =    3.22   自由度 = 8   出現確率(p-value) = 95.5088961%

 

 

銘柄数 = 1830

O=三桁目が「0」で始まる銘柄数 164件( 9.0%) (理論値=10.18%, E=186.27), (O-E)^2/E=  2.66

O=三桁目が「1」で始まる銘柄数 166件( 9.1%) (理論値=10.14%, E=185.52), (O-E)^2/E=  2.05

O=三桁目が「2」で始まる銘柄数 176件( 9.6%) (理論値=10.10%, E=184.78), (O-E)^2/E=  0.42

O=三桁目が「3」で始まる銘柄数 195件(10.7%) (理論値=10.06%, E=184.05), (O-E)^2/E=  0.65

O=三桁目が「4」で始まる銘柄数 206件(11.3%) (理論値=10.02%, E=183.33), (O-E)^2/E=  2.80

O=三桁目が「5」で始まる銘柄数 171件( 9.3%) (理論値= 9.98%, E=182.61), (O-E)^2/E=  0.74

O=三桁目が「6」で始まる銘柄数 172件( 9.4%) (理論値= 9.94%, E=181.90), (O-E)^2/E=  0.54

O=三桁目が「7」で始まる銘柄数 200件(10.9%) (理論値= 9.90%, E=181.21), (O-E)^2/E=  1.95

O=三桁目が「8」で始まる銘柄数 193件(10.5%) (理論値= 9.86%, E=180.51), (O-E)^2/E=  0.86

O=三桁目が「9」で始まる銘柄数 187件(10.2%) (理論値= 9.83%, E=179.83), (O-E)^2/E=  0.29

(O-E)^2/Eの合計カイ二乗値) =   12.96   自由度 = 8   出現確率(p-value) = 16.4204786%

 

  

 

という感じで、自動計算アップロードのプログラムが完成したら、なにかの参考になる方もいるかなと記事を自動でUPしていきます。