當前位置: 華文問答 > 科學

可不可以利用大數據來預測彩票中獎號碼?

2014-07-05科學

彩票號碼到底有沒有規律可循?能否透過大數據分析得出號碼預測?

從事大數據工作的小智告訴大家:

彩票號碼是沒有規律的,開獎號碼更無法預測!

這不是妄下結論,且看小智分析分析。

----------------------------------------------------

以雙色球為例。

從2003年2月23日雙色球第一期開獎起,至2016年11月3日, 雙色球共開獎2028期

【歷史號碼研究的偽命題】

對於有著 17721088種號碼組合 的雙色球,嚴格的說,2028期的開獎數據真不能算是大數據,只能算抽樣數據啦。

每周開獎3期,全年平均開獎153期,理論上,需要 11萬多年 才能開出所有組合。

於是,對於彩票號碼歷史數據的分析,從一開始就是個偽命題,因為你不能用數量很少的數據來覆蓋大量的組合情況,用這樣的「小數據」來分析得出預測,只能是個笑話。

再者,從機率論的角度,下一期的開獎號碼,本身是一個獨立事件,與再多的歷史號碼都沒有必然聯系。

【小數據分析能提供的一點幫助】

那麽,彩票歷史號碼研究就完全沒有任何用處了嗎?

用處並不是一點都沒有。

還以雙色球為例,將2028期的所有開獎號碼拿來簡單分析(只分析紅球)。

首先,統計6個紅球位置的數位頻率。註意1至6號紅球位置是按順序排列,非開獎球順序。

得出這樣一張表:▼

很明顯的現象(還稱不上規律),2號紅球裏不可能出現數位「1」,這不用分析,明擺著的。

1號紅球中,最大數位為「24」,且只出現過一次(可以算作小機率事件了)。出現頻次較高的是10以內數位。

6號紅球中,最小數位為「11」,且只出現過一次。出現頻次較高的是24及以後的數位。

這還是有點參考價值的。

如果你按照從小到大排序選彩票號碼,那麽根據歷史數據呈現的頻率,根據上面這張表,小智可以告訴你,1號紅球選擇16及以下的數位,命中率會更高,若選擇20以上數位,則多半是浪費錢。

6個紅球中,拿一個位置來讓小智幫忙提供選擇範圍,是沒問題的,但若要6個位置都提供,小智只能說無能為力。

因為,要在6個範圍中綜合圈出最後一個範圍,這組合多了去了。

話說回來,圈中一個紅球位置的數位範圍又能怎樣呢?

縱觀2028期雙色球號碼,33個紅球出現的頻率,全都在3%左右徘徊,這和機率論的理論是一致的,也進一步說明彩票號碼的隨機性。

----------------------------------------------------

【彩票到底需不需要暗箱操作】

最近幾年,有人質疑過彩票中心,認為其暗箱操作。

質疑者認為經常雙色球一等獎只有幾註中獎,而現在每期銷售基本是1億多註,按照機率怎麽也得十幾二十註中獎,所以懷疑暗箱操作。

小智從數據分析的角度,認為沒有暗箱操作,因為不需要暗箱操作。

從歷史開獎數據上看,一等獎中獎註數在20註以上的有101次,30註以上的有43次,最高的中獎註數為117,於2012年中出。出現得比較多的,是4到9註的情況(共出現739次)。

這樣的數位,對於1億註左右的池子,是比較正常的。

彩票這樣龐大的體系,要暗箱操作的話,其中環節太多,不出紕漏幾乎不可能。

所以,小智認為,彩票中心犯不著暗箱操作。

機率使然。