当前位置: 华文问答 > 科学

可不可以利用大数据来预测彩票中奖号码?

2014-07-05科学

彩票号码到底有没有规律可循?能否通过大数据分析得出号码预测?

从事大数据工作的小智告诉大家:

彩票号码是没有规律的,开奖号码更无法预测!

这不是妄下结论,且看小智分析分析。

----------------------------------------------------

以双色球为例。

从2003年2月23日双色球第一期开奖起,至2016年11月3日, 双色球共开奖2028期

【历史号码研究的伪命题】

对于有着 17721088种号码组合 的双色球,严格的说,2028期的开奖数据真不能算是大数据,只能算抽样数据啦。

每周开奖3期,全年平均开奖153期,理论上,需要 11万多年 才能开出所有组合。

于是,对于彩票号码历史数据的分析,从一开始就是个伪命题,因为你不能用数量很少的数据来覆盖大量的组合情况,用这样的「小数据」来分析得出预测,只能是个笑话。

再者,从概率论的角度,下一期的开奖号码,本身是一个独立事件,与再多的历史号码都没有必然联系。

【小数据分析能提供的一点帮助】

那么,彩票历史号码研究就完全没有任何用处了吗?

用处并不是一点都没有。

还以双色球为例,将2028期的所有开奖号码拿来简单分析(只分析红球)。

首先,统计6个红球位置的数字频率。注意1至6号红球位置是按顺序排列,非开奖球顺序。

得出这样一张表:▼

很明显的现象(还称不上规律),2号红球里不可能出现数字「1」,这不用分析,明摆着的。

1号红球中,最大数字为「24」,且只出现过一次(可以算作小概率事件了)。出现频次较高的是10以内数字。

6号红球中,最小数字为「11」,且只出现过一次。出现频次较高的是24及以后的数字。

这还是有点参考价值的。

如果你按照从小到大排序选彩票号码,那么根据历史数据呈现的频率,根据上面这张表,小智可以告诉你,1号红球选择16及以下的数字,命中率会更高,若选择20以上数字,则多半是浪费钱。

6个红球中,拿一个位置来让小智帮忙提供选择范围,是没问题的,但若要6个位置都提供,小智只能说无能为力。

因为,要在6个范围中综合圈出最后一个范围,这组合多了去了。

话说回来,圈中一个红球位置的数字范围又能怎样呢?

纵观2028期双色球号码,33个红球出现的频率,全都在3%左右徘徊,这和概率论的理论是一致的,也进一步说明彩票号码的随机性。

----------------------------------------------------

【彩票到底需不需要暗箱操作】

最近几年,有人质疑过彩票中心,认为其暗箱操作。

质疑者认为经常双色球一等奖只有几注中奖,而现在每期销售基本是1亿多注,按照概率怎么也得十几二十注中奖,所以怀疑暗箱操作。

小智从数据分析的角度,认为没有暗箱操作,因为不需要暗箱操作。

从历史开奖数据上看,一等奖中奖注数在20注以上的有101次,30注以上的有43次,最高的中奖注数为117,于2012年中出。出现得比较多的,是4到9注的情况(共出现739次)。

这样的数字,对于1亿注左右的池子,是比较正常的。

彩票这样庞大的体系,要暗箱操作的话,其中环节太多,不出纰漏几乎不可能。

所以,小智认为,彩票中心犯不着暗箱操作。

概率使然。