马尔科夫链在彩票分析中的应用

更新时间:2023-10-27 23:35:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

马尔科夫链在彩票分析中的应用

摘要马尔可夫链是一类特殊的时间离散的随机过程,其最大的特点就是无后效性。本文依据全国体育彩票排列五的历史数据,建立了彩票预测的马尔可夫链模型,并对利用模型得出的结果进行分析,结果表明该模型对体育彩票排列五中奖号码的预测具有一定的现实指导意义。

关键词彩票分析马尔可夫链转移概率矩阵 中图分类号:G812文献标识码:A 1引言

彩票是一种建立在机会均等基础上,公平竞争的娱乐性游戏,1994年,国家批准发行了中国体育彩票。根据国家有关部门的规定:我国体育彩票发行奖金的构成比例应为返奖率不低于总销售额的50%,发行费用比例不得高于总销售额的15%,彩票公益金比例不得低于总销售额的35%。目前,全国统一发行的体育彩票排列五都是从0―9这十个数字中,可重复地抽出五个数字依次排列组成(这种抽奖属于典型的“独立随机事件”,即其中任何一次事件发生的概率都与此前各事件的结果无关)。对于中大奖来说,这是小概率事件,一般认为在一

次试验中,小概率事件是不可能发生的。彩民在选号的过程中如何科学的选号才能增大获奖机会呢?本文针对这一问题,依据全国体育彩票排列五的历史数据,建立了彩票预测的马尔可夫链模型。利用此模型,对彩民如何科学的选号才能增大获奖机会给出了理论上的解释。

2 基本知识

设={,}为一随机过程,其状态空间为{},若对任意正整数,任意,<及任意非负整数,有(1)

则称为离散时间的马尔科夫链,称条件概率为{}时刻的步转移概率,简记为,如果有=,则称此马尔科夫链为齐次的,特别地当时有,称为一步转移概率,由一步转移概率组成的矩阵 (2)

称为一步转移概率矩阵[1]。

3 模型的建立

体彩排列五是从0―9这十个数字中随机抽取五个排列而成,由于每次抽取的号码与以前抽取的中奖号码无关,因此可以认为各期抽取中奖号码的过程构成一个离散时间的马尔科夫链。总共有0―9这十个数字,假设每个数字对应一个

状态,则该马尔马尔科夫链的状态空间{}。

依据参考文献[2]给出了2009年7月13日至2009年8月11日(即9187期―9216期)共30期体彩排列五的历史数据如下。

利用此数据,就可以通过以下式子算出从状态经过步转移到状态的转移概率

在上式中,为状态转移的次数,为处于状态的数字的总个数,为由状态转移到状态的数字个数,于是可以得到如下的一步转移概率矩阵

将此30期的数据作简单的统计,即可计算出该马尔科夫链的一步转移概率矩阵与二步转移概率矩阵如下: 用上述一步转移概率矩阵与二步转移概率矩阵,即可对下期开奖号码作简单的预测,具体的方法是:

根据预测期数前两期的开奖号码,分别从两个转移概率矩阵中抽出该数值所对应状态所在行的转移概率值; 将抽得的两行转移概率值对准排成十列,再将十列转移概率值同列相加;

以相加后和值最大的一列作为预测结果,写出预测号码,若第一列的合计值最大则预测下期可能有的号码为0,若第二列的合计值最大,则预测下期可能有的号码为1,以此类推。

4 对开奖号码的预测

利用上述方法,以2009年8月11日第9216期为例,进行下期开奖号码的预测。由于本期开奖号码为1,8,3,8, 5.预测过程为

1的一步转移概率与二步转移概率之和为

上表中概率值最大的为,位于第一列,故对应的数字为0,即0有可能在下期开奖号码中出现。 8的一步转移概率与二步转移概率之和为

上表中概率值最大的为,位于第五列,故对应的数字为5,即5有可能在下期开奖号码中出现。

用此方法同理可计算得3和5的一步转移概率与二步转移概率之和中最大概率分别为,,所对应的数字分别为4和1。 由此对下期开奖号码所作的预测是:最有可能的四个数字是0,5,4,1.而实际的开奖号码为99004,可以认为有两个数值预测准了。

5 结束语

根据彩票的发行,摇奖机是随机的摇出一个号码,所以每个号码出现的机会是均等的,然而,把每期的中奖号码作为历史数据进行统计,当期数比较大时,各数出现的频数基本相等。在对历史数据统计分析的基础上,运用Markov链理论预测分

析彩票这种随机性很强的事件是一种方法,运用此方法进行长期预测时初始状态和转移概率矩阵随着时间的推移在变化,所以我们可以根据最新得到的号码随时改变初始状态和转移概率矩阵,判断各个号码出现的概率。由以上分析显然可以看出第9216期的开奖号码1,8,3,8,5中出现了重复数字,预测的数字0,4在下期的开奖号中出现了,而且0是以重复数字的形式出现的,故利用此种方法一般能预测中1到2个号码,具有一定的可参考性,但这种方法得到一个必中的号码的概率很低,在实际应用中还有一定的局限性,我们可以运用这种方法再结合其他方法可能得到更大的概率值,为科学的选号提供参考。

本文来源:https://www.bwwdw.com/article/8mq2.html

Top