马尔可夫过程_srtp论文

更新时间:2023-05-21 16:29:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

数学建模,马尔科夫链,论文

马尔可夫过程在深圳指数预测中的应用

田禹 颜虎 蒙小兰 西南交通大学数学学院

摘要

股价指数是反映股票市场价格平均水平和变动趋势的指标,是对整个股票市场行情的一种反映。如何准确地预测未来的股价指数,从而有效地防范投资风险,一直是学者关注的问题。本文以深证综合指数为研究对象,建立了3种不同的马尔科夫链模型,分别给出了深证综指的预测结果,并提出了利空度矩阵分析法,对深证综指的跌涨幅度作出了定量分析。

在引入了马尔可夫过程的相关理论之后,本文首先建立了指数权马尔可夫链模型。根据指数序列的统计分布特点,对指数变动范围进行了状态划分,使每个交易日的指数唯一对应一个状态,再利用转化得到的状态序列,估计它的各阶状态转移概率矩阵,然后以状态序列的各阶自相关系数为权重,结合各阶转移概率矩阵,对预测期的指数状态进行预测。

加权模糊马尔可夫链是对状态划分模糊的马尔可夫链的改进。该模型采用模糊状态划分方法,将原指数序列转化为模糊状态向量序列,在不同时段分别建立模糊状态转移概率矩阵,再利用各时段转移概率矩阵加权求和得到的新转移概率矩阵,对预测期指数的模糊状态进行预测。

结合上述两种模型的特点,本文又建立了指数权—加权模糊马尔可夫链模型。该模型采用模糊状态划分方法,通过对建立在不同时段上的各阶转移概率矩阵加权求和,得到最终用于预测的各阶转移概率矩阵,并以指数序列的各阶自相关系数为权重,结合相应的转移概率矩阵,加权预测未来指数的模糊状态。

为了定量描述股市的整体跌涨幅度,本文最后建立了利空度分析模型。它基于状态转移概率矩阵构造利空度矩阵,以此计算股市的利空度。利空度的符号和绝对值大小反映了股价指数的跌涨和相应幅度。

本文以MATLAB7.0为计算工具,分别利用各种模型的深证综指进行了实证分析,结果均与实际吻合。说明马尔可夫链模型在股市行情分析中有较好的适用性。

关键词:马尔可夫链 指数权 加权 模糊 利空度

数学建模,马尔科夫链,论文

1 引言

面对跌宕起伏的证券市场,中外分析人士一直在竭尽全力,长期不懈地探索市场运行规律。各种技术分析流派都以准确预测市场未来走势为目的,传统技术分析遵循周而复始、重复再现的变化原则,但在实际运用中往往和市场走势背离,预测的结果往往不尽理想。

本文基于马尔可夫链建立了3种预测模型,并建立了刻画股指跌涨幅度的利空度矩阵模型,希望能对股价指数的定量分析提供一些思路。

2 马尔可夫链的相关概念

2.1马尔可夫过程的定义

马尔可夫过程是具有所谓马尔可夫性的一类特殊的随机过程,这种马尔可夫性意过程在时刻t(t tk)处的状态只与过程在时味着:在某时刻tk所处的状态已知的条件下,刻tk的状态有关,与过程在tk以前的状态无关,这种特性称为无后效性。它严格的数学定义如下:

X t ,t T 、为一随机过程,E为状态空间,若对任意的n 1,任意的t

1

t2.... tn t,

任意的a1,a2,....an,a E,机变量x t 在已知条件下x t1 a1,x t2 a2,...x tn an,下的条件分布函数只与x tn an有关,而与x t1 a1,x t2 a2,...x(tn-1) an 1无关,即条件分布函数满足等式F(a,t|a1,a2,....an;t1,t2....,tn) F(a,t|an,tn)则称此过程为马尔可夫过程。由于马尔可夫过程的无后效性,可以将其称为一个只注重现在而将过去忘却的特殊随机过程。

2.2马尔可夫链的定义

由上可知马尔可夫过程是无后效性的随机过程,即在系统“现在”状态已知的条

件下,其“将来”的状态与“过去”的状态无关。当状态空间和时间参数都是离散情形时,称为马尔可夫链。其严格定义如下:记时间参数为t1,t2, ,tn, ,当t tn时,随机变量X(tn)(n 1,2, )可能取的状态空间为E(a1,a2, ,aN),对任意的l,m,k,

P{Xm k am k|Xm am,Xm 1 am 1, ,X1 a1} P{Xm k am k|Xm am}

成立。

(k)

当Pij(k)(m) P{Xm k am k|Xm am} pij,即状态转移概率与与初始时刻m无

关时,为齐次马尔可夫链,此时,称矩阵(pij(k))N N为系统的k步状态转移概率矩阵。

特别地,当k 1时, Pij P{Xn aj|Xn 1 ai}(i,j 1,2, ,N)为马尔可夫链的一步转移概率。矩阵(Pij)N N称为一步转移概率矩阵。由此,根据某一时刻的状态可

数学建模,马尔科夫链,论文

以预测下一时刻的状态。显然有以下性质:

Pij(k) 0, i,j E

P(k) 1, i E

ijj E

2.3 齐次马尔可夫链的遍历性和平稳分布

设齐次马尔可夫链 X n ,n 1 的状态空间为E=(a1,a2, ,aN),若对所有的i,j 属于E,存在不依赖i的常数 j,为其转移概率Pij在n趋于 的极限,即

n

n

limPij

n

j i,j E

p12p22..p....

........

p1. 1 2

p2.. 2 n 1 ..

p.. 1 2

其相应的转移矩阵有

p11

p 21 .. p..

p n

.

. .

则称齐次马尔可夫链具有遍历性,并称 j为状态j的稳态概率。

齐次马尔可夫链的平稳分布的严格数学定义:设 X n ,n 1 是一个齐次马尔可

夫链。,若存在实数集合 rj,j E ,满足

①rj 0,j E ② rj 1

j E

③rj

rP,j E

iiji E

则称 X n ,n 1 为平稳齐次马尔可夫链, rj,j E 是该过程的一个平稳分布。

2.4 C K方程

设 X n ,n 0,1.... 为马尔可夫链,状态空间E=(a1,a2, ,aN),则n步转移概率满足下述等式:

Pij(r)= Pik

k E

n m

n m r pkj r m ,i,j E,i m n

这个等式就叫C K方程

对应的n步转移矩阵为

p n r p m r p n m r m

数学建模,马尔科夫链,论文

3 指数权马尔可夫链预测法

3.1指数权马尔可夫链预测的思路

证券指数的变动不仅与各上市公司的经营状况有关,还受宏观经济形势、经济周期和政策变动的影响,因此不宜仅把证券指数作为一阶马尔可夫链来处理,而是有必要考虑连续多阶的相互影响。由于证券指数是一列相依的随机变量,各自相关系数刻画了各种时滞的证券指数间的相关关系的强弱。因此,可考虑先分别根据前若干期的证券指数对预测期证券指数状态进行预测,然后,按前面各期与该预测期相关关系的强弱加权求和,即达到了充分、合理地利用信息进行预测的目的。

3.2指数权马尔可夫链的预测步骤

⑴根据实际数据的分布特点,对指数序列所能取到的最小值m0和最大值mn所限定的区间分为若干小区间:[m0,m1),[m1,m2), ,[ml 1,ml),其中mi mi 1,i 1,2, l,使每一个交易日的指数仅落入其中一个区间内,每一区间可视为一种状态。再记Ei [mi 1,mi),则可将指数序列{Xt,t 1,2, ,n},转化为一个以E {Ei,i 1,2, ,l}为状态空间的随机时间序列。

⑵对证券指数序列作马氏性检验:用fij表示在证券指数状态序列z1,z2. ,zn中从状态i出发,经过一步转移到达状态j的频数,构造频数转移矩阵(fij)m m。记

p j

f

i 1j 1

2

i 1

mm

f

m

ij

, pij

ij

fij

f

j 1

n

,则当n较大时,统计量 2

ij

2

f

i 1j 1

mm

ij

ln

pijp j

服从自由

2

度为 m 1 的 2分布。给定显著性水平 ,查表可得该分布的上 分位点 (m 1)2

2的值,并计算得到统计量 2。若 2 (m 1)2,则认为序列{zi}符合马氏性,否则

不可作为马尔可夫链来处理。

(z

⑶计算序列{zi}各阶自相关系数rk

j 1

n k

jn

z) (zj k z)

j

(z

j 1

z)2

其中,rk表示k阶(时滞为k期)自相关系数,zj表示第j年的证券指数状态,z表示证券指数状态序列{zi}的均值,n表示该序列的长度。

数学建模,马尔科夫链,论文

⑷对各阶自相关系数规范化,即wk

rk

r

k 1

M

,并以wk作为各时滞的马尔可夫链的

k

权重(M为预测需要的最大阶数)。

⑸对⑴所得结果进行统计,可得不同时滞(步长)的马尔可夫链的转移频数矩阵

f

(k)

,利用公式ijm m

(k)

pij

fij(k)

j 1

n

fij(k)

(k)

,构造相应的转移概率矩阵pij

m m

⑹分别以前面若干期的证券指数状态为初始状态,,结合各初始状态在相应的转移概率矩阵所在行,并以各阶自相关系数为权重,通过加权求和即可预测出该期证券指数处于状态i的概率

Pi wk Pi(k),(k 1,2, ,M;i 1,2, ,m),其中Pi(k)为从时滞为k的初始状态转移至

k 1

M

状态i的k步转移概率。

⑺若Pj max{Pi},则该预测期证券指数所处状态为j。将其加入原状态序列,再重复⑴~⑹,可进行下一期的证券指数状态预测。

3.3 指数权马尔可夫链的实例分析

本文以1997年1月2日至2002年12月31日共计1444个交易日的深证综指为例,说明该方法的具体应用。本文限于篇幅,只对一个交易日的指数状态进行预测。

⑴首先,根据数据的描述性统计结果对数据做状态划分。MATLAB的统计分析结果显示【见附录1】,1444个交易日的深证综指最高值为664.85点,最低值为305.81点。不妨取等间隔长度100,将原始数据划分为4个状态:305 395为状态1,395 485为状态2,485 575为状态3,575 665为状态4。

⑵利用⑴中确定的状态划分方法,将原始序列转换为状态序列。

⑶利用MATLAB根据第2小节的原理可计算得到步长为1、2、3、4的马尔可夫链的转移概率矩阵如下:

P(1)

00 00 0.96350.0365 0.93820.0618

0.03190.924300.04380.05380.892400.0538(2) P 0 000.9830.017 00.96940.0306

0.10530.02390.8708 0.12920.04310.8278 0 000 00 0.92220.0778 0.91080.0892

0.06590.893100.06390.0740.85400.072(4) P 0 000.9660.034 00.9660.034

00.15310.04780.79900.17220.04780.7799

2

P(3)

⑷对状态序列做马氏性检验: 2

f

i 1j 1

mm

ij

ln

pijp j

3736.5,给定显著性水平

数学建模,马尔科夫链,论文

222

0.05,查表可得上分位点 (9) 16.919,由于 2 (m 1)2 0.05 (m 1)2 ,

故认为指数状态序列满足马氏性。

⑸计算状态序列的各阶自相关系数和各步长的马尔可夫链的权重,如表2所示:

表1 各阶自相关系数和各步长的马尔可夫链权重

k(阶数、步长)10.9959

rk(自相关系数) wk(权重)

0.2516

20.99180.2505

30.98770.2495

40.98340.2484

⑹利用1997年1月2日至2002年12月31日的状态指数序列,结合相应的状态转移概率对2003年1月2日的深证指数状态进行预测。

表2 2003年1月2日证券指数状态预测 基期 初状态权重 状态1 状态2 状态3状态4 概率来源

1 0.25160.96350.0365 0 0 02/12/31 1

P(1)(1,j)

02/12/30 1 02/12/27 02/12/26

2 3 4

0.25050.93820.0618 0 0

P(2)(1,j)P(3)(2,j)

2 0.24950.2484

0.06590.8703 0 0.06390.072

2 0.074 0.0854 0 0.5123

0.4539

P(4)(2,j)

转移至末状态i的概率加权和Pi

0.0338

由表2知,max{Pi} P即2003年1月2日的深证指数状态为1,实际当1 0.5123,日的指数为380.44,满足状态1的取值范围[305,395),预测准确。

4 加权模糊马尔可夫链预测法

在第3节中的讨论中,采用了明确的状态划分方法,将整个指数取值区间划分为4个状态(低、较低、较高、高),使每个交易日的指数唯一地归属于某一状态,然而,这样的状态划分具有一定缺陷,比如处于两状态取值界限的数值兼有左右两侧状态的特点,而在这样的状态划分方式下,只能被强制归为其中的一个状态,这就可能损失部分信息,也很难有说服力。故在本节我们提出一种状态划分模糊的方法,进而建立相应的马尔可夫链模型。

4.1 状态划分模糊的马尔可夫链预测法的预测步骤

⑴将随机变量的取值范围设为U,建立U上的模糊状态集S1,S2, ,SM,对任意

数学建模,马尔科夫链,论文

u U,有 Sm(u) 1。则称 Sm(u)为数值u对模糊状态Sm的隶属度,也称u对Sm的

m 1

M

分配系数。

⑵定义 Si(Xk) Sj(Xk 1)为时刻tk变为tk 1时状态Si到状态Sj的模糊状态转移系数,而称Aij

k 1

n 1

Si

(Xk) Sj(Xk 1)为状态Si到状态Sj的模糊转移频数。

⑶计算模糊转移频率Pij 模糊转移概率矩阵(Pij)M M。

Aij

Ai1 Ai2 AiM

(i,j 1,2, ,M),以此为元素,构作

⑷通过隶属函数确定目前随机变量取值ut的模糊向量St (s1(ut),s2(ut), ,sM(ut))。 t 1的模糊向量为 ⑸以当前时刻为基期,则下一时刻的预测值u

t 1),s2(u t 1), ,sM(u t 1)) St P。 St 1 (s1(u

⑹将得到的St 1向量加入原状态向量序列,重复⑴~⑸,可得下一预测期的指数状态向量。

4.2 加权模糊马尔可夫链模型的思路

马尔可夫链预测法的关键问题在于状态转移概率矩阵的计算,因为状态转移概率的精确与否直接影响到最终预测值的精确度。加权模糊马尔可夫链预测模型就是在状态划分模糊的马尔可夫链基础上,对不同时段的状态转移概率矩阵加权求和,使得加权求和后得到的状态转移概率矩阵较之传统的更为精确。具体做法是:把原始数据按时间先后顺序排列后,把它们适当分成若干段,在每一段上都求出一个状态转移概率矩阵,然后分别赋予相应权重,加权求和后得一新的状态转移概率矩阵。最后,我们用这个新的状态转移概率矩阵预测下一期的证券指数。

这里有一个问题需要明确:若干转移概率矩阵的加权求和是否具有合理性?即加权求和后得到的矩阵是否还是一个转移概率矩阵?答案是肯定的。下面给出加权转移概率矩阵合理性的证明。

(k)(k)

, , m),k 1,2, n为n个转移概率矩阵,即满足 (jk) 0,即已知:Pk ( 1(k), 2

m

向量的每一个分量不小于0(j 1,2, m),且 (jk) e (1,1, 1)T, k为各转移概率矩

j 1

阵对应的权重,满足 k 0,(k 1,2, n)且 k 1。求证:P k Pk仍满足转移概

k 1

k 1

nn

率矩阵的条件。

数学建模,马尔科夫链,论文

证明:设P ( 1, 2, , m),则原问题等价于证明 i 0,(i 1,2, m)且 j e

j 1

m

P k Pk ( k

k 1

k 1

nn

(k)1, k (k)2

, , k

(k)m

) ( k

k 1

n

(k)1

, k

k 1

n

(k)2

(k)

, , k m)

k 1

n

( 1, 2, , m)

j k

j 1

j 1k 1

m

m

n

(k)

j

k (jk) 1 e e 证毕

k 1

j 1

nm

4.3 加权模糊马尔可夫预测法对深证指数的实证研究

本节数据仍然采用1997年1月2日至2002年12月31日各交易日的深证综合指数,通

过对2003年1月2日的深证指数的预测,说明该方法的运用。受篇幅限制,以下只对一个交易日的指数状态进行预测。

⑴根据深证指数在上述时间段内的取值范围U [305,665],把U由低到高分为4个等长区间,并采用清晰区间模糊化技术建立模糊等级状态:S1,S2,S3,S4并用图1予以表示:

图1 清晰区间模糊化隶属函数图像

相应的隶属函数为:

u [305,350)时,

S(u) 1, S(u) S(u) S(u) 0;

1

2

3

4

u [350,440)时,

11

S1(u) 1 u 350 , S2(u) u 350 , S3(u) S4(u) 0;

9090u [440,530)时,

数学建模,马尔科夫链,论文

S(u) 1

2

11

u 440 , S3(u) u 440 , S1(u) S4(u) 0; 9090

u [530,620)时,

S(u) 1

3

11

u 530 , S4(u) u 530 , S1(u) S2(u) 0; 9090

u [620,665)时,

S(u) 1, S(u) S(u) S(u) 0。

4

1

2

3

⑵将根据⑴中给出的隶属函数确定各交易日深证指数的状态分配系数。

⑶将原始数据按时间顺序分为两组,为了避免转移概率矩阵出现某一行全为0元素的情况,取前800个交易日为第一时段,后面所有交易日为第二时段。分别计算每个时段的模糊转移频数和模糊转移频率,并建立相应的模糊转移概率矩阵:

0.7864

0.2650 P1

0.0007 0

0.21360.65100.32530.0006

0.00010 0 0.43320.56590.0008

0.08400 0.07300.66590.25750 , P2

00.60170.0723 0.28670.53540.1778

0.64210.3573 000.10910.8908

⑷我们知道,对一个系统来说,它是处于变化发展中的,因此,用时间久远的数据

来预测未来状态,势必会造成一些不准确因素。与此同时,这些数据在一定程度上又可看作相对稳定的系统,时间久远的数据在对状态转移概率矩阵的计算上有会起到一定作用。所以,我们得出这样的结论:在状态转移概率的计算上,对与那些时间久远的数据我们决不可以丢弃它们,但也不能把它们与近前的数据等同起来,一个容易想到的方法是把不同时段的转移概率矩阵赋予不同的权重,加权求和得到一个新的具有更高精度的状态转移概率矩阵。

用主观评判法对矩阵P1,P2,P3分别赋予权重0.4,0.6,故新的状态转移概率矩阵

0.5745

0.1498 P 0.4 P1 0.6 P2 0.0003 0

0.42500.66210.30220.0003

0.00050 0.18810 0.56190.1356

0.32230.6774

⑸利用上一步骤得到的转移概率矩阵,预测2003年1月2日的深证指数。2002年12月31日的深证指数为388.76点,对应的模糊状态向量为(0.5693,0.4307,0,0),则下一交易日的深证指数状态向量为:

0.5745

0.1498

F (0.5693,0.4307,0,0)

0.0003 0

0.42500.66210.30220.0003

0.00050

0.18810

(0.3916,0.5271,0.0813,0)

0.56190.1356

0.32230.6774

数学建模,马尔科夫链,论文

因为max{ S

i

(Xn 1),i 1,2,3,4} S2(Xn 1) 0.5271,而实际指数为380.44,属于模糊

状态集S2的取值范围[350,530],故预测结果与实际吻合。

5 指数权—加权模糊马尔可夫链预测法

从4.3的实证研究中不难发现,加权模糊马尔科夫链对深证指数的预测值406.35偏

离真实值380.44的程度较大。原因是:无论是指数权马尔科夫链,还是加权模糊马尔科夫链模型,都只利用了股市提供的部分信息。在此,我们提出一种将两种模型相结合的思路,既考虑连续多阶的相互影响,有考虑不同时段对预测期的影响。在基于对原始序列模糊状态划分的基础上,首先,分别在各时段上计算各步模糊状态转移概率矩阵,通过赋予不同时段相应权重,合并为新的模糊状态转移概率矩阵,再利用前几期与预测期的相依关系的强弱(以各阶自相关系数表示),对通过各阶转移概率矩阵预测出的模糊状态向量加权求和,即得预测期的模糊状态向量。这就是指数权—加权马尔可夫链模型的基本思想。

5.1 状态划分模糊的指数权马尔科夫链预测步骤

在介绍指数权—加权马尔科夫链模型之前,我们首先引入状态划分模糊的指数权马尔可夫链模型:

⑴将随机变量的取值范围设为U,建立U上的模糊状态集S1,S2, ,SM,对任意

u U,有 Sm(u) 1。则称 Sm(u)为数值u对模糊状态Sm的隶属度,也称u对Sm的

m 1

M

分配系数。

⑵定义 Si(Xl) Sj(Xl k)为时刻tl变为tl k时状态Si到状态Sj的k步模糊状态转移系数,而称A

(k)ij

Si(Xl) Sj(Xl k)为状态Si到状态Sj的模糊转移频数。

k 1

(k)ij

n k

⑶计算k模步糊转移频率P

(k)Aij

A

j 1

m

(k)ij

(i,j 1,2, ,M),以此为元素构作k阶模

糊转移概率矩阵(Pij(k))M M。

⑷计算序列的各阶自相关系数 k

(X

l 1

n k

l

X) (Xl k X)

n

(k 1,2 m)

l

(X

l 1

X)2

⑸规范化各阶自相关系数,即以 k

k

k 1

m

作为滞为k的模糊状态向量对预测期模糊

k

数学建模,马尔科夫链,论文

状态向量的权重。

⑹分别利用前几期的模糊状态向量,并结合相应步长的转移概率矩阵,通过加权求和对预测期的模糊状态向量进行预测,用F(Xn)表示tn时刻深证指数的模糊状态向量,则预测期即tn 1时刻的模糊状态向量为:F(Xn 1) k F(Xn k 1) P(k) 。

k 1m

5.2 指数权—加权模糊马尔可夫链预测模型

借鉴加权模糊马尔科夫链模型的思路,指数权—加权模糊马尔可夫链模型就是对不同时段上的各阶状态转移概率矩阵加权求和,利用新得的各阶转移概率矩阵替换在指数权—加权马尔科夫链模型的中的相应转移概率矩阵。这样在考虑了不同时段的影响程度后,使得各阶转移概率矩阵的估计更加精确。

在实证分析之前,我们同样需要就“指数权—加权模糊马尔可夫链模型预测得到的向量仍然满足模糊向量的条件”进行证明。

已知:Fk(k 1,2 l)为l个模糊状态向量,即满足各分量非负且和为1,Pk, k分别为对应的转移概率矩阵和权重。求证:F k Fk Pk为一模糊状态向量。

k 1

(k)

证明:设Fk Pk ( 1(k), 2(k), , m),F ( 1, 2, , m),

m

l

因为 Fk各分量非负且和为1,由转移概率矩阵的性质知,必有 j(k) 1,

j 1

而F k Fk Pk ( k

k 1

k 1

ll

(k)

1

, k

k 1l

l

(k)2

(k)

, , k m)

k 1

l

m k

j 1

j 1k 1

mml

(k)

j

j 1

m

(k)j

k 1 1 1 证毕

k 1

5.3 指数权—加权模糊马尔可夫链预测模型的实证分析

我们依然以1997年1月2日至2002年12月31日共计1444个交易日的深证综指为研究对象,对2003年1月2日的深证指数进行预测。

为了便于前后对比,仍按4.3节中指数状态的划分方法,并采用相同的隶属函数,则各交易日的状态分配系数向量不变。时段的划分也与4.3节中保持一致。以

Pi(k)(i 1,2,3;k 1,2,3)表示第i时段的k阶模糊状态转移概率矩阵,计算结果如下:

0.7864

0.2650

0.0007 0

0.21360.65100.32530.0006

0.00010 0.7818

0.08400 (2) 0.2671

P1

0.00290.60170.0723

0.64210.3573 0

0.2180

0.64420.33320.0004

0.00030

0.08870

0.58940.0746

0.64310.3565

(1)P1

数学建模,马尔科夫链,论文

(3)P1

0.7766

0.2701

0.0041 0 0.4223

0.0756

0.0003 0

0.22280.63770.33760.00010.57590.66430.29470.0001

0.00060 0 0.43320.56590.0008

0.09210.0001 (1) 0.07300.66590.25750

P2

00.58180.0765 0.28670.53540.1778

0.64250.3574 000.10910.8908 0.00180 0 0.40920.58790.029

0.26010 (3) 0.07820.65970.26210.0001

P2 0.52540.17960.00070.30180.51650.1810

0.11160.8883 00.00020.11400.8858

P2(2)

同样按照“时间久远的数据对当前影响小,而时间临近的数据对当前影响大”的原则,分别赋予第一、二时段权重0.4,0.6,以P(k)表示各时段加权求和得到的k阶模糊状态转移概率矩阵,则

(1)

0.6 P2(1)P(1) 0.4 P1

0.5745

0.1498

0.0003 0 0.5661

0.1522

0.0013 0 0.5562

0.1550

0.0020 0

0.42500.66210.30220.00030.43270.65620.31010.00020.44190.65090.31610.0001

0.00050

0.18810

0.56190.1356

0.32230.6774 0.00120

0.19150

0.55100.1376

0.32420.6756 0.00190

0.19410.0001

0.54260.1392

0.32540.6745

(2)

0.6 P2(2)P(2) 0.4 P1

(3)

0.6 P2(3)P(3) 0.4 P1

由3.2节中的计算结果,指数序列的1,2,3阶自相关系数分别为0.9959,0.9918,

0.9877,规范化后对应的权重分别为 1 0.3347, 2 0.3333, 3 0.3319,最后三期样

本对应的模糊状态向量为:

F(Xn 2) (0.4924,0.5076,0,0),F(Xn 1) (0.5367,0.4633,0,0),F(Xn) (0.5693,0.4307,0,0)则预测期的模糊状态向量

F(Xn 1) k F(Xn k 1) P(k) (0.3729,0.5371,0.0900,0)

k 1

3

因为max{ S

i

(Xn 1),i 1,2,3,4} S2(Xn 1) 0.5371,而实际指数为380.44,属于模糊

状态集S2的取值范围[350,530],故预测结果与实际吻合。

数学建模,马尔科夫链,论文

6 利空度矩阵分析法

实际中,人们通常希望了解股市在一段时期内的跌涨情况,通过判断股市行情作出投

资决策。股市行情的变化往往通过股票指数的跌涨幅度来体现,但是,股市瞬息万变,股票指数并不总是保持在某一特定的变化趋势上,而是在某一时期有涨有跌,交替变化。针对该问题,本文基于马尔可夫状态转移概率矩阵的理论,提出了“利空度矩阵”的概念,从而为判断股市的跌涨幅度提供了有力工具。

6.1 利空度矩阵的模型建立

基于股票指数在某段时期的状态转移概率矩阵P pij

m m

,其中pij表示从状态i转移

至状态j的概率。状态转移概率矩阵不但反映了各个状态之间的转移概率,还包含着股票指数跌涨的信息。比如,从状态i转移至状态j为跌,若有i j则为跌,若i j则为涨,i j时视为基本持平我们并不关心股指在某些状态间的涨跌,而主要关心其是涨幅大于跌幅,还是跌幅大于涨幅,从而把握股市的整体跌涨情况。

定义1:H hij

m m

为转移矩阵P的利空度矩阵,其中

hij sgn(j i) (j i)2 pij,(i,j 1,2, ,m),sgn(j i)表示j i的符号。

定义2:E(H) hij为转移矩阵P的利空度。

i 1j 1

mm

构造利空度矩阵元素sij的说明:符号sgn(j i)表示跌涨,若sgn(j i) 1,则股指从较高的状态i跌至较低的状态j;sgn(j i) 1,则股指从较低的状态i涨至较高的状态j;若sgn(j i) 0,则股指的状态没有发生转移。

6.2 利空度矩阵的分析步骤

⑴将股票指数划分为若干个状态,使每个交易日的指数属于其中的某一状态;或对指数的变化范围进行模糊状态的划分,使每个交易日的指数对应一个模糊状态向量。

⑵利用⑴中得到的状态序列计算状态转移概率矩阵;或利用⑴中得到的模糊状态向量序列计算模糊状态转移概率矩阵。需要特别指出的是,由于这里的转移概率矩阵是作为计算利空度矩阵的桥梁,故允许出现某行元素全部为0的情况。

⑶根据⑵中得到的状态转移概率矩阵或模糊状态转移概率矩阵计算利空度。

6.3 利空度矩阵的实证分析

本节仍以1997年1月2日至2002年12月31日各交易日的深证综指为分析对象。

首先,我们采用第3节中深证指数的状态划分方法(即按取值从低到高划分为4个状态),将指数序列转化为状态序列,得到1阶状态转移概率矩阵

数学建模,马尔科夫链,论文

00 0.96350.0365

0.03190.924300.0438 ,利用定义1中的公式,得利空度矩阵P 000.9830.017

00.10530.02390.8708 00.036500 0.0319000.1753 ,利空度E(H) 0.2480。说明从1997年初H 0000.0170

00.42110.02390 至2002年末,深证综指总体跌幅大于涨幅,据此可以判断,深市行情总体处于跌大于

涨。

我们再从另外一个角度验证上述结论,即改变深证指数的状态划分方法。采用第4节中的模糊状态划分法,将指数序列转化为模糊状态序列,进而得到1阶模糊状态转移

0 0.76750.23230.0001

0.19500.65780.14720 ,对应的利空度矩阵为概率矩阵P

0.00030.29830.55700.1444

000.12550.8745 00.23230.00050

00.14720 0.1950 ,利空度为E(H) 0.0956。同样得到“深H

0.0010 0.298300.1444

00.00020.12550 市行情总体跌大于涨”,的结论,说明两种状态划分方法得到的结论相同,但需要注意

的是,第2次得到的利空度虽然也取负值,但其绝对值0.0956小于第1次得到的利空度0.2480,说明在状态划分模糊的意义下,深证综指虽然总体处于跌落,但幅度并不明显。 此外,我们还想进一步了解在1997年1月2日至2002年12月31日的1444个交易日中,不同时段的深市行情各自有怎样的起伏特点。于是,我们将原来的1444平均分为三个时段,大体上1997年和1998年为第一时段,1999年和2000年为第二时段,2001和2002年为第三时段。不妨采用第3节中的模糊状态划分方法,记第i个时段的 利空度矩阵为Hi,相应的利空度为Li,(i 1,2,3),得如下计算结果:

Hi

00.25810.00010

00.02260 0.3795

0.0239 0.544000

0000

Li

1997~1998 (i 1)

0.6666

数学建模,马尔科夫链,论文

00.10540.00080

1999~2000 0.089600.17860

0.0003 0.2077 (i 2)00.2182

0 0.0002 0.15480 00.56590.00330

2001~2002 0.073100.25700

0.0002 0.3530 (i 3)00.0966

0 0.0002 0.09800

0.0505

0.3958

从上表可以看出,第一时段的利空度为负,即指数处于上涨状态,而后两个时段的利空度都为正,指数处于下跌状态,而由前面的分析结果,三个时段的整体利空度为 0.0956,说明是由于第一时段的跌幅过大,而后两个时段的涨幅过小,导致整体利空度为负,同时从另一个角度也说明,利空度只能判断股市整体的跌幅和涨幅的相对大小,不能判断股指究竟处于跌或涨的状态。否则,由利空度为 0.0956,我们作出股指趋于下跌的状态,而事实上,在最后的两段时期,股指还有一定幅度的上涨。

7 小结

至此,我们对各模型的特点作以下总结:

指数权马尔可夫链模型的主要特点有:一、预测结果为股价指数的状态(相当于一个取值范围),而非具体数值,因此,比较适合非点值的状态预测,且预测结果的可靠性较高。二、由于以各阶自相关系数为权重,并结合了各阶转移概率矩阵来预测指数状态,与只有一阶转移概率矩阵相比,能更充分地利用信息,同时也是对马尔可夫过程与相关分析相结合的预测方法的尝试。三、在对指数状态作划分时,处于两状态界限上的数值只能归属其中的一个状态,因此可能会给预测结果带来一定偏差。

加权模糊马尔可夫链模型是对状态划分模糊的马尔可夫链模型的改进。后者的主要特点是:以模糊化技术对指数状态进行划分,使每一指数值对应一模糊状态向量,从而预测结果也是预测期指数对应的模糊状态向量。这也是对指数权马尔可夫链模型的改进。但是,它在计算转移概率矩阵时,忽略了由于时间因素导致的数据重要程度的差别,而这正是加权模糊马尔可夫链模型的改进思路。改进后的模型依据“时间越远的数据对当前影响越小”这一思想,对不同时段的转移概率矩阵赋予相应权重,使加权求和得到的转移概率矩阵具有更高的精度。

指数权—加权模糊马尔可夫链模型综合了上述两种模型的优点。首先,它采用模糊状态划分法,克服了指数权马尔可夫链模型的缺陷。其次,它以指数序列的各阶自相关系数为权重,结合各阶转移概率矩阵,对预测期指数的模糊状态进行预测,达到了充分利用信息的目的。最后,它仿照加权马尔可夫链模型的思路,在估计各阶转移概率矩阵时,对不同时段的各阶转移概率矩阵也赋予了相应权重,体现了不同时段数据值对当前影响程度的差异。

利空度分析模型则进一步拓展了马尔可夫链模型的应用范围。它能同时给出股价指数的总体变动方向和变动大小的定量刻画,便于人们对一段时期内股价的涨落有总体的把握。

数学建模,马尔科夫链,论文

附录

1 指数序列的描述行统计分析结果

>> max(data) %指数序列的最大值 ans =

664.8500

>> min(data) %指数序列的最小值 ans =

305.8100

>> length(data) %指数序列的数据总数 ans =

1444

>> hist(data) %作指数序列的频数直方图

图2 1997.1.2至2002.12.31

深证综指日度数据的频数分布图

250

200

150

100

50

2 指数权马尔可夫链预测法程序代码(附带计算利空度矩阵)

fid=fopen('shenzheng.txt','r'); %读取数据 data=fscanf(fid,'%f'); status=fclose(fid);

for i=1:length(data) %将原始数据转化为状态数据 if data(i)>=305 & data(i)<395

数学建模,马尔科夫链,论文

Z(i)=1;

elseif data(i)>=395 & data(i)<485 Z(i)=2;

elseif data(i)>=575 & data(i)<665 Z(i)=3; else Z(i)=4; end end

P1=zeros(4);F1=zeros(4); %P1,P2,P3,P4分别为1、2、3、4步状态转移概率矩阵 P2=zeros(4);F2=zeros(4); %F1,F2,F3,F4分别为1、2、3、4步频数转移矩阵 P3=zeros(4);F3=zeros(4); P4=zeros(4);F4=zeros(4);

for i=1:length(Z)-1 %计算1步转移频数矩阵F1 switch Z(i) case 1

switch Z(i+1) case 1

F1(1,1)=F1(1,1)+1; case 2

F1(1,2)=F1(1,2)+1; case 3

F1(1,3)=F1(1,3)+1; case 4

F1(1,4)=F1(1,4)+1; end case 2

switch Z(i+1) case 1

F1(2,1)=F1(2,1)+1; case 2

F1(2,2)=F1(2,2)+1; case 3

F1(2,3)=F1(2,3)+1; case 4

F1(2,4)=F1(2,4)+1; end case 3

switch Z(i+1) case 1

F1(3,1)=F1(3,1)+1; case 2

F1(3,2)=F1(3,2)+1; case 3

F1(3,3)=F1(3,3)+1;

数学建模,马尔科夫链,论文

case 4

F1(3,4)=F1(3,4)+1; end case 4

switch Z(i+1) case 1

F1(4,1)=F1(4,1)+1; case 2

F1(4,2)=F1(4,2)+1; case 3

F1(4,3)=F1(4,3)+1; case 4

F1(4,4)=F1(4,4)+1; end end end

for i=1:4 %计算 for j=1:4

P1(i,j)=F1(i,j)/sum(F1(i,:)); end end

for i=1:length(Z)-2 %计算 switch Z(i) case 1

switch Z(i+2) case 1

F2(1,1)=F2(1,1)+1; case 2

F2(1,2)=F2(1,2)+1; case 3

F2(1,3)=F2(1,3)+1; case 4

F2(1,4)=F2(1,4)+1; end case 2

switch Z(i+2) case 1

F2(2,1)=F2(2,1)+1; case 2

F2(2,2)=F2(2,2)+1; case 3

F2(2,3)=F2(2,3)+1; case 4

F2(2,4)=F2(2,4)+1;

1步转移概率矩阵P1 2步转移频数矩阵F2

数学建模,马尔科夫链,论文

end case 3

switch Z(i+2) case 1

F2(3,1)=F2(3,1)+1; case 2

F2(3,2)=F2(3,2)+1; case 3

F2(3,3)=F2(3,3)+1; case 4

F2(3,4)=F2(3,4)+1; end case 4

switch Z(i+2) case 1

F2(4,1)=F2(4,1)+1; case 2

F2(4,2)=F2(4,2)+1; case 3

F2(4,3)=F2(4,3)+1; case 4

F2(4,4)=F2(4,4)+1; end end end

for i=1:4 %计算 for j=1:4

P2(i,j)=F2(i,j)/sum(F2(i,:)); end end

for i=1:length(Z)-3 %计算 switch Z(i) case 1

switch Z(i+3) case 1

F3(1,1)=F3(1,1)+1; case 2

F3(1,2)=F3(1,2)+1; case 3

F3(1,3)=F3(1,3)+1; case 4

F3(1,4)=F3(1,4)+1; end case 2

2步转移概率矩阵P2 3步转移频数矩阵F3

数学建模,马尔科夫链,论文

switch Z(i+3) case 1

F3(2,1)=F3(2,1)+1; case 2

F3(2,2)=F3(2,2)+1; case 3

F3(2,3)=F3(2,3)+1; case 4

F3(2,4)=F3(2,4)+1; end case 3

switch Z(i+3) case 1

F3(3,1)=F3(3,1)+1; case 2

F3(3,2)=F3(3,2)+1; case 3

F3(3,3)=F3(3,3)+1; case 4

F3(3,4)=F3(3,4)+1; end case 4

switch Z(i+3) case 1

F3(4,1)=F3(4,1)+1; case 2

F3(4,2)=F3(4,2)+1; case 3

F3(4,3)=F3(4,3)+1; case 4

F3(4,4)=F3(4,4)+1; end end end

for i=1:4 %计算 for j=1:4

P3(i,j)=F3(i,j)/sum(F3(i,:)); end end

for i=1:length(Z)-4 %计算 switch Z(i) case 1

switch Z(i+4) case 1

3步转移概率矩阵P3 4步频数转移矩阵F4

数学建模,马尔科夫链,论文

F4(1,1)=F4(1,1)+1; case 2

F4(1,2)=F4(1,2)+1; case 3

F4(1,3)=F4(1,3)+1; case 4

F4(1,4)=F4(1,4)+1; end case 2

switch Z(i+4) case 1

F4(2,1)=F4(2,1)+1; case 2

F4(2,2)=F4(2,2)+1; case 3

F4(2,3)=F4(2,3)+1; case 4

F4(2,4)=F4(2,4)+1; end case 3

switch Z(i+4) case 1

F4(3,1)=F4(3,1)+1; case 2

F4(3,2)=F4(3,2)+1; case 3

F4(3,3)=F4(3,3)+1; case 4

F4(3,4)=F4(3,4)+1; end case 4

switch Z(i+4) case 1

F4(4,1)=F4(4,1)+1; case 2

F4(4,2)=F4(4,2)+1; case 3

F4(4,3)=F4(4,3)+1; case 4

F4(4,4)=F4(4,4)+1; end end end

for i=1:4 %计算4步转移概率矩阵P4

本文来源:https://www.bwwdw.com/article/dhm4.html

Top