离散时间马尔可夫链
离散时间马尔可夫链是什么?
考虑随机过程中值状态空间。一个马尔可夫过程进化的方式是独立的路径,导致当前状态。也就是说,当前状态包含所有必要的信息来预测未来路径的条件概率。这被称为特征马尔可夫性质。虽然一个马尔可夫过程是一种特定类型的随机过程,它广泛用于建模更改的状态。马尔可夫过程的特殊性导致了一个相对完整的理论。
马尔可夫过程可以用不同的方法限制,导致越来越简洁的数学公式。下列条件的限制。
状态空间可以被限制在一个离散集。这是指示性的特征马尔可夫链。马尔可夫转移概率的财产“链接”链中的每个状态。
如果状态空间是有限的,链有限状态。
如果进程的发展在离散时间的步骤中,链离散时间。
如果马尔可夫性质是长期有效的,链均匀。
计量经济学的工具箱™包括dtmc
模型对象代表一个有限状态离散时间齐次马尔可夫链。即使有限制,dtmc
对象具有很大的适用性。它足够健壮的服务在许多建模场景在计量经济学,数学理论是适合MATLAB矩阵代数®。
有限状态马尔可夫链有双重理论:一个在矩阵分析,另一个在离散图形。对象的功能dtmc
对象突出这种二元性。函数允许您数值和图形表示形式之间来回移动。您可以使用工具最适合特定方面的调查。特别是,传统的特征值方法确定转移矩阵的结构是跟踪与可视化的进化链通过其关联的有向图。
任何马尔可夫链的一个关键特性是其限制的行为。这个特性在计量经济学应用程序尤其重要,模型的预测性能取决于它的随机组件都有一个定义良好的分布、渐近。对象的功能dtmc
对象允许您调查的瞬态和稳态行为链和编制了一个独特的属性限制。其他函数计算极限分布估计的收敛率,或混合时间。
模拟一个合适的马尔可夫链的基本随机过程是应用程序的基础。模拟可以采取的形式生成一个随机序列的状态转换从一个初始状态或从整个分布的时间演化的状态。仿真允许您确定一个链的统计特征,可能不是很明显的规范或理论。在计量经济学,马尔可夫链成为更大的组件状态变换模型,代表了经济环境的变化。的dtmc
对象包括函数模拟和可视化马尔可夫链的时间演化。
离散时间马尔可夫链理论
任何有限状态离散时间齐次马尔可夫链可以表示,在数学上,通过它n——- - - - - -n转移矩阵P,在那里n的状态数,或有向图D。虽然两个表示equivalent-analysis中执行一个域导致等效二的结果相当大的差异分析问题的概念和产生的算法解决方案。金宝搏官方网站这种二分法是最好的说明了比较理论的发展[7]例如,发展[6]和[9]。或者,使用MATLAB,二分法可以通过比较算法的基础上图
对象及其功能与矩阵分析的核心功能。
有限状态过程的完全图边缘和每个节点之间的转移概率我和其他节点j。节点代表状态的马尔可夫链。在D如果矩阵的条目Pij是0,那么边缘连接状态我和j是删除。因此,D只显示可行的状态之间的转换。同时,D可以包括self-loops表明非零概率P二世的过渡状态我回到本身。Self-transition概率被称为状态惯性或持久性。
在D,一个走国家间的我和j是连接状态的序列开始的吗我结束j,至少两个。一个路径散步不重复。一个电路是走的我=j,但没有其他重复的国家存在。
状态j是可获得的,或可访问的,从状态我,表示 ,如果有一个走我来j。美国沟通,表示 ,如果每个可从其他连接。交流是状态空间上的等价关系,划分成通信类。在图论中,州被称为通信强连通分量。马尔可夫过程,单个国家的重要属性是由所有其他国家共享通信类,所以成为类本身的属性。这些属性包括:
递归式——从所有国家可获得的属性是可获得的。这个属性相当于一个渐近回报的概率等于1。每个链都有至少一个周期性的类。
无常——不复发的性质,也就是说,访问的可能性没有返回的状态。这个属性相当于一个渐近的概率返回0。类与无常对渐近行为没有影响。
周期性——骑自行车在多个子类的属性在类和留住一些内存的初始状态。的最大公约数的状态是所有电路的长度包含状态。州或类1期非周期。Self-loops各州确保非周期性和形成的基础懒惰的链。
连锁作为一个整体的一个重要属性不可约性。链是不可约如果链由一个通信类。状态或类属性成为整个链的性质,简化了描述和分析。泛化是一个unichain,这是一个链组成的一个经常性类和任意数量的瞬态类。重要的渐近分析相关可以集中在复发性类。
一个浓缩图,它是由每个类的国家整合为一个supernode,简化视觉对整体结构的理解。在这个图中,单一定向边缘之间的出错导致C1和C2对应于类之间的独特的转型方向。
凝聚图显示,C1是瞬态和C2是复发。C1的出度是积极的,这意味着无常。因为C1包含自身环,非周期。C2是定期与一段3。单一国家的three-cycle C2,在更一般的周期类,子类进行沟通。链是一个可约unichain。想象一个定向边缘C2 C1。在这种情况下,C1和C2是通信类,他们崩溃成一个单一的节点。
遍历性,一个理想的属性,结合了不可约性和非周期性和担保统一限制行为。因为不可约性在本质上是一个连锁的属性,不是一个类属性,遍历性连锁性质。unichains一起使用时,遍历性意味着独特的复发性类是遍历。
这些定义,可以总结最根本的存在性和唯一性定理1×——有关n平稳分布 ,在那里 。
如果P是正确的随机吗 总是有一个概率向量的解决方案。因为每一行P总结,P有权利的特征值特征向量。具体地说,e= 1n,一个n1的向量。所以,P也有一个左特征向量 的特征值。由于Perron-Frobenius定理, 是负的,可以标准化生产一个概率向量。
当且仅当是独一无二的呢P代表一个unichain。一般来说,如果一个链包含k复发性类,π*=π*P有k线性独立的解决方案。金宝搏官方网站在这种情况下,P米收敛, ,但不相同的行。
每一个初始分布π0收敛于 当且仅当P表示一个遍历unichain。在这种情况下, 是一个极限分布。
Perron-Frobenius定理的结果是一组与非负的特征值,不可约矩阵。应用马尔可夫链,结果可以概括如下。对于一个有限状态unichain,P有一个特征值λ1= 1 (Perron-Frobenius特征值)和一篇非负左特征向量 (可以归一化概率向量)和右特征向量e= 1n。另一个特征值λ我满足 ,我= 2,…n。如果unichain或唯一的复发性类unichain非周期,不平等是严格的。当有周期性的时期k,有k特征值在单位圆k根的团结。如果unichain遍历P米渐近收敛于 作为 。误差趋于0至少一样快 ,在那里λ年代是第二大特征值的大小和问的多重性λ年代。
收敛的速度 取决于第二大特征值模(SLEM) 。可以表达的光谱的差距,这是 。大差距产生更快的收敛。的混合时间是一个特征时间偏离平衡,总变异距离。因为收敛指数,是一个混合时间衰变的一个因素e1是
鉴于收敛定理,混合时间应该被遍历unichains的上下文中。
相关定理理论的非负不可约矩阵给方便特征一致收敛的两个重要属性:还原性和遍历性。假设Z是指示器或零模式的P,即矩阵的非零项P。然后,P是不可约当且仅当所有条目的 是积极的。Wielandt定理[11]州P遍历当且仅当所有条目的P米是积极的 。
Perron-Frobenius定理及相关非建设性的平稳分布的结果 。有几种方法计算的极限分布的遍历链。
定义返回时间T二世州我最小数量的步骤回到状态我后开始在国家我。此外,定义平均恢复时间τ二世的期望值T二世。然后, 。这个结果有更直观的内容。个人平均混合时间可以估计蒙特卡罗模拟。然而,模拟和评估的困难收敛的开销,使蒙特卡罗模拟不切实际的一般方法。
因为P米方法与所有行等于一个矩阵 作为 ,任何一行的“高功率”P接近π*。虽然这个方法很简单,它包括选择适当收敛宽容和大米为每个p .一般来说,混合时间分析的并发症也使这个计算不切实际。
线性系统 可以增强与约束 形式 ,1n——- - - - - -n是一个n——- - - - - -n矩阵的。使用约束,这个系统
系统可以有效地解决与MATLAB反斜杠符是数值稳定的,因为遍历P沿着主对角线(否则不能拥有的P将可约)。该方法建议[5]。
因为 独特的左特征向量与Perron-Frobenius相关特征值的P、分类特征值和相应的特征向量识别 。因为约束 不属于特征值问题, 需要规范化。该方法利用MATLAB的强大的数字
eigs
函数和方法实现的渐近
目标函数的dtmc
对象。
对于任何马尔可夫链,a说法分析可以建议其渐近性质和混合率。说法分析包括这些数量的计算:
的击中概率 的概率是打过状态子集的状态吗一个(目标),从状态我在链。明确,击中概率显示哪些国家可以从其他国家; > 0意味着目标一个是可以从状态我。如果 = 0,目标一个是遥不可及的状态我,这意味着国家我是远程为目标。如果一个形成一个经常性的类, 是吸收概率。
的预计首中时 是长期平均数量达到所需的时间步骤一个第一次,从状态我。 =∞意味着下列备选方案之一:
起始状态我是远程为目标一个。
起始状态我是remote-reachable为目标一个;也就是说, > 0, > 0,B是一个反复出现的类不包含任何国家吗一个。
如果一个形成一个经常性的类, 是预期的吸收时间。
一个向量的撞击概率或预期第一次为目标,从每个州在一个马尔可夫链,提出的混合率链。
引用
[1]Diebold, F.X.,一个d G.D. Rudebusch.商业周期:持续时间、动态和预测。普林斯顿,纽约:普林斯顿大学出版社,1999年。
[2]Gallager, R.G.随机过程:理论的应用。英国剑桥:剑桥大学出版社,2013年。
[3]Gilks, w·R。,S. Richardson, and D.J. Spiegelhalter.在实践中马尔可夫链蒙特卡洛。波卡拉顿:查普曼和大厅/ CRC, 1996。
[4]Haggstrom, O。有限马尔可夫链和算法的应用程序。英国剑桥:剑桥大学出版社,2002年。
[5]汉密尔顿,詹姆斯D。时间序列分析。普林斯顿,纽约:普林斯顿大学出版社,1994年。
[6]角,R。,一个d C. R. Johnson.矩阵分析。英国剑桥:剑桥大学出版社,1985年。
[7]贾维斯,j . P。,一个d D. R. Shier. "Graph-Theoretic Analysis of Finite Markov Chains." In应用数学建模:一个多学科的方法。波卡拉顿:CRC出版社,2000年。
[8]Maddala, g S。,一个d I. M. Kim.单位根、协整和结构性变化。英国剑桥:剑桥大学出版社,1998年。
[9]蒙哥马利,J。社会系统的数学模型。未出版的手稿。社会学、威斯康星大学麦迪逊分校,2016年。
[10]诺里斯,j . R。马尔可夫链。英国剑桥:剑桥大学出版社,1997年。
[11]Wielandt, H。主题分析的矩阵理论。课堂讲稿由r·迈耶。数学系,威斯康星大学麦迪逊分校,1967年。