ewma模型的特点（ecm模型有何优点？）

大家好，我是讯享网，很高兴认识大家。

讯享网

MEA

在第一篇推文中，我们提到了数学模型在预测天气和股市分析中的应用。那么，具体应该如何利用这些模型进行预测呢？

(/^▽^)/点此跳转第一篇推文(^▽^)

这里我们引入一个重要的工具——马尔可夫链。让我们先来了解一下它的定义吧！

MEA

马尔可夫链是什么？

马尔可夫链是概率论和数理统计中具有马尔可夫性质且存在于离散的指数集和状态空间内的随机过程。

简单来说，马尔可夫链就是一系列随机变量

组成的一个数列，其中每个变量的值 表示在时间  的状态，且满足给定当前状态时，未来状态的概率分布只与当前状态相关，而与过去的状态无关。即，若  对于过去状态的条件概率分布仅是  的一个函数，则称该随机过程为马尔可夫链。用数学公式来描述就是

定

义

MEA

马

尔可夫链

Markov 

Chain

为了更直观地理解马尔可夫链，我们可以举一个常见例子——化简的天气预测：若今天是晴天，则明天是晴天的概率为0.9，是阴天的概率为0.1；若今天是阴天，则明天是晴天的概率为0.4，是阴天的概率为 0.6。假设明天天气不受前天天气影响，那么这就是一个典型的马尔可夫链。

我们可以用转移概率矩阵  来描述以上的条件。矩阵的每一个元素  表示从状态转移到状态的概率，即 ，由此我们得到转移概率矩阵：

注

意

这里需要注意的是，由于概率矩阵  的每一行都表述了从一个特定状态转移到其他所有可能状态的概率，故它的和为1。

我们假设晴天为状态1，阴天为状态2，那么有转移概率:

此时 ，转移概率矩阵为：

MEA

知道了马尔可夫链模型的转移概率矩阵，接下来我们讨论一下他的其中一个重要性质——稳态性质。

假设今天天气的概率分布是 [0.7, 0.3] ，即 70% 概率的晴天， 30% 概率的阴天。以这个状态作为序列概率分布的初始状态 t₀ 将其代入转移概率矩阵计算t₁ , t₂ , t₃ , …的情况，代码如下：

import numpy as npmatrix = np.matrix([[0.9,0.1],[0.4,0.6]],dtype = float)vector = np.matrix([[0.7,0.3]],dtype = float) for i in range(100):vector = vector * matrix print(“round”, i+1)print(vector)

讯享网

部分输出结果如下：

讯享网round 1[[0.75 0.25]]round 2[[0.775 0.225]]round 3[[0.7875 0.2125]]round 4[[0.79375 0.20625]]round 5[[0. 0.]]…round 24[[0. 0.]]round 25[[0.8 0.2]]round 26[[0.8 0.2]]…round 99[[0.8 0.2]]round 100[[0.8 0.2]]

MEA

不难发现，从第25轮开始，概率分布就一直保持在 [0.8, 0.2] ，即 80% 概率的晴天， 20% 概率的阴天。这会是一个巧合吗？

接下来我们更改初始状态为 [0.5, 0.5]  ，再次执行后，部分输出结果如下：

round 1[[0.65 0.35]]round 2[[0.725 0.275]]round 3[[0.7625 0.2375]]round 4[[0.78125 0.21875]]round 5[[0. 0.]]…round 25[[0. 0.]]round 26[[0.8 0.2]]round 27[[0.8 0.2]]…round 99[[0.8 0.2]]round 100[[0.8 0.2]]

尽管我们更改了初始状态，最终状态的概率分布依旧趋向于 [0.8, 0.2]  ，也就是说，马尔可夫链模型的转移概率矩阵收敛到的稳定概率分布与初始状态无关。因此，我们可以得出结论：马尔可夫链中，如果转移概率矩阵满足一定的条件（例如，是正则的，即矩阵的每一行元素之和为1，且矩阵中不存在全为零的行），那么无论初始状态如何，经过足够多的状态转移后，系统的状态分布都会趋向于一个固定的分布，这个分布称为稳态分布。

MEA

介绍完马尔可夫链，我们来讲讲它在实际生活中的应用——PageRank算法。PageRank是由谷歌联合创始人拉里·佩奇和谢尔盖·布林在1998年提出的一种网页排名算法。该算法的核心思想是利用互联网网页之间的链接关系，评估每个网页的重要性或权威性。

假设有一个随机浏览者浏览任意一个网页，当他浏览这个网页时，点击当前网页上的链接跳转到下一个网页的概率为  ，随机跳转到任意网页的概率为  。经过足够长的时间后，该浏览者停留在某个网页的概率就是该网页的PageRank值。由于跳转到下一个网页的概率分布只与该网页有关，而与上一个网页无关，符合马尔可夫性质，而所有网页构成了马尔可夫链的状态空间，现在我们利用马尔可夫链来计算PageRank值