技术文章和通讯

探索风险蔓延使用图论和马尔可夫链

肯Deeley MathWorks


最近的金融危机和市场波动的时期风险意识的增强危机和系统性风险在金融分析师的圈子。因此,金融专业人士通常负责构建和分析模型,将产生了解的潜在影响风险投资,投资组合和业务操作。

几个作者所描述的使用先进的数学和统计技术对量化投资之间的依赖关系,外汇汇率,工业部门,或地理区域[1]- [7]。之间的鸿沟方面正式的方法和工作代码实现对分析师是一个关键的挑战。

这篇文章展示了MATLAB®可以用来分析方面使用各种数学工具的风险传染。主题包括:

  • 数据聚合、预处理和基准风险
  • 量化相关金融变量之间的关系
  • 可视化的网络依赖与邻近的信息(图1)
  • 使用隐马尔可夫模型分析的风险传染

下载本文的MATLAB脚本生活交互式访问所有的图像、方程和代码。现场脚本包含所有代码、输出方程,文章和图片。您可以下载脚本,打开它在MATLAB中,并探索在本文中描述的分析的步骤。

R2016a以上需要使用MATLAB实时编辑器。如果你没有R2016a,你可以下载一个免费试用

了解更多的MATLAB实时编辑器。

risk_fig1_w.jpg
图1所示。相关距离依赖网络工业的回报。

数据聚合和预处理

我们从一个中型集合不同国家的证券价格在2008年1月- 2013年12月。每个安全都有关联的元数据市值等工业部门,和国家。在本文中,我们将分析不同行业之间的传染,但很容易研究替代分组——例如,原产国。我们使用规范化的市场资本定义个人安全权重,然后聚合所有证券从每个部门使用加权和。结果是基准价格系列如图2所示。

risk_fig2_w.jpg
图2。基准价格系列的8个工业部门。

相关分析

最简单的方法之一来研究变量之间的依赖关系来计算数据的相关矩阵。使用MATLABplotmatrix函数和统计和机器学习的工具箱™相关系数函数,我们可以创建信息可视化显示的成对关系出现在部门返回系列数据。这些图表的例子如图3和图4所示。

图3中的非对角元素两两联合分布,和对角线显示每个变量的边际分布直方图。图4量化的相对强度成对线性关系如图3所示,说明工业部门之间的两两相关系数的回报。研究更一般的变量之间的单调关系,我们可以计算肯德尔的τ斯皮尔曼的ρ使用系数相关系数函数。

risk_fig3_w.jpg
图3。实证两两部门回报之间的关系。
risk_fig4_w.jpg
图4。线性相关系数的热图显示两两部门。用红色突出显示的相关性高于0.80。

可视化使用图论的依赖性

很难洞察风险传染直接从相关矩阵。应用图论是一种有效的技术来量化和可视化变量的距离。测量距离,我们将相关系数转换成距离等使用映射\ (f (C) = 1 - C \)或\ f (C) = \√{2 (1 - C)} \)

把工业部门分配给网络的节点,然后加入的节点通过边长度的相关距离。在[1]和[2],作者计算最小生成树这张图(MST)。是一个MST子图连接所有节点的总长度是最小化边缘。在这种情况下,我们可以认为MST“骨干”网络封装行业之间的依赖关系。我们可以使用MATLABminspantree函数计算MST直接:

图G = (sectorDist、行业);T = minspantree (G);

在这里,sectorDist相关矩阵和距离吗行业是一个单元阵列包含部门名称。

有几个选项可用于可视化结果MST。最简单的方法是使用图情节函数直接在树上。另一种方法提供一个2 d表示[1]是使用非线性多维定标的距离矩阵通过马斯映射:

坐标= mdscale (sectorDist 3“标准”,“马斯”);

创建一个二维可视化,我们通过的结果数组欧几里得坐标坐标情节方法:

情节(T, XData,坐标(:1),YData,坐标(2):,)

当结合一些简单的情节设置,这种方法使我们能够创建可视化图1所示。我们评估的质量图嵌入通过创建一个谢泼德图(图5)。如果分散点不大幅偏离参考线,然后我们有一个质量好的包埋。

risk_fig5_w.jpg
图5。谢泼德马斯嵌入距离与实际距离的阴谋。

使用图形中心措施评估部门的重要性

代表图中的数据形式帮助我们量化变量之间的关系。因为数学图形本质上提供节点意义的措施,我们可以通过计算这些量评估部门的重要性。我们使用中心方法与对象:

发病率=中心(T,“学位”);亲密=中心(T,‘亲密’,‘成本’,edgeWeights);中间性=中心(T,“中间状态”、“成本”,edgeWeights);

发病率节点的计数边相邻节点的数量,而亲密的倒数之和从节点到其他节点的距离。高亲密值因此意味着中央节点,或重要。类似地,中间状态节点的节点衡量经常出现在图中两个其他节点之间的最短路径。高中间性值意味着节点是非常重要的。

计算这些措施上面的MST生成结果如图6所示。我们看到所有的服务业最高的值的措施。中央服务节点以红色突出显示如图1所示。

risk_fig6_w.jpg
图6。从MST部门中心措施计算。

可视化风险传染通过滚动窗口

在前一节中描述的分析使用的全部数据集从2008 - 2013。是很常见的风险模型进行分析在滚动窗口以评估动态变化感兴趣的变量。实现连续6个月的滚动窗口的前面分析,我们使用一个为每个窗口循环增量开始日期。

从这个过程中可以获得图形使用一个视频文件VideoWriter类,显示高度相关的发病率(> 0.80)部门对随时间变化(图7)。

图8显示了中央部门随时间的变化。我们注意到服务、工业品和消费品行业有很高的重要性在这个时期。

risk_fig8_w.jpg
图8。中央节点的跟踪计算滚动窗口。

量化与替代距离指标的依赖关系

尽管相关简单的解释和计算,它可能没有描述的复杂本质完全金融变量之间的依赖关系。在[5]中,作者使用了一个基于统计指标熵和互信息理论的概念。如果\ (f_X \)是一个随机变量的概率密度函数\ \)(X,然后熵\ (X \)

\ [H_X = - \ int f_X (x) \ log f_X (x) \ mathrm {d} x \]

我们可以把熵作为衡量的障碍,或随机性的变量。高的熵表示高度的障碍。同样的,如果我们有两个随机变量\ (X \)和联合密度\ \ (Y \) (f {X, Y} \),然后相互熵\ (X \)和\ (Y \)

\ [H_ {X, Y} = - f {X, Y} \ iint日志f (X, Y) \ {X, Y} (X, Y) \ mathrm X \ d {} mathrm {d} Y \]

互信息内容\ (X \)和\ (Y \)被定义为

\ [I_ {X, Y} = H_X + H_Y——H_ {X, Y} \]

使用互信息可以转化为距离公式

\ [d_ {X, Y} = 1 - \√{1 - e ^ {2 i_ {X, Y}}} \]

注意,最大距离是1。这个结果只是实现的互信息内容\ (X \)和\ (Y \)为零,而反过来,只发生如果\ (X \)和\ (Y \)是独立的[5]。如果\ (X \)和\ (Y \)是密切相关的,那么他们的互信息内容大,因此,距离是接近于零。

我们可以估计两个随机变量的联合密度在使用统计和机器学习MATLAB工具箱函数ksdensity。这种技术的优点是避免任何对数据分布的假设。

假设\ (X \)和\ (Y \)返回系列有两个领域,计算示例代码\ (H_ {X, Y} \)如下:

x = linspace (min (x)、马克斯(x), 250);y = linspace (min (y), max (y), 250);[Xgrid, Ygrid] = meshgrid (x, y);分= [Xgrid (:), Ygrid (:));fXY = ksdensity ((X, Y),分);fXY =重塑(fXY、大小(Xgrid));integrandXY = fXY。*日志(fXY);integrandXY (isnan (integrandXY)) = 0;HXY = - trapz (y, trapz (x, integrandXY, 2));

这段代码估计的联合密度\ (X \)和\ (Y \)在250 x250点阵,然后计算二重积分定义\ (H_ {X, Y} \)使用trapz函数执行数字梯形集成。一些值发生在被积函数如果估计值\ (f {X, Y} \)为零。我们将这些整合之前为零。

图9显示了估计的联合密度第一两个行业,原材料和消费品。

risk_fig9_w.jpg
图9。估计前两个工业部门联合密度函数。

我们用类似的方法来估计\ (H_X \) \ (H_Y \),然后计算信息距离\ (d_ {X, Y} \)。估计联合密度函数在一个细格子可以是一个耗时的过程,所以我们使用parfor构造并行计算工具箱™并行估计两两距离矩阵,这需要nSector (nSectors-1) / 2不同的距离来计算。图10显示了生成的MST计算使用距离度量的信息。始终与前面的分析,中央部门服务,用红色突出显示在图10所示。

risk_fig10_w.jpg
图10。MST计算使用距离度量的信息。

使用隐马尔可夫模型建模风险传染

从描述性分析建模时,几个作者使用统计技术,如隐马尔可夫模型(见,例如,[6])。回到滚动窗口分析,我们认为高度相关部门对的数量是一个基本的代理级别的风险传染出现在市场。

为简单起见,我们假设三个潜在的,未被注意的风险传染的水平,我们的名字“低”,“中”,“高”构成了一个隐藏的马尔可夫链。我们观察到的排放顺序的马尔可夫链高度相关部门对的数量,这可以从0到28。

图11显示了观测数据在时间期间2008 - 2013。我们看到,有几个高蔓延时期,以不同的速率和高传染似乎消散。下面的图表显示的顺序排放转换——也就是说,高度相关的数量的差异对从一个窗口到另一个。

risk_fig11_w.jpg
图11。观察序列高度相关部门对和排放转换。

统计和机器学习工具箱提供了一个框架构造隐马尔可夫模型。估计状态和排放转换矩阵,我们使用hmmtrain功能,提供初始猜测TR新兴市场对未知的矩阵:

[estTR, estEM] =hmmtrain(排放、TR、EM);

检查的可靠性估计矩阵,我们可以在排放的子集向量旨在确保算法收敛于相同的矩阵。图12显示了马尔可夫链的数据可视化在图11。表1显示,仍有高概率的相同的状态,和小但不平凡的过渡的概率水平向上或向下。有一个微不足道的机会转变上下两层在一个步骤。

状态 媒介
0.964 0.036 0.000
媒介 0.107 0.833 0.060
0.000 0.035 0.965

表1。使用马尔可夫链转移概率计算hmmtrain

risk_fig12_w.jpg
图12。隐藏的马尔可夫链状态图。

hmmviterbi回顾函数估计最可能的序列的状态:

州= hmmviterbi(排放,estTR、estEM…Statenames,{“低”,“中等”,“高”})。”;

我们也计算后验概率使用状态hmmdecode:

pstates = hmmdecode(排放,estTR estEM)。”;

表结果提供洞察市场环境在历史时期(图13)。第二列包含的输出状态hmmviterbi和列3 - 5包含后状态概率hmmdecode。同样的,我们了解这个模型通过比较可能状态的疗效与观察到的市场数据(图14)。

risk_fig13_w.jpg
图13。表隐马尔可夫模型的结果分析。
risk_fig14_w.jpg
图14。马尔可夫链状态和观察到的市场数据。

总结和下一步

了解系统性风险需要仔细的建模和分析。在本文中,我们的技术实现量化金融变量之间的距离,包括相关性和信息距离。我们已经看到如何使用图论想象距离信息。量化和可视化变量之间的关系是很重要的探索性数据分析阶段。搬到建模阶段,我们创建了一个简单的模型对风险传染通过拟合观测数据的隐马尔可夫模型。

将本文中描述的技术,包括其他方面的系统性风险在我们的分析中,我们可以利用先进的模型可以在其他MATLAB工具箱,包括:

  • 在计量经济学时间序列和状态空间模型(工具箱™)
  • 市场和信用风险模型(在金融工具箱™)
  • 仪器定价功能(在金融工具的工具箱™)

2016 - 92983 v00出版

引用

  1. Resovsky烫发,丹尼斯•霍弗拉基米尔•Gazda和玛丽安娜Sinicakova,“最小生成树应用在货币市场”,外汇市场,7/2013https://www.nbs.sk/_img/documents/_publik_nbs_fsr/biatec/rok2013/07-2013/05_biatec13-7_resovsky_en.pdf

  2. McDoland,马克,俄梅珥Suleman,斯泰西·威廉姆斯,杰夫,和尼尔·f·约翰逊,“检测使用外汇货币的主导地位或依赖网络树”,https://arxiv.org/abs/cond-mat/0412411

  3. 欧阳,红兵和刘天主教徒,一个系统性的重要性和系统性风险传染机制的分析中国的金融机构基于网络分析,红兵欧阳,天主教徒,CMS, 2015年第23节(10):30-37

  4. 罗莉,会,会德马西Ovidiu诉Precup Giampaolo Gabbi,圭多Caldarelli,”意大利隔夜货币市场”的网络分析,经济部门的讨论文件系列,05/05https://www.city.ac.uk/__data/assets/pdf_file/0017/90260/0505_iori-et-al.pdf

  5. 资产管理岩石,哈坎,“偏心”《网络理论在金融领域,卷1,1号(https://www.jbs.cam.ac.uk/faculty-research/centres/risk/)

  6. 杰里米•Staum C。,和Ming Liu Staum,”Systemic Risk Components in a Network Model of Contagion”,2012年1月。可以在SSRN:https://ssrn.com/abstract=1726107

  7. Bisias,迪米特里,马克洪水,安德鲁·w·罗和Valavanis,系统性风险的调查分析,金融研究办公室,工作论文# 0001,2012年1月5日https://financialresearch.gov/working-papers/files/OFRwp0001_BisiasFloodLoValavanis_ASurveyOfSystemicRiskAnalytics.pdf

查看相关文章的能力

为相关行业观点文章