主要内容

利用极值理论和介体对市场风险进行评估

这个例子展示了如何建模假设的全球股票指数投资组合的市场风险与蒙特卡洛模拟技术利用学生的t接合部和极值理论(EVT)。首先提取过滤过程从每个回归残差系列非对称GARCH模型,然后构造样本边际累积分布函数(CDF)每个资产使用高斯核估计的内部和广义帕累托分布(加仑日)估计上下尾巴。学生的t接合部是那么适合模拟之间的数据和用于诱导相关残差的资产。最后,仿真评估假设的风险价值(VaR)全球股票投资组合在一个月的地平线。

注意,这是一个相对先进,全面的例子,假设一些熟悉EVT和连系动词。详情关于广义帕累托分布和介体模拟,估计看到尾部造型与广义帕累托分布数据使用介体模拟相关的随机变量在统计和机器学习的工具箱™。细节关于这个例子的方法大多数是基础,明白了[5][6])。

检查每日关闭全球股票指数的数据

日常关闭的原始数据包括2665个观测值以下代表股票指数生成交易日期27 - 4月- 1993年7月14 - - 2003:

加拿大:TSX综合(股票^ GSPTSE):法国CAC - 40(股票^ FCHI):德国DAX指数(股票^ GDAXI)日本:日经225指数(股票^最高峰英国富时100指数(股票^富时):标准普尔500指数(股票^ GSPC”)
负载Data_GlobalIdx1%每日进口指数关闭

下面的情节说明了每个指标的相对价格变动。每个索引的初始水平已经标准化的统一促进相对性能的比较,并没有明确考虑股息的调整。

图绘制(日期、ret2price (price2ret(数据)))datetick (“x”)包含(“日期”)ylabel (的索引值)标题(“相对日常指标关闭”)传说(系列,“位置”,“西北”)

在准备后续的建模中,每个指数的收盘水平转换为每日对数返回(有时称为几何,或不断加剧,返回)。

回报= price2ret(数据);%对数返回T =大小(回报,1);% #的回报(即。,historical sample size)

以来的第一步的整体建模方法需要重复应用GARCH过滤和极值理论来描述每个股票指数的分布返回系列,它有助于检查细节对一个特定的国家。你可以改变下一行的代码的任何整数集合{1,2,3,4,5,6}检查任何索引的详细信息。

指数= 1;% 1 =加拿大、法国2 = 3 =德国,4 =日本、英国5 = 6 =图绘制(日期(2:结束),返回(:,指数))datetick (“x”)包含(“日期”)ylabel (“返回”)标题(“每日对数收益”)

为每个索引过滤返回

建模一个分布的尾巴大约一加仑日需要观察独立同分布(先验知识)。然而,大多数经济回报系列表现出某种程度的自相关,更重要的是,异方差性。

例如,样本自相关函数(ACF)返回与所选指标揭示了一些轻微的序列相关性。

图autocorr(返回(:,指数))标题(“样本ACF的回报”)

然而,样本ACF的平方返回说明了持久性的程度差异,和表明GARCH建模可能显著条件数据用于后续尾估计过程。

图autocorr(返回(:,指数)。^ 2)标题(“方返回的样本ACF”)

产生一系列i.i.d.观察,符合一阶自回归模型的条件意味着每个股票指数的回报

$ $ r_t = c + \θr_ {t - 1} + \ epsilon_t $ $

条件方差和非对称GARCH模型

$ $ \ασ^ 2 _t = \ kappa + \ \σ^ 2 _ {t - 1} +φ\ \ε^ 2 _ {t - 1} + \ psi (\ epsilon_ {t - 1} < 0] \ε^ 2 _ {t - 1} $ $

一阶自回归模型补偿自相关,而GARCH模型弥补了异方差性。特别是最后一项包含了不对称布尔(杠杆)方差的指示器,1如果之前模型剩余价值是负和0(见[3])。

此外,每个指标的标准化残差建模作为一个标准化的学生弥补脂肪的t分布尾巴常与股票回报。这是

$ $ z_t = \ epsilon_t / \ sigma_t $ $ i.i.d.分布式t(\ν)$ $ $ $

下面的代码段提取过滤剩余工资和条件方差的每个股票指数的回报。

模型= arima (基于“增大化现实”技术的南,“分布”,“t”,“方差”gjr (1,1));nIndices =大小(数据,2);% #的指数残差=南(T, nIndices);% preallocate存储方差=南(T, nIndices);适合=细胞(nIndices, 1);选择= optimoptions (@fmincon,“显示”,“关闭”,“诊断”,“关闭”,“算法”,“sqp”,“TolCon”1 e);i = 1: nIndices适合{我}=估计(模型、收益(:,我)“显示”,“关闭”,“选项”、选择);(残差(:,i)、方差(:,我)]=推断(适合{我},返回(:,我));结束

为选定的指数,比较模型残差和相应的条件标准差过滤从原始的回报。图中清晰地显示出较低的变化波动(异方差性)出现在过滤后的残差。

图次要情节(2,1,1)情节(日期(2:结束),残差(:,指数))datetick (“x”)包含(“日期”)ylabel (“残留”)标题(过滤后的残差的次要情节(2,1,2)情节(日期(2:结束),sqrt(方差(:,指数)))datetick (“x”)包含(“日期”)ylabel (“波动”)标题(“过滤条件标准差”)

从每个过滤模型残差返回系列,标准化残差的相应条件标准差。这些标准化残差代表底层零均值,unit-variance i.i.d.系列的EVT估计样本提供的反面。

残差=剩余工资。/√(差异);

结束这一节,检查标准化残差和的平方的acf标准化残差。

比较的标准化残差的acf相应的原始返回表明acf标准化残差现在大约先验知识。,从而更适合后续尾估计。

图autocorr(残差(:,指数))标题(样本ACF的标准化残差的)图autocorr(残差(:,指数)^ 2)标题(标准化残差平方的ACF样本)

估计Semi-Parametric CDFs

考虑到标准化,从上一步i.i.d.剩余工资,估计每个索引的经验提供高斯内核。这消除了CDF估计消除楼梯未平滑样本CDFs的模式。尽管内核提供非参数估计非常适合的内部分布的数据发现,它们往往表现不佳时应用于上、下尾巴。为了更好地估计分布的尾部,EVT适用于那些落在每一个尾巴的残差。

具体来说,找到上下阈值,10%的残差是留给每一个尾巴。然后适应这些极端的残差的数量在每个尾下降超过相关的阈值由最大似然参数加仑日。这种方法通常被称为超过数点的分布峰值超过阈值方法。

鉴于每个超过数点尾巴,优化负对数似函数来估计尾指数(ζ)和规模(β)加仑日的参数。

下面的代码段创建的对象类型paretotails为每个索引返回系列,一个这样的对象。这些paretotails对象封装参数的估计医生低尾巴,非参数kernel-smoothed室内,参数GP上尾巴来构造复合semi-parametric提供为每个索引。

结果分段分布对象允许插值在运作的内部和外推(评估)的函数在每一个尾巴。外推法是非常可取的,允许分位数估计在历史记录,和对风险管理应用程序都是非常宝贵的。

此外,帕累托尾对象还提供评估提供方法和逆CDF(分位数函数)和查询的累积概率和分位数之间的界限的每段分段分布。

nPoints = 200;% #每个区域的采样点CDFtailFraction = 0.1;%小数的剩余工资分配给每一个尾巴尾巴=细胞(nIndices, 1);%帕累托尾对象的单元阵列i = 1: nIndices尾巴{我}= paretotails(残差(:,我),tailFraction, 1 - tailFraction,“内核”);结束

估计有三个不同的区域复合semi-parametric经验提供的图形连接并显示结果。再次,注意上下尾区域,显示在红色和蓝色,分别适合推断,而kernel-smoothed内部,人们在黑色的、适合插值。

下面的代码调用CDF实验组和逆CDF帕累托尾的方法感兴趣的对象与数据以外的合适的。具体来说,引用的方法获得安装状态,并且现在调用选择和分析特定区域的概率曲线,作为一个强大的数据过滤机制。

图保存网格minProbability = cdf(反面{指数},(最低(残差(:,指数))));maxProbability = cdf(反面{指数},(max(残差(:,指数))));pLowerTail = linspace (minProbability tailFraction nPoints);%样本低尾pUpperTail = linspace (1 - tailFraction, maxProbability nPoints);%样本上的尾巴1 - tailFraction pInterior = linspace (tailFraction, nPoints);%样本内部情节(icdf(反面{指数},pLowerTail) pLowerTail,“红色”,“线宽”2)图(icdf(反面{指数},pInterior) pInterior,“黑”,“线宽”2)图(icdf(反面{指数},pUpperTail) pUpperTail,“蓝”,“线宽”(2)包含标准化的剩余的)ylabel (“概率”)标题(“经验提供”)({传奇“帕累托低尾”内核内部平滑的“帕累托上尾巴”},“位置”,“西北”)

评估加仑日装

虽然前面的图表说明了综合运作,它是有益的更详细地检查加仑日配合。

GP的CDF实验组的分布参数化

$ $ F (y) = 1 -(1 + \ζy / \β)^{1 / \ζ},y # 62; = 0, \β# 62;0 \ζ# 62;-0.5美元美元

超过数点(y),尾指数参数(ζ)和尺度参数(β)。

视觉评估加仑日健康,情节上尾巴的经验提供超过数点的残差随着CDF加仑日安装。尽管只有10%的标准化残差,密切关注超过数拟合分布数据,所以加仑日模型似乎是一个不错的选择。

图(P, Q) =边界(反面{指数});%的累积概率与分位数的界限y =排序(残差(残差(:,指数)> Q(2),指数)- Q (2));%超过数点排序情节(y) (cdf(反面{指数},y + Q (2)) - P (2)) / P (1)) (F (x) = ecdf (y);%经验提供持有楼梯(x, F,“r”网格)传奇(拟合广义帕累托提供的,“经验提供”,“位置”,“东南”);包含(“超过数”)ylabel (“概率”)标题(标准化残差的尾巴上)

校准t连系动词

鉴于标准化残差,现在估计标量参数的自由度(自由度)和线性相关矩阵(R)的t联结使用copulafit函数的统计和机器学习工具。的copulafit函数允许用户估计的参数t介体由两种不同的方法。

默认的方法是一种正式的最大似然方法中执行一个两步的过程。

具体来说,尽管完整的对数似可以直接最大化,最大的目标函数通常发生在很长一段,平坦,在多维空间狭窄的山谷,收敛困难可能出现在高维度。为了克服这些困难,copulafit执行最大似然估计(企业)两个步骤。内一步最大化对数似对线性相关矩阵,给出一个固定值的自由度。条件最大化是放置在一个一维最大化的自由度,从而最大化对数似在所有参数。函数在这外一步最大化被称为概要对数似自由度。

相比之下,下面的代码段使用另一种接近配置文件为自由度参数对数似大样本大小。虽然这种方法通常明显高于大中型企业,应小心使用,因为估计和置信区间为小型或中等样本大小可能并不准确。

具体来说,近似推导出微分对数似函数对线性相关矩阵,假设自由度是一个固定的常数。然后解决由此产生的非线性方程迭代相关矩阵。反过来,这个迭代是嵌套在另一个优化估计自由度。该方法在精神上面的概要对数似方法类似,但不是一个真正的大中型企业,相关矩阵不收敛到有条件的大中型企业对于一个给定的自由度。然而,对于大样本大小的估计往往非常接近大中型企业(见[1][7])。

另一个方法估计线性相关矩阵,首先计算样本秩相关矩阵(肯德尔的τ或枪兵的ρ),然后将等级相关线性相关性与一个健壮的正弦变换。鉴于这种估计的线性相关性矩阵,然后最大化对数似函数对自由度参数。这个方法似乎也出于这个概要文件对数似方法,但不是一个标定方法。然而,这种方法不需要矩阵求逆,因此的优势是数值稳定的close-to-singular关联矩阵(见[8])。

最后,Nystrom Skoglund[6]建议保留自由度参数指定的模拟输入,从而允许用户主观诱导尾巴资产之间依赖的程度。特别是,他们推荐一个相对较低的自由度,在1和2之间,从而允许仔细检查联合极端的可能性。这个方法是有用的对压力测试的极端协同依赖性的程度是至关重要的。

下面的代码段第一转换统一变量的标准化残差semi-parametric实证CDF派生的上面,然后符合t接合部转换后的数据。当统一变量转换的实证提供每个边缘,标定方法通常被称为规范最大似然(CML)。

U = 0(大小(残差));i = 1: nIndices U (:, i) = cdf(反面{我},残差(:,我));%将保证金统一结束(R,景深)= copulafit (“t”U“方法”,“approximateml”);%的连系动词

用t接合部模拟全球指数投资组合的回报

给定的参数t接合部,现在模拟共同依赖股票指数收益首先模拟相应的标准化残差的依赖。

这样做,首先模拟依赖一致的变量使用copularnd函数的统计和机器学习工具。

然后,通过向医生推断尾巴和插值平滑内部,通过反演变换统一变量标准化残差semi-parametric边际CDF的每个索引。这产生模拟标准化残差符合这些获得的AR (1) + GJR上面(1)过滤过程。这些残差是独立的时间,但在任何时候的依赖。模拟标准化残差数组的每一列代表一个i.i.d.单变量随机过程当孤立地看待,而每一行接合部引发的等级相关。

以下代码段模拟2000个独立的随机试验依赖标准化指数残差超过一个月22个交易日的地平线。

s = RandStream.getGlobalStream ();重置(s) nTrials = 2000;% #独立随机试验地平线= 22;% VaR预测地平线Z = 0(地平线,nTrials nIndices);%标准化残差的数组U = copularnd (“t”R景深地平线* nTrials);% t介体模拟j = 1: nIndices Z (:,:, j) =重塑(icdf(反面{j}, U (:, j)),地平线,nTrials);结束

使用模拟标准化残差作为i.i.d.输入噪声过程,恢复原始的自相关和异方差性观察指数的回报通过计量经济学的工具箱™过滤器函数。

请注意,过滤器接受指定的标准化的干扰来自联结单一指数模型和模拟多个路径,这意味着所有样本路径模拟连续为每个索引和存储。

充分利用当前的信息,指定必要的presample模型残差,方差,并返回,这样每个模拟路径的发展从一个共同的初始状态。

Y0 =回报(结束:);% presample回报Z0 =残差(结束:);% presample标准化残差V0 =方差(结束:);% presample方差simulatedReturns = 0(地平线,nTrials nIndices);i = 1: nIndices simulatedReturns (:,:, i) =过滤器(适合{我},Z(:,:我),“Y0”,Y0(我),“Z0”Z0(我),“半”V0 (i));结束

现在重塑模拟返回数组,这样每一页是一个多元回归系列的试验,而不是多个单变量回归系列的试验。

simulatedReturns =排列(simulatedReturns [1 3 2]);

最后,鉴于每个索引的模拟的回报,形成一个同样加权个人组成的全球指数投资组合指数(国家的全球指数指数)。因为我们正在与日常对数收益,在风险累积回报地平线只是在每个干预期间的资金回报。还注意到风险投资组合权重保持固定在整个地平线,而模拟忽略了任何交易成本需要重新平衡投资组合(每日再平衡过程被认为是自筹经费)。

注意,尽管模拟回报对数(连续计算),投资组合回报率系列是由第一次转换单个对数回归算法返回(价格变化除以初始价格),然后恢复权重各个算法获得投资组合的算术返回,最后回到组合对数转换返回。日常数据和一个简短的VaR地平线,重复转换造成什么影响,但对较长时间段的差距可能是重要的。

cumulativeReturns = 0 (nTrials, 1);重量= repmat (1 / nIndices nIndices 1);%同样加权组合i = 1: nTrials cumulativeReturns (i) =总和(日志(1 + (exp (simulatedReturns(:,:我))- 1)*权重));结束

总结结果

在模拟指数,形成了全球投资组合的回报率,报告最大的得失,信心各级VaR,超过一个月的风险。同时,情节实证CDF的全球投资组合。

VaR = 100 *分位数(cumulativeReturns, [0.10 0.05 0.01]);disp (' ')流('最大模拟损失:% 8.4 f % s \ n”,-100 *分钟(cumulativeReturns),“%”)流('最大模拟增益:% 8.4 f % s \ n \ n”,100 * max (cumulativeReturns),“%”)流(模拟90% % VaR: % 8.4 f % s \ n 'VaR (1),“%”)流(模拟95% % VaR: % 8.4 f % s \ n 'VaR (2),“%”)流(模拟99% % VaR: % 8.4 f % s \ n \ n 'VaR (3),“%”)图h = cdfplot (cumulativeReturns);h。颜色=“红色”;包含(“对数回归”)ylabel (“概率”)标题(“模拟月全球投资组合回报提供”)
最大模拟损失:14.4228%最大模拟增益:12.3980% 90% VaR:模拟模拟VaR: 95% -4.6345% -6.3275%模拟99% VaR: -10.6622%

引用

[1]Bouye E。,V. Durrleman, A. Nikeghbali, G. Riboulet, and Roncalli, T. "Copulas for Finance: A Reading Guide and Some Applications." Groupe de Rech. Oper., Credit Lyonnais, Paris, 2000.

[2]Embrechts, P。,A. McNeil, and D. Straumann. "Correlation and Dependence in Risk Management: Properties and Pitfalls".风险管理:风险价值。剑桥:剑桥大学出版社,1999年,页176 - 223。

[3]Glosten, l·R。,R. Jagannathan, and D. E. Runkle. “On the Relation between the Expected Value and the Volatility of the Nominal Excess Return on Stocks.”《金融。48卷,5号,1993年,页1779 - 1801。

[4]麦克尼尔,a和r·弗雷。“估计尾相关风险测量异方差的金融时间序列:一个极端值的方法。”实证金融杂志。7卷,2000年,页271 - 300。

[5]Nystrom, k和j . Skoglund。“单变量极值理论,GARCH和措施的风险。”Preprint, submitted 2002.

[6]Nystrom, k和j . Skoglund。“一个基于场景的风险管理框架”。Preprint, submitted 2002.

[7]Roncalli, T。,A. Durrleman, and A. Nikeghbali. "Which Copula Is the Right One?" Groupe de Rech. Oper., Credit Lyonnais, Paris, 2000.

[8]Mashal、r和Zeevi。金融资产之间的“超越关系:极端Co-movements。”Columbia University, New York, 2002.