主要内容

缺失数据估值

介绍

资本资产定价模型(CAPM)是一种古老的工具,用来描述资产和市场价格之间的变动,但经常遭到恶意中伤。尽管在CAPM的实施和解释过程中出现了许多问题,但实践者面临的一个问题是在不完整的股票价格数据下估计CAPM的系数。

这个例子展示了如何使用缺失的数据回归函数来估计CAPM的系数。您可以使用以下命令直接运行示例CAPMdemo.m位于matlabroot/工具箱/金融/ findemos

资本资产定价模型

在参考文献中可以找到一系列假设(见夏普)[11],林特纳[6],年后)[5],夏普等人。[12]), CAPM的结论是资产收益与市场收益呈线性关系。具体来说,给定构成市场的所有股票的回报为无风险资产的收益记为C, CAPM表示每种资产的回报R在市场上具有预期的形式

E R α + C + β E C

的资产= 1,…,n,在那里β是指定给定资产与标的市场之间变动程度的参数。换句话说,每项资产的预期回报率等于无风险资产的回报率加上经风险调整后的预期市场回报率,减去无风险资产回报率。参数的集合β1、……βn称为资产贝塔。

资产的形式是

β R var

也就是资产和市场收益的协方差除以市场收益的方差。β是指金融工具的价格波动相对于整个市场或指数的价格波动。Beta通常用于股票。高贝塔系数的工具比低贝塔系数的工具风险更大。如果一项资产的贝塔值为1,那么该资产就会随市场而变动;如果一项资产的贝塔> 1,则该资产比市场更不稳定。相反,如果一项资产的贝塔值< 1,则该资产的波动性小于市场。

CAPM的估计

标准的CAPM模型是一个线性模型,每个资产都有附加参数来描述残差。为每个n资产与观察到的资产回报样本R凯西,我、市场回报k,以及无风险的资产回报Ck,估计模型有形式

R k α + C k + β k C k + V k

为样本k= 1,…,和资产= 1,…,n,在那里α是指定资产的非系统性回报的参数,β资产是贝塔吗V凯西,我是否每个资产的剩余误差与相关的随机变量V

参数的集合α1、……αn称为资产。CAPM的严格形式规定α必须为零,而离零的偏差是临时不平衡的结果。然而,在实践中,资产可能具有非零阿尔法,在这种情况下,许多积极的投资管理都致力于寻找具有可利用的非零阿尔法的资产。

为了考虑到非零阿尔法的可能性,估计模型通常寻求估计阿尔法,并执行测试,以确定阿尔法在统计上是否等于零。

剩余的错误V是有时间的吗

E V 0

E V V j 年代 j

的资产我,我= 1,…,n,其中参数年代11、……年代神经网络称为残差或非系统方差/协方差。

例如,每个资产的剩余方差的平方根,年代2= 1,…,n,被称为资产的剩余或非系统风险,因为它描述了不能用市场价格变化解释的资产价格的剩余变化。

缺失数据估计

尽管可以估算具有足够长的资产回报历史的公司的贝塔值,但很难估算近期ipo的贝塔值。然而,如果足够可见公司存在的集合,可以将有一定程度的相关性与新公司的股票价格波动,也就是说,在同一行业的公司作为新公司,可以获得新公司估算估计贝塔的缺失数据回归的例程。

一些技术股票beta的估计

为了说明如何使用缺失数据回归例程,请估算12只科技股的beta值,其中有一只股票(GOOG)正在进行IPO。

  1. 从mat -文件中载入12支股票的日期、总回报率和股票代码CAPMuniverse

    负载CAPMuniverse资产数据日期
    Name Size Bytes Class Attributes Assets 1x14 1568 cell Data 1471x14 164752 double date 1471x1 11768 double

    模型中的资产有以下符号,其中后两个系列是市场和无风险资产的代理:

    资产(1:7)资产(14)
    ans = 'AAPL' 'AMZN' 'CSCO' 'DELL' 'EBAY' 'GOOG' 'HPQ' ' ans = 'IBM' 'INTC' 'MSFT' 'ORCL' 'YHOO' 'MARKET' 'CASH' '

    数据涵盖2000年1月1日至2005年11月7日期间的日总回报率。宇宙中有两支股票的缺失值是这两只股票中有一只在这段时间进行了首次公开募股,因此其数据明显少于其他股票。

  2. 计算每个股票的单独回归,其中缺少数据的股票有反映其降低的可观察性的估计。

    [NumSamples, NumSeries] = size(数据);NumAssets = NumSeries - 2;StartDate可以=日期(1);EndDate =日期(结束);流(1," Separate regression with ");流(1,'每日总返回数据从%s到%s…\n'...datestr (StartDate可以,1),datestr (EndDate,1));流(1,' %4s %-20s %-20s %-20s\n'“α”“β”“σ”);流(1,' ---- -------------------- ');流(1,'-------------------- --------------------\ n ');我= 1:NumAssets%建立独立的资产数据和设计矩阵TestData = 0 (NumSamples, 1);TestDesign = 0 (NumSamples, 2);TestData(:) = Data(:,i) - Data(:,14);TestDesign (: 1) = 1.0;TestDesign(:,2) = Data(:,13) - Data(:,14);分别估算每项资产的CAPM[Param, Covar] = ecmmvnrmle(TestData, TestDesign);估计协方差参数的理想标准误差[StdParam, StdCovar] = ecmmvnrstd(TestData, TestDesign,...柯伐合金,“雪”);%估计模型参数的样本标准误差StdParam = ecmmvnrstd(测试数据,测试设计,Covar,“海赛”);%设置输出结果α=参数(1);β=参数(2);σ=√柯伐合金);StdAlpha = StdParam (1);StdBeta = StdParam (2);StdSigma =√StdCovar);%显示估计流(' % 4 s % 9.4 f (% 8.4 f) % 9.4 9.4 8.4 (%) % f (% 8.4 f) \ n '...{我}资产,α(1),abs(α(1)/ StdAlpha (1)),...β(1)、abs(β(1)/ StdBeta(1)),σ(1)StdSigma (1));结束

    此代码片段生成以下表。

    从2000年1月03日到2005年11月07日的日总收益数据的分离回归…αβσ  -------------------- -------------------- -------------------- apple 0.0012 (1.3882) 1.2294 (17.1839) 0.0322 (0.0062) amazon 0.0006 (0.5326) 1.3661 (13.6579) 0.0449 (0.0086) cisco -0.0002 0.0298 1.5653(0.2878)(23.6085)(0.0057)戴尔的-0.0000 (0.0368)1.2594 (22.2164)0.0255 (0.0049)EBAY 0.0014 (1.4326) 1.3441 (16.0732)0.0376 (0.0072) google 0.0046 0.0252 0.3742 (3.2107) (1.7328) (0.0071) (0.1747) 0.0001 hp IBM -0.0000 1.3745 0.0255 (24.2390) (0.0049) (0.0312) 1.0807 (28.7576) 0.0169 (0.0032) intel 0.0001 0.0263 1.6002(0.1608)(27.3684)(0.0050)微软-0.0002 (0.4871)1.1765 (27.4554)0.0193 (0.0037)ORCL 0.0000 (0.0389) 1.5010 (21.1855) 0.0319 (0.00) yhoo 0.0001 (0.1282) 1.6543 (19.3838) 0.0384 (0.0074)

    α列包含每个股票的alpha估计,如预期的接近于零。此外,t统计量(括号中)通常拒绝在99.5%显著性水平上alpha非零的假设。

    β列包含每只股票的估计,括号中还包含t-statistics。对于除GOOG以外的所有股票,在99.5%的显著性水平上,都接受贝塔系数非零的假设。然而,谷歌似乎没有足够的数据来获得对beta的有意义的估计,因为它的t统计量意味着拒绝非零beta假设。

    σ列包含残差标准偏差,即对非系统性风险的估计。而不是t-statistics,残差标准差的相关标准误差用括号括起来。

一些技术股票beta的分组估计

为了估计所有12只股票的贝塔值,建立一个联合回归模型,将所有12只股票组合在一个设计中。(由于每只股票都有相同的设计矩阵,这个模型实际上是一个看似不相关的回归例子。)估计模型参数的程序是ecmmvnrmle,而估计标准误差的程序是ecmmvnrstd

因为GOOG有大量的缺失值,直接利用缺失的数据例程ecmmvnrmle需要482次迭代才能收敛。这可能需要很长时间来计算。为了简洁起见,在前480次迭代后的参数和协方差估计包含在一个mat -文件中,并用作初始估计来计算股票beta。

负载CAPMgroupparamParam0Covar0
Name Size Bytes Class Attributes Covar0 12x12 1152 double Param0 24x1 192 double

现在估计一下这12支股票的参数。

流(1,' \ n ');流(1,“与”分组回归);流(1,'每日总返回数据从%s到%s…\n'...datestr (StartDate可以,1),datestr (EndDate,1));流(1,' %4s %-20s %-20s %-20s\n'“α”“β”“σ”);流(1,' ---- -------------------- ');流(1,'-------------------- --------------------\ n ');NumParams = 2 * NumAssets;%建立分组资产数据和设计矩阵TestData = 0 (NumSamples, NumAssets);TestDesign = cell(NumSamples, 1);设计= 0 (NumAssets, NumParams);k = 1: NumSamplesi = 1:NumAssets TestData(k,i) = Data(k,i) - Data(k,14);设计(i,2*i - 1) = 1.0;设计(i,2*i) = Data(k,13) - Data(k,14);结束TestDesign {k} =设计;结束%估算所有资产的CAPM和初始参数%的估计[Param, Covar] = ecmmvnrmle(TestData, TestDesign, [], [], [],...Param0 Covar0);估计协方差参数的理想标准误差[StdParam, StdCovar] = ecmmvnrstd(测试数据,测试设计,Covar,...“雪”);%估计模型参数的样本标准误差StdParam = ecmmvnrstd(测试数据,测试设计,Covar,“海赛”);%设置输出结果α=参数(1:2:end-1);β=参数(2:2:结束);σ=√诊断接头(柯伐合金));StdAlpha = StdParam (1:2: end-1);StdBeta = StdParam(2:2:结束);StdSigma =√诊断接头(StdCovar));%显示估计i = 1:NumAssets fprintf(' % 4 s % 9.4 f (% 8.4 f) % 9.4 9.4 8.4 (%) % f (% 8.4 f) \ n '...{我}资产,α(i), abs(α(我)/ StdAlpha(我)),...β(i)、abs(β(i) / StdBeta(我)),σ(i), StdSigma (i));结束

此代码片段生成以下表。

从2000年1月03日到2005年11月07日的日总回报数据的分组回归…αβσ  ---------------------- ---------------------------------------- apple 0.0012 (1.3882) 1.2294 (17.1839) 0.0322 (0.0062) amazon 0.0007 (0.6086) 1.3673 (13.6427) 0.0450 (0.0086) cisco -0.0002 0.0298 1.5653(0.2878)(23.6085)(0.0057)戴尔的-0.0000 (0.0368)1.2594 (22.2164)0.0255 (0.0049)EBAY 0.0014 (1.4326) 1.3441 (16.0732)0.0376 ( 0.0072) GOOG 0.0041 ( 2.8907) 0.6173 ( 3.1100) 0.0337 ( 0.0065) HPQ 0.0001 ( 0.1747) 1.3745 ( 24.2390) 0.0255 ( 0.0049) IBM -0.0000 ( 0.0312) 1.0807 ( 28.7576) 0.0169 ( 0.0032) INTC 0.0001 ( 0.1608) 1.6002 ( 27.3684) 0.0263 ( 0.0050) MSFT -0.0002 ( 0.4871) 1.1765 ( 27.4554) 0.0193 ( 0.0037) ORCL 0.0000 ( 0.0389) 1.5010 ( 21.1855) 0.0319 ( 0.0061) YHOO 0.0001 ( 0.1282) 1.6543 ( 19.3838) 0.0384 ( 0.0074)

尽管对全数据股票的结果是相同的,但对AMZN和GOOG(这两支缺失值的股票)的贝塔估计与对每只股票分别得出的估计是不同的。由于AMZN的缺失值很少,所以估算的差异很小。然而,在谷歌,这种差异更加明显。

t-统计数据显示,GOOG的beta估计值现在达到了99.5%的显著性水平。然而,t- beta估计的统计是基于来自样本Hessian的标准误差,与Fisher信息矩阵相反,它解释了由于缺失值而增加的估计的不确定性。如果t-统计量是由较为乐观的Fisher信息矩阵得到的t——谷歌的统计数据8.25.因此,尽管数据缺失增加了不确定性,但谷歌对贝塔的估计在统计学上仍然很重要。

最后,请注意谷歌的beta估计0.62-可能需要一些解释的值。尽管在这段时间里市场波动很大,价格横向波动,但谷歌的价值稳步上升。因此,它与市场的相关性较低,这意味着它的波动性小于市场(贝塔值< 1)。

参考文献

彼得·E·凯恩线性随机系统。约翰·威利父子公司,1988。

[2]克莱默,哈拉尔德。统计学的数学方法。普林斯顿大学出版社,1946年。

[3]邓普斯特,a.p. N.M.莱尔德,d.b.鲁宾。“通过EM算法从不完整数据得到的最大似然”。皇家统计学会学报,B辑。第39卷第1期,1977年,第1-37页。

威廉·H·格林计量经济学分析。第5版,培生教育股份有限公司,2003。

[5]年后,R.A.金融理论。新世纪,Inc ., 1988年。

[6]林特纳,《风险资产的估值与股票风险投资的选择》。经济与统计评论。1965年第14卷,第13-37页。

[7] Little, Roderick J. A和Donald B. Rubin。缺失数据的统计分析。第2版,John Wiley & Sons, Inc, 2002。

[8]孟,xiao li和Donald B. Rubin。“通过ECM算法的最大似然估计。”生物统计学。第80卷,第2期,1993年,267-278页。

[9] Sexton, Joe和Anders Rygh Swensen。"以电磁速率收敛的电子对抗算法"生物统计学。第87卷第3期,2000年,第651-662页。

j·L·谢弗不完全多元数据分析。查普曼和霍尔/CRC, 1997。

[11]夏普,《资本资产价格:风险条件下的市场均衡理论》金融杂志》上。1964年第19卷,第425-442页。

夏普,W. F., G. J. Alexander和J. V. Bailey。的投资。6版,Prentice-Hall, Inc., 1999。

另请参阅

||||||||||||||||||

相关的话题