当前位置 首页 >工作报告 > 工作总结 >

重尾估计在金融数据中的应用

作者:jkyxc 浏览数:


打开文本图片集

摘 要:重尾分布是存在于许多高频时间序列的边缘分布,而且在尾部存在着大量的信息。基于重尾分布尾指数估计的Hill估计方法提出优化改进的AvHill估计方法,该方法成功地降低了Hill估计的方差。同时,融合矩估计方法和最大似然估计方法的思想,给出重尾评测的MM估计,其在渐近方差上也低于Hill估计。基于理论仿真随机获取的1 000个数据进行评测方法的比较分析,Hill估计、AvHill估计和MM估计在的测试中表现了各个估计的稳定程度并在不同的数据容量中表现出了不同的优点。针对股票数据的涨跌绝对值的测试中,将3种方法进行综合运用估计,通过对3种估计方法的交点进行数据上的分段,可发现各种估计方法在不同的数据容量中的优缺点以及各种估计方法的优缺点。

关键词:重尾估计; Hill估计; AvHill估计; MM估计; 股票数据

DOI:10.15938/j.jhust.2019.02.014

中图分类号: TP399

文献标志码: A

文章编号: 1007-2683(2019)02-0096-07

Abstract:There exist many marginal distributions of high frequency time series data in the Heavytailed distribution which stores a great deal of information in its tail. Based on the Hill"s estimator which is the classic in the Heavytailed index, the AvHill"s estimator is proposed and AvHill"s estimator successfully reduce the variance of the Hill"s estimator. The MM estimator is proposed which is based on the moment estimator and the maximum likelihood meanwhile and it also reduces the variance of the Hill"s estimator. Based on the theoretical simulation in the 1000 data and compare the data, Hill"s estimator , AvHill"s estimator and MM estimator express their own advantage in the different data capacity and degree of stability. We use Hill"s estimator , AvHill"s estimator and MM estimator to estimate the absolute value in the up and down of the stock data. We find the data segment using the intersections of the curves of the three estimators to reflects the function and the advantage of the three estimator in the different data segment.

Keywords:Heavy tailed estimation; Hill"s estimator; AvHill"s estimator; MM estimator; stock data

收稿日期: 2017-04-14

基金项目: 黑龙江省自然科学基金(A201301); 哈尔滨市科技创新人才研究专项资金(2017RAQXJ045).

作者简介:

黄 飞(1990—),男,硕士研究生;

谢 晟(1994—),男,硕士研究生.

通信作者:

陈海龙(1975—),男,博士,教授,硕士研究生导师,Email:hrbustchl@163.com.

0 引 言

重尾分布現像经常出现在金融、气象学、经济等领域的研究中,尤其是高频时间序列数据的边缘分布。现实生活中所遇到的大量非高斯信号或噪声也具有显著的尖峰脉冲特性[1],通常这种情况下并不符合高斯分布的假设,而且该种信息不能用简单的线性模型进行描述[2]。许多研究也表明,金融资产价格、保险索赔、网络流量以及许多人类行为现象不满足正态分布假设,而是服从重尾分布[3]。唐笑通等在对著名的ON/OFF模型进行研究后指出,聚合流量的突发性由ON和OFF周期的重尾分布引起的[4]。后来的学者发现高额的金融资产收益率不是正态分布而是重尾分布的,正态分布的假设将会导致严重低估的极端情形下的内在风险。在现实生活中,极端的情况(如巨额亏损和巨额盈利)发生的概率要远远高于标准正态分布所显示的概率。极端情况往往会带来巨额风险,2015年的股票暴跌带来的严重后果充分地说明了这一点。重尾分布的尾部也存在着大量的信息,若我们忽视这些存在于尾部的信息则会带来决策上的误区。若想准确地捕捉极端事件发生的可能性以及通过尾部的信息带来更直观的观察,必须能准确描述分布的重尾程度,即准确地估计重尾分布的尾部指数,我们称之为重尾指数。

Pareto在1987年提出了Pareto理论以及指出20%的经营往往带来80%的利润[5],而且Pareto分布也是一种常用的重尾分布。20世纪,许多学者发现了重尾分布的现象并且提出了许多估计重尾分布尾指数的方法。英国人Gosset的1908年发现了在小分布的数集中的一种特殊的重尾分布——T分布。在1949年,Zipf[6]发现分布具有尖峰厚尾的特点当他在研究日常用的词汇表时并提出了一种估计方法。1975年,Pickands[7]提出了现在仍在频繁地应用在重尾指数估计的Pickands估计。Pickands估计有一个缺陷:当它是一致性的估计的时候,它的估计是无穷的。Hill[8]基于最大似然函数提出了Hill估计。其他的学者提出了矩估计,核估计[9]以及更多的其它估计。

自20世纪90年代初期上海和深圳两个股票交易所建立以来,中国的股票市场已经经过了几十年的发展。股票作为经济发展的重要指标,集中体现了国家宏观调控对股票市场影响的效果。在行为金融学中认为股票名义收益率是不确定的,实际收益率是稳定的,它与市场的扰动是相关的[10]。早在1963年Mandelbort[11-12]就已指出:高额的金融资产是非正态的,是厚尾的。由于金融经济数据往往具有尖峰重尾的统计特征,难以用高斯分布法拟和,因此近年来重尾序列的研究成为统计学及相关领域的热点问题之一[13]。李秀敏等[14]在观察上证指数每日收盘价时也发现股票收益率服从正态分布是不合适的,而且它的分布具有较厚尾部特征。简志宏等[15]研究了沪深股指,发现其收益序列具有右偏、尖峰厚尾等典型特征。本文根据Hill估计、AvHill估计和MM估计综合考虑并给出了一种新的综合估计方法。在模拟实验中,这种综合估计方法取得了优秀的模拟效果。综合估计方法比3种方法中和任何一种的估计更准确,并且将数据进行了分段处理,对每段选择优势的估计方法进行估计。并根据数据量的大小进行不同的分段和不同的组合估计。将其应用在股票的涨跌的绝对值中,可以体现出重尾分布估计的优势,及时发现较大的变动并对以后的涨跌作出合理的估计。

1 极植理论与重尾分布

1.1 极值理论与经典估计方法

随机现象中的极端事件在各统计领域的应用都是主要研究的方向,极值理论主要研究随机样本或随机过程中极端事件发生的概率及其统计推断,是研究分布尾部行为的一个重要工具[16]。极植理论也为罕见事件的估计和预测提供了有效的数学工具[17]。对于极值理论来说,最能体现其作用的是如何正确地描述曲线。重尾分布的尾部拥有许多的信息,极值在极值理论当中也占有非常重要的地位。在分析随机变量的极值问题时常遇到的问题是如何根据经验确定分位函数,也就是说当真正的分位点在可选择的函数覆盖的范围内被分层的可用数据使用,也就是将数据进行了可易的分配。

在这个表达式里,只有一个未知数,也就是我们常说的重尾分布的尾指数估计。在重尾指数估计中有两种估计方式:半参数式估计,可以分为Hill估计、Pickands估计以及矩估计;另外一种是基于Pareto分布(GPD)和极值分布的参数估计。在极值理论中,理解理论中的所有尾信息是必要的。正确合理地估计未知数是最为直接的途径。许多知名的学者在重尾估计领域提出了他们自己的见解并得到了广泛的使用以及认可。在极值理论中最重要的一个问题就是对形状参数(极值指标)的统计估计,常用的方法有Hill估计、Picakands估计和矩估计等。在下一节中我们将介绍两种经典的估计方法以及针对它们的改进方法。

1.2 重尾估计方法优化

1.2.1 Hill估计与AvHill估计

2 仿真及实际系统验证

2.1 理论仿真

综上所述,3种估计方法在估计金融数据时各有自己的优势,故将它们共同应用在高频的金融数据中。我们模拟人工时间序列并利用Matlab R2014b对3种估计方法进行测试,并对改进的方法进行系统性估计。我们随机生成1000个0到1之间的独立同分布变量并将其从小到大进行排列以符合估计的条件。

2.2 实际数据验证

数据来源于软件同花顺上的上海证券交易所于2005年到2017年的上证指数的涨跌变化量,数据总量为2953个数据量。由于在数据在跌的过程中为负数,故我们将其列为绝对值以更好地对极端事件进行估计。上证指数反映了上海证券交易市场的总体走势,同时也给我们对股票的涨跌带来了更好的研究。股票的极端事件往往带来巨大的收益或者损失,因此我们会着重观察它的极端事件以此来预防大量的亏损。由于数据过于庞大,故我们将其进行归一化处理使其范围在0到1之间并利用Matlab R2014b进行实际数据的验证。然后根据我们的新的综合估计方法对该数据进行估计,并且获取最优的分段估计方法。

上海证券交易所的上证指数的每日变化量均有所有不同,涨为正值,跌为负值,如图7所示。在图7中,我们可以看到其值有正有负,且它们的变化量也不尽相同,但是它们的涨跌均不会超过400。极端的情况(如巨额亏损和巨额盈利)会对股市带来不良的影响,虽然它不经常发生,但是会使股民损失惨重。我们依据其涨跌的绝对值进行數值上的从小到大排序,如图8所示。图8显示数据明显符合重尾估计的尖峰厚尾现像,故对其进行科学的数值上的估计以期获得规律性的理论,对未来的发展做出合理的估计。

2.3 模拟分析结果

在模拟的过程中,综合估计方法取得了良好的估计方法,在各个阶段取得了较好的估计值。由于3种估计的优势点不同,故它们在不同的范围有不同的优势,取得的值达到了各个阶段的最优。因此在综合估计上取得了良好的改进方法,比任何一种方法更优秀。当取值不同的时候,可以进行不同的估计方法的组合,并给出相对应的优秀值,使重尾分布得到了良好的估计。在股票数据的实际应用中,该综合方法也取得了良好的估计方法。虽然在综合估计中,只分成了两个阶段,但是根据曲线的发展趋势,如果数据量足够大时,MM估计的曲线最后会交于一点。在此也足以说明不同的组合方式以及数据量的大小会取得不同的效果,但是它比其中任何一种的单一估计方法都要优秀。在两个阶段,它们在各自和范围内取得了良好的估计。

3 结 论

本文介绍了两种经典的重尾估计方法Hill估计和矩估计以及它们的改进方法。在模拟实验中,Hill估计和AvHill估计的曲线要比MM估计的曲线更早地获得了比较平缓的曲线。MM估计在数据容量较小时,得到重尾估计值有较大的变化值,但是Hill估计和AvHill估计的变化量趋于稳定。数据量较小时,Hill估计和AvHill估计要优于MM估计。当数据量逐渐增大时,MM估计逐渐表现出了它的优越性并且趋于稳定。在股票涨跌的绝对值的应用中,容量较小时,与模拟数据所得到的曲线相似,Hill估计和AvHill估计要优于MM估计。但随着数据量的增大,Hill估计和AvHill估计略微优于MM估计。3个重尾估计方法数据容量不同的情况下各有优势,因此我们可以根据估计方法的优势与弱点,在不同的范围内使用不同的估计方式。在金融领域的使用中,我们发现股票的涨跌会给投资者带来巨大的利益或者巨大的损失。根据不同的时间点带来不同的涨跌,我们需要制定更合理的股票机制并带给企业和投资人更好的投资环境。

参 考 文 献:

[1] 陈海龙, 刘春丽, 由承姬. Alpha稳定分布参数评估及应用研究[J]. 哈尔滨理工大学学报, 2013,18(4):63.

[2] 劉春丽, 邵雷, 陈海龙,等. 标准参数系下Alpha稳定分布随机变量的产生及仿真[J]. 哈尔滨理工大学学报, 2014,19(3):51.

[3] 王元月, 杜希庆, 曹圣山. 阈值选取的Hill估计方法改进--基于极值理论中POT模型的实例分析[J]. 中国海洋大学学报,社会科学版, 2012(3):42.

[4] 唐孝通, 焦秉立. 通信网络聚合流量突发性的产生机理研究[J]. 哈尔滨理工大学学报, 2011, 16(2): 29.

[5] Colin S. Gillespie. Fitting Heavy Tailed Distributions: the PoweRlaw Package[J]. Journal of Statistical Software, 2014, 64(2): 1.

[6] ZIPF G K. Human Behavior and the Priciple of Least Effort:an Introduction to Human Ecology[M].Cambridge:Mass,1949.

[7] PICKANDS J. Statistical Inference Using Extreme Order Statistics[J].Annals of Statistics,1975(3):119.

[8] HILL B.A Simple General Approach to Inference About the Tail of a Distribution[J].Annals of Statistics, 1975(3):1163.

[9] CSORGO S.DEHEUVELS P,MASON D.Kernel Estimates of the Tail Index of a Distribution[J]. Annals of Statistics, 1985, 13(3):1050.

[10]史永, 丁伟, 袁绍峰. 市场互联、风险溢出与金融稳定——基于股票市场与债券市场溢出效应分析的视角[J]. 金融研究, 2013(3): 170.

[11]MANDELBROT B. The Variation of Certain Speculative Prices[J]. Journal of Business, 1963(6): 94.

[12]B.Mandelbrot. New Methods in Statistical Ecnomics[J]. Journal of Political Economy , 1963(71):421.

[13]秦瑞兵, 孟萍. 重尾过程协整检验的Bootstrap逼近[J]. 云南民族大学学报: 自然科学版, 2015,24(6):480.

[14]李秀敏,蔡霞。金融市场中极值指标的位移尺度不变估计[J]. 数学的实践与认识, 2013,43(14):231.

[15]简志宏, 曾裕峰, 刘曦腾. 基于CAViaR型的沪深300股指期货隔夜风险研究[J]. 中国管理科学, 2016, 24(9): 1.

[16]刘维厅, 赫英迪, 陈琳. 重尾分布的尾部指数估计及沪深股市实证分析[J]. 数学的实践与认识, 2011, 6(4): 1.

[17]WAN Huixia Judy, LI Deyuan, HE Xuming. Estimation of High Conditional Quantiles for HeavyTailed Distributions[J]. Journal of the American Statistical Association. 2012,107(500):1453.

[18]RESNICK S, STRIC C. Smoothing the Hill estimator[J] . J Appl. Probab, 1996,33: 139.

[19]DEKKERS A , EINMAHL J , DE Haan L.A Moment Estimator for the Index an Extreme Value Distribution[J]. Annals of Statistics , 1989(17):1833.

[20]FRAGE Alves MI, GOMES M I, DE Haan L,et al. Mixed Moment Estimators and Location Invariant Alternatives[J]. Extremes, 2009(12):149.

(编辑:温泽宇)

推荐访问:估计 金融 数据

相关文章:

Top