金融时间序列聚类研究方法比较探究

金融时间序列聚类研究方法比较探究

ID:8253651

大小:36.00 KB

页数:12页

时间:2018-03-13

金融时间序列聚类研究方法比较探究_第1页
金融时间序列聚类研究方法比较探究_第2页
金融时间序列聚类研究方法比较探究_第3页
金融时间序列聚类研究方法比较探究_第4页
金融时间序列聚类研究方法比较探究_第5页
资源描述:

《金融时间序列聚类研究方法比较探究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、金融时间序列聚类研究方法比较探究  【摘要】本文研究目的是通过使用金融时间序列聚类方法验证收益率序列相似的公司是否属于同一个行业。由于金融时间序列数据不服从正态分布,不能用线性相关系数来进行相似性度量,因此文中选用几种非线性相关系数来对金融序列相似度进行度量,然后运用PAM、agnes、diana三种聚类方法分别对金融时间序列进行聚类。研究发现:最终聚类结果和初始的行业分类比较吻合,表明同一个行业中的股票收益率相似度很大。【关键词】非线性相关系数相异度度量聚类方法验证统计量引言时间序列聚类在很多领域有重要的作用,如金融和经济,工程学和生命科学

2、等等。时间序列聚类有多种方法,聚类时通常要构建两个时间序列之间的相异度度量。如Piccolo(1990)[14]和Maharaj(1996)[12]提出的基于扩展的自相关系数的距离,Galeano(2000)[7]提出基于自相关的距离,Tong和Dabas(1990)[15]提出基于残差拟合的距离,Bohte(1980)[3]提出基于交叉相关系数距离,Caiado(2006)[5]提出基于周期图的距离,Maharaj和D’12Urso(2010)[13]提出基于谱的相异度度量,Berndt和Clifford(1996)[2]提出动态时间扭曲距

3、离,DeGregorio(2008)[6]提出马尔科夫算子距离,等等。时间序列聚类分析在金融领域显得尤为重要,因为金融从业人员对金融资产之间的相似性很感兴趣,通过研究资产之间的相似度,对资产进行聚类,来进行投资和风险管理。因此,金融研究者提出了很多统计方法来分析资产价格序列的相似结构。例如,Mantegna和Bonanno(2001)[4]使用Pearson相关系数来度量两个股票收益率序列之间的相似度。考虑到金融时间序列的波动性,Caiado和Crato(2006)[5]提出了一种描述两个股票收益率数据之间动态特征的的类Mahalanobis

4、距离度量方式,并且提出了一种聚类程序来对DJIA指数进行聚类。本文中,通过Hoeffding’D,Kendall’sτ和Spearman’sρs三种相关系数分别来定义金融时间序列的相似度,然后运用PAM、agnes、diana三种聚类方法对相异度度量矩阵进行聚类,从而对不同的相似度度量方法和聚类方法进行比较。这对实际中进行金融时间序列分析有借鉴作用。文章结构分为四个部分,第一部分介绍几种了相关系数和相异度度量方法;第二部分介绍了几种聚类方法和聚类评价标准;第三部分运用股票收益率数据进行了实证分析;第四部分做出总结并提出相关建议。12一、相关系

5、数和相异度度量在对金融时间序列数据进行聚类之前,首先要获得适合于聚类算法的数据结构。Kaufman和Rousseeuw(1990)[10]提出,聚类算法的数据结构通常有两种:第一种数据结构是对象—属性的n×p矩阵,其中矩阵的行代表对象,矩阵的列代表属性;第二种数据结构是相异度矩阵,矩阵的行和列的性质一样,代表的都是两个对象之间的相异度。本文运用的是相异度矩阵数据结构,因此首先介绍一些相关系数和相异度的概念。(一)相关系数相关系数是最常用的相似度的度量方式,常用的相关系数包括:Pearson相关系数ρp,Hoeffding’D,Kendall’

6、sτ和Spearman’sρs。其中Pearson相关系数ρp是一种线性相关系数,其他三种均为非线性相关系数。由于金融时间序列不服从正态分布,而呈现的是一种厚尾分布,不适合用线性相关系数进行两个金融时间序列的相关性度量。因此,本文主要考虑后三种非线性相关系数。1.相关系数ρp12Pearson相关系数描述的是一种线性相关关系,相关系数的值在[-1,1]之间,数值越接近于1或-1,说明两个变量相关程度越大,数值越接近于0,说明两个变量之间相关程度越小。如果ρp(X,Y)=0,则说明X和Y是相互独立的,反之则不成立。2.Kendall’sτ当且仅

7、当事件{X2>X1且Y2>Y1}或事件{X20}才会出现。因为事件{X2>X1且Y2>Y1}和事件{X2  1.PAM(围绕中心点)方法。PAM方法是一种基于划分的聚类方法,它不仅可以对对象-属性矩阵进行聚类,也可以对相异度矩阵进行聚类,本文用于对相异度矩阵进行聚类。这种方法是由Kaufman和Rousseeuw提的,又被称为k-medoid方法。PAM的聚类算法如下:(1)首先选择k个对象,这k个对象应当为它们各自所定义的类的中心,使得每个类中其他对象到它的平均距离最短,这k个对象被称为代表性对象。从这可知,最初的k个代表对象不是随机选择的

8、,这也是这种方法和k-means方法的主要不同点。(2)把剩余的对象归到离它最近的代表对象的一类。Kaufman和Rousseeuw认为这种方法在对有离群值的对象进

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。