基于社交媒体的投资者情绪对股市收益影响的大数据分析.doc

上传人:99****p 文档编号:1856236 上传时间:2019-03-18 格式:DOC 页数:8 大小:29KB
下载 相关 举报
基于社交媒体的投资者情绪对股市收益影响的大数据分析.doc_第1页
第1页 / 共8页
基于社交媒体的投资者情绪对股市收益影响的大数据分析.doc_第2页
第2页 / 共8页
基于社交媒体的投资者情绪对股市收益影响的大数据分析.doc_第3页
第3页 / 共8页
基于社交媒体的投资者情绪对股市收益影响的大数据分析.doc_第4页
第4页 / 共8页
基于社交媒体的投资者情绪对股市收益影响的大数据分析.doc_第5页
第5页 / 共8页
点击查看更多>>
资源描述

1、基于社交媒体的投资者情绪对股市收益影响的大数据分析摘要社交媒体中的信息是一个大数据库,通过微博搜索抓取社交媒体中投资者微博数据,利用中文语义分析技术,将该投资者情绪划分成六个等级,构建社交媒体中投资者的情绪指数,并且以同时段的股市为研究对象,基于 VAR 模型,运用 Granger 因果关系检验、脉冲响应函数,探讨社交媒体中不同程度的投资者情绪倾向与股市收益之间的预测能力和双向反馈关系。 关键词社交媒体;投资者情绪;股市收益;大数据 DOI10.13939/ki.zgsc.2015.25.065 1 引 言 行为金融学认为,情绪可以深刻地影响个人的行为和决策。夏雨禾(2010)通过对 438

2、个样本的分析,对新浪微博互动的结构性要素以及发生机制进行了深入探究,研究结果发现,新浪微博是一个文化性、个人性和情绪性的互动空间。杨维(2011)从微博传播的及时性、草根性的特征出发,探讨了在网络舆情形成过程中微博起到的作用。梁坤,蒋翠清,丁勇(2013)利用特征提取等技术,抽取中文社会媒体上的干系人的话题,同时构建股票收益率的回归模型,研究中文社会媒体上千系人和话题的活动状况对股票收益率的影响。研究结果表明,中文社会媒体上不同干系人对股票收益的影响不同。而乔智和耿志民(2013)讨论了股吧对个人投资者情绪的影响研究,运用实证方法验证了个人投资者情绪与股市收益间存在的相关关系。徐琳(2013)

3、基于微博中的投资者情绪的研究,使得让投资者知情股市收益研究,微博信息不仅反映了该信息发布者的心理和行为,同时也能够影响相关投资者的投资行为。 2 研究模型与方法 2.1 主要模型 本文采用向量自回归模型(VAR)来检验社交媒体中的投资者情绪与股市收盘价、股市成交量之间的时滞关系。VAR 模型把系统中每一个内生变量作为系统中所有内生变量的滞后项的函数来构造模型,其一般形式为: 其中, 是 k 维内生变量向量,Yt-1(i=1,2,P)是滞后内生变量向量,Xt-i(i =0,1,r)是 d 维外生变量向量或滞后外生变量向量,P、r 分别是内生变量和外生变量的滞后阶数。At 是 k*k 维系数矩阵,

4、Bi 是 k*d 维系数矩阵,这些矩阵都是待估计的参数矩阵。t 是由 k 维随机误差项构成的向量,其元素相互之间可以同期相关,但不能与各自的滞后项相关以及不能与各自的滞后项相关以及不能与模型右边的变量相关。 2.2 研究方法 第一,使用深圳视界信息技术有限公司研发的网页采集软件八爪鱼数据采集系统抓取海量的微博数据。该平台以分布式云计算平台为核心,从各种不同的网站或者网页获取大量的规范化数据。第二,以天为单位归类微博数据,并且清洗不能表现投资者情绪的垃圾数据,如非原创微博或者只包含链接地址的微博等。第三,运用中文语析分析工具,分析微博中包含的情感信息,量化投资者情绪。本课题将从两个层面来分析和量

5、化投资者情绪信息:第一个层面可以将投资者情绪分为两个维度积极情绪倾向和消极情绪倾向;第二个层面讲积极情绪和消极情绪继续细分,可分为一般、中度和高度积极情绪倾向以及一般、中度和高度消极情绪倾向。第四,接下来我们将会把得到的数据资料用专业软件 Eviews 进行整理并加以分析,以便我们制作出相应的统计图表等,最终基于大数据对投资者情绪与股市收益之间的相互关系进行分析。第五,通过 Granger 因果关系检验,论述和验证社会情绪变化与股票市场变化确实存在相关关系。第六,使用脉冲响应函数进行股市收益走势预测的实证分析,得出投资者情绪和股市收益走势相互间的预测能力,并提出改善方案。 3 实证研究 3.1

6、 数据来源社交媒体中的投资者情绪数据 本文的数据来源于新浪微博平台,采用“微博搜索”的方式继续对股市相关的信息进行监测挖掘。在新浪微博界面,以股票名称为关键词,按时间搜索相应的与该只股票相关的原创微博信息。以“华谊兄弟”为实例研究对象,研究华谊兄弟公司从 2014 年 9 月 19 日到 2015 年 2 月 28日,该公司在新浪微博的投资者情绪与股市收益之间的关系。微博的发表时间跨度为 2014 年 9 月 19 日至 2014 年 12 月 5 日,我们抓取到微博数量为 1286688 条。 股市收益指数样本来自上证综合指数和深圳成分指数,包括上证综合指数收盘价、日成交量和深圳成分指数的收

7、盘价、日成交量。股票数据均使用浙江核新同花顺网络信息股份有限公司提供的同花顺软件获得的。t 日上证综合指数的和深圳成分指数的股指收益率 Rt 的计算公式为 其中 Pt 为 t 日股指的收盘价,Pt-1 为(t-l)日股指的收盘价。样本区间为 2014 年 11 月 17 日至 2015 年 2 月 28 日。 3.2 数据分析 (1)量化投资者情绪。利用 ROST Content Mining(简称 ROST CM)的情感分析模块对每天的微博进行情绪倾向分析。本文实验利用ROST CM 分析情绪的统计结果如图 1 所示。 针对 ROST CM 对于投资者情绪的分类,将分析三段积极情绪(一般、中

8、度、高度)和三段消极情绪(一般、中度、高度)与股市收益之间的相互影响,不使用中性情绪作为实验数据。 同时,选取该公司于 2014 年 11 月 16 日至 2015 年 2 月 28 日每天的综合指数收盘价和成交量产生的时间序列进行比较,并且,每个类别的情绪倾向数据之间也能进行比较,需要对实验数据进行 Z-Score 标准化处理。转化函数为: 其中,X 为变量 X 的均值, 为变量 x 的标准差。经过处理的数据符合均值为 0 标准差为 1 的标准正态分布。 (2)变量的基本描述。由于 VAR 模型的建立和 Granger 因果检验都要求使用的时间序列是平稳时间序列。表 1 是运用增广的迪基一福

9、勒检验(ADF 检验)各时间序列单位根的检验结果。 情绪的时间序列和股票数据的时间序列一阶差分的 ADF 检验的 t 统计量都比 1%、5%、10%检验水平下的临界值小,因此可以拒绝原假设,即可以认为情绪时间序列和股票数据的时间序列一阶查分没有单位根,也即社交媒体中的投资者情绪的时间序列和股票数据的时间序列是一阶差分平稳的。 (3) Granger 因果关系检验。Granger 因果关系检验可以用来确定经济变量之间是否存在因果关系以及影响的方向。因此采用 Granger 因果关系检验分析社交媒体中的投资者情绪对股市收益的预测能力。 分别将社交媒体的投资者一般积极情绪(Pl) 、中度积极情绪(P

10、2) 、高度积极情绪(P3) 、一般消极情绪(Nl) 、中度消极情绪(N2) 、高度消极情绪(N3)指数与股市收益(SY)和股市成交量做两两检验。表 2 列出滞后期 1 阶到 5 阶响应的部分 Granger 因果关系检验结果。 可以发现,一是社交媒体上的投资者高度消极情绪倾向不是引起股市收盘价变化的 Granger 原因在滞后期为 3 时被拒绝;二是股市收盘价不是一般积极情绪倾向的 Granger 原因在滞后期为 5 时被拒绝;三是社交媒体中的投资者高度积极情绪的 Granger 原因在滞后期为 1 时被拒绝;四是社交媒体中投资者高度消极情绪倾向不是股市收盘价的 Granger 原因在滞后期

11、为 2 时被拒绝;五是社交媒体中投资者的中度积极情绪、高度积极情绪、一般消极情绪和中度消极情绪不是股市成交量的 Granger原因被拒绝,说明社交媒体中投资者较为显著的情绪是股市成交量的Granger 原因;六是股市成交量不是社交媒体中投资者一般消极情绪的Granger 原因被拒绝,说明股市成交量是社交媒体中投资者一般消极情绪的 Granger 原因。 (4)脉冲响应函数分析。脉冲响应函数用于衡量来自某个内生变量的随机扰动项的一个标准差冲击(称为“脉冲” )对 VAR 模型中所有内生变量当前值和未来值的影响。如图 2 所示,图中的横轴表示时期数,纵轴表示脉冲响应函数大小,实线为脉冲响应函数,红

12、色虚线为正负两倍标准差偏离带(+2S.E) 。 图 2 (a)描述了社交媒体中投资者的高度积极情绪和高度消极情绪与股市收盘价之间的两两响应。在图 2(a)中可以看到,社交媒体中的高度积极情绪,在受到股市收盘价的一个正向单位标准差冲击时,没有立即响应,在第 1 期中期出现响应,并在第 2 期内达到负向最大值,并在第 6 期后逐渐减弱并且趋向于 0。说明股票的收盘价变动对社交媒体中的高度积极情绪只存在较短时间内的影响,并且会对社交媒体中的投资者造成一定影响,大约持续 5 个交易日内。 图 2 (b)中,受社交媒体中投资者的高度消极情绪的一个正向单位标准差冲击时,股市收盘价第一期前期没有立即响应,在

13、之后产生正向影响,在第 3 期中期达到正向最大后立即减弱,并且趋向于 0。说明社交媒体中的高度消极情绪对股市收盘价只存在短期同向影响,持续在前 10个交易日左右。 图 2 (c)和图 2(d)可以看到,股市成交量对社交媒体中投资者中度积极情绪和高度积极情绪的扰动立即做出了响应,第一期的响应大约为 0.5 左右且为正向。之后,股市成交量对投资者中度积极情绪和高度积极情绪的响应有所下降,并趋近于 0,说明社交媒体中投资者的中度积极情绪和高度积极情绪对股市成交量存在短期同向影响,并且投资者的中度积极情绪持续时间较投资者的高度积极情绪的持续时间长。 在图 2 (e)中可以看到,股市成交量对社交媒体中投

14、资者的中度消极情绪扰动立即做出了响应,第 1 期的响应为 0.7 左右,在第 2 期减弱到 0.2 左右。之后,股市成交量对投资者的中度消极情绪的扰动开始上升,在第 3 期中期达到最大(为 2.5 左右) ,且为正向的。接着,股市成交量对投资者的中度消极情绪的响应有所下降,在第 10 期后,响应趋向于 0。可见,社交媒体中的投资者中度消极情绪的变动会对股市成交量造成正向影响,且持续时间超过 10 期。 图 2 (f)描述的是社交媒体中投资者的一般消极情绪与股市成交量的响应。从图中可以看到,社交媒体中投资者的一般消极情绪对股市成交量的扰动立即做出了负向响应。在第 2 期中期达到负向最大值,并在之

15、后逐渐减弱,在第 10 期左右逐渐趋近于 0。从中可以看出股市成交量的变动会对社交媒体中投资者的一般消极情绪造成影响,持续时间比较长,且前 4 期影响较为明显。 4 结论与展望 通过微博大数据搜索抓取社交媒体中投资者微博数据为样本,以同时段的股市为研究对象,利用中文语义分析技术,将该投资者情绪划分成六个等级,并且构建了社交媒体中投资者的情绪指数,并且基于 VAR模型,运用 Granger 因果关系检验、脉冲响应函数,探讨社交媒体中不同程度的投资者情绪倾向与股市收益之间的预测能力和双向反馈关系。研究结果表明: 第一,中文社交媒体中的投资者情绪变化能够有效地反映出股市收盘价和成交量的变化。第二,社交媒体中投资者不同等级倾向的情绪对股市收盘价和股市成交量的影响是不同的。一般积极情绪对股市收益没有产生显著的影响,中度、高度积极情绪对股市收益产生短期影响,中度消极情绪对股市收益产生持续时间较长的影响。第三,股市的收盘价和成交量均会引起社交媒体中投资者不同程度的情绪变化。 结论有益于投资者以社交媒体为观察视角进行有效的投资决策和判断,同时端正投资心态和增强风险意识。同时也有益于决策者利用社交媒体提供的大量的有效信息来合理地管理股票市场。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文资料库 > 毕业论文

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。