1、1毕 业 论 文论坛发帖量与股指关系研究2摘 要随着互联网的普及,股票论坛成为投资者交流重要平台。我国股票市场处于新兴发展阶段,非理性投资者居多,投资决策更易受到消息与传闻的影响。 本文基于相关性分析和简单的计数方法,分析股票论坛发帖量与股指走势的关系,得到了发帖量与股指未来一段时间走势的规则。本文主要创新有:1)提出了按股指上升趋势以及股指下降趋势阶段分析发帖量与股指的关系;2)利用多周期的分析方法统计发帖量与股指涨跌的规则。实验结果证明股票论坛发帖量与股指成相关关系,并验证了规则的有效性。关 键 词 股票市场,在线股评,相关分析1 引言作为市场经济的重要组成部分,股票市场是经济运行状况的指
2、示器,可以反映出经济整体、行业、企业的状态和形势,是进行经济预测与分析的重要参考。在二十多年的发展时间里。中国股票市场发展迅猛,在国民经济中的影响日益增强,对其进行分析与预测具有重大的实践意义,股票市场高风险、高回报的特征也使得股票市场的分析与预测成为当前的研究热点。随着金融市场不断发展与完善,市场活动日趋复杂,以投资者理性假设的有效市场理论不断受到挑战,股票溢价、过度自信和羊群效应等现象难以得到解释,行为金融理论打破了投资者理性假设,从投资者心理与行为角度合理地回应了上述现象。行为金融理论提出投资者的非理性及不可预见性与套利有限性使股票价格偏离其价值1 ,投资者的情绪会对金融市场产生影响2,
3、因此,在股票市场中,研究投资者的心理及行为对股票市场变化产生的影响具有重要意义。 截至 2010 年 12 月底,我国互联网用户规模达到 457 亿3,各种新兴网络社会媒体,如博客、网络社区、论坛等逐渐成为传递信息、沟通交流的主要平台。网络也成为股市投资信息传播的主要渠道,其中,股票论坛是投资者交流与讨论的重要场所之一,是行情分析、内幕、传闻等股票信息比较集中的平台。在股票论坛中,使用者可以发表评论表达对市场走势的见解与感受,也可以浏览和评论他人的投资观点,综合论坛中的各种信息后进行投资决策。投资者发布的信息不仅表达了自己对股市的观点,同时很可能对他人的投资心理与决策行为产生影响,进而对上市公
4、司股票表现乃至整个股票市场的变化产生一些影响。在股票市场成熟的发达国家,股民早在 20 世纪九十年代就开始利用互联网金融论坛进行信息的交流,上个世纪末一些学者开始从投资者参与互联网论坛的活动人手。基于在线股票评论对股票市场展开分析。Wysock(1998)收集了 3000 多支股票的 946000 条在线股评,研究指出隔夜的股评数量可以预测次日的股票交易量与异常收益的变化4。Antweiler 证研究了 45 支股票的 1559621 条评论信息,分析得出股评数量与交易量、股票的波动都具有正向相关性5。Tumarkin(2001)以 72 支互联网服务行业的股票为研究对象,指出股评活动并不能对
5、股票的交易量与收益进行预测6。Das(2007)以 24 支科技部门的股票为例,分析表明投资者的情感倾向与大盘指数是相关的,但在个股层面这种相关关系并不显著7。Sabherwal(2008) 围绕股票成为 TheLion 网站上的最热门股票这个事件进行了研究分析得到当股票成为热门的当天会平均产生 194的异常收益8 。Zimbra(2009)将研究具体到沃尔玛公司,结果表明企业论坛数据能够反映出用户所关心的具体问题,并可以对企业的股票价格进行一定程度的预测8。胡洋(2011)结果表明论坛发帖量与股指关系的相关性9.以上研究大都证明股票论坛与股票价格存在一定相关性,但缺乏基于股票论坛数据预测股票
6、价格方法的研究。本文基于东方财富网上证指数股票论坛发帖量数据进行了统计分析研究,采用相关分析方法和统计计数方法进行了有益的探索。结果表明,论坛发贴量与股指存在一定3相关性,并且得到了基于发帖量的相应的股指预测规则,实验验证了股指预测规则的有效性.本文的主要贡献有:1) 首次对帖子数量与股指进行了多周期的分析。本文尝试了多个周期情形下帖子发表数量与股指走势的相关关系,以及提取了对应的预测规则。对比选出的最佳周期,能取得了较好效果;2) 发现了帖子数量与股指存在相关关系,并可预测。创造性的提出了需要分开上升阶段和下降阶段来分析发帖量与股指的关系,基于本思路的预测规则,准确率得到了极大的提升。2 研
7、究方法2.1 相关分析采用 Pearson 相关系数法进行变量之间的相关关系分析 , 2.2 统计计数方法采用统计计数方法,提取发帖量与指数预测的规则。主要方法是将一定时间内的发帖量分成若干区间,然后计算预测结果准确率,并将这些预测结果总结为预测规则。3 发帖量与上证指数分析3.1 数据概况本文以互联网股票论坛中在线评论(帖子) 为研究对象,主要是各支股票的评论数量信息。由于本文是以国内股市为研究对象,需要选择国内比较有影响力的大型财经金融类论坛,以 Alexa中国官方网站(http:/I)提供的网站流量排名、网络流量统计、网络用户量等作为参考指标对各个财经类网站进行了比较,东方财富(http
8、:/)在同类财经金融类网站中排名居首。所以,本文以东方财富网作为数据来源。本文下载了 2008 年 8 月 11 日到 2009 年8 月 14 日的在线股评数据,原因是在这个时间段上证经过了一次牛熊市。2008 年 8 月 11 日到 2009 年 8 月 14 日的在线股评数量共计 33641 贴,本文分别按 1 天,3天,5 天为时间周期统计发帖总数量,并分别计算 1 天,3 天,5 天后股指变化数,以此分析发帖量与股指变化的关系。3.2 在线股评帖子数量与股指相关分析首先,我们画出发帖量以及对应股指关系图。如图 1 所示。可以看出发帖量与股指存在一定的关系。进一步,可以进行严格的数学分
9、析,这里运用相关分析。通过图像可以直观分析得到上升趋势和下跌趋势中,发帖量与股指相关性是刚好相反的,由此本文把下跌和上升分开计算得到r1 = 0.4940; r2= -0.5981其中 r1 代表下降趋势中的相关系数, r2 代表上升趋势中的相关系统。下降阶段为 2008-8-11 至2008-11-7,上升阶段为 2008-11-10 至 2009-8-14.4图 1 发帖量与股指关系图从相关分析结果来看,股指与发帖量存在中度相关关系。由此我们进一步分析 1,3,5 天发贴量与股指的变化量的关系,得到如表 1 结果:表 1 周期发帖量与周期股指变化相关系数由表格 1,知道上升趋势中,发帖量与
10、股指变化负相关;下降趋势中,发帖量与股指变化正相关。除了以天为周期,上升趋势中,发帖量与股指变化弱相关之外,其他情况低度相关。3.3 不同周期帖子数量与股指趋势规则分析由 3.2 节分析得知,周期为 1 天的情况没有参考价值。因此本文主要分析周期为 3 天和周期为 5 天,这 2 种情况。(1)周期为 3 天的情形通过观察,可以发现帖子数量在 200-900 贴之间,本文把帖子数量分为 7 个区间,通过统计计数法,得到如下规则:下跌趋势 200-300 贴 无上升趋势 200-300 贴 88%涨,平均 67 点, 12%跌,平均 -112 点下跌趋势 300-400 贴 36%涨,平均 80
11、 点, 64%跌,平均 -100 点上升趋势 300-400 贴 69%涨,平均 67 点, 31%跌,平均- 44 点下跌趋势 400-500 贴 20%涨 平均 82 点, 80%跌 平均-84 点5上升趋势 400-500 贴 41%涨,平均 74 点, 59%跌,平均-82 点 下跌趋势 500-600 贴 8%涨,平均 40 点, 92%跌,平均 -106 点上升趋势 500-600 贴 40%涨,平均 94 点, 60%跌,平均 -101 点下跌趋势 600-700 贴 50%涨,平均 143 点, 50%跌,平均-51 点上升趋势 600-700 贴 40%涨 平均 95 点,
12、60%跌,平均-95 点下跌趋势 700-800 贴 50%涨,平均 92 点, 50%跌,平均-0.04 点上升趋势 700-800 贴 0%涨, 100%跌,平均-261 点下跌趋势 800-900 贴 100%涨,平均 170 点, 0% 跌上升趋势 800-900 贴 无(2)周期为 5 天的情形观察发帖数据大都在 400-1100 贴之间,因此可以把数量分解成 6 个区间,通过统计计数法,得到如下规则:下跌趋势 400-500 贴 无上升趋势 400-500 贴 96%涨, 平均 172 点, 4%跌, -159 点下跌趋势 500-600 贴 100%跌 平均 -71.5 点上升趋
13、势 500-600 贴 87.3%涨,平均 136 点, 12.7%跌,平均-49.5 点下跌趋势 600-700 贴 10%涨 平均 63.8 点, 90%跌,平均-157 点上升趋势 600-700 贴 67%涨,平均 95 点, 33%跌,平均-119 点下跌趋势 700-800 贴 7%涨,平均 50 点, 93%跌,平均-188 点上升趋势 700-800 贴 60%涨, 平均 77 点, 40%跌, 平均-97 点下跌趋势 800-900 贴 100%跌, 平均 -207,上升趋势 800-900 贴 40%涨,平均 73 点, 60%跌,平均-152 点下跌趋势 900-1000
14、 贴 25%涨, 平均 58.9, 75%跌,平均-232 点上升趋势 900-1000 贴 12.5%涨,平均 8 点, 87.5%跌, 平均 -160 点下跌趋势 1000 贴外 83.3%涨,平均 198 点, 16.7%跌,平均 -10 点上升趋势 1000 贴外 无由上述(1)(2)两种情形,可以看出,下跌趋势中,发帖量达到顶峰的时候,往往意味后续几天的暴涨,反之,在上涨趋势中,发帖量达到顶峰的时候,往往意味后续几天的暴跌。 本规则6对于实际投资操作有指导作用。4 实验结果4.1 数据准备本文实验采用背对背的测试方法,即学习规则用的数据与测试数据不一致. 测试数据同样来自东方财富网(
15、http:/) 上证指数吧。 本文下载计算了 2009 年 8 月 17 日到2009 年 9 月 11 日的在线发帖量. 在应用规则过程中, 上升趋势和下降趋势的选择方法基于 13日均线, 即大于 13 日均价则视为上升趋势, 小于 13 日均线视为下降趋势。由于本文研究前人目前还没有类似工作,因此不进行对比实验。4.2 规则预测实验本文基于 20 日测试数据,分别应用 3 日周期规则,和 5 日周期规则,分别如表 2,3 所示。 由表可以计算得出 5 日周期规则预测中有 7 个错误,13 个正确, 正确预测率 65%;3 日周期规则预测中有 13 次预测正确,有 7 次规则无法预测,正确预
16、测率为 65%。3 日与 5 日周期规则预测准确率基本一致,因此实际使用可使用 3 日,也可使用 5 日的规则预测。表 2 3 日周期预测情况表从实验中,我们可以看出,发帖量对于预测股指走势有一定准确率,65%的准确率,可以指导投资者盘中操作。而本文在发帖量与股指大走势之间得到的结论:即发帖量冲向顶峰的时候,在上升趋势中,往往意味大跌,下降趋势则刚好相反。本文所发现的宏观规则,能有效指导投资者把握好牛熊转换规律,有效率的进行投资布局和避免投资损失。7表 3 5 日周期预测情况表5 结论本文在借鉴互联网与金融市场成熟地区在线股评研究的理论与方法的基础上,对我国股票论坛中在线股票评论展开研究,分析
17、了在线股评的数量与上证指数表现的关系。研究发现:(1)在线股评数量与上证指数存在较强的相关性;(2)一定周期下的在线股评数量对股票投资具有指导作用。本文为股票市场的研究提供了新的途径,并为基于股票评论的股票市场研究提供了有力的证据和可以参考的结论。本文只从在线评论的数量上对上证指数进行了研究,没有考虑评论的具体内容,未来的研究中,可以深入研究股评内容对股市变量的影响;其次,本文也未考虑多周期,多因素联合情况下,股评数量与上证指数的关系,在以后的研究中,可引入多元线性回归分析等方法,提炼准确率更高的预测方法。6 参考文献1Shleifer,A ,Inefficient Market:An Int
18、roduction to Behavioral FinanceMNew York:Oxford University Press,USA, 2000 2Shleffer,A ,Summers,LH The Noise Trader Approach to FinanceJThe Journal of Economic Perspectives1990;4(2):19333中国互联网络信息中心第 27 次中国互联网络发展状况统计报告R北京:中国互联网络信息中心,20114Wysocki,PDCheap talk on the Web:The determinants of position st
19、ock message boardsJAnn Arbor,1998,1001:4810912345Antweiler,W ,Frank,MZIs All That Talk Just Noise? The Information Content of Internet Stock Message BoardsJJFinance 2004,59(3):1259946Tumarkin,R ,Whitelaw,RNews or Noise? Internet posting and Stock PricesJFinancial 8Analysts Journal,2001,57(3):41517 D
20、as,S ,Chen,MYahoo! For amazon:Sentiment extraction from small talk on the WebJManagement Science2007,53(9):1375 一 C888 Sahherwal,S ,Sarkar, S., Zhang, Y Online Talk: Does It Matter J? Managerial Finance. 2008;34(6):423369李玉梅,闫相斌,胡洋在线股评对股票市场的影响分析C中国管理科学2011. 19(10) 专辑:38639010 Assessing Public Opinions through Web 20:A case Study on WalMartCICIS,200911马向前,万帼荣影响我国股票市场价格波动的基本因素J山西统计2001,(01):2223,2912史美景会计信息对股票价格影响作用的回归分析J西部论坛2002. 4(02):3032