以往预测期货价格的方法有哪些 o 搜索关键词:Reviews on stock market prediction o 传统预测方法 o 机器学习 o 深度学习 舆情预测的必要性和重要性 o 情绪是指市场参与者和一般公众对金融市场、股票或经济状况所 表达的态度、意见和情绪。这些情绪可以是积极的、消极的,也 可以是中性的,不仅来自新闻文章和社交媒体帖子等文本数据, 还包括更广泛的市场心理和行为因素 情绪分析方法 o 可以参考的论文 综述中:在本研究中,数据筛选过程由两位领域专家进 行,特别是第二和第三作者,他们在研究股票市场预测的 情绪分析方面拥有丰富的经验。两位专家都拥有数据科学 相关领域的高级学位,重点是情绪分析,两位专家都发表 了多篇关于情绪分析及其在股市预测中的应用的同行评审 文章。 o 舆情预测方法 研究人员利用各种情绪分析方法,包括情绪词典、基于词 典的方法、机器学习、深度学习和混合方法,从文本数据 中解释市场情绪。 首先,情绪词典,如哈佛心理学和劳克兰-麦克唐纳,通过 提供与积极或消极情绪相关的预定义单词列表,使用起来 很简单,可以根据单词的存在快速识别文本中的情绪。然 而,它们往往受到无法涵盖所有相关术语、理解上下文或 检测更复杂语言结构中的情绪的限制,从而降低了它们在 细微差别场景中的准确性(Li et al., 2021)目前,国内 研究者已经构建出了多个金融邻域相关词典。Yi([53]易 洪波,赖娟娟,董大勇,网络论坛不同投资者情绪对交易市场 的影响--基于 VAR 模型的实证 分析[.财经论 丛,2015,0(1):46-54.)(等人对东方财富网 股吧中的帖 子进行人工标注,整理了金融领域特有的情感词汇。Yao ([54]姚加权,冯绪,王赞钧.语调,情绪及市场影响:基于金 融情绪词典[J,管理科学学报,2021, 24(5):26-46.) 等人 针对口语化 的表达,结合大连理工大学情感词本题库、清 华大学褒贬义词典等构建了金融领域适 用词典。除了使用 人工标注的方式,研究者们也尝试采用各类算法自动标注情 感词典。 Jiang([55]姜富伟,孟令超,唐国豪.媒体文本情 绪与股票回报预测[J].经济学(季刊),2021,4:13231344.) 等人使用 word2vec 算法,对已有的情感词典进行 了有效的补充。 词典的问题:是否适用于当下场景,是否与期货预 测紧密相连,静态词典无法捕获动态变化的市场环 境 些关于情景分析的综述集中在深度学习(DL)方法 上,如(Mercha and Benbrahim, 2023;Yadav and Vishwakarma, 2020)。基于词典方法的 SA 调查比较 了 SA 工具,包括自然语言工具包(NLTK)、文本 blob、价感知词典和基本推理(VADER),发现 VADER 优于其他工具(Bonta 和 Janardhan, 2019) 基于词典的方法通常分为两种方法:基于词典的方 法和基于语料库的方法(Mitra, 2020) 词数分析方法通过字典识别每个单词的情感(积极 或消极)并求和来确定文本情感,常用的有 Loughran 和 McDonald 的金融词典以及哈佛 - IV 词典。(Nti, I. K., Adekoya, A. F., & Weyori, B. A. (2020). Predicting Stock Market Price Movement Using Sentiment Analysis: Evidence From Ghana. Applied Computer Systems, 25(1), 33–42. https://doi.org/10.2478/acss-20200004) 其次,基于词典的方法通过结合更复杂的规则和启发式来 扩展情感词典,以考虑情感的强度并处理一些上下文细微 差别来确定情感(Shang 等人,2023)。然而,这些方法 与情感词典有着相同的基本限制,比如依赖于预定义的单 词列表,以及与上下文特定含义的潜在斗争。第三,与基 于词典的方法相比,支持向量机(svm)和决策树等机器学 习方法能够检测数据中更复杂的模式和关系,被广泛用于 情绪预测。Wu et al.(2021)采用维度价值唤醒来定义股 票市场趋势的情绪和交易强度,以促进股票市场情绪的预 测。Parray 等人(2020)利用支持向量机和逻辑回归预测 市场指数。然而,它们仅限于对大量标记数据进行训练的 高要求以及过度拟合的风险。 机器学习方法中常用的技术包括支持向量分类器 (SVC)、朴素贝叶斯和神经网络(NN)等,但该方 法存在人工标注训练数据集耗时的问题,基于 SVM 和 PSO 的新闻情感分析与股价预测:有研究提出用 粒子群优化(PSO)技术增强的支持向量机(SVM) 对新闻进行情感分析,以预测股价走势,证实了网 络新闻与股价变动的相关性,并实现了比深度学习 模型更高的预测准确率(Nti, I. K., Adekoya, A. F., & Weyori, B. A. (2020). Predicting Stock Market Price Movement Using Sentiment Analysis: Evidence From Ghana. Applied Computer Systems, 25(1), 33–42. https://doi.org/10.2478/acss-2020-0004) 此外,深度学习方法,如卷积神经网络(cnn)和长短期记 忆网络(LSTMs),在捕获长期依赖关系和理解复杂的语言 结构方面特别有效,代表了情感分析的前沿(例如,Zhao 和 Yang, 2023;Albahli and Nazir, 2024)。例如, Zolfaghari 和 Gholami(2021)将自适应小波变换、lstm 和 armax - garch 方法结合起来用于股票指数预测。Singh (2023)使用 lstm 进行时间序列预测,以提高股价预测精 度。据报道,基于变压器(bert)双向编码器表示的后训 练模型可以有效地提取方面并对情感进行分类(Xu et al., 2019)。然而,与机器学习类似,深度学习模型也需 要大量的资源进行训练,需要大型数据集来避免过度拟合 和推广到新数据。Chandar(2022)利用 Gramian Angular Field 将从历史数据中提取的 10 项技术指标转化为图像, 并作为特征向量集成到 cnn 中,以提高预测精度。 Daradkeh(2022)开发了一种用于股票趋势预测的 CNNBiLSTM 混合模型,并在迪拜金融市场数据上进行了实验, 表明联合使用新闻事件/情绪和定量金融数据提高了股票市 场预测的准确性 机器学习深度学习问题:只关注一种方法忽略其他 方法的有效性 近年来,越来越多的人采用混合方法来提高股市预测的准 确性,这种方法结合了多种方法的元素,以发挥各自的优 势,同时减轻其弱点。例如,Jing et al.(2021)提出了 一种混合方法,首先利用 CNN 对来自知名股票论坛的投资 者隐藏情绪进行分类,然后应用 lstm 分析来自股票市场的 技术指标以及情绪分析结果。Sharaf 等人(2023)引入了 一种混合系统,该系统集成了机器学习和深度学习模型, 用于挖掘社交媒体数据和历史股票数据,以提高整体股票 趋势预测的准确性。这些混合方法虽然通常可以提高准确 性和健壮性,但在实现和调优方面往往会增加复杂性,并 且需要仔细集成和平衡不同的方法,以确保最佳的模型性 能。 一般集成预测方法:一般集成预测方法是基于同质数据, 通过组合多个基础模型的预测结果来提升整体预测性能。 常见的一般集成方法有堆叠集成、装袋集成和提升集成。 例如,Zhao 等(2017)运用堆叠去噪自动编码器(SDAE) 来模拟油价与其影响因素之间的复杂关系,并借助自举重 采样(装袋)技术生成多个数据集,用于训练一组 SDAE 模型,该方法展现出比其他方法更优的预测能力。Sun 等 (2020)将 LSTM 神经网络与装袋集成策略相结合,实现 了准确的汇率预测,同时提高了交易盈利能力,其实证研 究表明 LSTM - B 方法在预测准确性和潜在交易盈利方面 o 效果显著。Jiang 等(2021)采用一种新颖的分解 - 选择 - 集成预测系统对原油和天然气期货价格进行预测,结果 显示该系统优于其他模型。然而,一般集成预测方法往往 忽视其他类型数据及其各自的特征和所包含的信息,这种 信息的缺失可能导致模型在预测时遗漏重要的关系和洞 察,进而限制了预测信息的多样性和丰富性。而且,过度 依赖单一类型的数据会增加模型过拟合的风险,使得模型 在面对新的或未见过的数据时表现不佳。 多模态集成预测方法:多模态集成预测方法利用多种不同 类型的数据,如统计数据、新闻文本和社交媒体情绪等, 来提高预测的准确性。其核心目的是整合不同模态的信 息,以获得更全面、精确的预测结果。例如,Cheng 等 (2022)提出多模态图神经网络(MAGNN)用于预测金融时 间序列,该模型利用历史价格序列、媒体新闻和相关事件 等多模态输入,提高了预测的准确性。Ortega - Bastida 等(2021)提出一种多模态预测方法,将历史 GDP 数据与 Twitter 消息中的信息相结合,对西班牙不同地区的 GDP 进行预测,并取得了成功。Xue 等(2023)引入了一种多 模态深度学习方法,用于预测每小时景点的游客吸引力, 该方法结合了搜索引擎数据、社交媒体数据以及多景点客 流量数据,通过整合小时和日度特征,提升了预测精度。 He 等(2023)提出了一种基于深度学习集成方法的金融时 间序列预测模型 CNN - LSTM,该模型捕捉了时空数据特 征,并结合 ARMA 模型考虑了自相关特征,在金融时间序 列预测中能处理线性和非线性特征。Wang 等(2023)提出 了一种用于社会电力需求预测的多模态信息融合方法,开 发了 CNN - LSTM 模型,将文本数据与传统时间序列数据 相结合,实证结果证明了该模型的有效性以及不同数据类 型融合在提升预测性能方面的作用。在预测农产品期货价 格时,多模态集成模型具有显著优势,因为农产品期货价 格受多种因素影响,包括投资者情绪和外部力量等。通过 融合金融新闻、社交媒体评论等多种信息来源,多模态集 成预测模型能够更全面地理解农业市场的动态本质,从而 做出更准确、更全面的预测。 舆情文本 搜索引擎 谷歌搜索趋势与股市关系:有研究探讨谷歌搜索趋 势与股市交易量和波动性的关系,发现谷歌搜索无 法预测未来异常收益,但搜索量的增加能预测交易 量和波动性的上升,表明谷歌搜索与未来交易活动 的关联更强。 谷歌搜索与黄金市场关系:研究经济不确定性和投 资者关注对黄金价格变化及其波动性的影响时发 现,印度发起的谷歌搜索与黄金市场的相关性更 强,且搜索量增加与黄金价格下跌和波动性增加相 关,这种关系不仅是相关性,还具有双向的高预测 能力。 其他搜索引擎与股市关系:有研究提出使用自动搜 索词选择和自适应方法,利用网络搜索数据预测股 市走势,证实了网络搜索数据的预测能力。对中国 搜索引擎百度指数对中国股市波动性影响的研究发 现,基于百度指数能以较高准确性预测股市波动 性,在经济不稳定时期尤为明显。不过,也有研究 指出,基于搜索引擎查询的交易技术在扣除交易成 本后可能无法盈利。以上都是(Nti, I. K., Adekoya, A. F., & Weyori, B. A. (2020). Predicting Stock Market Price Movement Using Sentiment Analysis: Evidence From Ghana. Applied Computer Systems, 25(1), 33–42. https://doi.org/10.2478/acss-2020-0004) 社交媒体 基于 Twitter 数据的股市信任管理框架:提出基于 Twitter 股票相关数据(推文)的股市信任管理框 架,研究发现异常股票收益与 Twitter 情感之间存 在正相关。 基于推文情感分析的股市预测:有研究利用模糊决 策平台研究推文情感分析对股市走势的影响,召回 率在 69% - 96% 之间。还有研究从推文情感的绝对 数量、推文情感的点赞加权和转发加权三个角度, 构建预测巴西股市走势的情感分析框架,证实了基 于推文情感的股市可预测性,且 MLP 在预测中表现 优于其他分类器。但推文数据存在问题,如用户可 能通过多个账户发帖影响舆论,且多数股票推文是 对过去股价变动的回应,仅用推文作为股市分析的 输入特征可能影响模型准确性,以上都是(Nti, I. K., Adekoya, A. F., & Weyori, B. A. (2020). Predicting Stock Market Price Movement Using Sentiment Analysis: Evidence From Ghana. Applied Computer Systems, 25(1), 33–42. https://doi.org/10.2478/acss-2020-0004) 社交媒体在股票价格预测中的应用尝试:随着现代 媒体的发展,许多研究开始将社交媒体纳入股票价 格预测的研究范畴,其中 Facebook、Twitter 等平 台被广泛应用。例如,有研究专门以 Twitter 为语 料库进行情感分析,并阐述了推文收集和处理的方 法。该研究利用特定表情符号构建情感分类训练 集,避免了手动标记推文的繁琐过程,根据快乐和 悲伤表情符号将训练集划分为积极和消极样本,为 利用 Twitter 数据进行股票价格预测提供了一种新 的思路和方法。(Kordonis, J., Symeonidis, S., & Arampatzis, A. (2016). Stock Price Forecasting via Sentiment Analysis on Twitter. In Proceedings of PCI ’16 (pp. 3003733.3003787). ACM. DOI: http://dx.doi.org/10.1145/3003733.3003787) 财经新闻 基于 SVM 和 PSO 的新闻情感分析与股价预测:有 研究提出用粒子群优化(PSO)技术增强的支持向量 机(SVM)对新闻进行情感分析,以预测股价走势, 证实了网络新闻与股价变动的相关性,并实现了比 深度学习模型更高的预测准确率。 欧洲央行新闻与股价关系:研究欧洲央行新闻情感 基调与股价变动的关系发现,新闻情感对股价收益 率的波动性和均值有显著影响,且在金融危机期 间,新闻情感与股市波动性的关联更强。然而,网 络财经新闻存在股票相关新闻稀疏的问题,这对基 于新闻的预测模型是个限制,因为机器学习模型部 分依赖输入数据集的数量。 《纽约时报》新闻与股市关系:利用信息理论和随 机矩阵理论分析《纽约时报》新闻与股市的关系, 发现新闻不仅与股市相关,还对股价走势有较高的 预测能力,支持了行为金融学作为当代经济范式的 观点。以上都是((Nti, I. K., Adekoya, A. F., & Weyori, B. A. (2020). Predicting Stock Market Price Movement Using Sentiment Analysis: Evidence From Ghana. Applied Computer Systems, 25(1), 33–42. https://doi.org/10.2478/acss-2020-0004)) 同时适用 探索不同舆情文本之间的相关性 在大数据时代,随着越来越多的公共数据被访问 (Rumsfeld et al., 2016),对自动文本分类的需求也在 增长(Binkhonain and Zhao, 2019),推动了自然语言处 理(NLP)、分类和深度学习方法在新闻情感分析中的应 用,以预测股票趋势。例如,Sinha 等人(2022)基于 SEntFiN 1.0 数据集为从新闻文章中识别的实体提取了细 粒度的金融情绪,Anbaee Farimani 等人(2022)开发了 一个 FinBERTempowered 的预测模型,用于计算金融新闻标 题的情绪。 文本数据通常从网络获取,主要来源有搜索引擎查询、网 络财经新闻和 Twitter 推文,因此文献综述围绕这三个数 据来源展开(Nti, I. K., Adekoya, A. F., & Weyori, o 创新点 常用的舆情文件:社交媒体和财经新闻 o 考虑多个数据源:Weng 等人(2018)使用集成方法设计了一个金 融专家系统,该系统集成了多个数据源,用于提取谷歌、维基百 科和金融新闻情绪,以预测短期股票价格 o 考虑多个特征,采用 TFT(时间融合转换器)和 SHAP 两种可解 释人工智能(XAI)模型,从特征重要性和特征部分依赖性两个方 面对玉米价格预测过程进行解释,全面评估和理解不同解释方法 对玉米价格预测的影响和贡献 。(刘宏宇。基于双注意力机制 LSTM 的粮食价格预测与解释研究 [J]. 粮油食品科技,2025, 33 (1):272-279.) 目前的研究现状 o 深度学习应用的广泛性:cnn 和 lstm 等深度学习模型越来越普遍 地用于股票价格预测 o 新闻文本数据:第二个主题揭示了使用从金融新闻文章中提取的 新闻情绪的普遍性 o 了解投资者情绪如何影响金融市场 o 人们对利用社交媒体平台上表达的情绪越来越感兴趣,特别是微 博,微博已经发展成为人们实时发布他们对政治、金融和经济等 话题的感受和观点的有用工具(Sun et al., 2020),用于股票 趋势预测。鉴于包括股票微博在内的在线投资社区在个人投资者 和金融专业人士中越来越受欢迎(Li et al., 2018),学者们已 经使用情感分析来自动挖掘有意见的内容,以识别微博用户的意 见(Oliveira et al., 2016)。例如,Ye 等人(2021)专注于 使用多视图集成学习融合不同特征的信息进行微博情感分类,Sun 等人(2020)根据微博用户的身份将微博用户划分为不同的集 群,并研究了不同集群对股票市场的影响。 未来研究方向(如何做到) o 首先是开发适应实时数据和不断变化的市场条件的模型,例如, 集成来自各种来源的实时数据馈报,并使用机器学习技术动态更 新情感词典 o 。第二个建议侧重于结合多个数据源和混合模型,以提供市场情 绪的整体视图(例如,Ma 等人,2023;Chen et al., 2024c)。 o 另一个建议是调查情绪对股价的非线性影响,并检查不同细分市 场的异质性,以更深入地了解市场动态,并捕捉情绪与市场行为 之间的复杂关系。 o B. A. (2020). Predicting Stock Market Price Movement Using Sentiment Analysis: Evidence From Ghana. Applied Computer Systems, 25(1), 33–42. https://doi.org/10.2478/acss-2020-0004) 舆情对期货价格预测 public sentiment analysis futures price prediction (关键字) o 扩大研究范围,包括更广泛的市场事件和条件,以确保情绪分析 模型的稳健性和泛化性。
0
You can add this document to your study collection(s)
Sign in Available only to authorized usersYou can add this document to your saved list
Sign in Available only to authorized users(For complaints, use another form )