人工智能方法在股票数据分析中的应用
              人工智能方法在股票数据分析中的应用
2013年06月25日
人工智能方法在股票数据分析中的应用
历代王朝摘要:
股票是一种有价证券,是股份公司在筹集资本时向出资人公开或私下发行的、用以证明出资人的股本身份和权利,并根据持有人所持有的股份数享有权益和承担义务的凭证。 只有股份有限公司可以发售股票,有限责任公司只能发给股东持股证明,不能转售。股票的分析涉及大量的复杂数据和计算,我们不可能单靠人力来完成这样的计算。股票的实时走势是投资者最关心的,影响股票走势的因素很多,我们怎样最快的得到比较可靠地估测结果呢,人工智能的研究方法提供给了我们解决办法。
引言
    时间序列分析方法就是从具有先后顺序的信息中提取有用信息,它是数理统计的一个重要分支。时间序列分析方法的实质是通过对历史数据的处理,寻出前后数据之间的关系,建立关联模型,然后通过历史数据和所建立的关联模型来预测时间序列的未来值,从而把握事物的未来发展。由于大量研究数据可获得性和相关问题具有的挑战性,金融领域一直是时间序列研究的热点,各国学者也取得了非常丰富的成果,为金融决策分析及金融风险规避提供了大量有价值的资料,并在应用领域研究中取得了重大的理论突破。
     金融时间序列分析研究的是资产价值随时间演变的理论与实践。它是一个带有高度经验性的科学,但也想其他学科领域一样,理论是形成分析推理的基础。然而,金融时间序列分析有一个区别于其他时间序列分析的主要特点:金融理论及其经验的时间序列都包含不确定因素。例如,资产波动率有各种不同的定义。对一个股票收益序列,波动率是不能直接观察到的,正因为带有不确定性,统计理论的方法在金融时间序列分析中期重要作用。
    开始将时间序列的分析方法应用于金融时间序列的方法主要是基于统计和线性的方法,例如移动平均算法,指数平滑算法,移动平均算法,自回归移动平均算法等等。所谓移动平均,是指给定的一组历史数据,计算这组历史数据的平均值,然后利用这一平均值最为
下一期的预测值。移动平均方法具有简单、直观和容易理解等优点,同时容易从数据序列中排除季节分量。然而其也有其不足之处:其一,当预测项较多时,需要存储大量数据;其二,最新观测值应该较早期观测值包含更多的信息,则应该给予较大的权重,但是移动平均方法对每个观测值都给予相同的权重。同时在很多文献中已经表明移动平均算法的预测精度是比较低的。[Makridakis S, Wheelwright S C and Mc Ggee V E. Forecasting Methods and Application, New York: Wiley, 1983]
    指数平滑算法诞生于本世纪50年代末,是由Brown和Winters两位学者提出的,其基本思想是兼容了全期平均和移动平均所长,不舍弃过去的数据,但是仅给予逐渐减弱的影响程度,即随着数据的远离,赋予逐渐收敛为零的权数。实际预测中,经常使用低阶平滑模型,高阶平滑模型的使用则相对较少;适应参数平滑模型有Trigg和Leach[Trigg J W and Lim K S., Threshold autoregression. ]提出,但是通过许多研究表明,其预测效果并不是很好。[Makridakis S and Hibon M. Accuracy of forecasting: an empirical investigation. Journal of the Royal Statistical Society]但是作为一种方法论,平滑模型不具有模型识别和诊断检测的客观程序,由于这一缺陷,平滑模型也受到理论学者的批评。[Harrison P J and Stevens C F., A Bayesian approach to short-term forecasting.]另外,平滑模型不是对
应单一的模型,而是一组模型,在使用这些模型时,常常在一开始就要施加一个非常严格的先验限制,不像下面将介绍的Box-Jenkins模型那样具有一点的灵活性。尽管平滑有许多不足,但其简单易懂等优点,使得它在时间序列预测方法中占有举足轻重的地位。
感恩的故事    早在上个世纪20年代,Yule就提出了自回归模型的概念,但是在当时对预测并没有产生太大的影响。直到70年代,由Box和Jenkins在《Time Series Analysis: Forecasting and Control》中提出的Box-Jenkins模型几乎成为自回归移动平均模型(ARIMA)的代名词,同时概述也被誉为时间序列分析的最经典著作。该方法最大的优点在于其一般性,能够处理各种数据模式;同时在统计上是完善的,有较为牢固的理论基础,该方法论提出了一种正规的,结构化的建模途径,同时也提出了基于吝啬原理建模的哲学。其建模的基本思想是:将预测对象随时间推移而形成的数据序列视为一个随机序列,用一定的数学模型来近似描述这个序列。这个模型一旦被识别后就可以从时间序列的过去值及现在值来预测未来值。现代统计方法、计量经济模型在某种程度上已经能够帮助企业对未来进行预测。Box-Jenkins方法是理论上最为完善的预测方法。随着预测技术的普及和计算机的广泛应用一度成为研究人员的关注热点。
人工智能方法在金融时间序列中的应用
    虽然基于统计和线性假设前提下所提出的一些模型在一定程度上满足了我们要求的性能指标,在特定领域取得了很好的分析和预测效果。但是,总所周知,金融领域可谓一个存在非线性,混沌性等环节的复杂非线性系统。传统的时间序列分析方法直接应用于金融时间序列,很难取得令人满意的效果。尽管基于自回归移动平均模型的一些改进算法取得了一定提高,但荏苒不恩那个很好的解决非线性环节的存在所产生的噪声干扰。因此,从事金融时间序列分析的学者将一些人工智能的方法引入到金融时间序列的分析中。例如,计算智能(Computational Intelligence )中的遗传算法(Genetic Algorithm)以及人工神经元网络(Artificial Neural Networks)、模糊分析方法(Fuzzy Analysis)、智能体(Agents)等等。目前,众多学者又提出了混合算法的思想,就是将人工智能的方法与传统的算法相结合。用常规的方法处理金融时间序列的线性部分,将得到的残差利用智能算法进行处理,从而得到更好的分析与预测的效果。 
    计算智能是以生物进化的观点认识和模拟智能。按照这一观点,智能是在生物的遗传、变异、生长以及外部环境的自然选择中产生的。在用进废退、优胜劣汰的过程中,适应度高的(头脑)结构被保存下来,智能水平也随之提高。因此说计算智能就是基于结构演化的智能。计算智能的主要方法有人工神经网络、遗传算法、遗传程序、演化程序、局部搜
索、模拟退火等等。这些方法具有以下共同的要素:自适应的结构、随机产生的或指定的初始状态、适应度的评测函数、修改结构的操作、系统状态存储器、终止计算的条件、指示结果的方法、控制过程的参数。计算智能的这些方法具有自学习、自组织、自适应的特征和简单、通用、鲁棒性强、适于并行处理的优点。
梭子蟹蒸多久      人工神经网络(Artificial Neural Networks, ANN),一种模范动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。人工神经网络具有自学习和自适应的能力,可以通过预先提供的一批相互对应的输入-输出数据,分析掌握两者之间潜在的规律,最终根据这些规律,用新的输入数据来推算输出结果。
    自己做的小麻薯方本在进行金融时间序列分析中,通常采用BP神经网络,一种采用反向传播算法是多层前馈前馈网络。将其引入到金融时间序列分析之中,将传统方法分析历史数据得到的残差作为神经网络的输入,通过训练,从而得到分析值或者预测值的非线性部分。然后再与传统方法(例如自回归移动平均算法(ARIMA))得到的分析值或预测值的线性部分进行叠加,叠加后的结果最为最终的分析值。这样一来,大大的提高的分析和预测的精度。但是在应
用神经元网络的过程中也存在一些问题,比如隐层数目的选取,学习率的确定,过拟合和欠拟合现象等等。因此后来又提出了支持向量机算法,一种很有效的机器学习工具。不仅避免了人工神经元网络算法的诸多缺陷,而且在很大程度上提高了对于金融时间序列非线性部分分析和预测的精度。
      遗传算法(Genetic Algorithm)是模拟达尔文的遗传选择和自然淘汰的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法,它是有美国Michigan大学J.Holland教授于1975年首先提出来的,并出版了颇有影响的专著《Adaptation in Natural and Artificial Systems》。该算法是从代表问题可能潜在的解集的一个种(population)开始的,而一个种则由经过基因(gene)编码的一定数目的个体(individual)组成。因此开始需要实现从表现型到基因型的映射即编码工作。由于仿照基因编码的工作很复杂,往往采用二进制编码来对问题进行简化。初代种产生之后,按照适者生存和优胜劣汰的原理,逐代(generation)演化产生出越来越好的近似解,在每一代,根据问题域中个体的适应度(fitness)大小挑选(selection)个体,并借助于自然遗传学的遗传算子(genetic operators)进行组合交叉(crossover)和变异(mutation),产生出代表新的解集的种。这个过程将导致种像自然进化一样的后生代种比前代更加适应于环境,末代种
保暖内衣哪个牌子的好中的最优个体经过解码(decoding),可以作为问题近似最优解。
四级怎么算分
    对金融时间序列进行预测时,如果采用人工神经元网络的方法,则可以用遗传算法进行特征分离和神经元间权值的选取。通过[Genetic algorithm approach to feature discretization in artificial neural networks for the prediction of stock price index]可以得出,应用遗传算法不仅可以提高学习算法本身,还可以降低特征空间的复杂性,同时也能优化网络层之间的权值以及特征分离的阈值。总而言之,应用遗传算法,可以降低特征空间的维度和减少不相关因素对分析和预测的影响。
    近年来,模糊的思想被引入到金融时间序列分析的研究中来,并且在众多文献中取得了很好的分析和预测效果。选取预测模型的重要标准之一仍然是预测的精度。到目前,在金融市场中的预测中,定性的方法已经成为一种十分重要的手段,特别是针对金融的决策和投资。人工神经元网络方法是一种可以广泛应用到时间序列分析领域的一种有效的手段。该算法需要长时间的大量的历史数据,从而来构建一个更加精确的模型。然而,在现实世界中,特别是在金融市场中,产生金融时间序列的环境是充满不确定性和多变性的。因而,在这种环境下进行预测就必须采用在较短的时间内利用较少的数据信息。虽然模糊的
方法可以应该到这种环境,但是最终结果并不总是令人满意,常与人工神经元网络一起构建一个混合模型,从而可以利用较小的数据集来提高预测精度。同时还可以弥补神经元网络的单纯模糊自回归方法的缺陷。[Mehdi Khashei, Seyed Reza Hejazi, Mehdi Bijari, A new hybrid artificial neural networks and fuzzy regression model for time series forecasting]目前台湾,韩国一些学者又提出了应用模糊技术的高阶模糊时间序列的概念,从而将模糊技术更好的与传统算法相结合的同时,有效的提高了分析和预测精度。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。