计算动词理论在股票数据分析中的应用
姓名:张梦帆
学院:信息科学与技术学院
系:电子工程系
指导老师:杨涛
研究目标
本文应用计算动词理论对中国沪市股票市场进行研究,旨在得出沪市股票市场的主要分类及各分类的代表曲线。
研究意义
2
在计算动词的帮助下得到较为理想的股票数据分类及其典型代表曲线
1
探讨计算动词理论在经济领域,尤其是在股票市场领域的优越性。
3
通过对代表曲线的研究,能够更好地分析股票市场动态及其内在规律。
研究综述
对数据进行预处理
(平滑、归一化)
求数据曲线与标准动词间的相似度
应用kmeans算法进行数据聚类
输出每类代表曲线
1
2
3
4
一、数据的预处理
1. 对数据进行平滑处理
我们要研究的是股票的长期发展趋势,其中的短期波动会影响我们的分析。需要剔除高频噪声分量。我们设计低通滤波器来实现此过程。
浦发银行(编号600000)2010年3月10日股票价格波动曲线
自适应低通滤波器设计
经过反复试验,根据信号处理工程处理的原则,选择信号能量的85%或90%或95%作为保留部分,而能量的保留恰对应于低频通带。
MATLAB实现效果对比图:
数据归一化
为了方便大量数据的统一处理,我们对数据要进行归一化处理。本文采用线性函数变换方式,因为这种方式方便使用和理解。
y=(x-MinValue)/(MaxValue-MinValue)
MATLAB仿真效果图:
求数据曲线与标准动词间的相似度
本文选取的计算标准动词:
本文设置的MATLAB格式为:
increase=0:1/238:1;
decrease=1:-1/238:0;
stay=*ones(1,239);
图3-5显示的是此标准动词组的三条基本动词曲线。其中红色直线为“increase”绿色线为“stay”;蓝色线为“decrease”.
求数据曲线与标准动词间的相似度
相似度计算函数
距离的相似度采用欧几里德距离,其中K为采样个数:
趋势的相似度为:
根据实际情况本文采用一个复合的的动词相似度计算函数:
二、求数据曲线与标准动词间的相似度
本文采用的相似度计算规则:
曲线xn
s1 s2 s3
s1
s2
s3
x y z
xn1
xn2
xn3
.
.
.
曲线矩阵
.
.
.
应用以上规则
计算动词理论在股票数据分析中的应用 来自淘豆网m.daumloan.com转载请标明出处.