基于遗传算法的股票市场选择模型
摘要:为提高投资者在股票市场的收益,解决在证券投资中股票选择这一重要问题,提出一种基于遗传算法的股票选择模型。算法以上市公司的财务指标为样本特征,为克服K-means算法的不稳定性,采用基于遗传算法的K-m<i<n+1,n为股票样本总数),股票样本是由上市公司的10个财务指标和它的股票回报率组成的一个11维空间,即S={X]X2xn}。Sz-[j]表示第i只股票样本的第j+1个财务指标(0j9),Sz-[10]表示第i只股票样本的回报率。T代表训练集,即T={S1S2Sn},n只股票样本组成模型训练数据集。V代表验证集,即V={S1S2Sn},n只股票样本组成验证模型数据集。P代表股票选择模型筛选条件,即P={p1p2p10},Pj为对应表1所示第j个财务指标的筛选条件。q代表是否选择第i只股票,选择时等于1,不选时等于0。P作为筛选条件进行股票选择时,对于第j个财务指标,若为正指标,股票的这一项指标xj需要不小于pj;若为逆指标,股票的这一项指标xj需要不大于Pj。如果股票的10项指标都满足条件,则该只股票被选择。反之只要有一项指标不满足,则该只股票不被选择。
定义原则1证券投资理论中,投资策略是一系列投资组合的总称,分为积极和消极的投资策略[10]o消极投资策略是指通过基本面分析和组合投资的方法来获得平均收益,即获得的平均收益越高,投资策略越好。
定义原则2股票组合投资中股票的平均收益率是指总收益率除以股票个数,设定投资为等权组合投资。
基于以上原则,所以目标函数定义为选择股票的算术平均回报率最大值,其公式为:
纭Sz-[10]
maxT=1(1)
i=1
约束条件为:
c
i=1(Si[j]Pj+1(0j7)&&Si[8]P9&&Si[9]Pio)==1
i=0,(Si[j]Pj+1(0j7)&&Si[8]P9&&Si[9]P10)==0
纭>1(2)
i=1
取得最大平均回报率时的P即为最佳的股票选择模型参数。
3基于浮点数编码的遗传算法及改进
3・1染色体编码
染色体的编码方式有很多种,例如二进制编码、格
戎容,吴萍:基于遗传算法的股票市场选择模型2016,52(18)169
戎容,吴萍:基于遗传算法的股票市场选择模型2016,52(18)169
max
c1
Ip
m1
(6)
(7)
max
p=!
F
avg
Pm1是基准变异概率,紡、
雷码、浮点数编码、符号编码[11]。传统的遗传算法采取二进制编码以便于算法的交叉、变异操作。但是本文涉及的是多维数据操作,二进制编码会增加染色体编码长度、人为离散化参数取值,并且上市公司各项财务指标都是小数,所以在本文中米用浮点数编码,可以提高遗传算法的精度,减少计算量。同时针对采用浮点数编码在处理一些复杂问题时会发生的停滞现象,本文也提出了改进策略。
选择运算
选择运算把较好的个体按一定规则直接遗传到下一代群体中,适应度高的个体更容易遗传到下一代群体中。本文使用轮盘赌选择法[12],各个体被选中的概率Pri与其适应度值Fi成正比。设种群规模为N,则:
F
Pr=—=12N(3)
,tF
i
i=1
交叉运算
交叉运算是指把2个父代染色体的部分基因按某种方式交换重组,从而生成新个体,使得遗传算法的搜索能力大大提升。采用浮点数编码时,交叉运算使用适合浮点数编码的算术交叉算子[13]:
R+1=axt+(1-a丹
[t+1tt⑷
IB=(1-a)xA+axB
其中,a是[0,1]范围内的随机数。
变异运算是对群体中的个体串的某些基因座上的基因值作变动。变异操作使遗传算法具有局部的随机搜索能力并且可维持群体多样性,以防止出现未成熟收敛现象。均匀变异算子对于每个变异点从对应基因位的取值范围内产生一个随机数代替原有基因值[14]。即
x=xmin+r(xmax—xmin)(5)
其中,r是[0,1]范围内的随机数;xmax,xmin分别是该基因位的数值上下限。
股票样本特征属性较多,数据维数高。在进行股票筛选的初始种群中,每一个个体P都是随机产生的,由于各样本股票所属上市公司的发展水平各异,各股票样本财务指标千差万别,个体P作为筛选条件对股票样本Si进行筛选时,目标函数约束条件很难满足,即能同时满
足筛选条件Si[j]Pj+1(0j7)&&Si[8]P9&&Si[9]P10的股票非常少。若有股票满足个体,此个体很有可能为
戎容,吴萍:基于遗传算法的股票市场选择模型2016,5
基于遗传算法的股票市场选择模型 来自淘豆网m.daumloan.com转载请标明出处.