统计软件及应用课程设计
虫情危害预测
院: 级:
口
号: 名:
指导老师:
精选文档
目录
'.背景与意义
.问题重述
.方法简介
(一) .判别分析....
(二) .BP神经网络
数据元仅 与相邻层神经元之间相互全连接, 同层内神经元之间无连接,各层神经元之间无 反馈连接,构成具有层次结构的前馈型神经网络系统。
分皴结果
数据来自于〜年〜月安徽庐江的月平均温度、月最低温度、 月日照时间、月降雨量以及水稻的月平均虫害程度, 且数据都是经过标准化之后 的。
(一).数据预处理
首先,将降雨量的最后一个数据中的空格消除, 再把原始数据的前两列合并
精选文档
为一列,并保存为CSV(逗号分隔)格式,之后用函数将数据读入到R的内存中。
shujuv-('ch ongqin ')
为了方便之后的操作,对各列进行命名,其中 date代表年度时间,x〜x
分别代表平均气温、最低气温、日照时间、降雨量, y代表虫害程度。同时给出
各类别下的样本量个数。由于本文不采用时间序列预测的方法进行分析, 故第一
列的数据使用不到,最终确定使用的数据集为剔除原数据框第一列之后的数据 框。从原始数据中可知样本量为 ,不是很多,如果再进行分块,可能由于样 本量的限制无法得到最好的结果,因此,下文中的训练集和测试集均选用原始数 据来充当。
names(shuju)v-c('date','x','x','x','x',y)
x<-shuju[,:]
table(y)
y
将数据框X中的变量链接到内存中,降低后续代码的复杂程度,提高代码的 可读性。
attach(x)
(二).判别分析
模型建立
安装并加载软件包MASS
in stall. packages( “ MASS)
library(MASS)
将训练集中的y变量作为判别变量,其他剩余的变量作为特征变量,运用 I
da()函数来进行费希尔判别下的线性判别。
ldav-lda(y~.,data=x) # 线性判别
lda
Call:
lda(y ~ ., data = x)
P rior p robabilities of groups:
. . . .
Group means:
x x x x
-. -. -. -.
. . . -.
. . . -.
. . . -.
Coefficie nts of lin ear discrim inan ts:
精选文档
x
x
x
LD LD LD
. -. -.
. . .
. . -.
x -. -. .
Prop orti on of trace:
LD LD LD
. . .
输出结果的第二项为此次过程中各类别所使用的先验概率, 其实就是训练集
中判别变量各水平下的数量占总样本量的比例。 第三项为各变量在每一类别中的
均值,从中可以看出x〜x在各类别下有较明显的差别,相反x在各类别下的 差别很小,也就说明降雨量对虫害程度的影响不是很显著。第四项给出线性判别 式的参数矩阵。第五项给出各线性判别式分别的贡献比例。
> P lot(lda)
(N -
LD
- -
〔小 五
从上图可以看到,在个线性判别式下〜这个类别的分布情况,不同 类别样本已经用相应数字标出。可能受样本量的限制,图中并不能看出很明显的 分布情况。
下面用上述模型对测试集进行预测,并给出测试集中y变量的预测结果与实 际类别的混淆矩阵。
P red<-p redict(lda,x[,:])
p red$class
[]
r语言课程设计 来自淘豆网m.daumloan.com转载请标明出处.