设计应用

基于改进神经网络的农作物产量预测方法

作者:刘 鹏1,郑 勇2,杨红军3
发布日期:2019-10-18
来源:2019年电子技术应用第10期

0 引言

    农业是国民经济组成的重要部分,农作物生产对于社会的稳定具有重要作用。农作物产量是政府部门进行农业决策和宏观调控的重要依据,预估农作物产量具有重要的意义。影响农作物产量的因素众多,农作物产量的形成通常具有非线性的特点,准确地预估农作物产量一直是农业发展中的一个难题。

    现有的估产办法主要包括统计方法、遥感术[1]、水肥测量[2]、一元或多元回归分析[3]等方法。这些方法通常存在成本高、周期长、精确度不够高等缺点。同时只使用产量信息的预测方法无法得到更加准确的预测结果。随着现代农业和大数据时代的发展,能够获得大量影响农作物生长因素的信息,其中气候因素对农作物的产量影响重大[4]

    近十多年来神经网络快速发展,它模拟人脑的神经系统对复杂信息的处理机制,具有高度的非线性特点[5]。不同于多元回归只能对线性关系建模,神经网络对线性关系和非线性关系都能建模,而且不需要预处理,也不需要对输入输出关系做任何假设。递归神经网络(Recurrent Neural Network,RNN)能够更灵活、准确地对农作物产量做出预测。但是标准的递归神经网络由于梯度消失比较难捕获长期依赖关系[6],HOCHREITER S等人[7]提出一种特殊的RNN结构类型——长短期记忆网络(Long Short-Term Memory,LSTM),它可以处理长期信息依赖,所以适合于处理和预测时间序列中间隔和延迟相对较长的重要事件[8-9]

    然而,仅用单一的LSTM模型无法充分考虑其他影响产量的因素。在农作物产量预测中,温度、降水量等是重要的决定因素。针对此问题,本文提出一种基于LSTM,同时使用影响产量的气候因素的ELSTM模型,对农作物的产量进行更加准确的预测。实验表明ELSTM模型比LSTM模型具有更高的准确性。

1 相关工作

    许多学者对预测问题做了深入的研究,特别是神经网络可以快速有效地解决复杂问题,近年来在众多领域得到了广泛的应用。

    MISHRA S等人[10]提出一种新型的RNN结构来处理短期预测问题,时间关系由神经元提供,可以根据具体情况使用不同类型的激活函数和不同数量的神经元来提高准确性。该模型只适用于短期预测,不适用于本文要解决的问题。

    Guo Tao等人[11]使用LSTM模型来处理预测问题,LSTM最多增加4个层来改进重复模块,方便实现和控制长期记忆,在准确性方面得到令人满意的预测。

    Hu Haiqing等人[12]综合了灰色预测模型和三角模型的优点,建立TGM模型来预测中国粮食的产量。但是该模型只使用了产量信息,没有考虑其他的条件,不符合本文要解决的问题。

    HOSSAIN M A等人[13]考虑气候对农作物产量的影响,利用神经网络(NN)建立天气参数预测模型,然后将预测天气以及当前的农业数据作为支持向量机(SVM)的输入对水稻产量进行预测。但是SVM适用于分类问题,产量预测准确性不是很高。

    综上,当前用于处理预测问题的方法无法很好地解决本文所述问题,而且仅用单一的LSTM预测模型无法进行准确预测,其他方法也没有充分利用影响产量的气候因素。基于这个问题,本文考虑在使用LSTM预测的基础上同时优化LSTM,在预测模型中考虑气候因素对产量的影响以使预测更加准确,提出了使用气候因素进行产量预测的ELSTM模型。

2 数据预处理和ELSTM模型

    随着现代农业和精准农业的发展,对农作物的产量和气候因素有准确的记录。农作物的产量预测模型主要根据历史产量来建模学习和预测当前年份的产量,同时在模型中加入历史年份的气候因素,以更加准确地给出当前年份的产量的预测。

2.1 数据预处理

    基于农作物生长的自然规律,气候条件对产量的影响是产量预测中必须注意的一个要点。气候中最重要的两个因素是气温和降水[14]。对初始数据进行下述处理可以获得适用于本模型的数据集:

    定义 s为预测的目标年份,使用前i年的信息进行预测,则Xs={xs-i,…,xs-2,xs-1}为预测s年产量的历史产量数据;Es={es-i,…,es-2,es-1}为预测s年产量的气候因素数据。例如预测2010年的产量,使用前3年数据进行预测,则产量是数据为X2010={x2007,x2008,x2009},气候因素数据为E2010={e2007,e2008,e2009}。

    本模型主要利用前s-i年所有产量数据和气候数据对接下来s年产量进行预测。

2.2 LSTM

    RNN是一种节点定向连接成环的人工神经网络,可以利用它内部的记忆来处理任意时序的输入序列。然而BENGIO Y等人[15]观察到由于梯度消失问题,RNN无法处理长距离依赖的问题。LSTM是RNN的变体,但是单一的产量数据进行预测结果不够准确。因此,本文提出了在LSTM基础上增加了考虑气候因素的ELSTM模型。

2.3 ELSTM模型

    不同年份农作物生长期内温度、降水情况对产量有重要影响。结合历史年份气候条件和预测年份气候条件相似性可以进一步挖掘产量中的内部联系,这对提高预测性能是重要的。

    ELSTM模型整体架构如图1所示,模型在标准LSTM架构的结果上加入气候因素权重,以便能够捕捉气候条件对农作物产量的影响。

jsj3-t1.gif

    ELSTM模型共分为LSTM层、权重层和预测层。模型需要两个输入,即历史产量Xs和气候条件Es。Xs经过LSTM层得到每年产量的向量表示Hs={hs-i,…,hs-2,hs-1},Es经过权重层得到每年生长条件对应的As={jsj3-t1-x1.gifs-i,…,jsj3-t1-x1.gifs-2jsj3-t1-x1.gifs-1}。Hs和As经过预测层得到预测产量。

    首先是LSTM层,如图2所示历史产量Xs经过LSTM层得到对应的产量向量表示Hs

jsj3-t2.gif

    LSTM在普通RNN基础上,在隐藏层各神经单元中增加记忆单元,从而使时间序列上的记忆信息可控。一个LSTM单元有3个门:遗忘门、输入门、输出门。LSTM单元结构如图3所示。

jsj3-t3.gif

    (1)遗忘门:遗忘门是以上一单元的输出ht-1和本单元的输入xt为输入的sigmoid函数,{Wf,Uf,bf}是遗忘门的参数。

jsj3-gs1-6.gif

    由于一个年份对应一个LSTM单元,因此取每个单元的输出向量表示当前年份的产量信息。离被预测年份越近的年份受之前年份的产量影响越大。

    在权重层得到s-i年气候因素所对应的权重。

    首先将s-i年与s年的气候因素做差,气候条件与s年越相似的年份,差值越小。将每年的差值归一化并组合成一条信息,具体计算如下:

jsj3-gs7-12.gif

jsj3-gs13.gif

    训练过程如下:

    (1)LSTM层。产量信息Xs作为LSTM层的输入。按年份顺序将产量信息输入不同LSTM单元中,在每个LSTM单元得到包含所有历史产量信息Hs

    (2)权重层。将生长条件信息作为权重层的输入,经过计算得到每个年份的权重As

    (3)预测层。将Hs和As作为最终预测层的输入,经过预测层的运算即可得到历史产量向量,然后得到预测值。

    (4)通过有监督的训练调整模型。按照损失函数计算预测值与真实值之间的差别,使用BP算法调整模型每层的参数。

    参数调整后重复这一过程,直到得到一组最优的参数并保留下来。

3 实验

    用于建模分析的数据是2000年~2016年山东省17个市农作物产量和气候情况。其中农作物选择的是小麦、玉米这两种代表性的农作物。为了避免因为种植面积变化带来的产量变化,本文使用每公顷产量作为农作物的产量的单位。气候因素是两种农作物对应生长期每天的降水量和温度,小麦的气候因素数据是每年9月份到下年5月份每天的降水量和温度,玉米的气候因素数据是每年6月份~9月份每天的降水量和温度。

3.1 实验设置说明

    本节将通过实验评估所提出的ELSTM模型。实验环境为:INTELCorei5 CPU,3.20 GHz;8 GB内存。每个对比实验情况均运行10遍,取平均值。主要设置3个对比模型:

    (1)ELSTM模型:本文提出的ELSTM模型,利用产量和生长条件信息进行预测。

    (2)LSTM模型:标准的LSTM模型,只使用历年产量信息进行预测。

    (3)SVM模型:使用支持向量机(SVM)对历年产量信息进行预测。

3.2 模拟比较实验

    本节使用ELSTM、LSTM和SVM 3种模型进行实验。将过去2~6年的历史产量和气候条件作为模型输入。

    使用偏差率(Deviation rate)来计算预测值同真实值之间的偏差占真实值的百分比,偏差率值越小,模型的准确率越高。使用以下公式计算:

    jsj3-gs14.gif

    使用决定系数(R2)来判断模型拟合的程度,拟合程度越高,R2越接近1。使用如下公式计算:

jsj3-gs15.gif

    小麦误差率实验结果如表1所示。玉米误差率实验结果如表2所示。

jsj3-b1.gif

jsj3-b2.gif

    从实验结果中可以看出,在3个模型中,ELSTM模型预测结果最好。同时根据误差率的分布,可以得出使用过去4年的产量预测下一年产量预测结果更准确。

    将过去4年小麦的产量和气候条件作为输入进行计算,得到实验结果如表3所示。

jsj3-b3.gif

    从实验结果中可以看出,ELSTM模型的决定系数最大,拟合程度优于其他模型。

    通过以上实验可以看出,ELSTM模型的预测结果准确率更高,拟合程度更好。针对此问题,ELSTM是一个很好的预测模型。

4 结论

    预测农作物产量是农业生产中的一个重要问题。由于农作物生长受多方面因素影响,准确预测农作物产量非常重要。

    本文针对农作物产量预测问题设计了一个基于LSTM的改进模型进行求解。在求解过程中,将农作物历史产量数据与生长条件数据相结合,作为输入对模型进行训练,可对当年农作物产量进行精准预测。实验表明,与其他预测方法相比,本模型有更理想的预测结果。

    在未来的工作中,计划将所提出的方法应用于其他具有相同特征的预测问题,以观察该模型在不同问题上的预测精确度和通用性。

参考文献

[1] GUERIF M,LAUNAY M,DUKE C.Remote sensing as a tool enabling the spatial use of crop models for crop diagnosis and yield prediction[C].IEEE International Geoscience and Remote Sensing Symposium,2000:1477-1479.

[2] Jin Chuan,Qin Qiming,Zhu Lin,et al.TVDI basedcrop yield prediction model for stressed surfaces[C].IEEE International Geoscience and Remote Sensing Symposium,2007:4656-4658.

[3] KERDILES H,REMBOLD F,LEO O,et al.CST,a freeware for predicting crop yield from remote sensing orcrop model indicators:illustration with RSA and Ethiopia[C].International Conference on Agro-Geoinformatic,2017:1-6.

[4] Zhuo Zhihong,Gao Chaochao,Liu Yonghong.Regional grain yield response to climate change in China: a statistic modeling approach[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2014,7(11):4472-4479.

[5] Wang Anhong,Zhang Xueying,Sun Zhiyi,et al.A nonlinear prediction speech coding ADPCM algorithm based on RNN[C].International Conference on Machine Learning and Cybernetics,2002:1353-1357.

[6] PASCANU R,MIKOLOV T,BENGIO Y.On the difficulty of training recurrent neural networks[J].Computer Science,2013,28(1):337-345.

[7] HOCHREITER S,SCHMIDHUBER J.Long short-term memory[J].Neural Computation,1997,9(8):1735-1780.

[8] 涂小萌,陈强国.基于ARIMA-LSSVM混合模型的犯罪时间序列预测[J].电子技术应用,2015,41(2):160-162,166.

[9] 杨烁,孙钦斐,朱洁,等.基于大数据平台的电采暖用电量预测分析[J].电子技术应用,2018,44(11):67-69.

[10] MISHRA S,PATRA S K.Short term load forecasting using a novel recurrent neural network[C].IEEE Region 10 Conference,2008:1-6.

[11] Guo Tao,Liu Rui,Yang Heng,et al.Predict atmosphere electric field value with the LSTM neural network[C].International Conference on Computer Systems,Electronics and Control,2017:263-266.

[12] Hu Haiqing,Zhang Dan,Qiu Ping.Application of trigonometric grey prediction approach to forecasting China grain yield[C].IEEE International Conference on Grey Systems and Intelligent Services,2009:538-542.

[13] HOSSAIN M A,UDDIN M N,HOSSAIN M A,et al.Predicting rice yield for Bangladesh by exploiting weather conditions[C].International Conference on Information and Communication Technology Convergence,2017:589-594.

[14] Huang Youxin,Liu Xiuguo,Shen Yonglin,et al.Assessment of agricultural drought indicators impact on soybean crop yield:a case study in Iowa,USA[C].The Third International Conference on Agro-Geoinformatics,2014:1-6.

[15] BENGIO Y,FRASCONI P,SIMARD P.The problem of learning long-term dependencies in recurrent networks[C].IEEE International Conference on Neural Networks.San Francisco,USA,1993(3):1183-1188.



作者信息:

刘  鹏1,郑  勇2,杨红军3

(1.山东麦港数据系统有限公司,山东 济南250100;

2.山东省农业信息中心,山东 济南250100;3.济南市农业信息中心,山东 济南250002)

此内容为AET网站原创,未经授权禁止转载。
农作物产量预测 长短期记忆神经网络 深度学习 递归神经网络 气候因素