引言
水稻是全世界重要的食物来源,在亚洲更是占据了不可代替的地位。中国60以上的人口以米饭为主食,水稻种植面积在3 000万公顷左右,占我国总播种面积的五分之一以上[1]。在传统的农业生产模式中,人力资源的消耗通常十分显著。在水稻的种植过程中,细菌、真菌和其他微生物的侵害对水稻的健康状况和产量构成了严重威胁,导致了巨大的损失。农业生产中为了应对病虫害问题,需要投入大量劳动力,这不仅增加了农业成本,也加大了劳动力的工作负担。
物联网技术[2]和计算机视觉[3]等科技的引入、科技与农业的深度融合推动了农业智慧化方向的快速发展,实现智慧农业[4]的全新格局。在智慧农业下,农业通过智能农业设备进行水稻病虫害的自动化治理,不仅显著提升了农业种植的效率,更在减少农业损失方面发挥了至关重要的作用。这种智能化的治理模式不仅代表了农业现代化的重要方向,也为提高农业生产效益、促进农业可持续发展注入了新的动力与意义。
近年来,深度学习技术在各个领域都取得了巨大进展,特别是植物病虫害分类方面。随着农业智能化发展,人们对于智能治理植物病虫害提出了更高要求。在智慧农场中,由于分散于不同地区且归属于不同组织机构的农业设备在运行中产生了数据孤岛问题,给数据整合与分析带来较大困扰。为了解决该问题,本文在研究中加入了联邦学习框架(FL),联邦学习在设备进行深度学习任务时对数据隐私保护和提高模型性有很大帮助。联邦学习在2016年由谷歌研究院提出[5],它是一种分布式机器学习方法,允许在多个设备或计算节点上进行模型训练,而无需将原始数据传输到中央服务器。这种学习方法的核心思想是在保护数据隐私的同时,允许多个参与方共同学习一个全局模型,联邦学习有效地解决了数据孤岛[6]这个难题。
在以往的研究中,不少学者通过改进深度学习的卷积神经网络(CNN)来提高水稻病虫害的识别分类性能。比如Latif等学者[7]对预训练模型VGG19进行改进,在非归一化增强数据上拥有96.08的准确率,高于相同或类似数据集在其他研究中的表现。Bhimavarapu[8]在卷积神经网络中改进了激活和优化函数,减少了损失并明显地提高了预测性能和分类准确性。预训练能够加速训练过程并提高训练效果,在研究中使用预训练模型进行迁移学习也是不错的方法[9]。Ahad等学者[10]对六种CNN预训练模型进行了水稻病虫害分类比较,对五种预训练模型进行迁移学习,通过比较得到不同模型的效果及优缺点。
传统的集中式机器学习要面对数据安全隐私和数据中心化的挑战[11],医疗和金融领域饱受这些问题的困扰[12]。谷歌团队设计了联邦学习应用在这些领域来解决以上矛盾。在医疗领域,Sheller等研究者[13]发现,对十个医疗机构的数据进行联邦学习的结果已经达到了集中数据模型质量的99%。他们又进一步研究了合作机构间的数据分布对模型质量和学习模式的影响,通过与其他多种协作方法相比证明了联邦学习的优越性,联邦学习在医院数据上的应用将进一步推动个性化精准医疗的发展。Adnan等人[14]则是利用联邦学习分析医学上的组织病理学图像,与传统训练相比他们所使用的差分私有联邦学习是医学图像分析中机器学习模型协作开发的可行且可靠的框架。Li等人[15]提出一种联邦学习用于金融信用风险管理领域的应用方案,联邦学习在具有异构特征的Non-IID银行小样本数据下的金融信贷风险管理中的性能提高了14%。联邦学习在近期开始应用到了农业领域中。Sharma等学者[16]利用联邦学习下的CNN模型对马铃薯作物病虫害进行准确分类;Kaur等人[17]则是利用该技术对辣椒叶的疾病进行了分类;Tripathy等人[18]在联邦学习框架下,利用LeNet模型提取特征,对水稻病虫害进行了分类优化。联邦学习在这些农业场景下都有不错的表现。
尽管病虫害识别技术已相当成熟,但随着智慧农业的崛起,对该场景的需求也呈现出新的趋势和变化。本文在智慧农业场景下,使用联邦学习解决了不同机构和地区设备的数据孤岛问题。不同的数据分布对联邦学习产生影响,本文将水稻病虫害图像分为IID和Non-IID数据[19],并把预训练模型作为初模型进行特征提取以获得更高的效率和准确率。
针对以上几点,本文做了相应的研究和实验加以验证,证实了该场景下应用联邦学习和使用预训练模型的方案可行性并探索了适合该方案和实验环境下的预训练模型和条件。
本文详细内容请下载:
https://www.chinaaet.com/resource/share/2000006216
作者信息:
黄炯炯
(浙江农林大学 数学与计算机科学学院,浙江 杭州 311300)