设计应用

基于联邦学习的加密流量分析研究

作者:崔又文1,2,冯千烨1,何云华1,高健桐1,2,单伯瑜1,2,刘馨妍1
发布日期:2025-02-08
来源:网络安全与数据治理

引言

随着信息化的快速发展,网络流量的安全性备受关注。近年来,随着 SSL/TLS 等流量加密算法的普及,加密流量比例已超过 90%。虽然加密技术提升了信息传输的安全性,但越来越多的恶意软件通过加密技术隐藏自己,引发了更多不可控的安全隐患。《中国互联网络发展状况统计报告》显示,截至2023年6月,我国互联网普及率更是高达76.4%[1],互联网企业对加密流量识别和检测的不重视给了不法分子更多可乘之机,如何保障安全的网络环境成为了当下的挑战。SSL/TLS协议是当下主流的加密算法之一,攻击者可以通过将恶意行为嵌入被 SSL/TLS 协议加密的内容中,对公众网络安全造成威胁。传统的基于端口号和深度包检测的流量分析方法在加密流量面前显得力不从心。在加密通信时代,学界积极探索新的技术路径,如杨旭提出的基于流量统计特征的分类方法,将流量外部统计特征与机器学习相结合,有效解决了伪装端口、加密流量等问题,为加密流量分类提供了新思路[2]。仝鑫等人提出的基于机器学习的加密流量分析方法,展示了该领域在特征工程、分类器模型等方面的研究进展,在一定程度上提高了加密流量识别的准确率[3]。此外,朱蓓佳等人提出的基于对比学习的加密流量检测技术,通过设计特定的检测方案来提高检测准确率和泛化性,但仍需在保障数据安全方面进一步探索[4]。在此情形下,迫切需求一种既能有效利用数据又能保障数据安全的新技术,联邦学习等技术应运而生,其核心优势在于可在不汇聚原始数据的前提下进行分布式建模,打破数据孤岛,实现数据隐私保护与高效利用的双重目标。面对这一问题,本研究认为,根据SSL/TLS分别在客户端与服务端相互认证等技术特点,使用分布式联邦学习进行本地监测成为了一种可行的方案。联邦学习的核心理念是在保证数据隐私安全及合法合规的基础上,利用各个节点完全掌握的数据共同建模,核心优势在于原始数据无需汇聚在中央服务器,在各个终端服务器即可进行训练和计算模型梯度信息,只将参数和梯度等信息上传至中央服务器,通过加权等方式整合最终模型,下发到各个服务器终端,从而有效打破数据孤岛,提升模型的效果。该方法不仅可以有效保护用户隐私,还可以综合大量数据使得系统对加密流量更加敏感,识别率大大提高。 本文研究了基于联邦学习技术的SSL/TLS加密流量识别,通过预处理网络流量数据,提取关键特征,并利用联邦学习框架训练模型,实现了高效的加密流量分类,同时保护了数据安全和用户隐私。实验结果表明,该方法在分类准确率、实时性和隐私保护等方面均优于传统方法。


本文详细内容请下载:

https://www.chinaaet.com/resource/share/2000006295


作者信息:

崔又文1,2,冯千烨1,何云华1,高健桐1,2,单伯瑜1,2,刘馨妍1

(1.北方工业大学信息学院,北京100144;

2.文脉联坊(北京)科技有限责任公司,北京100143)


Magazine.Subscription.jpg

此内容为AET网站原创,未经授权禁止转载。
加密流量 联邦学习 网络安全 网络流量分类