设计应用

SARIMA嵌入的时序知识图谱推理

作者:吴钰1,胡友德1,冯桐2,杜滢明2,曹晗2,唐静1,李新兵1
发布日期:2026-06-17
来源:电子技术应用

引言

知识图谱(Knowledge Graph, KG)作为语义网的核心技术,已广泛应用于问答系统、推荐系统、信息检索等领域。知识图谱通常以三元组(s,r,o)形式存储事实,其中s、o为实体,r为实体间的语义关系[1]。知识图谱嵌入(Knowledge Graph Embedding, KGE)旨在将实体和关系映射到连续向量空间,通过向量运算捕捉语义关联,为下游推理任务提供支撑。然而,传统知识图谱嵌入模型仅从无时间信息的事实中学习,无法捕捉动态演化规律[2]。

时序知识图谱(Temporal Knowledge Graph, TKG)通过为三元组添加时间戳t,形成四元组(s,r,o,t),能够反映出事实的时间演化规律,支撑如未来事件预测、历史事实补全等时序推理任务。时序知识图谱嵌入(Temporal Knowledge Graph Embedding, TKGE)作为TKG推理的核心技术,通过将时间信息融入实体和关系的向量表示,实现对时序事实的语义建模[3]。时序推理通常包括插值和外推两种设置。

TransE[4]作为静态知识图谱嵌入模型,核心通过翻译操作建模语义关联:它将实体与关系均映射到同一低维向量空间,期望主语实体向量与关系向量相加后,结果能尽可能接近宾语实体向量,通过计算两者的距离衡量三元组的合理性。

DistMult[5]同样属于静态模型,采用张量分解方法实现语义建模:它将实体表示为低维实向量,将关系表示为对角矩阵,通过张量分解的思想,将三元组的合理性得分定义为主语向量、关系对角矩阵与宾语向量的连乘结果,通过该得分判断事实的有效性。

ComplEx-N3[6]在复数空间中构建实体与关系的嵌入表示:它将实体和关系均映射为复数向量,在计算三元组得分时引入复数共轭操作,通过实部与虚部分离的运算逻辑,有效适配非对称关系。

RotatE[7]基于复平面的旋转特性刻画语义关联:它将实体映射为复平面上的向量,将关系对应为复平面内的旋转角度,通过旋转后的向量相似度衡量三元组合理性。

QuatE²[8]基于四元数空间实现知识图谱嵌入:它将实体与关系均表示为四元数,借助四元数独特的代数性质建模语义关联,通过四元数的乘法运算计算实体与关系的交互得分,相比复数空间能捕捉更复杂的语义信息。

TTransE[9]作为时序模型,在TransE的基础上改进以融入时间信息:它先沿用TransE的“翻译”逻辑计算实体与关系的基础向量得分,再将事实的时间戳差异转化为低维特征向量,将该时间特征向量与实体、关系向量拼接后重新计算三元组得分,但这种时间融入方式仅停留在简单的特征拼接,对季节性周期这类复杂时间模式的建模能力有限。

HyTE[2]通过“时间-超平面”映射与循环神经网络捕捉时间依赖:它为每个时间戳构建一个对应的超平面,将实体和关系向量投影到该超平面上进行嵌入计算,同时利用循环神经网络学习时间序列的依赖关系,但这种依赖建模仅能捕捉时间的线性演化趋势。

生态环境中存在大量周期性事实,例如,图1中洞庭湖在不同季节污染来源不同,包括工业、农业、市政废水等,因此,各项污染指标的浓度也不同[10]。然而,现有大多数时序知识图谱嵌入模型通过简单方式融入时间信息,难以适配季节性周期场景,难以处理生态环境等领域的周期性事实。

图片1.png 

图1 洞庭湖不同季节污染来源与主要水质指标知识图谱

为解决上述问题,本文提出季节性自回归积分滑动平均(Seasonal Autoregressive Integrated Moving Average, SARIMA)模型嵌入的时序知识图谱推理模型EI-SAR。其核心原理是将SARIMA模型的时间分解能力融入实体和关系的向量表示,将时间序列分解为非季节性趋势、季节性趋势与随机残差;该模型通过明确建模季节性周期、高斯分布量化表示不确定性、构建混合损失优化等方式,可精准捕捉周期性事实的动态演化规律,支撑资源循环、生态修复等周期场景下的外推预测。

本文的贡献总结如下:

(1)提出面向周期性场景的SARIMA嵌入框架:首次将季节性时间序列模型与知识图谱嵌入结合,将实体和关系的时序表示分解为非季节性趋势、季节性趋势及随机残差三部分,填补现有TKGE模型对季节性周期建模的空白。

(2)设计融合残差特性的评分函数:基于对称KL散度构建评分函数,融合SARIMA残差的统计特性,同时通过高斯分布量化实体和关系的时序不确定性,提升时序事实的语义关联捕捉能力。

(3)构建混合损失优化策略:设计包含SARIMA残差惩罚项的混合损失函数,在区分正负样本的同时约束残差平稳性,确保模型在推理任务中的稳定性与精度。


本文详细内容请下载:

https://www.chinaaet.com/resource/share/2000007118


作者信息:

吴钰1,胡友德1,冯桐2,杜滢明2,曹晗2,唐静1,李新兵1

(1.材料科学姑苏实验室,江苏 苏州 215000;

2.苏州德华生态环境科技股份有限公司,江苏 苏州 215000)

此内容为AET网站原创,未经授权禁止转载。
时序知识图谱 知识表示与推理 时间序列分解 SARIMA模型