设计应用

基于知识库的智能问答系统构建技术研究

作者:王亮,张强,魏韵萧
发布日期:2026-04-23
来源:网络安全与数据治理

引言

数据中心作为数据信息资源存储与处理的核心载体,承载着各业务领域的多源异构知识库,积淀了海量的数据信息资源。在业务应用场景中,针对知识库的信息获取,主要还是使用传统的人工检索文档或数据库的方式,存在着较大的效率瓶颈,难以满足高效信息获取的现实诉求。近年来,大语言模型(Large Language Model, LLM)技术在自然语言处理(Natural Language Processing, NLP)领域取得突破性进展[1-3]。凭借大模型参数规模和强大的语义学习能力,大语言模型能够对海量文本数据进行深度语义理解与知识挖掘,对各类自然语言的任务处理表现优异。如何依托大语言模型相关技术,提升数据中心多源异构知识库的检索效能,提高不同用户群体从海量数据中获取信息的便捷性与实用性,已成为数据中心业务保障中亟待解决的关键问题。智能问答系统的出现为该问题提供了有效的解决方案[4-5],它通过自然语言交互模式精准理解用户查询意图并快速返回精准答案,显著提升了信息获取效率。

目前大量学者在数据智能检索与推荐方面进行了广泛研究,并取得了一定成果。陈晓云等[6]提出Apriori与IOGA融合的增量关联规则挖掘方法,有效提升AI问数机器人问答准确性。张超等[7]针对非结构化数据检索效率问题,提出基于语义智能识别的多模态检索方法,实现精准检索。袁凤源等[8]提出FFSREGNN方法,通过图神经网络与注意力机制融合特征,生成有效语义表示。杨运强[9]基于知识图谱构建智能问答系统,解决知识获取与语义理解难题。超木日力格等[10]提出MMSAF模型,借助高阶语义增强与自适应模态融合优化推荐效果。许惠惠[11]基于BERT模型构建算法框架,验证其在常识问答中的应用价值。李俊燕等[12]借助LLM,整合多模态遥感信息构建本地知识库,采用混合检索增强生成算法,结合轻量化Embedding模型语义映射,形成检索—推理链路,构建智能问答系统以实现遥感信息高效管理与智能化应用。董永涛等[13]利用大语言模型和检索增强生成技术,构建装备故障智能问答系统,提高了故障诊断效率。

考虑到军队数据中心主要承载军事领域业务数据信息,涉密程度高、专业性强,而且关联复杂、形式多样,导致传统大语言模型检索技术缺乏领域适配性,不仅对特定领域专业术语的解析精度不足,而且难以满足本地化数据存储与敏感涉密信息保护的核心诉求。为此,针对数据中心海量本地多源异构知识资源,本文提出面向军事领域的知识库驱动型智能问答构建方案。首先面向军事各业务场景中用户差异化的数据查询诉求,构建规范化的数据检索需求表征模型。在此基础上,设计多维度知识关联检索机制,通过量化检索需求与候选数据集间的关联程度、适配权重等指标,实现高相关候选数据的精准匹配与筛选。进而将筛选后的知识数据与用户原始查询一同注入大语言模型,结合检索增强生成策略,生成精准可靠的问答回复。在严格落实敏感涉密数据安全管控的基础上,基于局域网环境开展系统实验。结果显示,所提方法在问答效果上具备较好优势,有助于提高多源异构知识库的整合利用效率与智能化服务水平。


本文详细内容请下载:

https://www.chinaaet.com/resource/share/2000007061


作者信息:

基于知识库的智能问答系统构建技术研究

王亮,张强,魏韵萧

此内容为AET网站原创,未经授权禁止转载。
数据中心 多源知识库 大语言模型 智能问答