一种基于语义分析的海量文本检索匹配方法

发明授权

CN117972025B 一种基于语义分析的海量文本检索匹配方法有权

请登陆查看更多内容

专利标题： 一种基于语义分析的海量文本检索匹配方法
申请号： CN202410386961.4

申请日： 2024-04-01
公开(公告)号： CN117972025B

公开(公告)日： 2024-06-07
发明人: 董莎 , 马成英 , 严浩 , 郑智剑 , 叶名辰 , 郑宗波 , 徐芬 , 李元丽
申请人： 浙江大学
申请人地址： 浙江省杭州市西湖区余杭塘路866号
专利权人： 浙江大学
当前专利权人： 浙江大学
当前专利权人地址： 浙江省杭州市西湖区余杭塘路866号
代理机构： 天津正阳知言专利代理事务所
代理商 孔珍
主分类号： G06F16/33
IPC分类号： G06F16/33 ; G06F40/30 ; G06F16/35 ; G06F18/22

摘要：

本发明属于文本检索匹配技术领域，具体涉及一种基于语义分析的海量文本检索匹配方法，通过从检索平台的关联知识库中筛选出符合当前输入请求问题主题词的备选文本数据，并对备选文本数据按照共性进行组集划分，进而依据共性特征分组进行文本预处理，实现了将海量文本检索效率提升落脚在文本预处理上，由此借由提高文本预处理效率来提高信息检索效率，并在预处理后对文本数据进行层级类型解析，进而依据层级类型选择适配相似度算法，从而由适配相似度算法对文本数据进行语义匹配，实现了文本匹配的针对性操作，不仅能够提高匹配准确性和适应性，还有助于提高匹配的效率和性能，并减少计算资源的消耗。

公开/授权文献

CN117972025A 一种基于语义分析的海量文本检索匹配方法公开/授权日：2024-05-03

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06F	电数字数据处理（基于特定计算模型的计算机系统入G06N）
G06F16/00	信息检索；数据库结构；文件系统结构
G06F16/30	.•非结构文本数据（文档管理系统入G06F 16/93）
G06F16/33	..••查询