发明公开
CN114492393A 文本主题的确定方法、装置及电子设备
无效 - 驳回
- 专利标题: 文本主题的确定方法、装置及电子设备
-
申请号: CN202210051090.1申请日: 2022-01-17
-
公开(公告)号: CN114492393A公开(公告)日: 2022-05-13
- 发明人: 申大忠 , 秦川 , 王超 , 董政 , 祝恒书 , 熊辉
- 申请人: 北京百度网讯科技有限公司
- 申请人地址: 北京市海淀区上地十街10号百度大厦二层
- 专利权人: 北京百度网讯科技有限公司
- 当前专利权人: 北京百度网讯科技有限公司
- 当前专利权人地址: 北京市海淀区上地十街10号百度大厦二层
- 主分类号: G06F40/216
- IPC分类号: G06F40/216 ; G06F40/284
摘要:
本公开提供了文本主题的确定方法,涉及数据处理技术领域,尤其涉及大数据、自然语言处理等人工智能领域。具体实现方案为:在确定待处理文本对应的词序列,及词序列中每两个词在待处理文本中间隔的词数量后,可以根据每两个词在待处理文本中间隔的词数量,确定待处理文本对应的图结构,之后,可以根据词序列及图结构,确定文本对应的主题分布,然后,根据主题分布,可以确定文本对应的主题。由此,通过根据词序列及图结构,确定文本对应的主题分布,进而确定文本对应的主题,不仅使得确定的主题考虑了文本中词的语义信息,还考虑文本中各词间的依赖关系,提高了确定的主题的正确性和可靠性。