- 专利标题: 近邻语义的挖掘方法、装置、存储介质和终端设备
- 专利标题(英): Method, device, storage medium and terminal device for mining nearest neighbor semantics
-
申请号: CN201810712820.1申请日: 2018-06-29
-
公开(公告)号: CN108959551A公开(公告)日: 2018-12-07
- 发明人: 陈徐屹 , 冯仕堃 , 朱志凡 , 曹宇慧 , 朱丹翔
- 申请人: 北京百度网讯科技有限公司
- 申请人地址: 北京市海淀区上地十街10号百度大厦2层
- 专利权人: 北京百度网讯科技有限公司
- 当前专利权人: 北京百度网讯科技有限公司
- 当前专利权人地址: 北京市海淀区上地十街10号百度大厦2层
- 代理机构: 北京市铸成律师事务所
- 代理商 陈建焕; 杨瑾瑾
- 主分类号: G06F17/30
- IPC分类号: G06F17/30
摘要:
本发明提出一种近邻语义的挖掘方法、装置、存储介质和终端设备,其中,所述方法包括:获取待挖掘近邻语义的自然语句;根据变分自编码模型的编码器,对所述自然语句进行编码,获得所述自然语句的隐向量;其中,所述隐向量位于所述编码器产出分布的均值点处;对所述隐向量进行近邻语义搜索,获得与所述隐向量具有近邻语义的近邻隐向量;以及根据变分自编码模型的解码器,对近邻隐向量进行解码,获得与所述自然语句具有近邻语义的语句。采用本发明,可以挖掘出大量语义句法近似的语句。
公开/授权文献
- CN108959551B 近邻语义的挖掘方法、装置、存储介质和终端设备 公开/授权日:2021-07-13