一种对主题相似度进行计算的方法及装置

    公开(公告)号:CN112733519A

    公开(公告)日:2021-04-30

    申请号:CN202010966515.2

    申请日:2020-09-15

    Abstract: 本申请公开了一种基于领域词词典对主题相似度进行计算的方法及装置。其中,该方法包括:获取问题的文本内容和答案的文本内容,对所述问题的文本内容和所述答案的文本内容分别进行分词,获得所述问题的领域词以及所述答案的领域词,其中所述问题和所述答案相对应,领域词为在词汇领域内的语义单元;利用预先建立的领域词词典,确定所述问题的领域词在问题领域词词典的各个类别中的主题权重以及所述答案的领域词在答案领域词词典的各个类别中的主题权重,其中所述领域词词典包括问题领域词词典以及答案领域词词典;以及根据所述问题的主题权重与所述答案的主题权重,确定所述问题与所述答案的主题相似度。

Patent Agency Ranking