-
公开(公告)号:CN113496118B
公开(公告)日:2024-05-31
申请号:CN202010266045.9
申请日:2020-04-07
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/242 , G06F40/279 , G06N20/10
Abstract: 本发明公开了一种新闻主体识别方法、设备和计算机可读存储介质。该方法包括:获取待识别新闻文本,并对新闻文本进行预处理;利用预设的分词词典,对预处理后的新闻文本执行带词性标注的分词处理,得到多个被标注词性的分词;在词性被标注为主体的分词中查询预设的目标主体,并在新闻文本中提取目标主体对应的多种主体特征;将目标主体对应的多种主体特征输入预先训练的主体识别模型中,获取主体识别模型输出的识别结果。在本发明中,将目标主体对应的多种主体特征作为主体识别模型的输入,使主体识别模型根据目标主体对应的多种主体特征识别新闻文本的主体是否为目标主体,弥补了新闻主体识别的技术空白。
-
公开(公告)号:CN114218381B
公开(公告)日:2022-08-30
申请号:CN202111493451.X
申请日:2021-12-08
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本公开涉及一种立场识别方法、装置、设备及介质。其中,立场识别方法包括:获取待识别的目标文本;对目标文本进行语义识别处理,得到目标文本的整体语义向量;基于预先定义的话题分类模板,对目标文本进行话题识别处理,得到目标文本的话题表示向量;基于整体语义向量和话题表示向量,对目标文本进行立场分类,得到目标文本对应的目标立场类别。根据本公开实施例,能够准确地识别出目标文本所涉及的话题表示向量,从而可以结合文本语义与文本话题对目标文本进行更准确的立场识别。
-
公开(公告)号:CN114265982B
公开(公告)日:2022-08-26
申请号:CN202111583634.0
申请日:2021-12-22
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/9535 , G06F16/9536 , G06F16/36 , G06F16/335 , G06F40/216 , G06N3/04
Abstract: 本发明涉及一种基于知识图谱的智能推荐方法,包括:A1、针对指定领域内待推荐信息的目标用户,获取目标用户的类型;A2、若目标用户的类型为活跃用户,则根据目标用户在第一预设时间段内的交互行为数据,基于知识图谱推荐内容方式和基于用户协同过滤推荐方式获取个性化的推荐结果;其中,知识图谱是预先构建的存储有指定领域内知识和实体之间关系的结构化的图谱信息;个性化的推荐结果包括:目标用户的最近邻用户对应的信息项和与目标用户的偏好实体匹配的信息项,本发明的方法可以有效解决现有推荐方法中存在的数据稀疏且关联性弱的问题,同时实现了快速精准推送文本信息,并做到千人千面的个性化推送。
-
公开(公告)号:CN114218381A
公开(公告)日:2022-03-22
申请号:CN202111493451.X
申请日:2021-12-08
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本公开涉及一种立场识别方法、装置、设备及介质。其中,立场识别方法包括:获取待识别的目标文本;对目标文本进行语义识别处理,得到目标文本的整体语义向量;基于预先定义的话题分类模板,对目标文本进行话题识别处理,得到目标文本的话题表示向量;基于整体语义向量和话题表示向量,对目标文本进行立场分类,得到目标文本对应的目标立场类别。根据本公开实施例,能够准确地识别出目标文本所涉及的话题表示向量,从而可以结合文本语义与文本话题对目标文本进行更准确的立场识别。
-
公开(公告)号:CN114139547A
公开(公告)日:2022-03-04
申请号:CN202111416144.1
申请日:2021-11-25
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/30 , G06F40/295
Abstract: 本公开涉及一种知识融合方法、装置、设备、系统及介质。其中,知识融合法包括:基于第一实体数据中的第一实体名,获取第一实体数据对应的实体的至少一个实体别称,得到实体名称集;基于实体名称集,检测第一实体名和第二实体数据中的第二实体名是否匹配;在检测到第一实体名和第二实体名匹配时,将第一实体数据和第二实体数据进行融合,得到融合实体数据。根据本公开实施例,能够根据两条实体数据中的实体名是否匹配来判断它们是否需要融合,以减少计算量,提高融合效率,并且在两条实体数据中的实体名不匹配时,能够根据该两条实体数据的多维度相似度进行融合判别,以提高判别精度,进而实现多来源知识的融合,达到精准有效融合效果。
-
公开(公告)号:CN113496118A
公开(公告)日:2021-10-12
申请号:CN202010266045.9
申请日:2020-04-07
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/242 , G06F40/279 , G06N20/10
Abstract: 本发明公开了一种新闻主体识别方法、设备和计算机可读存储介质。该方法包括:获取待识别新闻文本,并对新闻文本进行预处理;利用预设的分词词典,对预处理后的新闻文本执行带词性标注的分词处理,得到多个被标注词性的分词;在词性被标注为主体的分词中查询预设的目标主体,并在新闻文本中提取目标主体对应的多种主体特征;将目标主体对应的多种主体特征输入预先训练的主体识别模型中,获取主体识别模型输出的识别结果。在本发明中,将目标主体对应的多种主体特征作为主体识别模型的输入,使主体识别模型根据目标主体对应的多种主体特征识别新闻文本的主体是否为目标主体,弥补了新闻主体识别的技术空白。
-
公开(公告)号:CN113672731B
公开(公告)日:2024-02-23
申请号:CN202110881327.4
申请日:2021-08-02
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/35 , G06N3/0455 , G06N3/0464 , G06N3/082
Abstract: 析结果的准确率。本公开实施例涉及一种基于领域信息的情感分析方法,该方法包括:对待分析的文本信息进行预处理,并获取领域信息;将待分析的文本信息输入到预先融合有领域信息的情感分类模型中,获取文本信息的情感类别;融合有领域信息的情感分类模型包括:全局情感语义模型、每一个领域的局部情感语义模型和对应每一个领域的情感融合策略;其中,基于与领域信息匹配的局部情感语义模型,获取局部情感概率值;基于全局情感语义模型,获取全局情感概率值;基于与领域信息匹配的情感融合策略,对局部情感
-
公开(公告)号:CN113496780B
公开(公告)日:2023-11-03
申请号:CN202010197391.6
申请日:2020-03-19
Applicant: 北京中科闻歌科技股份有限公司
IPC: G16H50/80
Abstract: 本发明实施例提供了一种传染病确诊者数量预测方法、装置、服务器及存储介质,该方法包括:确定传染病预测天数、基本传染数、传染病潜伏周期,基于以下步骤进行迭代,直至传染病预测天数归零输出传染病第二累计确诊者数量:获取第一易感者数量、第一现存疑似者数量、第一累计确诊者数量、第一累计痊愈者数量;基于第一累计痊愈者数量、第一累计确诊者数量、基本传染数、传染病潜伏周期更新预设传染病预测模型中系数;基于第一易感者数量、第一现存疑似者数量、第一累计确诊者数量、第一累计痊愈者数量、经过更新的传染病预测模型,输出第二易感者数量、第二现存疑似者数量、第二累计确诊者数量、第二累计痊愈者数量;对传染病预测天数进行递减。
-
公开(公告)号:CN115688773A
公开(公告)日:2023-02-03
申请号:CN202110857375.X
申请日:2021-07-28
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/295
Abstract: 本申请涉及一种实体关系抽取方法、装置及存储介质,所述方法包括:利用已训练的关系抽取模型从待抽取的目标语料中抽取目标关系;基于所述目标关系从所述目标语料中抽取目标实体对;利用所述目标关系和所述目标实体对构建所述目标语料对应的实体关系三元组。由此,可以实现先抽取目标语料中的目标关系,然后再基于目标关系抽取目标语料中的实体对,这相较于现有技术而言,可以避免在进行关系判断时,引入并无关系的实体对这一冗余信息,从而提高实体关系抽取结果的准确性。
-
公开(公告)号:CN114218923B
公开(公告)日:2022-08-30
申请号:CN202111564484.9
申请日:2021-12-20
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/211 , G06F40/295 , G06F40/258 , G06F40/30 , G06F16/35 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本公开实施例涉及一种文本摘要抽取方法、装置、设备及存储介质。本公开实施例通过对文本进行分句处理,获得文本中的语句和标题;提取语句中的实体,确定语句中的实体占文本中的实体的比例;基于该比例,确定语句的第一得分;基于语句与标题之间的语义相似度,确定语句的第二得分;基于第一得分和第二得分,确定用于形成摘要的语句。本公开实施例通过建模文本语句实体与文本实体,文本语句与文本标题的相关性,减少了文本摘要的冗余性,提高了文本摘要表达文本信息的准确性,提高了用户的阅读体验。
-
-
-
-
-
-
-
-
-