-
公开(公告)号:CN116049413B
公开(公告)日:2023-06-13
申请号:CN202310346366.3
申请日:2023-04-03
申请人: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司
IPC分类号: G06F16/35 , G06F18/22 , G06F18/2415 , G06N3/0455 , G06N3/047
摘要: 本发明提供了一种基于事件演化的用户观点和立场获取方法,首先对输入的多个文本例如新闻进行文本聚类,然后对聚类结果进行清洗和合并以得到事件,然后针对事件的演化过程,抽取事件对应的评论者、观点和立场,最后按照事件的演化时间顺序,输出对应的评论者、观点和立场,能够根据事件的演变,推断评论者的观点、立场的变化情况。
-
公开(公告)号:CN116361470B
公开(公告)日:2024-05-14
申请号:CN202310347961.9
申请日:2023-04-03
申请人: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司
IPC分类号: G06F16/35
摘要: 本发明提供了一种基于话题描述的文本聚类清洗和合并方法,首先对文本进行聚类,得到多个聚类结果,每个聚类结果相当于一个话题,然后基于话题向量与话题中文本向量的文本相似度大小、话题描述与每个文本生成的话题描述的文本相似度大小、文本与话题的关键词相同的个数三个指标,对聚类结果进行清洗和合并,最后得到聚类结果和每个话题的描述,能够使得聚类结果更加准确。
-
公开(公告)号:CN116049414B
公开(公告)日:2023-06-06
申请号:CN202310346367.8
申请日:2023-04-03
申请人: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司
摘要: 本发明提供了一种基于话题描述的文本聚类方法、电子设备和存储介质,方法包括:首先对待聚类的每个文本生成一个话题描述,然后将该话题描述输入话题描述特征生成模型,提取话题描述的特征,作为当前文本的话题描述特征,基于该特征,对文本进行聚类,相较于直接使用原始文本提取的特征进行聚类,使用生成的话题描述特征进行聚类,减少了文本内容形式多样导致的噪声干扰,提高了聚类准确性。聚类后,基于文本和话题的特征向量之间的相似度以及文本和话题的话题描述特征向量之间的相似度,对聚类结果进行清洗和合并,最后得到聚类结果和每个话题的话题描述,能够使得聚类结果更加准确。
-
公开(公告)号:CN116049414A
公开(公告)日:2023-05-02
申请号:CN202310346367.8
申请日:2023-04-03
申请人: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司
摘要: 本发明提供了一种基于话题描述的文本聚类方法、电子设备和存储介质,方法包括:首先对待聚类的每个文本生成一个话题描述,然后将该话题描述输入话题描述特征生成模型,提取话题描述的特征,作为当前文本的话题描述特征,基于该特征,对文本进行聚类,相较于直接使用原始文本提取的特征进行聚类,使用生成的话题描述特征进行聚类,减少了文本内容形式多样导致的噪声干扰,提高了聚类准确性。聚类后,基于文本和话题的特征向量之间的相似度以及文本和话题的话题描述特征向量之间的相似度,对聚类结果进行清洗和合并,最后得到聚类结果和每个话题的话题描述,能够使得聚类结果更加准确。
-
公开(公告)号:CN116361470A
公开(公告)日:2023-06-30
申请号:CN202310347961.9
申请日:2023-04-03
申请人: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司
IPC分类号: G06F16/35
摘要: 本发明提供了一种基于话题描述的文本聚类清洗和合并方法,首先对文本进行聚类,得到多个聚类结果,每个聚类结果相当于一个话题,然后基于话题向量与话题中文本向量的文本相似度大小、话题描述与每个文本生成的话题描述的文本相似度大小、文本与话题的关键词相同的个数三个指标,对聚类结果进行清洗和合并,最后得到聚类结果和每个话题的描述,能够使得聚类结果更加准确。
-
公开(公告)号:CN116049413A
公开(公告)日:2023-05-02
申请号:CN202310346366.3
申请日:2023-04-03
申请人: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司
IPC分类号: G06F16/35 , G06F18/22 , G06F18/2415 , G06N3/0455 , G06N3/047
摘要: 本发明提供了一种基于事件演化的用户观点和立场获取方法,首先对输入的多个文本例如新闻进行文本聚类,然后对聚类结果进行清洗和合并以得到事件,然后针对事件的演化过程,抽取事件对应的评论者、观点和立场,最后按照事件的演化时间顺序,输出对应的评论者、观点和立场,能够根据事件的演变,推断评论者的观点、立场的变化情况。
-
公开(公告)号:CN116361468B
公开(公告)日:2024-05-03
申请号:CN202310347374.X
申请日:2023-04-03
申请人: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司
IPC分类号: G06F16/35
摘要: 本发明提供了一种事件脉络生成方法、电子设备和存储介质,方法包括:首先对接收到的文本进行文本编码,然后进行文本聚类,并进行话题清洗与合并,得到所有话题,然后对每个话题,进行事件拆分,得到每个事件,并对相似事件进行合并,然后基于文本相似度进行事件脉络生成,能够更好地划分话题或事件,使得生成的话题或事件更加准确。此外,本发明不需要人工干预,可自动对多篇新闻进行数据预处理,生成话题库和事件库,并根据发布时间,输出事件的事件脉络。
-
公开(公告)号:CN116361468A
公开(公告)日:2023-06-30
申请号:CN202310347374.X
申请日:2023-04-03
申请人: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司
IPC分类号: G06F16/35
摘要: 本发明提供了一种事件脉络生成方法、电子设备和存储介质,方法包括:首先对接收到的文本进行文本编码,然后进行文本聚类,并进行话题清洗与合并,得到所有话题,然后对每个话题,进行事件拆分,得到每个事件,并对相似事件进行合并,然后基于文本相似度进行事件脉络生成,能够更好地划分话题或事件,使得生成的话题或事件更加准确。此外,本发明不需要人工干预,可自动对多篇新闻进行数据预处理,生成话题库和事件库,并根据发布时间,输出事件的事件脉络。
-
公开(公告)号:CN115797715B
公开(公告)日:2023-06-23
申请号:CN202211583636.4
申请日:2022-12-09
申请人: 北京中科闻歌科技股份有限公司
IPC分类号: G06V10/77 , G06V10/82 , G06N3/0464 , G06N3/08
摘要: 本发明提供了一种量子视觉MLP处理系统及存储介质,所述系统包括n个量子视觉MLP处理模块、处理器和存储有一段计算机程序的存储器,所述量子视觉处理模块包括n个依次连接的量子视觉MLP处理单元,当所述处理器执行一段计算机程序时,实现如下步骤:获取目标图像对应的图像块初始特征向量,将图像块初始化特征向量输入量子视觉MLP处理模块,以获得该目标图像的最终图像聚合特征和最终图像块特征;本发明提出的量子视觉MLP处理系统,一方面使得图像块的特征充分考虑了其语义内容,更利于图像块的聚合,另一方面,其包含了较少的归纳偏差,具有较高的适应性。
-
公开(公告)号:CN115526338B
公开(公告)日:2023-06-23
申请号:CN202211287916.0
申请日:2022-10-20
申请人: 北京中科闻歌科技股份有限公司
IPC分类号: G06N20/00 , G06F16/33 , G06F16/338
摘要: 本申请涉及信息检索领域,特别是涉及一种用于信息检索的强化学习模型构建方法,所述方法包括:S100,获取查询信息Q的特征编码q和候选文档集合中各候选文档的特征编码;S200,构建MDP模型,其中:MDP模型的初始状态s0=[0,q],MDP模型的智能体在初始状态下选择动作a0的概率分布为π(a0|s0;w);S300,根据长期奖励对MDP模型进行模型训练。本发明提高了信息检索时文档排序的精确性。
-
-
-
-
-
-
-
-
-