Patent search ap:("北京中科闻歌科技股份有限公司") AND inv:"王宇琪" Page 2

11.

发明授权
公共卫生安全事件检测及事件集合构建方法及系统有权

公开(公告)号：CN113449101B

公开(公告)日：2024-10-22

申请号：CN202010226687.6

申请日：2020-03-26

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 罗引 , 郭建彬 , 孔庆超 , 王宇琪 , 方省 , 汪小东 , 张西娜 , 赵菲菲 , 王磊

IPC: G06F16/35 , G06F16/335 , G06F16/36

Abstract: 本发明实施例涉及一种公共卫生安全事件检测及事件集合构建方法及系统，方法包括：确定多个第一文本数据对应的多个主题信息，以及每个主题信息对应的至少一个第一文本数据；对每个主题信息对应的至少一个第一文本数据进行事件检测，确定每个主题信息对应的至少一个目标事件；将全部主题信息以及每个主题信息对应的至少一个目标事件作为事件集合；从互联网新闻流数据中获取与事件集合中主题信息相匹配的第二文本数据；基于第二文本数据与事件集合中目标事件的归属度对事件集合进行更新，基于静态文本数据构建的事件集合可以实现对动态文本数据的检测，进而提高互联网新闻流数据的检测效率，形成特定主题下相关舆情分析数据。

12.

发明授权
一种事件脉络生成方法、电子设备和存储介质有权

公开(公告)号：CN116361468B

公开(公告)日：2024-05-03

申请号：CN202310347374.X

申请日：2023-04-03

Applicant: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司

Inventor： 王磊 , 郭鸿飞 , 王俊艳 , 蔡昌艳 , 蒋永余 , 徐才 , 王宇琪 , 曹家 , 罗引

IPC: G06F16/35

Abstract: 本发明提供了一种事件脉络生成方法、电子设备和存储介质，方法包括：首先对接收到的文本进行文本编码，然后进行文本聚类，并进行话题清洗与合并，得到所有话题，然后对每个话题，进行事件拆分，得到每个事件，并对相似事件进行合并，然后基于文本相似度进行事件脉络生成，能够更好地划分话题或事件，使得生成的话题或事件更加准确。此外，本发明不需要人工干预，可自动对多篇新闻进行数据预处理，生成话题库和事件库，并根据发布时间，输出事件的事件脉络。

13.

发明公开
一种基于大语言模型的统一信息抽取方法、介质及设备有权

公开(公告)号：CN117764062A

公开(公告)日：2024-03-26

申请号：CN202311671334.7

申请日：2023-12-07

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 王磊 , 王宇琪 , 王亦洁 , 肖星琳 , 徐楠 , 曹家 , 罗引

IPC: G06F40/279 , G06N5/022

Abstract: 本发明提供了一种基于大语言模型的统一信息抽取方法、介质及设备，涉及信息抽取技术领域，包括：获取待处理文本以及目标指令，将待处理文本和目标指令拼接后输入目标信息抽取模型，以得到目标信息抽取模型输出的信息抽取结果。目标信息抽取模型，通过以下步骤得到：获取若干原始文本集，对若干原始文本集中的每一原始文本，进行目标训练样本生成处理，以得到目标训练样本集，根据目标训练数据集对预设大语言模型进行训练，以得到目标信息抽取模型。本发明能够使得目标信息抽取模型具备抽取不同任务类型信息的能力，提高信息抽取的效率，并可以降低模型的发散性。

14.

发明授权
一种面向社交媒体公共言论的情感、话题及观点分析方法和装置有权

公开(公告)号：CN113220823B

公开(公告)日：2024-03-01

申请号：CN202010072425.9

申请日：2020-01-21

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 王宇琪 , 孔庆超 , 苑霸 , 郭建彬 , 赵菲菲 , 方省 , 罗引 , 张西娜

IPC: G06F16/33 , G06F16/31 , G06F40/30 , G06F40/242 , G06F40/289 , G06F40/205 , G06Q50/00 , G06Q50/26

Abstract: 本申请涉及一种面向社交媒体公共言论的情感、话题及观点分析方法和装置，该方法包括：获取与公共事件对应的媒体报道信息以及公众舆论内容；按照第一预设策略分析所述媒体报道信息得到第一分析结果，按照第二预设策略分析所述公众舆论内容得到第二分析结果；对比所述第一分析结果和第二分析结果确定所述媒体报道信息与所述公众舆论内容的差异程度；根据所述差异程度规划所述公共事件的报道议程。该技术方案通过对网络公共事件的媒体报道信息以及公众舆论进行对比分析，能够得到公众对公众事件的观点以及情感倾向，并根据公众的观点以及情感倾向规划公共事件的报道议程，以此不仅(56)对比文件杨雨丹.言论差异与媒体公共性的建构——以都市报时评为中心的研究《.中国博士学位论文全文数据库信息科技辑》.2013,(第2期),I141-11.

15.

发明公开
一种事件脉络生成方法、电子设备和存储介质审中-实审

公开(公告)号：CN116361468A

公开(公告)日：2023-06-30

申请号：CN202310347374.X

申请日：2023-04-03

Applicant: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司

Inventor： 王磊 , 郭鸿飞 , 王俊艳 , 蔡昌艳 , 蒋永余 , 徐才 , 王宇琪 , 曹家 , 罗引

IPC: G06F16/35

Abstract: 本发明提供了一种事件脉络生成方法、电子设备和存储介质，方法包括：首先对接收到的文本进行文本编码，然后进行文本聚类，并进行话题清洗与合并，得到所有话题，然后对每个话题，进行事件拆分，得到每个事件，并对相似事件进行合并，然后基于文本相似度进行事件脉络生成，能够更好地划分话题或事件，使得生成的话题或事件更加准确。此外，本发明不需要人工干预，可自动对多篇新闻进行数据预处理，生成话题库和事件库，并根据发布时间，输出事件的事件脉络。

16.

发明公开
一种基于量子的媒体信息的情感预测方法、介质及设备有权

公开(公告)号：CN115982395A

公开(公告)日：2023-04-18

申请号：CN202310267414.X

申请日：2023-03-20

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 王磊 , 蒋永余 , 王俊艳 , 王宇琪 , 曹家 , 罗引

IPC: G06F16/45 , G06F18/2415 , G06F18/25 , G06F18/2135

Abstract: 本发明涉及多模态情感预测领域，特别是涉及一种基于量子的媒体信息的情感预测方法、介质及设备。包括如下步骤：对每一模态的表示信息进行预处理，生成每一模态的表示信息对应的复数词向量集A1及A2，对A1及A2进行特征转换处理，生成对应的特征密度矩阵集ρt及ρv；对ρt及ρv进行特征融合处理，生成融合特征fp；根据fp与多个预设情感类型的投影算子，生成fp为每一种预设情感类型的概率值。将P(e1)，P(e2)，…，P(ew)中最大值对应的情感类型，作为目标媒体信息的情感类型。通过利用量子理论的模型，可以更加有效的捕获不同模态之间的信息交互，进而可以提高对媒体信息所表达情绪的预测结果的精度。

17.

发明公开
多语言观点摘要生成方法、装置、设备、系统及存储介质审中-实审

公开(公告)号：CN115248857A

公开(公告)日：2022-10-28

申请号：CN202211026146.4

申请日：2022-08-25

Applicant: 北京中科闻歌科技股份有限公司 , 航空工业信息中心 , 中国科学院自动化研究所

Inventor： 王婧宜 , 俞笑 , 孔庆超 , 王童跃 , 徐楠 , 胡佳茵 , 王宇琪 , 曹家 , 罗引

IPC: G06F16/34 , G06F16/35 , G06N3/04 , G06N3/08

Abstract: 本公开涉及一种多语言观点摘要生成方法、装置、设备、系统及存储介质。该方法包括：获取待处理的多个目标文本；对多个目标文本进行跨语言文本表征处理，得到各个目标文本对应的多个通用表征向量；基于多个通用表征向量，提取各个目标文本中的至少一个观点句；基于观点句，生成多个目标文本对应的多个观点摘要。根据本公开实施例，无需依赖机器翻译工具对不同的语言对应的多媒体内容先进行翻译再生成观点摘要，对于海量的多语言目标文本，降低了观点摘要的生成成本，同时，生成的观点摘要不受机器翻译准确性的影响，因此，提高了多语言观点摘要生成的准确性，有利于推广应用。

18.

发明公开
面向多级标签的文本分类方法、装置、设备及存储介质审中-实审

公开(公告)号：CN114691866A

公开(公告)日：2022-07-01

申请号：CN202210225366.3

申请日：2022-03-09

Applicant: 航空工业信息中心 , 北京中科闻歌科技股份有限公司 , 中国科学院自动化研究所

Inventor： 王婧宜 , 禹宁 , 冯昊 , 孔庆超 , 王宇琪 , 许刚刚 , 曹家 , 罗引

IPC: G06F16/35 , G06F40/30

Abstract: 本公开实施例涉及一种面向多级标签的文本分类方法、装置、设备及存储介质。本公开实施例通过获取文本以及文本中关键词对应的标签；基于预设的面向多级标签的文本分类模型中的文本编码模型对文本进行编码处理，得到文本的特征向量，文本的特征向量对文本的关键词进行敏感表征，基于预设的面向多级标签的文本分类模型中的标签编码模型，对标签进行编码处理，得到标签的向量；分别计算文本的特征向量与每个标签的向量之间的余弦相似度；将余弦相似度大于预设阈值的标签确定为文本的标签。通过对文本和现有类别标签进行编码处理和余弦相似度计算处理，选择出文本内容相匹配的标签，可减轻对人工标注标签的依赖，降低人工标注和标签体系的维护成本，提高标签标注的准确率，使文本分类结果更准确。

19.

发明公开
知识图谱本体构建方法、装置、设备及可读存储介质有权

公开(公告)号：CN114528417A

公开(公告)日：2022-05-24

申请号：CN202210377444.1

申请日：2022-04-12

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 周玉金 , 孙攀 , 王宇琪 , 李军锋 , 王璋盛 , 曹家 , 罗引 , 王磊

IPC: G06F16/36 , G06F40/295 , G06F40/30

Abstract: 本公开涉及一种知识图谱本体构建方法、装置、设备及可读存储介质。本公开通过基于文本语料获取文本领域本体候选集，并基于图像数据获取图像领域本体候选集，基于文本领域本体候选集中文本领域本体的本体概念词，确定文本领域本体的层次结构，基于图像领域本体候选集中图像领域本体的图像语义标签，确定图像领域本体的层次结构。进而基于文本领域本体候选集、文本领域本体的层次结构、图像领域本体候选集和图像领域本体的层次结构，确定包含文本领域本体和图像领域本体的知识图谱本体，实现了对文本和图像等多模态数据的知识本体分类别、分层次的构建。

20.

发明公开
基于领域信息的情感分析方法、装置、设备及存储介质有权

公开(公告)号：CN113672731A

公开(公告)日：2021-11-19

申请号：CN202110881327.4

申请日：2021-08-02

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 张佳旭 , 王宇琪 , 郝保 , 曹家 , 刘莹 , 鲁县华 , 罗引 , 王磊

IPC: G06F16/35 , G06N3/04 , G06N3/08

Abstract: 本公开实施例涉及一种基于领域信息的情感分析方法，该方法包括：对待分析的文本信息进行预处理，并获取领域信息；将待分析的文本信息输入到预先融合有领域信息的情感分类模型中，获取文本信息的情感类别；融合有领域信息的情感分类模型包括：全局情感语义模型、每一个领域的局部情感语义模型和对应每一个领域的情感融合策略；其中，基于与领域信息匹配的局部情感语义模型，获取局部情感概率值；基于全局情感语义模型，获取全局情感概率值；基于与领域信息匹配的情感融合策略，对局部情感概率值和全局情感概率值进行融合，获得融合结果；基于融合结果获取情感类别。通过本方法进行文本情感分析，分类效果更好，大大提高了分析结果的准确率。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification