专利检索 ap:("北京信立方科技发展股份有限公司" OR "清华大学") AND inv:"唐海霞" 第 1 页

1.

发明公开
基于多层次知识图谱的仪器推荐方法及装置审中-公开

公开(公告)号：CN117290611A

公开(公告)日：2023-12-26

申请号：CN202311577580.6

申请日：2023-11-24

申请人： 北京信立方科技发展股份有限公司 , 清华大学

发明人： 付雪林 , 高宸 , 韩啸 , 秦荧瑢 , 王涛 , 安重阳 , 唐海霞 , 李勇

IPC分类号： G06F16/9535 , G06F16/36 , G06F18/25 , G06F18/23 , G06N3/0464 , G06N3/09

摘要： 本发明提供一种基于多层次知识图谱的仪器推荐方法及装置，涉及仪器推荐技术领域，方法包括：获取目标用户的仪器使用数据，目标用户的仪器使用数据包括仪器使用信息和目标用户与仪器的交互信息；根据仪器使用信息，得到仪器知识图谱，以及根据目标用户与仪器的交互信息，得到仪器交互二部图；将仪器知识图谱和仪器交互二部图输入至仪器推荐模型中，得到仪器推荐模型输出的仪器推荐结果。本发明不仅依赖用户的历史交互数据，还考虑仪器在仪器知识图谱中的位置和与其他仪器的关系，以及其在特定应用领域的重要性，从而显著提升推荐系统对用户需求的理解，以为用户提供更加合适、有针对性的推荐。

2.

发明授权
基于多层次知识图谱的仪器推荐方法及装置有权

公开(公告)号：CN117290611B

公开(公告)日：2024-02-23

申请号：CN202311577580.6

申请日：2023-11-24

申请人： 北京信立方科技发展股份有限公司 , 清华大学

发明人： 付雪林 , 高宸 , 韩啸 , 秦荧瑢 , 王涛 , 安重阳 , 唐海霞 , 李勇

IPC分类号： G06F16/9535 , G06F16/36 , G06F18/25 , G06F18/23 , G06N3/0464 , G06N3/09

摘要： 本发明提供一种基于多层次知识图谱的仪器推荐方法及装置，涉及仪器推荐技术领域，方法包括：获取目标用户的仪器使用数据，目标用户的仪器使用数据包括仪器使用信息和目标用户与仪器的交互信息；根据仪器使用信息，得到仪器知识图谱，以及根据目标用户与仪器的交互信息，得到仪器交互二部图；将仪器知识图谱和仪器交互二部图输入至仪器推荐模型中，得到仪器推荐模型输出的仪器推荐结果。本发明不仅依赖用户的历史交互数据，还考虑仪器在仪器知识图谱中的位置和与其他仪器的关系，以及其在特定应用领域的重要性，从而显著提升推荐系统对用户需求的理解，以为用户提供更加合适、有针(56)对比文件唐浩等.基于协同知识图谱特征学习的论文推荐方法.计算机工程.2020,第46卷(第09期),306-312.唐浩;刘柏嵩;刘晓玲;黄伟明.基于协同知识图谱特征学习的论文推荐方法.计算机工程.(第09期),

3.

发明授权
一种分词检索方法及系统有权

公开(公告)号：CN114153949B

公开(公告)日：2022-12-13

申请号：CN202111512996.0

申请日：2021-12-11

申请人： 北京信立方科技发展股份有限公司

发明人： 付雪林 , 王涛 , 孙思遥 , 邓应来 , 王启超 , 吴邱思 , 安重阳 , 韩啸 , 张葳 , 曾明泉 , 唐海霞 , 赵鑫 , 刘成书

IPC分类号： G06F16/33

摘要： 本申请提供一种分词检索方法及系统。所述方法包括：接收用户输入的检索词；对所述检索词进行单字分词；分别计算每一语料文档的单字相关度；将单字相关度进行叠加生成语料文档的相关度得分；依据所述相关度得分对所述语料文档进行排序以生成第一检索结果。在单领域信息检索平台中，通过单字分词的方式将检索词进行拆分，再计算每一语料文档的单字相关度，通过单字相关度叠加生成的相关度得分对语料文档进行排序。检索过程能够针对数据结构类型多、用户量小、用户类型多且行业跨度大、专业性强的单领域信息检索平台进行精准的检索，不需要再耗费人工梳理语义模板，降低了单领域信息检索平台的维护成本，同时也实现了单领域信息检索平台的检索功能。

4.

发明公开
网页中标数据结构化方法及装置有权

公开(公告)号：CN115203309A

公开(公告)日：2022-10-18

申请号：CN202211118991.4

申请日：2022-09-15

申请人： 北京信立方科技发展股份有限公司

发明人： 刘成书 , 王涛 , 杨瑞龙 , 韩博 , 刘真 , 武自伟 , 林沙平 , 张丽娟 , 唐海霞

IPC分类号： G06F16/25 , G06F16/22 , G06F40/151

摘要： 本发明提供一种网页中标数据结构化方法及装置，方法包括：获取网页中标数据；循环读取网页中标数据，并基于预先建立的解析预测模型和结构化映射模板，确定选择表格解析模型或键值解析模型，以对网页中标数据进行解析，并将解析结果存储至关系型数据库中。本发明通过解析预测模型判断采用表格解析模型或键值解析模型对获取的网页中标数据中进行解析，以提高解析效率；另外，结合结构化映射模板，进行解析，以基于较高的准确率和召回率将网页非结构化形式的中标数据转化为结构化数据，从而将最小单元结构化数据存储至关系型数据库中，实现非结构化网页的结构化，提高数据的可读性，节省人工整理成本，便于后期快速对数据进行分析和统计。

5.

发明授权
网页中标数据结构化方法及装置有权

公开(公告)号：CN115203309B

公开(公告)日：2022-11-29

申请号：CN202211118991.4

申请日：2022-09-15

申请人： 北京信立方科技发展股份有限公司

发明人： 刘成书 , 王涛 , 杨瑞龙 , 韩博 , 刘真 , 武自伟 , 林沙平 , 张丽娟 , 唐海霞

IPC分类号： G06F16/25 , G06F16/22 , G06F40/151

摘要： 本发明提供一种网页中标数据结构化方法及装置，方法包括：获取网页中标数据；循环读取网页中标数据，并基于预先建立的解析预测模型和结构化映射模板，确定选择表格解析模型或键值解析模型，以对网页中标数据进行解析，并将解析结果存储至关系型数据库中。本发明通过解析预测模型判断采用表格解析模型或键值解析模型对获取的网页中标数据中进行解析，以提高解析效率；另外，结合结构化映射模板，进行解析，以基于较高的准确率和召回率将网页非结构化形式的中标数据转化为结构化数据，从而将最小单元结构化数据存储至关系型数据库中，实现非结构化网页的结构化，提高数据的可读性，节省人工整理成本，便于后期快速对数据进行分析和统计。

6.

发明公开
仪器识别方法、装置、电子设备及存储介质无效

公开(公告)号：CN109255377A

公开(公告)日：2019-01-22

申请号：CN201811001670.X

申请日：2018-08-30

申请人： 北京信立方科技发展股份有限公司

发明人： 唐海霞 , 佟华 , 聂梓晨 , 冯乐斌 , 李亚辉

IPC分类号： G06K9/62 , G06N3/08 , G06F16/58

摘要： 本申请提供了一种仪器识别方法、装置、电子设备及存储介质，其中，识别方法包括：利用至少一类仪器的样本图像对初始分类模型进行模型训练，得到最终分类模型；将待识别仪器的仪器图像输入至最终分类模型，确定待识别仪器的仪器类别和仪器图像对应的第一特征向量；根据待识别仪器的仪器类别和第一特征向量，在预先建立的特征数据库中查找待识别仪器的仪器名称。本申请实施例通过将待识别仪器的仪器图像输入至最终分类模型，能够得到待识别仪器的仪器名称，达到了对仪器进行识别的目的。

7.

发明授权
文本分类模型的样本构建方法及装置、文本分类方法有权

公开(公告)号：CN115544258B

公开(公告)日：2023-04-07

申请号：CN202211487421.2

申请日：2022-11-25

申请人： 北京信立方科技发展股份有限公司

发明人： 付雪林 , 王涛 , 安重阳 , 韩啸 , 王启超 , 孙思遥 , 李晨晖 , 苏雨辰 , 张葳 , 唐海霞 , 赵鑫

IPC分类号： G06F16/35 , G06F18/214 , G06F18/2431

摘要： 本发明涉及文本处理技术领域，提供一种文本分类模型的样本构建方法及装置、文本分类方法，所述样本构建方法包括：获取初始样本数据；所述初始样本数据包括多个初始文档，以及各所述初始文档的标签数据；所述多个初始文档的标签数据对应多个目标分类；确定任一所述目标分类中的各目标词语对所述目标分类的贡献值；所述目标词语为所述目标分类下的初始文档中的任一词语；根据所述贡献值对所述目标分类下的初始文档进行样本重组，得到目标样本数据。本发明提供的样本构建方法通过计算词语对分类的贡献值，对样本数据进行样本重组，可以平衡各分类下的文本长度、改变不同分类下的样本数据量，从而均衡样本数据的分布，解决样本不均衡的问题。

8.

发明公开
基于视频的图文网页生成方法及装置审中-实审

公开(公告)号：CN117194818A

公开(公告)日：2023-12-08

申请号：CN202311475166.4

申请日：2023-11-08

申请人： 北京信立方科技发展股份有限公司

发明人： 刘成书 , 唐海霞 , 王涛 , 韩博 , 刘真 , 高凌辉 , 李文永 , 卫世杰 , 孙思遥 , 高树奎 , 张小师 , 刘亚伟

IPC分类号： G06F16/9538 , G06V20/62 , G06V30/19 , G06V30/26 , G06F16/33 , G06F16/738 , G06F16/783

摘要： 本发明提供一种基于视频的图文网页生成方法及装置，涉及互联网技术领域，方法包括：获取包括至少一组视频帧组的视频帧序列，以及获取各视频帧组对应的语音数据；对各语音数据进行语音识别；对各视频帧组进行OCR文字识别；针对每组视频帧组，基于对应语音识别得到的预测文本和对应文字识别得到的识别文本，结合结巴分词和拼音相似度，确定预测文本中存在待纠正词，并结合三元语言模型，利用对应识别文本对待纠正词进行替换；针对每组视频帧组，将替换后的文本或预测文本存放至区隔标记DIV标签中，以及将对应视频帧存放至与DIV标签关联的图片标签中，得到超文本标记语言HTML网页。本发明既保证了网页内容的准确性，又便于用户阅读。

9.

发明授权
基于视频的图文网页生成方法及装置有权

公开(公告)号：CN117194818B

公开(公告)日：2024-01-16

申请号：CN202311475166.4

申请日：2023-11-08

申请人： 北京信立方科技发展股份有限公司

发明人： 刘成书 , 唐海霞 , 王涛 , 韩博 , 刘真 , 高凌辉 , 李文永 , 卫世杰 , 孙思遥 , 高树奎 , 张小师 , 刘亚伟

IPC分类号： G06F16/9538 , G06V20/62 , G06V30/19 , G06V30/26 , G06F16/33 , G06F16/738 , G06F16/783

摘要： 本发明提供一种基于视频的图文网页生成方法及装置，涉及互联网技术领域，方法包括：获取包括至少一组视频帧组的视频帧序列，以及获取各视频帧组对应的语音数据；对各语音数据进行语音识别；对各视频帧组进行OCR文字识别；针对每组视频帧组，基于对应语音识别得到的预测文本和对应文字识别得到的识别文本，结合结巴分词和拼音相似度，确定预测文本中存在待纠正词，并结合三元语言模型，利用对应识别文本对待纠正词进行替换；针对每组视频帧组，将替换后的文本或预测文本存放至区隔标记DIV标签中，以及将对应视频帧存放至与DIV标签关联的图片标签中，得到超文本标记语言HTML网页。本发明既保证了网页内容的准确性，又便于用户阅(56)对比文件闫建鹏;封化民;刘嘉琦.一种基于多模态特征的新闻视频语义提取框架.计算机应用研究.2012,(第07期),第2725-2729页.

10.

发明授权
基于知识工作者画像的贡献度预测方法及装置有权

公开(公告)号：CN115860283B

公开(公告)日：2023-05-02

申请号：CN202310173490.4

申请日：2023-02-28

申请人： 北京信立方科技发展股份有限公司

发明人： 刘成书 , 唐海霞 , 王涛 , 杨瑞龙 , 韩博 , 刘真 , 高凌辉 , 李文永 , 孙思遥 , 高树奎 , 陈艳凤 , 黄宇涵 , 张丽娟

IPC分类号： G06Q10/04 , G06Q10/0639 , G06F16/35 , G06F40/194 , G06F40/279 , G06F18/214

摘要： 本发明提供一种基于知识工作者画像的贡献度预测方法及装置，方法包括：基于预先获取的主页介绍信息表中各知识工作者的主页介绍信息分别对应的网页结构，对相应主页介绍信息进行解析，生成对应基本信息画像；根据预先获取的论文信息获取关键字，并根据关键字构建对应专业技能信息画像；根据论文信息和预先获取的专利信息获取对应贡献度得分，并基于贡献度得分构建对应贡献度画像；根据基本信息画像、专业技能信息画像和贡献度画像，得到对应知识工作者的画像；根据知识工作者的画像对相应知识工作者的贡献度进行预测，得到贡献度预测结果。本发明通过分级画像，实现初粒度到细粒度的高精度画像，提高基于画像进行贡献度预测的精度。

搜索结果

国家/区域

专利有效性

申请日

公布(公告)日

申请人

申请人所在国/区域

发明人

IPC

IPC部

IPC大类

IPC小类

IPC大组

IPC小组

外观分类