-
公开(公告)号:CN117112735A
公开(公告)日:2023-11-24
申请号:CN202311351864.3
申请日:2023-10-19
申请人: 中汽信息科技(天津)有限公司 , 中汽知识产权(广州)有限公司
IPC分类号: G06F16/33 , G06F40/30 , G06Q50/18 , G06F16/332
摘要: 本申请涉及一种专利数据库的构建方法和电子设备,涉及电数字处理技术领域,方法包括从全面专利数据库中检索目标企业的多个一层级专利;基于语义相似度模型,从所述全面专利数据库中筛选与各前一层级专利相似度大于阈值的专利,作为本层级专利;其中,本层级的阈值通过前一层级的专利价值与前一层级的阈值确定,前一层级的阈值大于等于本层级的阈值;以此类推得到多个层级专利,构建为目标企业的专利分析数据库。本申请凭借语义相似度模型和可变的阈值,实现渐进式的专利数量扩展,从而构建与企业技术紧密相关的、较全面的用于企业专利分析的数据库。
-
公开(公告)号:CN114840474B
公开(公告)日:2022-09-20
申请号:CN202210785305.2
申请日:2022-07-06
申请人: 中汽信息科技(天津)有限公司
摘要: 本发明公开了一种专利索引数据库的数据迁移方法和系统,涉及数据库间的数据同步技术领域。其中,方法包括:TRS数据库服务器将TRS文件发送至ES数据库服务器;ES数据库服务器从TRS文件解析出多条专利数据;如果目标专利数据的来源库存储有超过阈值的专利数据,则建立所述目标专利数据与所述来源库的库名的对应关系;将对应关系中的库名转换为分片路由Routing,将多条专利数据导入到对应Routing的数据分片中。本发明将专利数据从TRS数据库中批量迁移到ES数据库中,且保证迁移后各数据分片的均衡。
-
公开(公告)号:CN113434625B
公开(公告)日:2021-12-07
申请号:CN202110991498.2
申请日:2021-08-27
申请人: 中汽信息科技(天津)有限公司
发明人: 王铁 , 王军雷 , 季南 , 傅连学 , 冀然 , 王灿灿 , 吕惠 , 郭少杰 , 刘兰 , 王丹妮 , 郭宇宏 , 李健明 , 丁强 , 王静 , 辛明华 , 张昭昭 , 张娟 , 王亮亮 , 张海楠
IPC分类号: G06F16/31 , G06F16/332
摘要: 本发明实施例提供一种专利检索式的代码化方法、设备和存储介质,涉及计算机语言处理技术领域。方法包括:获取一专利检索式;通过解析Elasticsearch适用的布尔检索语句格式,确定抽象语法树的结构;按照抽象语法树的结构将所述专利检索式生成抽象语法树;将所述非叶子节点存储的逻辑运算符映射得到布尔逻辑运算符,将所述叶子节点存储的字段名、文本和操作符生成内部代码组,根据非叶子节点之间的级联关系,将所述布尔逻辑运算符生成代码嵌套格式;将内部代码组填充到代码嵌套格式中,得到布尔检索语句。本发明中用户只需要输入常规专利检索式,即可以自动生成抽象语法树,自动通过Elasticsearch进行高效地检索。
-
公开(公告)号:CN114996291A
公开(公告)日:2022-09-02
申请号:CN202210934896.5
申请日:2022-08-05
申请人: 中汽信息科技(天津)有限公司
摘要: 本发明公开了一种自适应优先级的多级数据更新方法,涉及数据更新技术领域。其中,方法包括:获取本地的企业树,所述企业树包括多个叶子节点和多个非叶子节点,每个节点至少存储有层级信息和对应企业信息;当每个更新周期到来时,按照所述第一当前优先级从高到低的顺序对多个节点进行排序,对前设定数量个节点的企业信息进行更新;对于任一非叶子节点,按照所述第二当前优先级从高到低的顺序对多个非叶子节点进行排序,并对前设定数量个非叶子节点及各级子节点的层级信息进行更新。本发明在更新周期的轮询中,能够拿以最小的代价对高优先级的节点快速准确地更新。
-
-
-