邮箱作者对应方法和装置及计算机可读存储介质

    公开(公告)号:CN107506374B

    公开(公告)日:2020-02-21

    申请号:CN201710574481.0

    申请日:2017-07-14

    发明人: 霍东云

    IPC分类号: G06F16/2458

    摘要: 本发明公开了邮箱作者对应方法和装置及计算机可读存储介质,该邮箱作者对应方法包括:邮箱查找步骤,在包含已知作者的作品的文件中查找邮箱;作者和邮箱共同出现量统计步骤,统计在包含已知作者的作品的文件中,已知作者与邮箱共同出现的文件的数量,即作者和邮箱共同出现量;合作者获取步骤,针对已知作者与所述邮箱共同出现的文件中包含的作品,获得已知作者的各合作者;合作者和邮箱共同出现量统计步骤,统计在包含已知作者的作品的文件中,各合作者与邮箱共同出现的数量,即合作者和邮箱共同出现量;邮箱关联步骤,在作者和邮箱共同出现量与各合作者和邮箱共同出现量之差均大于预定阈值时,将邮箱与已知作者相关联。

    作品全文查找方法和装置以及存储介质

    公开(公告)号:CN107526774A

    公开(公告)日:2017-12-29

    申请号:CN201710579560.0

    申请日:2017-07-17

    发明人: 霍东云

    IPC分类号: G06F17/30

    摘要: 本发明公开了一种作品全文查找方法和装置以及存储介质。该作品全文查找方法包括:作品信息接收步骤,接收要查找其全文的作品的作品信息;搜索引擎列表获取步骤,获得搜索引擎的列表;全文搜索步骤,按照所述搜索引擎在所述列表上的顺序,使用所述列表上的各搜索引擎,依据所述作品信息搜索所述作品的作品全文,当使用排序在前的搜索引擎查找到所需作品全文时,不在使用排序在后搜索引擎进行搜索。

    专家库建立办法和装置
    3.
    发明公开

    公开(公告)号:CN106776978A

    公开(公告)日:2017-05-31

    申请号:CN201611108848.1

    申请日:2016-12-06

    IPC分类号: G06F17/30 G06K9/62 G06Q50/00

    摘要: 本发明涉及一种专家库建立方法和装置,该方法包括以下步骤:样本收集步骤,收集特定领域的专家样本,包括专家的论文、专利和项目,形成训练集;专家分类模型建立步骤,根据训练库建立专家分类模型;直接专家识别步骤,利用所建立的专家分类模型,对全部待分类专家进行识别和分类,判断其是否属于所述特定领域的专家;合作专家识别步骤,根据待分类专家与所述特定领域的专家的合作度确定待分类专家是否属于所述特定领域的专家。

    邮箱作者对应方法和装置

    公开(公告)号:CN107577657B

    公开(公告)日:2020-09-11

    申请号:CN201710574804.6

    申请日:2017-07-14

    发明人: 霍东云

    IPC分类号: G06F40/279

    摘要: 本发明公开了邮箱作者对应方法和装置及计算机可读存储介质,该邮箱作者对应方法,包括:邮箱查找步骤,在包含已知作者的作品的文件中查找邮箱;作者信息解析步骤,对已知作者进行姓名解析,获得所述已知作者的姓名信息以及姓名信息的缩略表达;匹配字段获取步骤,将所述已该作者的姓名信息以及姓名信息的缩略表达与所述邮箱的地址进行比对,确定邮箱的地址中包含的所述已知作者的姓名信息以及姓名信息的缩略表达,即匹配字段;置信度判断步骤,根据所获得匹配字段,判断邮箱是已知作者的邮箱的置信度;关联步骤,当判断出邮箱是已知作者的邮箱的置信度高于阈值时,将作者和所述邮箱相关联。

    作品全文查找方法和装置以及存储介质

    公开(公告)号:CN107526774B

    公开(公告)日:2020-01-21

    申请号:CN201710579560.0

    申请日:2017-07-17

    发明人: 霍东云

    IPC分类号: G06F16/33

    摘要: 本发明公开了一种作品全文查找方法和装置以及存储介质。该作品全文查找方法包括:作品信息接收步骤,接收要查找其全文的作品的作品信息;搜索引擎列表获取步骤,获得搜索引擎的列表;全文搜索步骤,按照所述搜索引擎在所述列表上的顺序,使用所述列表上的各搜索引擎,依据所述作品信息搜索所述作品的作品全文,当使用排序在前的搜索引擎查找到所需作品全文时,不在使用排序在后搜索引擎进行搜索。

    专家库建立办法和装置
    6.
    发明授权

    公开(公告)号:CN106776978B

    公开(公告)日:2019-08-16

    申请号:CN201611108848.1

    申请日:2016-12-06

    IPC分类号: G06F16/903 G06K9/62 G06Q50/00

    摘要: 本发明涉及一种专家库建立方法和装置,该方法包括以下步骤:样本收集步骤,收集特定领域的专家样本,包括专家的论文、专利和项目,形成训练集;专家分类模型建立步骤,根据训练库建立专家分类模型;直接专家识别步骤,利用所建立的专家分类模型,对全部待分类专家进行识别和分类,判断其是否属于所述特定领域的专家;合作专家识别步骤,根据待分类专家与所述特定领域的专家的合作度确定待分类专家是否属于所述特定领域的专家。

    邮箱作者对应方法和装置及计算机可读存储介质

    公开(公告)号:CN107506374A

    公开(公告)日:2017-12-22

    申请号:CN201710574481.0

    申请日:2017-07-14

    发明人: 霍东云

    IPC分类号: G06F17/30

    摘要: 本发明公开了邮箱作者对应方法和装置及计算机可读存储介质,该邮箱作者对应方法包括:邮箱查找步骤,在包含已知作者的作品的文件中查找邮箱;作者和邮箱共同出现量统计步骤,统计在包含已知作者的作品的文件中,已知作者与邮箱共同出现的文件的数量,即作者和邮箱共同出现量;合作者获取步骤,针对已知作者与所述邮箱共同出现的文件中包含的作品,获得已知作者的各合作者;合作者和邮箱共同出现量统计步骤,统计在包含已知作者的作品的文件中,各合作者与邮箱共同出现的数量,即合作者和邮箱共同出现量;邮箱关联步骤,在作者和邮箱共同出现量与各合作者和邮箱共同出现量之差均大于预定阈值时,将邮箱与已知作者相关联。

    一种针对指定专家的信息爬取系统及方法

    公开(公告)号:CN110781368A

    公开(公告)日:2020-02-11

    申请号:CN201911008059.4

    申请日:2019-10-22

    IPC分类号: G06F16/951

    摘要: 本发明涉及互联网技术技术领域,尤其为一种针对指定专家的信息爬取系统及方法,包括用户交互模块、候选列表爬取模块、专家信息爬取模块、数据清洗模块、数据结构化模块和专家画像模块,本发明通过设计解决现有的网络爬虫技术中,将网络上的专家数据集中爬取后存在数据库和云端中,但是这种方法需要占用较多的存储空间和服务器资源,也需要在数据的全面性和维护成本之间进行取舍,从而能准确的返回用户指定的专家信息,无需在搜索引擎中进行搜索和确认,节省了用户的时间成本,能整合多个数据源的专家数据,避免了在单一数据源中搜索不到对应专家的问题同时将大量专家数据存储在数据库和云端的方式,能够节省大量的数据库空间和维护成本。

    专家匹配方法和装置以及存储介质

    公开(公告)号:CN107908704B

    公开(公告)日:2024-04-23

    申请号:CN201711090934.9

    申请日:2017-11-08

    摘要: 本发明涉及专家匹配方法和系统以及计算机存储介质。该专家匹配方法,包括:专家数据获取步骤,获取专家数据,所述专家数据包括专家的简历信息和/或作品信息,所述作品信息包括作品的概要或内容;专家数据分类步骤,按照技术领域对专家数据进行分类;类别关键词矢量和专家关键词矢量构建步骤,针对所获得的各个类别,确定各类别的关键词矢量和各专家的关键词矢量;需求信息获取步骤,获取对专家的需求信息;需求信息分类步骤,确定需求信息所涉及的技术领域;需求信息关键词矢量确定步骤,根据所述技术领域,确定所述需求信息的关键词矢量;匹配步骤,利用所述需求信息的关键词矢量和各专家的关键词矢量,确定与所述需求信息相匹配的专家。

    一种领域专家精准匹配推荐系统及方法

    公开(公告)号:CN112861010A

    公开(公告)日:2021-05-28

    申请号:CN202110230178.5

    申请日:2021-03-02

    发明人: 智强 姚兰

    摘要: 本申请公开了一种领域专家精准匹配推荐系统及方法,系统包括:领域专家数据采集模块、数据存储模块、专家匹配规则模块、数据更新模块、专家筛选匹配模块、更新匹配规则模块、专家推荐排序模块、展示结果模块;方法包括:对领域专家的历史数据进行采集;保存采集到的领域专家的数据;采用缓存技术保存专家匹配规则;判断传递过来的数据是否合格;通过正则表达式匹配的模式,检查一个专家的相关内容是否含有某种子字符串或者从某个字符串中取出符合某个条件的子字符串,根据不同搜索规则,制定对应的解析方法;按照预先准备好的专家画像,将所述解析后的数据序列填充领域对应的排序因子;显示所述检索结果。本申请能够准确地返回用户指定领域的专家信息,节省了用户的检索时间成本。