指针式仪表图像矫正方法、系统及存储介质

    公开(公告)号:CN112861870A

    公开(公告)日:2021-05-28

    申请号:CN202110144237.7

    申请日:2021-02-02

    申请人: 北京大学

    发明人: 金芝 李戈

    摘要: 本申请提供了一种指针式仪表图像矫正方法、系统及存储介质,通过获取指针式仪表的图像,进行图像预处理,得到仪表的灰度图像;根据仪表的灰度图像,通过自适应边缘检测,获得仪表的边缘边界;根据仪表的边缘边界,通过椭圆检测,获得仪表的椭圆边界;仪表的椭圆边界包括椭圆圆心位置、椭圆长轴长度、椭圆短轴长度以及表盘旋转角度;根据仪表的椭圆边界,通过透视变换,将仪表的椭圆边界对应的仪表椭圆图像投影至正圆区域,得到矫正图像。本申请对指针式仪表图像对圆形仪表的非正视图像进行正圆形矫正,获得标准的正视图像,具有快捷、高效、鲁棒性强等特点,提高了后续仪表示数的识别准确性。

    指针式仪表盘识别方法、系统及存储介质

    公开(公告)号:CN112861867A

    公开(公告)日:2021-05-28

    申请号:CN202110138641.3

    申请日:2021-02-01

    申请人: 北京大学

    发明人: 金芝 李戈

    摘要: 本申请提供了一种指针式仪表盘识别方法、系统及存储介质,通过获取不同场景下一定数量的指针式仪表图像,并进行仪表种类标签的标注,得到训练数据集;将训练数据集输入至目标检测神经网络进行训练,得到训练后的仪表检测模型;将待识别仪表图像输入至仪表检测模型进行预测,得到仪表预测向量;仪表预测向量包括仪表种类、仪表盘中心坐标以及仪表盘预测框的大小;根据仪表预测向量,将待识别仪表图像中的至少一个仪表盘进行切割,得到至少一个仪表盘图像。本申请利用复杂情况下大样本的仪表图像对目标检测神经网络进行训练得到训练后的仪表检测模型,支持各种复杂场景下多个仪表的同时检测,大大提高了仪表盘的识别准确性以及效率。

    一种多维度领域关键知识的提取和存储方法

    公开(公告)号:CN106446089B

    公开(公告)日:2019-08-16

    申请号:CN201610816682.2

    申请日:2016-09-12

    申请人: 北京大学

    发明人: 金芝 李戈 兰铮

    IPC分类号: G06F16/28 G06Q10/10

    摘要: 本发明公布了一种多维度领域关键知识提取和存储方法,面向招聘服务,根据招聘服务中的关键词,自动构建和量化关键词与职位之间、关键词之间、关键词组合所表达的信息,提取出并进行表示和存储;包括:提取招聘领域的关键词,将职位信息表示成领域关键词的向量;量化关键词之间的关系,得到关键词相关系数矩阵;量化关键词与职位之间的关系,得到关键词与职位相关系数矩阵,作为度量专业技能对职位类别的权重系数;量化关键词组合所表达的信息及其与职位之间的关系;由此实现面向招聘服务的多维度领域关键知识提取和存储。本发明方法易于从语义层面进行理解,简单易行,节省人力。

    一种基于迁移学习的API辅助代码概要生成方法

    公开(公告)号:CN109614083A

    公开(公告)日:2019-04-12

    申请号:CN201811220621.5

    申请日:2018-10-19

    申请人: 北京大学

    发明人: 李戈 金芝

    IPC分类号: G06F8/30

    摘要: 本发明提供了一种基于迁移学习的API辅助代码概要生成方法,包括:数据提取步骤,从第一代码库中提取第一API序列,从第二代码库中提取第二API序列、代码;API预训练步骤,采用序列到序列模型,对所述从第一代码库中提取得到的第一API序列进行API预训练,得到第一概要;API辅助代码概要生成训练步骤,采用API辅助代码概要生成模型,对所述从第二代码库中提取得到的第二API序列和代码进行API辅助代码概要生成训练,得到第二概要。本发明的方法提高了生成代码概要的准确率和召回率,并且提高了精度和效率,相对于其他代码概要生成方法更具表达性。

    一种基于LSTM自动补全代码的方法

    公开(公告)号:CN108388425A

    公开(公告)日:2018-08-10

    申请号:CN201810230691.2

    申请日:2018-03-20

    申请人: 北京大学

    发明人: 李戈 金芝

    IPC分类号: G06F8/30 G06F8/41

    摘要: 本发明提供了一种基于LSTM自动补全代码的方法,包括:源代码处理步骤,使用抽象语法树解析源代码;线下训练步骤,使用LSTM模型训练语言模型;线上代码补全步骤,根据训练过的语言模型补全代码。所述LSTM模型包括约束字符级LSTM和使用前上下文标识符编码器的标识符级LSTM。本发明实现了在编程过程中,任意地方输入任意字符都可以实现代码的自动补全,以及任意代码的推荐,并保证推荐过程的准确性。本发明的技术方案具有简单、快速的特点,能够较好地提高代码推荐的准确率和推荐效率。

    基于多维度领域关键知识的招聘信息匹配方法

    公开(公告)号:CN106447285A

    公开(公告)日:2017-02-22

    申请号:CN201610816684.1

    申请日:2016-09-12

    申请人: 北京大学

    发明人: 李戈 金芝 兰铮

    IPC分类号: G06Q10/10 G06F17/30 G06F17/27

    摘要: 本发明公布了一种基于多维度领域关键知识的招聘信息匹配方法,通过抽取关键词、简历关键词与职位之间进行直接匹配、简历与职位关键词之间进行相关匹配,实现多维度的简历与职位的精准匹配;包括:抽取职位信息与简历信息中的关键词,用向量表示职位信息与简历信息;直接匹配得到直接匹配所得文本相似度分值;相关匹配得到相关匹配所得文本相似度分值;获得预测差异性的衡量指标;通过加权计算得到最终简历和职位的文本相似度分值,作为信息匹配结果,完成招聘信息匹配。本发明方法能够全面体现关键词之间、关键词组合所表达的信息和知识;有效提高职位与简历的匹配精度,降低招聘中HR的人力成本。

    基于病例库的疾病症状及其权重知识的获取和处理方法

    公开(公告)号:CN106372439A

    公开(公告)日:2017-02-01

    申请号:CN201610836533.2

    申请日:2016-09-21

    申请人: 北京大学

    发明人: 金芝 李戈 陆军

    IPC分类号: G06F19/00 G06F17/27

    摘要: 本发明公布了一种基于病例库的疾病症状及其权重知识的获取和处理方法,以互联网上的海量病例库作为信息源,通过对信息源原始数据进行处理,自动获取疾病症状及其权重知识;包括:采取正则表达式进行HTML标签匹配,通过网络爬虫策略获取疾病症状原始数据;进行词语相似度计算和同义词识别获取医学词语相似度表和医学词语同义词表;进行分类、TF-IDF词频统计、无量纲化处理,获取疾病症状及其权重等多个参数,用于整体评价疾病与症状关系。采用本发明提供的技术方案,能够节省大量人力、财力和时间;得出的疾病症状及其权重结果更加合理;适用于导医系统和基于互联网的疾病自我预诊系统等场景。

    分类知识获取方法和装置

    公开(公告)号:CN103324692A

    公开(公告)日:2013-09-25

    申请号:CN201310219725.5

    申请日:2013-06-04

    申请人: 北京大学

    IPC分类号: G06F17/30

    摘要: 本发明提供一种分类知识获取方法和装置,通过获取原始种子术语的第一相关文本,从第一相关文本中获取第一关联词汇,对第一关联词汇进行搜索,获取第二相关文本,根据原始种子术语所属领域,对第二相关文本进行筛选,得到第二相关文本中匹配所述领域的第一子集,判断所述第一子集与所述原始种子术语的领域相关度是否达到预设值,相当于判断获取第二相关文本所用的第一关联词汇的领域相关性,基于判断结果获取原始种子术语的分类知识,从而保证了获取的分类知识的领域相关性,因此,解决了获取的分类知识领域偏离的问题,进而提高了获取的分类知识的有效率。

    业务领域知识库构建方法和装置

    公开(公告)号:CN103324689A

    公开(公告)日:2013-09-25

    申请号:CN201310218398.1

    申请日:2013-06-04

    申请人: 北京大学

    IPC分类号: G06F17/30

    摘要: 本发明提供一种业务领域知识库构建方法和装置,方法包括:创建业务领域的本体,所述业务领域的本体包括概念;分别以所述业务领域的本体中包括的所述概念为第一关键词,搜索与所述概念相关的信息条目;根据所述业务领域的本体所包括的概念构建所述业务领域的检索条目;在业务领域知识库中,在每个所述检索条目中存储内容对应的所述信息条目。本发明实施例有效解决了现有技术中,人们从现有知识库中搜索信息的效率较低的技术问题。

    程序注释方法和装置
    10.
    发明公开

    公开(公告)号:CN103324513A

    公开(公告)日:2013-09-25

    申请号:CN201310218270.5

    申请日:2013-06-04

    申请人: 北京大学

    IPC分类号: G06F9/45

    摘要: 本发明提供一种程序注释方法和装置。其中,方法包括:获取与程序代码对应的多媒体注释文件;建立多媒体注释文件与程序代码之间的关联关系。通过采用多媒体注释文件对程序代码进行注释,以使程序维护人员根据程序代码中的多媒体注释文件,能够快速理解程序代码,提高了程序维护人员的维护效率。