-
公开(公告)号:CN111325001A
公开(公告)日:2020-06-23
申请号:CN201811528227.8
申请日:2018-12-13
申请人: 北大方正集团有限公司 , 北大方正信息产业集团有限公司 , 北京北大方正电子有限公司
IPC分类号: G06F40/166 , G06F40/289
摘要: 本公开提供的论文标识、标识模型训练方法、装置、设备及存储介质,包括获取待识别论文;根据预设识别模型确定所述待识别论文对应的段落标识;其中,所述预设识别模型是预先根据论文训练集训练得到的。本公开提供的方案通过利用设置有段落预设标识的论文训练集训练模型,能够得到用于表示论文的模型,从而能够基于预设识别模型识别出论文中各个段落对应的标识,解决现有技术中需要依赖于人工对论文的格式进行编辑的问题。
-
公开(公告)号:CN111325001B
公开(公告)日:2022-06-17
申请号:CN201811528227.8
申请日:2018-12-13
申请人: 北大方正集团有限公司 , 北大方正信息产业集团有限公司 , 北京北大方正电子有限公司
IPC分类号: G06F40/166 , G06F40/289
摘要: 本公开提供的论文标识、标识模型训练方法、装置、设备及存储介质,包括获取待识别论文;根据预设识别模型确定所述待识别论文对应的段落标识;其中,所述预设识别模型是预先根据论文训练集训练得到的。本公开提供的方案通过利用设置有段落预设标识的论文训练集训练模型,能够得到用于表示论文的模型,从而能够基于预设识别模型识别出论文中各个段落对应的标识,解决现有技术中需要依赖于人工对论文的格式进行编辑的问题。
-
公开(公告)号:CN111401005A
公开(公告)日:2020-07-10
申请号:CN201811625152.5
申请日:2018-12-28
申请人: 北大方正集团有限公司 , 北京北大方正电子有限公司
IPC分类号: G06F40/14 , G06F40/154
摘要: 本发明提供了一种文本转换方法、装置及可读存储介质,通过获取待转换的参考文献文本;利用预设的多个类型的正则表达式组,依次对所述参考文献文本进行处理,以提取参考文献中的与每个类型的正则表达式组相应的元素信息;根据标签文件对获得的所述元素信息进行标签标注,并将标注后的元素信息输入至结构样本模板,生成参考文献的XML文件,从而实现了对参考文献的XML文件的自动生成,提高了XML文件的生成效率。
-
公开(公告)号:CN111401005B
公开(公告)日:2022-06-14
申请号:CN201811625152.5
申请日:2018-12-28
申请人: 北大方正集团有限公司 , 北京北大方正电子有限公司
IPC分类号: G06F40/14 , G06F40/154
摘要: 本发明提供了一种文本转换方法、装置及可读存储介质,通过获取待转换的参考文献文本;利用预设的多个类型的正则表达式组,依次对所述参考文献文本进行处理,以提取参考文献中的与每个类型的正则表达式组相应的元素信息;根据标签文件对获得的所述元素信息进行标签标注,并将标注后的元素信息输入至结构样本模板,生成参考文献的XML文件,从而实现了对参考文献的XML文件的自动生成,提高了XML文件的生成效率。
-
公开(公告)号:CN111199143A
公开(公告)日:2020-05-26
申请号:CN201811282802.0
申请日:2018-10-31
申请人: 北大方正集团有限公司 , 北京北大方正电子有限公司
IPC分类号: G06F40/154
摘要: 本发明提供一种Word论文的标引方法、装置、设备及存储介质,通过获取标引流程管理文件,标引流程管理文件包括标引流程树;然后遍历标引流程树的每一节点,并执行该节点上配置的标引规则文件的算法,查找Word论文中需要标引的元素,并根据元素对Word论文进行标引。本发明的方法通过在标引流程树的节点上配置标引规则文件,可以方便快捷的编写标引规则,提高标引规则编写的效率,进而可根据标引流程树实现Word论文的自动标引,提高Word论文的标引效率。
-
-
-
-