-
公开(公告)号:CN113268995A
公开(公告)日:2021-08-17
申请号:CN202110814460.8
申请日:2021-07-19
Applicant: 北京邮电大学
Abstract: 本发明提供一种中文学术关键词抽取方法、装置和存储介质,该方法包括以下步骤:从学术文本数据集中获得学术预料,输入至包含外部语义信息的预训练模型,生成输入的学术语料的动态字向量;基于所述动态字向量获得动态字向量输入序列输入至BiLSTM‑CRF序列标注模型,得到输入序列对应的标签序列的得分,基于得分获得最优标签序列,并基于得到的最优标签序列结果得到候选关键词集;基于候选关键词集中候选关键词的标题相似度和词频逆向文档频率TFIDF特征对候选关键词进行排序,基于排序结果获取目标关键词。
-
公开(公告)号:CN114924954A
公开(公告)日:2022-08-19
申请号:CN202210503044.0
申请日:2022-05-09
Applicant: 北京邮电大学
IPC: G06F11/36
Abstract: 本发明公开了一种基于Jenkins的自动化测试平台,包括视图层、控制层、服务层、数据层和工具层,其特征在于:所述视图层为用户界面,控制层为数据校验和权限校验,服务层包括测试用例管理、计划集管理、任务集管理、测试结果管理、定时任务管理和自动遍历管理,数据层包括Mysql和Neo4j,工具层包括单元测试工具、接口测试工具和移动端界面测试工具。本发明与现有技术相比的优点在于:经实践证明,对于测试行业流行的绝大多数测试工具,均可无缝集成到本系统,而对于特异测试工具,也可通过简单改造以极少成本集成到测试平台。自动化测试平台的出现即为在软件测试技术发展大背景下的产物,以主流测试技术为基础,并紧跟测试技术趋势。
-
公开(公告)号:CN114841173A
公开(公告)日:2022-08-02
申请号:CN202210778073.8
申请日:2022-07-04
Applicant: 北京邮电大学
IPC: G06F40/30 , G06F40/211 , G06K9/62
Abstract: 本发明提供一种基于预训练模型的学术文本语义特征提取方法、系统和存储介质,所述方法包括:获取学术资源文本数据;将获得的学术资源文本数据输入至预训练模型,得到多维的学术文本语义特征向量;所述预训练模型是基于多重负样例损失函数对Bert预训练模型进行微调、将微调后的Bert预训练模型作为教师模型通过知识蒸馏来训练学生模型得到的学生预训练模型;将所述多维的学术文本语义特征向量进行降维压缩,输出最终的学术文本语义特征。本发明在提高向量生成质量的同时加快了向量生成的速度,适用于学术大数据场景下的文本向量生成。
-
公开(公告)号:CN114841173B
公开(公告)日:2022-11-18
申请号:CN202210778073.8
申请日:2022-07-04
Applicant: 北京邮电大学
IPC: G06F40/30 , G06F40/211 , G06K9/62
Abstract: 本发明提供一种基于预训练模型的学术文本语义特征提取方法、系统和存储介质,所述方法包括:获取学术资源文本数据;将获得的学术资源文本数据输入至预训练模型,得到多维的学术文本语义特征向量;所述预训练模型是基于多重负样例损失函数对Bert预训练模型进行微调、将微调后的Bert预训练模型作为教师模型通过知识蒸馏来训练学生模型得到的学生预训练模型;将所述多维的学术文本语义特征向量进行降维压缩,输出最终的学术文本语义特征。本发明在提高向量生成质量的同时加快了向量生成的速度,适用于学术大数据场景下的文本向量生成。
-
公开(公告)号:CN113268995B
公开(公告)日:2021-11-19
申请号:CN202110814460.8
申请日:2021-07-19
Applicant: 北京邮电大学
Abstract: 本发明提供一种中文学术关键词抽取方法、装置和存储介质,该方法包括以下步骤:从学术文本数据集中获得学术预料,输入至包含外部语义信息的预训练模型,生成输入的学术语料的动态字向量;基于所述动态字向量获得动态字向量输入序列输入至BiLSTM‑CRF序列标注模型,得到输入序列对应的标签序列的得分,基于得分获得最优标签序列,并基于得到的最优标签序列结果得到候选关键词集;基于候选关键词集中候选关键词的标题相似度和词频逆向文档频率TFIDF特征对候选关键词进行排序,基于排序结果获取目标关键词。
-
-
-
-