基于大小模型协作的检索用查新点生成方法、系统及设备

    公开(公告)号:CN118964542A

    公开(公告)日:2024-11-15

    申请号:CN202410892234.5

    申请日:2024-07-04

    摘要: 本发明公开了一种基于大小模型协作的检索用查新点生成方法、系统及设备,首先输入用于抽取关键词的技术背景文本及需求提示,所述需求提示包括需要抽取的查新中心词的类别或特征;然后依据需求提示利用大模型从技术背景文本中抽取查新中心词;过滤查新中心词,利用小模型对保留的中心词生成查新点文本;接着采用评估分类器对生成查新点文本进行分类评估;对不符合要求的查新点文本由大模型根据提示信息进行改写;最后生成符合要求的查新点文本。本发明实现了人机交互下可控查新点文本自动生成,并在生成过程中采用大模型和小模型协同的方式,在减少查新人工成本、提升生成查新点质量及完整性的同时,克服了使用大模型可能会带来的幻觉错误等问题。

    文献原创性评估方法、装置、设备及存储介质

    公开(公告)号:CN118862862A

    公开(公告)日:2024-10-29

    申请号:CN202410881678.9

    申请日:2024-07-03

    申请人: 武汉大学

    摘要: 公开了一种文献原创性评估方法、装置、设备及存储介质,属于计算机技术领域,该方法包括:基于第一数据集,训练第一大语言模型,第一数据集包括多篇文献以及每篇文献的外部参数,第一大语言模型用于基于第一文献以及第一文献的外部参数,生成第一文献的第一原创性评分;基于第二数据集和多篇文献中的每篇文献的原创性评分,训练第二大语言模型,第二大语言模型用于基于第一文献的公开评审意见、第一文献被引用时的上下文以及第一原创性评分,生成第一文献的第一原创性评审意见和修正后的第一原创性评分。该方法能够准确、高效地实现文献原创性评估。

    细粒度标注的文档版式分析数据集的自动生成方法及系统

    公开(公告)号:CN117634447A

    公开(公告)日:2024-03-01

    申请号:CN202311572963.4

    申请日:2023-11-22

    申请人: 武汉大学

    IPC分类号: G06F40/186 G06F40/169

    摘要: 本发明公开了一种细粒度标注的文档版式分析数据集的自动生成方法及系统,由仿真论文生成和细粒度标注信息生成两个阶段组成。第一阶段包括基于上下文无关语法构建一种可以生成论文框架latex文件的系统;从真实论文数据中抽取作者、图像、表格和公式插入到latex文件中;选取若干期刊的cls文件加入源码,使系统可以生成版式丰富且包含真实论文中提取的元数据的仿真论文。第二阶段在Latex文件中对各个文档组成结构添加不同颜色的标注并使用计算机视觉算法获得其坐标,即获得了细粒度标注的文档版式分析数据集。本发明的优点为:针对文档版式分析任务,将数据标注转为标注数据的生成,大量节省了数据标注的人力物力,且生成的仿真论文与真实论文有高度一致性。