基于数字建模的跨语言信息处理方法

    公开(公告)号:CN119398060A

    公开(公告)日:2025-02-07

    申请号:CN202411407387.2

    申请日:2024-10-10

    Abstract: 本申请提供了基于数字建模的跨语言信息处理方法,涉及数据处理技术领域,包括:基于数字人文数据库,采集具有字数标签的古文训练语料集;对RoBERTa模型进行预训练,生成语言信息处理预训练模型;为满足跨语言需求,包括将文字理解转化为图像或视频,构建跨语言训练数据集;最后,通过微调该预训练模型,获得跨语言信息处理模型,实现跨语言需求处理。通过本申请可以解决现有技术由于在处理古文时表现不佳,难以结合整段话或长句的具体语境进行图像和视频的生成,导致在执行跨语言任务效率较低,进一步影响了模型在处理多样化语言和任务时的通用性和适应性,实现了对古文和跨语言任务的高效处理,显著提升了模型对古文的理解和处理效率。

    基于条件随机场的食品安全事件实体抽取方法

    公开(公告)号:CN108776656A

    公开(公告)日:2018-11-09

    申请号:CN201810569813.0

    申请日:2018-06-05

    Abstract: 本发明公开了一种多特征知识下的食品安全事件实体抽取方法,包括以下步骤:食品安全事件的实体界定;食品安全事件实体内部和外部特征统计;机器学习模型建立;语料的选择和语料的处理;特征的选取以及特征模板的制定;本发明的优点在于:对于构建食品安全事件知识库和挖掘食品安全应对策略起到了充当基础资源的作用。能够自动将食品名称与导致食品安全事件发生的具体因素抽出来。在构建抽取模型的过程中,不仅在条件随机场模型当中融入了大量的特征知识而且所构建的模型是在海量的经过标注的食品安全事件语料上进行的。

    一种基于深度学习模型的自动识别古籍引书系统和方法

    公开(公告)号:CN114021567A

    公开(公告)日:2022-02-08

    申请号:CN202111292294.6

    申请日:2021-11-03

    Abstract: 本发明公开了一种基于深度学习模型的自动识别古籍引书系统和方法,包括:语料预处理模块;语言模型预训练模块;引书条目识别试验模块;引书条目识别效果测评模块。步骤为:S1、选取目标研究语料,人工对其进行处理与校对,确定模型类别;S2、编写相关模型代码,根据语料、研究目的修改调整模型参数,对模型进行迭代训练;S3、选取模型评价方法,并根据结果对其进行打分,选取最优模型进行保存;S4、将最优模型选用为日后用户直接进行此任务的工具,实现古籍引书的自动识别。本发明的优点是:避免大量人工劳动,可直接借助计算机技术自动实现古籍引书的识别与抽取,有效地解决大规模古籍文本引书语料难于构建的问题。

    一种古文异文自动识别系统和方法

    公开(公告)号:CN114004216A

    公开(公告)日:2022-02-01

    申请号:CN202111292308.4

    申请日:2021-11-03

    Abstract: 本发明公开了一种古文异文自动识别系统和方法,包括:古文异文数据集构建模块;古文异文特征转换模块;古文异文模型训练模块;古文异文模型效果评估模块。步骤为:S1、选取合适的语料作为训练集,并人工校对并对其处理;S2、编写模型训练程序,调整模型参数,对训练集进行迭代训练;S3、对实验结果进行评估,并将最优的模型进行保存;S4、搭建模型调用接口,从而方便用户进行直接使用,实现对古文异文的识别。本发明的优点是:通过计算机实现异文的自动发掘,可以从更大规模的语料中获取有效信息,极大的降低了人力物力,减小工作量。

    基于人工智能的古籍信息智能处理方法及装置

    公开(公告)号:CN119669478A

    公开(公告)日:2025-03-21

    申请号:CN202411394210.3

    申请日:2024-10-08

    Abstract: 本发明涉及数字数据处理相关技术领域,具体包括基于人工智能的古籍信息智能处理方法及装置,包括:扫描古籍,构建知识图谱并划分领域数据库,训练垂直处理模型;引入多形式历史载体,形成多模态感知集合,建立多元信息网络,嵌入处理模型;建立对话框,实现多轮交互,结合阈限优化输出,解决古籍信息处理中面临的数字化、碎片化的限制,且由于古籍文献的多样性和复杂性,从而导致的古籍信息无法有效整合与利用技术问题,实现构建知识图谱并划分领域数据库,形成具有层次结构和逻辑关联的知识体系,通过训练垂直处理模型,针对古籍领域的特定需求进行深度学习与优化,并建立对话框,与用户的多轮交互反馈,辅助用户快速深入探索古籍技术效果。

Patent Agency Ranking