编目方法、装置、终端设备及存储介质

    公开(公告)号:CN118428319A

    公开(公告)日:2024-08-02

    申请号:CN202410397539.9

    申请日:2024-04-02

    摘要: 本申请适用于数据处理技术领域,提供了一种编目方法、装置、终端设备及存储介质,所述方法包括:获取待编目数据;将待编目数据输入至已训练的编目模型进行处理,得到待编目数据对应的已编目的目标数据;其中,编目模型包括多个编目子模型,每个编目子模型均不相同,不同的编目子模型由编目标准和样本数据集对预先构建的不同机器学习模型进行优化训练得到。与现有技术相比,在存在大量待编目数据时,本方法直接将该待编目数据输入至编目模型进行处理,即可得到已编目的目标数据,从而提高了编目效率;同时,由于编目模型包括多个由编目标准和样本数据集对预先构建的不同机器学习模型进行优化训练得到的不同编目子模型,也提高了编目质量。

    智能合同审查方法、装置、电子设备及存储介质

    公开(公告)号:CN117151096A

    公开(公告)日:2023-12-01

    申请号:CN202311143401.8

    申请日:2023-09-05

    摘要: 本申请提供一种智能合同审查方法、装置、电子设备及存储介质,所述方法包括:将各主条款段落输入至第一审查模型中进行分析处理,得到各主条款段落的类别;对各第二类主条款段落进行分割处理,得到各第二类主条款段落中的至少一个子段落;将各子段落以及子段落所属的主条款段落的类别输入至第二审查模型中进行分析处理,得到各子段落的类别;将各第二类子段落以及各第二类子段落的类别输入至第三审查模型中进行分析处理,得到各第二类子段落的要素信息;根据各第二类子段落的类别、要素信息,对各第二类子段落进行审查。可以适用于多种类型的合同审查,并且通过对合同的结构化信息的抽取,提高合同审查的准确性。

    一种多章节文档在线协同编辑方法、系统、终端及服务器

    公开(公告)号:CN116738941A

    公开(公告)日:2023-09-12

    申请号:CN202310739944.X

    申请日:2023-06-20

    发明人: 侯川

    摘要: 本发明公开了一种多章节文档在线协同编辑方法、系统、终端及服务器。所述方法包括:获取文档元信息并显示,所述文档中各个章节之间互相独立;响应于用户对章节的选择,从服务端获取已选择章节的章节元信息并显示;与服务端建立文档同步会话和章节同步会话,对所述文档进行协同编辑,所述文档同步会话用于协同编辑时同步文档元信息,所述章节同步会话用于协同编辑时同步文档中的章节元信息。通过将文档划分为多章节,各章节相互独立,在文档加载时只需要加载一级章节,加载速度快、效率高,使用文档元信息和章节元信息来描述文档的结构,结构简单清晰的,使用文档同步会话和章节同步会话完成多人在线协同编辑。

    文档处理方法及装置、电子设备、计算机可读存储介质

    公开(公告)号:CN116151196A

    公开(公告)日:2023-05-23

    申请号:CN202210795404.9

    申请日:2022-07-07

    IPC分类号: G06F40/137

    摘要: 本公开提供了一种文档处理方法及装置、电子设备、计算机可读存储介质,该方法包括:根据待处理文档中每个文档元素的元素属性,确定每个文档元素对应的元素级别;根据待处理文档中每个文档元素对应的元素级别确定目标文档元素,并基于目标文档元素的位置确定至少一个游标区间,一个游标区间表征待拆分出的一个子文档在待处理文档中的位置范围;根据每个游标区间对待处理文档进行拆分处理,生成每个游标区间对应的目标子文档。根据本公开的技术方案,能够实现将大体积的文档自动化拆分为多个子文档,从而有效提高文档的知识内容的可查阅性、可维护性和可编排性。

    长文本的分段方法及装置、存储介质、电子装置

    公开(公告)号:CN113076720B

    公开(公告)日:2022-01-28

    申请号:CN202110476650.3

    申请日:2021-04-29

    发明人: 田维政 李昕城

    摘要: 本发明提供了一种长文本的分段方法及装置、存储介质、电子装置,其中,该方法包括:将源语音文档转换为文本文档;将所述文本文档转换为向量序列,其中,所述向量序列包括词向量序列和句向量序列;根据所述向量序列生成语篇树,其中,所述语篇树的每个叶子节点对应所述句向量序列的一个句向量,叶子节点的父节点对应下级至少两个叶子节点之间的连贯性关系;基于所述语篇树生成所述文本文档的段落分割点,并采用所述段落分割点对所述文本文档进行分段。通过本发明,解决了相关技术对长文本自动分段的准确率低的技术问题,实现了长文本的自动和准确分段,提高了自动识别文本的可读性。

    规格书生成方法、装置及终端设备

    公开(公告)号:CN112966488A

    公开(公告)日:2021-06-15

    申请号:CN202110372491.2

    申请日:2021-04-07

    发明人: 陈灵

    IPC分类号: G06F40/186 G06F40/137

    摘要: 本发明实施例公开了规格书生成方法、装置及终端设备,通过获取目标对象的规格参数与生成规格书时所需的文本信息;根据数据库中预设规格参数与预设规格书模板的对应关系,判断是否存在目标对象的规格参数对应的预设规格书模板;若是,将目标对象的规格参数对应的预设规格书模板,作为目标对象的规格书模板;若否,根据目标对象的规格参数得到规格书模板节点,根据规格书模板节点,创建目标对象的规格书模板,其中,规格书模板节点包括节点名、节点属性及节点层级;根据文本信息与规格书模板,生成与规格书模板关联的规格书。本申请提供的规格书生成方法,提高了规格书的可复用性与信息同步性。