用户评价提取方法及其装置
    1.
    发明公开

    公开(公告)号:CN118503414A

    公开(公告)日:2024-08-16

    申请号:CN202310158770.8

    申请日:2023-02-15

    发明人: 卓孔圣

    摘要: 本申请公开了一种用户评价提取方法及其装置,该方法包括获取原始文本;对原始文本进行清洗处理,得到目标文本;对目标文本进行词性标注处理,得到分词结果以及每个词对应的词性;基于分词结果以及每个词对应的词性,从目标文本中提取用户评价候选集;将用户评价候选集输入至第一分类模型中,得到汽车领域的目标用户评价,第一分类模型基于多个用户评价与每个用户评价对应的是否属于汽车领域的标注训练得到。这样,有效提高了用户评价提取准确度。

    基于深度学习的大规模预训练语言模型的法律服务系统

    公开(公告)号:CN118445381A

    公开(公告)日:2024-08-06

    申请号:CN202310837861.4

    申请日:2023-07-10

    摘要: 本发明属于训练语言模型技术领域,尤其是涉及基于深度学习的大规模预训练语言模型的法律服务系统,包括以下步骤:S1、收集法律咨询相关的文本数据:通过机构和网站收集到基本的、多样化的网络公开的法律相关数据;S2、数据预处理:使用自然语言处理工具对数据进行清洗和处理。优点在于:本发明具有更快的响应速度:在训练和推理过程中具有更快的速度,比传统的深度学习模型更高效。快速响应用户请求,满足实时需求,并适应外部环境快速变化的情况。更好的通用性:不仅适用于经济领域,还可应用于各类问题的解答,涵盖民事问题、诉讼问题、劳资问题、投融资问题等,广泛适用性使不同领域和背景的用户能够获得专业的法律咨询和指导。

    一种基于集约化平台的信息纠错或纠偏管理系统

    公开(公告)号:CN118378617A

    公开(公告)日:2024-07-23

    申请号:CN202410666030.X

    申请日:2024-05-27

    摘要: 本发明公开一种基于集约化平台的信息纠错或纠偏管理系统,涉及信息管理领域,包括管理中心,所述管理中心通信连接有信息采集模块、信息分词模块以及信息纠错模块;通过信息采集模块对集约化平台内的文本信息进行采集,通过信息分词模块对所采集的文本信息进行分词处理获得匹配成功文本信息片段以及匹配失败文本信息片段,信息纠错模块根据分词处理的结果获得匹配失败文本信息片段中非正常匹配失败的文本信息子片段,根据非正常匹配失败文本信息子片段相邻的词语的词性以及词语的出现频率,对非正常匹配失败文本信息子片段进行改正,提高了纠错的准确性以及高效性。

    基于层级式法律知识与双图联合表示学习的罪名预测方法

    公开(公告)号:CN115048510B

    公开(公告)日:2024-07-23

    申请号:CN202210147755.9

    申请日:2022-02-17

    申请人: 东南大学

    摘要: 本发明涉及一种基于层级式法律知识与双图联合表示学习的罪名预测方法,主要用于依据案件事实描述对被告自动进行罪名预测,尤其是易混淆罪名的预测,辅助法官判案。本发明首先利用爬虫技术从中国裁判文书网上爬取大量法律文书,并对裁判文书进行初步处理,提取出每份文书的事实描述部分以及对应的判决罪名,构建结构图和语义图,并使用联合图交互得到事实描述的语义表示向量。然后利用爬虫技术爬取所有罪名的构成要件,作为专业法律知识用以区分罪名,并使用双图联合表示学习得到每个罪名知识的语义表示向量。然后利用注意力机制,得到知识感知的事实描述语义向量,最后将其与原事实向量相结合,输入到softmax层得到该事实描述对应的罪名预测结果。

    工程做法的智能解析方法、装置、设备和可读存储介质

    公开(公告)号:CN116306573B

    公开(公告)日:2024-07-09

    申请号:CN202310252534.2

    申请日:2023-03-15

    摘要: 本发明公开了一种工程做法的智能解析方法、装置、设备和可读存储介质,该方法包括:获取原始工程做法文本,确定原始工程做法文本包含的分隔符,通过分隔符将原始工程做法文本划分为多个单行做法文本;将单行做法文本输入至训练完成的文本分类模型中进行识别,获得每个单行做法文本对应的做法类型;提取做法类型为构造做法的单行做法文本,利用预设词库对提取的单行做法文本进行词性匹配,得到该单行做法文本对应的目标特征词,其中,预设词库包含多个特征词组合,目标特征词是特征词组合中的一个或多个;依据做法类型和目标特征词对原始工程做法文本进行格式转换,生成结构化的工程做法文本。

    生成测试题库方法及装置、电子设备、可读存储介质

    公开(公告)号:CN118297051A

    公开(公告)日:2024-07-05

    申请号:CN202410236715.0

    申请日:2024-03-01

    摘要: 本公开提供了一种生成测试题库方法及装置、电子设备、可读存储介质,属于人工智能技术领域,该方法包括:遍历原料库和第一语料库;在遍历原料库和第一语料库的过程中,将原料库中的词语填充至第一语料库的第一询问语句的填充位置,得到多个第一测试题;遍历原料库、第一语料库和第二语料库;在遍历原料库、第一语料库和第二语料库的过程中,将原料库中的词语填充至第二语料库的诱导语句的第二填充位置,得到多个诱导题目,将诱导题目与第二询问语句或第一测试题组合,得到多个第二测试题;第一测试题和第二测试题组成测试题库。本公开提供的生成测试题库方法及装置、电子设备、可读存储介质生成的测试题库覆盖面广且易维护。

    文档任务解析方法、装置、电子设备及存储介质

    公开(公告)号:CN118246436A

    公开(公告)日:2024-06-25

    申请号:CN202410447758.3

    申请日:2024-04-15

    发明人: 林小佳 林长春

    摘要: 本发明公开一种文档任务解析方法、装置、电子设备及存储介质,涉及文档解析技术领域。该方法包括通过对待解析任务文档进行词性标注、依存关系解析和实体识别,提取待解析任务文档的关键信息;将待解析任务文档的关键信息转换为JSON格式的结构化数据;将结构化数据转换为语义向量;将语义向量输入预先训练的任务分析模型,得到待解析任务文档所对应的任务列表,任务列表中包括至少一个任务,每个任务中包括至少一个子任务;任务分析模型是以样本任务文档的关键信息所对应的语义向量作为模型的输入,样本任务文档所对应的任务列表为输出进行训练得到的。本发明公开的方法、装置、电子设备及存储介质可从待解析任务文档中文档需求的任务列表。

    一种伤害类犯罪讯问笔录中的知识抽取方法及系统

    公开(公告)号:CN118228818A

    公开(公告)日:2024-06-21

    申请号:CN202410642135.1

    申请日:2024-05-23

    摘要: 本发明提出了一种伤害类犯罪讯问笔录中的知识抽取方法及系统,涉及自然语言处理、知识工程技术领域,针对执法监督与办案过程中,对于不规范笔录信息的处理仍需耗费大量人力、物力和时间的问题。本发明首先提取原始笔录数据中与知识本体相关的讯问问题对应的答话内容,得到的答话均为与案由相关的内容,减少了后续案件审核的信息量;再经过指代分析、句子拆分、句子去噪、句子补全、三元组提取,实现实体‑实体关系‑实体的三元组自动抽取;该方法覆盖完整笔录处理流程,各分步结果清晰明确,经过上述处理,形成了针对案由的三元组知识,可以支持机器处理语言表达不十分规范的电子笔录,大幅度提升执法监督的效能与客观性。