-
公开(公告)号:CN118503414A
公开(公告)日:2024-08-16
申请号:CN202310158770.8
申请日:2023-02-15
申请人: 北京罗克维尔斯科技有限公司
发明人: 卓孔圣
IPC分类号: G06F16/35 , G06F40/268 , G06F40/289
摘要: 本申请公开了一种用户评价提取方法及其装置,该方法包括获取原始文本;对原始文本进行清洗处理,得到目标文本;对目标文本进行词性标注处理,得到分词结果以及每个词对应的词性;基于分词结果以及每个词对应的词性,从目标文本中提取用户评价候选集;将用户评价候选集输入至第一分类模型中,得到汽车领域的目标用户评价,第一分类模型基于多个用户评价与每个用户评价对应的是否属于汽车领域的标注训练得到。这样,有效提高了用户评价提取准确度。
-
公开(公告)号:CN118445381A
公开(公告)日:2024-08-06
申请号:CN202310837861.4
申请日:2023-07-10
申请人: 上海大法数信息科技有限公司
IPC分类号: G06F16/332 , G06F16/33 , G06F40/30 , G06F40/289 , G06F40/268 , G06N20/00 , G06Q50/18
摘要: 本发明属于训练语言模型技术领域,尤其是涉及基于深度学习的大规模预训练语言模型的法律服务系统,包括以下步骤:S1、收集法律咨询相关的文本数据:通过机构和网站收集到基本的、多样化的网络公开的法律相关数据;S2、数据预处理:使用自然语言处理工具对数据进行清洗和处理。优点在于:本发明具有更快的响应速度:在训练和推理过程中具有更快的速度,比传统的深度学习模型更高效。快速响应用户请求,满足实时需求,并适应外部环境快速变化的情况。更好的通用性:不仅适用于经济领域,还可应用于各类问题的解答,涵盖民事问题、诉讼问题、劳资问题、投融资问题等,广泛适用性使不同领域和背景的用户能够获得专业的法律咨询和指导。
-
公开(公告)号:CN118378617A
公开(公告)日:2024-07-23
申请号:CN202410666030.X
申请日:2024-05-27
申请人: 内蒙古汇联科技有限公司
IPC分类号: G06F40/232 , G06F40/284 , G06F40/268 , G06F40/216
摘要: 本发明公开一种基于集约化平台的信息纠错或纠偏管理系统,涉及信息管理领域,包括管理中心,所述管理中心通信连接有信息采集模块、信息分词模块以及信息纠错模块;通过信息采集模块对集约化平台内的文本信息进行采集,通过信息分词模块对所采集的文本信息进行分词处理获得匹配成功文本信息片段以及匹配失败文本信息片段,信息纠错模块根据分词处理的结果获得匹配失败文本信息片段中非正常匹配失败的文本信息子片段,根据非正常匹配失败文本信息子片段相邻的词语的词性以及词语的出现频率,对非正常匹配失败文本信息子片段进行改正,提高了纠错的准确性以及高效性。
-
公开(公告)号:CN115048510B
公开(公告)日:2024-07-23
申请号:CN202210147755.9
申请日:2022-02-17
申请人: 东南大学
IPC分类号: G06F16/35 , G06F16/36 , G06F16/31 , G06F40/30 , G06F40/211 , G06F40/268 , G06F40/289 , G06N5/022 , G06N5/02 , G06Q10/04 , G06Q50/18
摘要: 本发明涉及一种基于层级式法律知识与双图联合表示学习的罪名预测方法,主要用于依据案件事实描述对被告自动进行罪名预测,尤其是易混淆罪名的预测,辅助法官判案。本发明首先利用爬虫技术从中国裁判文书网上爬取大量法律文书,并对裁判文书进行初步处理,提取出每份文书的事实描述部分以及对应的判决罪名,构建结构图和语义图,并使用联合图交互得到事实描述的语义表示向量。然后利用爬虫技术爬取所有罪名的构成要件,作为专业法律知识用以区分罪名,并使用双图联合表示学习得到每个罪名知识的语义表示向量。然后利用注意力机制,得到知识感知的事实描述语义向量,最后将其与原事实向量相结合,输入到softmax层得到该事实描述对应的罪名预测结果。
-
公开(公告)号:CN116306573B
公开(公告)日:2024-07-09
申请号:CN202310252534.2
申请日:2023-03-15
申请人: 广联达科技股份有限公司
IPC分类号: G06F40/205 , G06F40/268 , G06F40/237 , G06F16/35 , G06F16/11 , G06N3/0464
摘要: 本发明公开了一种工程做法的智能解析方法、装置、设备和可读存储介质,该方法包括:获取原始工程做法文本,确定原始工程做法文本包含的分隔符,通过分隔符将原始工程做法文本划分为多个单行做法文本;将单行做法文本输入至训练完成的文本分类模型中进行识别,获得每个单行做法文本对应的做法类型;提取做法类型为构造做法的单行做法文本,利用预设词库对提取的单行做法文本进行词性匹配,得到该单行做法文本对应的目标特征词,其中,预设词库包含多个特征词组合,目标特征词是特征词组合中的一个或多个;依据做法类型和目标特征词对原始工程做法文本进行格式转换,生成结构化的工程做法文本。
-
公开(公告)号:CN118297051A
公开(公告)日:2024-07-05
申请号:CN202410236715.0
申请日:2024-03-01
申请人: 北京深安未来科技有限公司 , 广东省信息安全测评中心
IPC分类号: G06F40/237 , G06F16/35 , G06F40/268 , G06F40/289
摘要: 本公开提供了一种生成测试题库方法及装置、电子设备、可读存储介质,属于人工智能技术领域,该方法包括:遍历原料库和第一语料库;在遍历原料库和第一语料库的过程中,将原料库中的词语填充至第一语料库的第一询问语句的填充位置,得到多个第一测试题;遍历原料库、第一语料库和第二语料库;在遍历原料库、第一语料库和第二语料库的过程中,将原料库中的词语填充至第二语料库的诱导语句的第二填充位置,得到多个诱导题目,将诱导题目与第二询问语句或第一测试题组合,得到多个第二测试题;第一测试题和第二测试题组成测试题库。本公开提供的生成测试题库方法及装置、电子设备、可读存储介质生成的测试题库覆盖面广且易维护。
-
公开(公告)号:CN118246447A
公开(公告)日:2024-06-25
申请号:CN202311657690.3
申请日:2023-12-05
申请人: 国家能源集团宁夏煤业有限责任公司
IPC分类号: G06F40/289 , G06F40/268 , G06F16/35 , G06N3/045 , G06N20/00
摘要: 本申请提供了一种电网故障的处理方法、处理装置和电子设备。包括:获取电网故障信息,对电网故障信息进行分词处理,得到故障分词信息;通过语言模型对故障分词信息进行分析,得到故障等级,并根据故障等级确定对应的故障处理方案,其中,语言模型是利用多组数据通过机器学习训练得到的,多组数据中的每组数据均包括:历史故障分词信息和历史故障等级;获取电网中多个电力设备的实际输出功率与多个电力设备的标准输出功率,计算每个电力设备的实际输出功率与对应的标准输出功率的均方根误差,将均方根误差大于预设阈值的电力设备确定为故障设备,并按照故障处理方案对故障设备进行处理。通过本申请,解决了人工进行电网故障处理效率低的问题。
-
公开(公告)号:CN118246436A
公开(公告)日:2024-06-25
申请号:CN202410447758.3
申请日:2024-04-15
申请人: 广州企元大数据科技有限公司
IPC分类号: G06F40/211 , G06F40/268 , G06F40/279 , G06F40/284 , G06F40/30 , G06N3/0455
摘要: 本发明公开一种文档任务解析方法、装置、电子设备及存储介质,涉及文档解析技术领域。该方法包括通过对待解析任务文档进行词性标注、依存关系解析和实体识别,提取待解析任务文档的关键信息;将待解析任务文档的关键信息转换为JSON格式的结构化数据;将结构化数据转换为语义向量;将语义向量输入预先训练的任务分析模型,得到待解析任务文档所对应的任务列表,任务列表中包括至少一个任务,每个任务中包括至少一个子任务;任务分析模型是以样本任务文档的关键信息所对应的语义向量作为模型的输入,样本任务文档所对应的任务列表为输出进行训练得到的。本发明公开的方法、装置、电子设备及存储介质可从待解析任务文档中文档需求的任务列表。
-
公开(公告)号:CN118228818A
公开(公告)日:2024-06-21
申请号:CN202410642135.1
申请日:2024-05-23
申请人: 天津财经大学
IPC分类号: G06N5/025 , G06N5/02 , G06N3/0442 , G06N3/0455 , G06N3/047 , G06F40/211 , G06F40/253 , G06F40/268
摘要: 本发明提出了一种伤害类犯罪讯问笔录中的知识抽取方法及系统,涉及自然语言处理、知识工程技术领域,针对执法监督与办案过程中,对于不规范笔录信息的处理仍需耗费大量人力、物力和时间的问题。本发明首先提取原始笔录数据中与知识本体相关的讯问问题对应的答话内容,得到的答话均为与案由相关的内容,减少了后续案件审核的信息量;再经过指代分析、句子拆分、句子去噪、句子补全、三元组提取,实现实体‑实体关系‑实体的三元组自动抽取;该方法覆盖完整笔录处理流程,各分步结果清晰明确,经过上述处理,形成了针对案由的三元组知识,可以支持机器处理语言表达不十分规范的电子笔录,大幅度提升执法监督的效能与客观性。
-
公开(公告)号:CN118211648A
公开(公告)日:2024-06-18
申请号:CN202410384833.6
申请日:2024-04-01
申请人: 浪潮卓数大数据产业发展有限公司
IPC分类号: G06N5/022 , G06N3/0455 , G06N3/088 , G06N3/082 , G06N3/0495 , G06F40/284 , G06F40/268 , G06F40/211 , G06V10/70 , G10L15/26 , G06F16/951 , G06F18/10 , G06F18/24
摘要: 本发明公开基于大数据的智能问答实现方法及系统,涉及大数据和人工智能领域;包括:步骤1:从各种数据源中采集文本、图像、音频和视频数据,步骤2:对采集的文本、图像、音频和视频数据进行预处理,步骤3:利用预处理后的数据训练问答模型,步骤4:接收用户的输入数据,将输入数据转化为问答模型可理解的格式,步骤5:根据用户的输入数据,利用问答模型进行分析,获得学习结果,根据学习结果生成相应的答案,步骤6:根据用户的反馈对问答模型进行优化和调整,提高问答模型的准确性和智能性。
-
-
-
-
-
-
-
-
-