-
公开(公告)号:CN113158674A
公开(公告)日:2021-07-23
申请号:CN202110353610.X
申请日:2021-04-01
Applicant: 华南理工大学
IPC: G06F40/295 , G06N3/04
Abstract: 本发明公开了一种人工智能领域文档关键信息抽取方法,包括以下步骤:S1、收集人工智能领域文档数据,进行关键信息抽取数据标注;S2、对预训练模型RoBERTa进行进一步预训练;S3、构建信息抽取模型;S4、利用进一步预训练得到的RoBERTa模型进行骨干网络参数初始化;S5、利用已标注数据进行训练,训练过程中对标注数据进行随机替换和数据增强并利用平方交叉熵损失来计算反向传播的误差;S6、利用训练得到的信息抽取模型在人工智能领域无结构化文本中进行信息抽取得到结果三元组。本发明方法将信息抽取作为一种机器阅读理解任务来求解,预测文本中各个关键信息的起点和终点位置,解决了序列标注模型应对长跨度知识文本时性能效果大幅度下降的问题。
-
公开(公告)号:CN110008196A
公开(公告)日:2019-07-12
申请号:CN201910310507.X
申请日:2019-04-17
Applicant: 华南理工大学
IPC: G06F16/178 , G06F16/25 , G08G1/01
Abstract: 本发明公开了一种海量交通点数据的清理转换方法和装置、设备和介质,所述方法包括步骤:原始数据读取:读取要进行整理的海量交通点数据库或文件夹;数据清洗:去除所述海量交通点数据中指定日期以外的数据,去除仅出现一次的交通点数据,仅保留同一时间同一经纬度最早和最晚的交通点数据;数据匹配:对清洗后的所述海量交通点数据进行匹配,对同一交通点的初始位置时间与结束位置时间进行匹配,同一交通点的初始经纬度与结束经纬度进行匹配;导出数据文本。本发明可将海量的交通点有效转为高质量的数据,并可实现交通点到交通路径的点线转换,监测交通点运动轨迹,可用于快速判断预测交通流变化和增强对交通点调度的灵活性,更好地服务用户。
-
公开(公告)号:CN113158674B
公开(公告)日:2023-07-25
申请号:CN202110353610.X
申请日:2021-04-01
Applicant: 华南理工大学
IPC: G06F40/279 , G06N3/0455 , G06N3/048 , G06N3/084 , G06N3/0895
Abstract: 本发明公开了一种人工智能领域文档关键信息抽取方法,包括以下步骤:S1、收集人工智能领域文档数据,进行关键信息抽取数据标注;S2、对预训练模型RoBERTa进行进一步预训练;S3、构建信息抽取模型;S4、利用进一步预训练得到的RoBERTa模型进行骨干网络参数初始化;S5、利用已标注数据进行训练,训练过程中对标注数据进行随机替换和数据增强并利用平方交叉熵损失来计算反向传播的误差;S6、利用训练得到的信息抽取模型在人工智能领域无结构化文本中进行信息抽取得到结果三元组。本发明方法将信息抽取作为一种机器阅读理解任务来求解,预测文本中各个关键信息的起点和终点位置,解决了序列标注模型应对长跨度知识文本时性能效果大幅度下降的问题。
-
公开(公告)号:CN113157885B
公开(公告)日:2023-07-18
申请号:CN202110392744.2
申请日:2021-04-13
Applicant: 华南理工大学
IPC: G06F16/332 , G06F16/35 , G06F40/35 , G06F40/30 , G06F40/247
Abstract: 本发明涉及一种面向人工智能领域知识的高效智能问答系统,包括准备模块和问答模块;其中,准备模块包括数据收集模块、模型训练模块和问答系统知识结构构建模块;问答模块包括输入预处理模块、基于知识库的问答模块、基于文本库的问答模块和基于知识库的问题推荐模块。本发明通过准备模块与问答模块,使得对于用户问题以及知识库问题、文本库问题的分词准确性大大增强,进而大幅度提升全问答系统整体的准确性,从而大幅度改善用户体验,实现低成本高效率高用户体验的知识问答服务。
-
公开(公告)号:CN113157885A
公开(公告)日:2021-07-23
申请号:CN202110392744.2
申请日:2021-04-13
Applicant: 华南理工大学
IPC: G06F16/332 , G06F16/35 , G06F40/35 , G06F40/30 , G06F40/247
Abstract: 本发明涉及一种面向人工智能领域知识的高效智能问答系统,包括准备模块和问答模块;其中,准备模块包括数据收集模块、模型训练模块和问答系统知识结构构建模块;问答模块包括输入预处理模块、基于知识库的问答模块、基于文本库的问答模块和基于知识库的问题推荐模块。本发明通过准备模块与问答模块,使得对于用户问题以及知识库问题、文本库问题的分词准确性大大增强,进而大幅度提升全问答系统整体的准确性,从而大幅度改善用户体验,实现低成本高效率高用户体验的知识问答服务。
-
-
-
-