-
公开(公告)号:CN112417083A
公开(公告)日:2021-02-26
申请号:CN202011258349.7
申请日:2020-11-12
Applicant: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
IPC: G06F16/31 , G06F16/36 , G06F40/295
Abstract: 本发明涉及数据处理技术领域,特别涉及一种构建部署文本实体关系提取模型的方法和存储设备。所述一种构建部署文本实体关系提取模型的方法,包括步骤:创建项目工程,创建数据存储目录;采集数据,对所述数据进行预处理;根据第四预设规范对所述预处理后的数据进行标注,抽取评估数据,并根据第五预设规范对所述评估数据进行数据评估;对标注后的数据进行切分成不同类型数据;选定训练模型,并将所述不同类型数据进行处理使得符合所述训练模型接收的数据格式;根据处理后的测试数据和处理后的评估数据对训练后的训练模型进行模型评估,若评估合格,则发布评估合格的模型。通过上述技术方案大大降低自然语言处理技术的应用门槛。
-
公开(公告)号:CN112416453A
公开(公告)日:2021-02-26
申请号:CN202011259907.1
申请日:2020-11-12
Applicant: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
Abstract: 本发明涉及计算机领域,特别涉及一种面向信创环境下国产化外部设备统一数据集成的方法和存储设备。所述一种面向信创环境下国产化外部设备统一数据集成的方法,包括步骤:构建本地中间件,所述本地中间件内封装有不同的接口;本地业务系统通过所述不同的接口与外部硬件进行适配,或本地业务系统通过所述不同的接口调用自动化程序。本地中间件作为中间桥梁,使得本地业务系统和外部硬件及本地业务系统和各种自动化程序通过本地中间件即可实现数据通讯与集成适配,满足了不同信创环境下,不同外部设备的统一数据集成的需求,无需针对不同环境不同设备进行适配集成开发,大大增加灵活性。
-
公开(公告)号:CN114220425A
公开(公告)日:2022-03-22
申请号:CN202111301900.6
申请日:2021-11-04
Applicant: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
Abstract: 本发明涉及一种基于语音识别和Rasa框架的聊天机器人系统及对话方法,所述系统包括语音服务模块及智能助手模块;所述语音服务模块包括语音识别单元及语音合成单元,所述语音识别单元用于对输入的语音信息进行识别,将输入的语音信息转化为文本信息;所述语音合成单元用于将收到的文本信息转换成语音信息;所述智能助手包括语言理解单元及对话管理单元,所述语言理解单元用于根据文本信息进行用户意图分类及实体提取;所述对话管理单元用于根据维护更新用户的对话状态和动作选择,根据语音理解单元的理解结果对用户的输入做出相应,输出回复的文本信息。使得机器人聊天对话更为流畅,提高用于的体验。
-
公开(公告)号:CN114169389A
公开(公告)日:2022-03-11
申请号:CN202111231070.4
申请日:2021-10-22
Applicant: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
IPC: G06K9/62
Abstract: 本发明涉及目标检测技术领域,特别涉及一种类别扩增的目标检测模型训练方法和存储设备。所述一种类别扩增的目标检测模型训练方法,包括步骤:获取融合数据集;在第一阶段训练中通过预设的无标签冲突损失函数对所述融合数据集进行训练得一阶段模型;通过位置置信度与分类置信度挖掘未被标注的真实框,生成伪标注;通过预设规则结合原始标注真实框与所述伪标注对所述一阶段模型进行再训练得最终模型。上述方法中,可直接对融合数据集进行模型训练,且不用改变使用的神经网络结构,大大节省成本。并且通过预设的无标签冲突损失函数,在训练过程中解决了假负样本的问题,使得得到的最终模型的性能更优。
-
公开(公告)号:CN112380342A
公开(公告)日:2021-02-19
申请号:CN202011247379.8
申请日:2020-11-10
Applicant: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
IPC: G06F16/35 , G06F40/242 , G06F40/289
Abstract: 本发明涉及一种电力文档主题提取方法及设备,包括以下步骤:S1、获取包括多个文档的数据集;S2、筛除重复数据;S3、筛选出电网相关的文档;S4、对数据集进行分类;S5、提取文档主题。
-
公开(公告)号:CN112328785A
公开(公告)日:2021-02-05
申请号:CN202011070721.1
申请日:2020-10-09
Applicant: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
Abstract: 本发明涉及数据处理技术领域,特别涉及一种电力领域文本分类的方法和存储设备。所述一种电力领域文本分类的方法,包括步骤:构建电力预训练模型;获取待训练数据,对待训练数据进行预处理;对预处理后的待训练数据进行随机取样生成K组训练数据;设置M个超参组合,生成L*K*M个业务分类子模型;对L*K*M个业务分类子模型进行验证,得每个业务分类子模型的模型评估数据;根据模型评估数据调整模型参数,直至确定最佳超参使得获得的业务分类子模型符合预设条件,共生成L*K个符合预设条件的业务分类子模型;输入待预测文本至符合预设条件的业务分类子模型,得文本分类结果。通过上述步骤,大大提高电力领域文本分类准确率。
-
公开(公告)号:CN112328632A
公开(公告)日:2021-02-05
申请号:CN202011070559.3
申请日:2020-10-09
Applicant: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
IPC: G06F16/2455 , G06F16/27 , G06F16/22
Abstract: 本发明涉及数据读取技术领域,特别涉及一种分布式两级缓存的方法和系统。所述一种分布式两级缓存的方法,包括步骤:响应用户请求,所述第一业务服务器发送获取命名空间缓存请求至缓存服务器;若缓存服务器中不存在命名空间缓存,则从数据库中获取数据,并将数据同步存储于第一本地内存缓存和集中式缓存;若缓存服务器中存在命名空间缓存,则从第一本地内存缓存中获取数据,若从第一本地内存缓存中无法获取数据,则从集中式缓存中获取数据,并同步存储数据至第一本地内存缓存。通过上述方法可大大提高了数据读取速度,同时可以为多个节点提供服务,也大大缓解了数据库的压力。
-
公开(公告)号:CN110990676A
公开(公告)日:2020-04-10
申请号:CN201911194794.9
申请日:2019-11-28
Applicant: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司 , 国网北京市电力公司 , 国家电网有限公司 , 国网信通亿力科技有限责任公司
IPC: G06F16/951 , G06F16/35 , G06F16/34 , G06F16/335
Abstract: 一种社交媒体热点主题提取方法与系统。所述热点主题提取方法收集的互联网文本信息数据进行过滤归纳,然后采用文本聚类算法聚集相同主题的互联网数据信息,再把所述互联网数据信息聚类,为所选主题生成文本摘要;所述热点主题提取系统包括了数据筛选计算、主题聚类和主题摘要提取三个模块;所述数据筛选模块将收集的互联网文本信息数据进行过滤归纳;所述主题聚类模块采用文本聚类算法聚集相同主题的过滤完的互联网文本信息数据;所述主题摘要提取模块,提取模块根据用户所选的主题,将对应的聚类后的互联网文本信息数据生成文本摘要,从而完成热点提取;本发明提升了社交媒体热点主题的提取质量,具有较强的实用价值。
-
公开(公告)号:CN110889296A
公开(公告)日:2020-03-17
申请号:CN201911182998.0
申请日:2019-11-27
Applicant: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
IPC: G06F40/58 , G06F16/951
Abstract: 本发明涉及一种结合爬虫技术的实时翻译方法,包括以下步骤:对原文本进行预处理,将原文本处理成实时翻译网页能够读取的格式;替换专业词语,预先建立专业词库,将进行预处理后的原文本中的专业词语替换为专业词库中对应的译文,并对替换的译文添加强制翻译网页不对译文进行翻译的表达式,生成待翻译文本;利用爬虫将待翻译文本送入翻译网页中进行翻译,得到翻译结果并返回;将翻译结果进行整理输出为翻译文本。
-
公开(公告)号:CN109710947A
公开(公告)日:2019-05-03
申请号:CN201910058614.8
申请日:2019-01-22
Applicant: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司 , 国网浙江省电力有限公司 , 国家电网有限公司 , 国网信通亿力科技有限责任公司
IPC: G06F17/27 , G06F16/36 , G06F16/335
Abstract: 一种电力专业词库生成方法及装置,其中方法包括如下步骤,获取电力相关语料,对相关语料进行切词,得到候选词,对候选词进行互信息值计算,设定互信息值阈值,将互信息值小于互信息值阈值的词剔除。解决现有技术中电力专业词库杂乱不准确,无法满足实际需求的问题。
-
-
-
-
-
-
-
-
-