-
公开(公告)号:CN109597885A
公开(公告)日:2019-04-09
申请号:CN201811511737.4
申请日:2018-12-11
申请人: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
IPC分类号: G06F16/338
摘要: 一种知识地图构建方法及存储介质,其中方法包括如下步骤,识别知识点,通过人工进行部分标注的语料输入基于机器学习的CRF算法模型进行训练,所述CRF算法模型被预置为词性特征倾向、和或信息熵特征倾向、和或全文词频倾向、和或逆文档概率倾向;用训练好的所述模型对特定文档集进行知识点识别,得到知识点集。本发明提出的面向知识搜索的动态知识地图构建方法,不面向特定的业务领域,在不同行业中具备普遍适用性,仅需通过普通标注少量知识点投入的资源少,无监督运行的效果也很好。同时针对不断扩展的企业文档,也能够起到不断进行知识地图结果优化的效果。
-
公开(公告)号:CN113536768A
公开(公告)日:2021-10-22
申请号:CN202110797247.0
申请日:2021-07-14
申请人: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
IPC分类号: G06F40/205 , G06F16/903
摘要: 本发明涉及一种基于正则表达式建立文本抽取模型的方法,包括如下步骤:S1、编写若干个正则表达式;S2、根据所述正则表达式,在语料库中抽取语料集;S3、将所述语料集分割为训练集与验证集;S4、构建文本抽取模型;S5、将训练集输入至文本抽取模型,训练文本抽取模型;S6、将验证集输入训练好的文本抽取模型,对训练好的文本抽取模型进行验证。
-
公开(公告)号:CN109710947B
公开(公告)日:2021-09-07
申请号:CN201910058614.8
申请日:2019-01-22
申请人: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司 , 国网浙江省电力有限公司 , 国家电网有限公司 , 国网信通亿力科技有限责任公司
IPC分类号: G06F40/20 , G06F16/36 , G06F16/335
摘要: 一种电力专业词库生成方法及装置,其中方法包括如下步骤,获取电力相关语料,对相关语料进行切词,得到候选词,对候选词进行互信息值计算,设定互信息值阈值,将互信息值小于互信息值阈值的词剔除。解决现有技术中电力专业词库杂乱不准确,无法满足实际需求的问题。
-
公开(公告)号:CN107037978B
公开(公告)日:2019-11-05
申请号:CN201610930983.8
申请日:2016-10-31
申请人: 福建亿榕信息技术有限公司 , 国家电网公司 , 国网浙江省电力公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
IPC分类号: G06F3/06
摘要: 本申请涉及数据迁移,特别涉及大型数据和特大型数据迁移和校正方法。本申请提供一种数据迁移校正的方法和系统,其中方法应用于具有控制器的系统中,控制器连接源数据服务器、目标数据服务器,包括步骤:源数据服务器存储有迁出文件,目标数据服务器具有未使用的存储空间,用于存放迁出文件,按源数据服务器的处理器核的个数的整数倍,将迁出文件划分为多个数据块,源数据服务器计算,获得每个数据块分别对应的数字摘要A;将数据摘要A保存于控制器中;并将迁出文件发送至目标数据服务器;在目标数据服务器中,在迁出文件转移的过程中平行计算经过数据迁移后的迁出文件中的数据块的数据摘要B;比较数据摘要A和数据摘要B是否相同;本申请用于解决大数据迁移时完整性校验的问题,其可靠性高、速度快。
-
公开(公告)号:CN107037978A
公开(公告)日:2017-08-11
申请号:CN201610930983.8
申请日:2016-10-31
申请人: 福建亿榕信息技术有限公司 , 国家电网公司 , 国网浙江省电力公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
IPC分类号: G06F3/06
摘要: 本申请涉及数据迁移,特别涉及大型数据和特大型数据迁移和校正方法。本申请提供一种数据迁移校正的方法和系统,其中方法应用于具有控制器的系统中,控制器连接源数据服务器、目标数据服务器,包括步骤:源数据服务器存储有迁出文件,目标数据服务器具有未使用的存储空间,用于存放迁出文件,按源数据服务器的处理器核的个数的整数倍,将迁出文件划分为多个数据块,源数据服务器计算,获得每个数据块分别对应的数字摘要A;将数据摘要A保存于控制器中;并将迁出文件发送至目标数据服务器;在目标数据服务器中,在迁出文件转移的过程中平行计算经过数据迁移后的迁出文件中的数据块的数据摘要B;比较数据摘要A和数据摘要B是否相同;本申请用于解决大数据迁移时完整性校验的问题,其可靠性高、速度快。
-
公开(公告)号:CN113641828A
公开(公告)日:2021-11-12
申请号:CN202110742593.9
申请日:2021-07-01
申请人: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
摘要: 本发明涉及数据处理技术领域,特别涉及一种基于知识图谱的电网供应商画像成像方法和存储设备。所述一种基于知识图谱的电网供应商画像成像方法,包括步骤:构建画像标签体系,并设置画像标签体系中每个标签的分析规则;构建图谱的本体结构及本体结构间的关系;获取目标供应商数据,并将目标供应商数据填充至图数据库中,构建知识图谱;结合知识图谱中的数据及每个标签的分析规则计算得每个标签的维度得分;根据每个标签的维度得分构建得供应商标签画像。通过上述步骤,实现从不同维度对供应商进行综合评价,为电网招标采购、供应商全息多维评价、质量监督业务运营决策场景提供辅助支撑,提供现代智慧供应链的基础支撑能力。
-
公开(公告)号:CN111090755A
公开(公告)日:2020-05-01
申请号:CN201911197172.1
申请日:2019-11-29
申请人: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司 , 国网北京市电力公司 , 国家电网有限公司大数据中心 , 国网福建省电力有限公司 , 国家电网有限公司 , 国网信通亿力科技有限责任公司
IPC分类号: G06F16/36 , G06F16/33 , G06F16/383 , G06F40/289 , G06Q50/06
摘要: 一种文本关联关系判别方法及存储介质,其中方法包括如下步骤,对输入的语料进行预处理,得到预处理文本,对预处理文本中的文本字段进行判断是否为超短文本,对其中的超短文本根据行业知识图谱进行改写,得到改写文本,将改写文本输入BERT模型进行训练、分析,得到模型输出的关联关系判别结果。本发明可以结合超短文本改写技术进行短文本关联关系判断的方法。对比已有方案具有语义理解能力强、文本长度影响小、相关性判断准确率高的有益效果,综上所述,本发明解决了现有技术中对行业文本相关性的判断仍然不够准确的问题。
-
公开(公告)号:CN106557571A
公开(公告)日:2017-04-05
申请号:CN201611034583.5
申请日:2016-11-23
申请人: 福建亿榕信息技术有限公司 , 国家电网公司 , 国网浙江省电力公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
IPC分类号: G06F17/30
CPC分类号: G06F16/215
摘要: 一种基于K‑V存储引擎的数据去重方法及装置,其中方法包括如下步骤,将文件分割成定长的数据块,对各数据块进行哈希计算,得到数据块摘要数组,将数组中摘要逐个与已存储在K‑V存储引擎中的数据块摘要进行比对,若存在相同的摘要,则不进行存储,否则以数据块摘要为Key,待存储数据块为Value存入K‑V存储引擎。
-
公开(公告)号:CN111090755B
公开(公告)日:2023-04-04
申请号:CN201911197172.1
申请日:2019-11-29
申请人: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司 , 国网北京市电力公司 , 国家电网有限公司大数据中心 , 国网福建省电力有限公司 , 国家电网有限公司 , 国网信通亿力科技有限责任公司
IPC分类号: G06F16/36 , G06F16/33 , G06F16/383 , G06F40/289 , G06Q50/06
摘要: 一种文本关联关系判别方法及存储介质,其中方法包括如下步骤,对输入的语料进行预处理,得到预处理文本,对预处理文本中的文本字段进行判断是否为超短文本,对其中的超短文本根据行业知识图谱进行改写,得到改写文本,将改写文本输入BERT模型进行训练、分析,得到模型输出的关联关系判别结果。本发明可以结合超短文本改写技术进行短文本关联关系判断的方法。对比已有方案具有语义理解能力强、文本长度影响小、相关性判断准确率高的有益效果,综上所述,本发明解决了现有技术中对行业文本相关性的判断仍然不够准确的问题。
-
公开(公告)号:CN109710947A
公开(公告)日:2019-05-03
申请号:CN201910058614.8
申请日:2019-01-22
申请人: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司 , 国网浙江省电力有限公司 , 国家电网有限公司 , 国网信通亿力科技有限责任公司
IPC分类号: G06F17/27 , G06F16/36 , G06F16/335
摘要: 一种电力专业词库生成方法及装置,其中方法包括如下步骤,获取电力相关语料,对相关语料进行切词,得到候选词,对候选词进行互信息值计算,设定互信息值阈值,将互信息值小于互信息值阈值的词剔除。解决现有技术中电力专业词库杂乱不准确,无法满足实际需求的问题。
-
-
-
-
-
-
-
-
-