-
公开(公告)号:CN107590134A
公开(公告)日:2018-01-16
申请号:CN201711012851.8
申请日:2017-10-26
申请人: 福建亿榕信息技术有限公司 , 国家电网公司 , 国网信息通信产业集团有限公司
摘要: 一种文本情感分类方法、存储介质及计算机,其中方法包括如下步骤,对输入文本进行情感词典构建,所述情感词典构建步骤包括词性选择表达、底层特征向量提取;中层特征提取,结合所述情感词典,采集训练样本的词向量,对训练样本的词向量进行池化后得到中层特征向量;对所述底层特征向量、中层特征向量进行加权融合,得到融合特征向量,分别基于底层特征向量分类模型、中层特征向量分类模型、融合特征向量分类模型计算分类结果。解决现有技术情感分类不够高效、稳定的问题。
-
公开(公告)号:CN105227672B
公开(公告)日:2018-04-17
申请号:CN201510671597.7
申请日:2015-10-13
申请人: 国家电网公司 , 福建亿榕信息技术有限公司 , 国网浙江省电力公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
IPC分类号: H04L29/08
摘要: 发明人提供了一种在满足SAN存储共享访问需求的同时具有能够提供支持多种操作系统、运行性能好、可靠性高、投资有限且方便维护等优点的数据存储访问的方法和系统,运行时包括数据存储阶段和数据访问阶段;所述数据存储阶段包括如下步骤:客户端向协调服务器发起待上传文件请求;协调服务器通过心跳时间校验流程确定一当前可有效执行写入操作的存储服务器;客户端获取所述经协调服务器确定可有效执行写入操作的存储服务器的IP并向该存储服务器上传文件。还包括一数据访问阶段方法。本发明技术方案所述的系统及其实现的方法兼具高可用性、高性能、跨平台和易实施的特性,规避了现有主流方案的缺点。
-
公开(公告)号:CN106776841A
公开(公告)日:2017-05-31
申请号:CN201611064180.5
申请日:2016-11-28
申请人: 福建亿榕信息技术有限公司 , 国家电网公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
IPC分类号: G06F17/30
摘要: 本发明提供一种互联网舆情事件传播指数的获取方法,所述获取方法为:1、输入舆情事件;2、采集在各个媒体源中抓取该舆情事件的相关舆情文章,并存入舆情事件分析库;3、对该舆情事件的所有舆情文章进行分析,以文章的发布时间先后对所有媒体源文章进行排序,形成舆情事件传播轨迹,同时,对每一篇文章进行单文章传播指数计算;4、通过文章传播指数提取舆情事件传播轨迹关键信息;5、通过舆情事件传播轨迹关键信息构建最终模型。本发明模型更为精确、更能反映舆情事件从生成、发展、爆发、高峰期、衰弱、结束等整个生命周期的发展态势。
-
公开(公告)号:CN106776841B
公开(公告)日:2020-04-21
申请号:CN201611064180.5
申请日:2016-11-28
申请人: 福建亿榕信息技术有限公司 , 国家电网公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
IPC分类号: G06F16/951
摘要: 本发明提供一种互联网舆情事件传播指数的获取方法,所述获取方法为:1、输入舆情事件;2、采集在各个媒体源中抓取该舆情事件的相关舆情文章,并存入舆情事件分析库;3、对该舆情事件的所有舆情文章进行分析,以文章的发布时间先后对所有媒体源文章进行排序,形成舆情事件传播轨迹,同时,对每一篇文章进行单文章传播指数计算;4、通过文章传播指数提取舆情事件传播轨迹关键信息;5、通过舆情事件传播轨迹关键信息构建最终模型。本发明模型更为精确、更能反映舆情事件从生成、发展、爆发、高峰期、衰弱、结束等整个生命周期的发展态势。
-
公开(公告)号:CN106776783B
公开(公告)日:2019-10-01
申请号:CN201611043089.5
申请日:2016-11-24
申请人: 福建亿榕信息技术有限公司 , 国家电网公司 , 国网浙江省电力公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
IPC分类号: G06F16/31 , G06F16/383
摘要: 本文提供一种非结构化数据存储管理方法和系统,解决现有技术中非结构化存储管理系统无法支撑大量的小文件及其元数据的存储和快速访问的问题。其特别涉及非结构化数据的存储管理;其方法包括步骤:非结构化数据具有与其对应的第二元数据;第二元数据存储于内存中,以哈希表的结构存储,第二元数据包括非结构化数据对应的部分描述数据和第一键值;第一键值对应第二元数据映射在哈希表中的关键字;接收非结构化数据管理指令;若非结构化数据管理指令的参数为第一键值,则在内存中执行该非结构化数据管理指令。本文提供的方案优化了非结构化数据的元数据的访问速度。
-
公开(公告)号:CN106776783A
公开(公告)日:2017-05-31
申请号:CN201611043089.5
申请日:2016-11-24
申请人: 福建亿榕信息技术有限公司 , 国家电网公司 , 国网浙江省电力公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
IPC分类号: G06F17/30
摘要: 本文提供一种非结构化数据存储管理方法、服务器和系统,解决现有技术中非结构化存储管理系统无法支撑大量的小文件及其元数据的存储和快速访问的问题。其特别涉及非结构化数据的存储管理;其方法包括步骤:非结构化数据具有与其对应的第二元数据;第二元数据存储于内存中,以哈希表的结构存储,第二元数据包括非结构化数据对应的部分描述数据和第一键值;第一键值对应第二元数据映射在哈希表中的关键字;接收非结构化数据管理指令;若非结构化数据管理指令的参数为第一键值,则在内存中执行该非结构化数据管理指令。本文提供的方案优化了非结构化数据的元数据的访问速度。
-
公开(公告)号:CN106557571A
公开(公告)日:2017-04-05
申请号:CN201611034583.5
申请日:2016-11-23
申请人: 福建亿榕信息技术有限公司 , 国家电网公司 , 国网浙江省电力公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
IPC分类号: G06F17/30
CPC分类号: G06F16/215
摘要: 一种基于K‑V存储引擎的数据去重方法及装置,其中方法包括如下步骤,将文件分割成定长的数据块,对各数据块进行哈希计算,得到数据块摘要数组,将数组中摘要逐个与已存储在K‑V存储引擎中的数据块摘要进行比对,若存在相同的摘要,则不进行存储,否则以数据块摘要为Key,待存储数据块为Value存入K‑V存储引擎。
-
公开(公告)号:CN107037978B
公开(公告)日:2019-11-05
申请号:CN201610930983.8
申请日:2016-10-31
申请人: 福建亿榕信息技术有限公司 , 国家电网公司 , 国网浙江省电力公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
IPC分类号: G06F3/06
摘要: 本申请涉及数据迁移,特别涉及大型数据和特大型数据迁移和校正方法。本申请提供一种数据迁移校正的方法和系统,其中方法应用于具有控制器的系统中,控制器连接源数据服务器、目标数据服务器,包括步骤:源数据服务器存储有迁出文件,目标数据服务器具有未使用的存储空间,用于存放迁出文件,按源数据服务器的处理器核的个数的整数倍,将迁出文件划分为多个数据块,源数据服务器计算,获得每个数据块分别对应的数字摘要A;将数据摘要A保存于控制器中;并将迁出文件发送至目标数据服务器;在目标数据服务器中,在迁出文件转移的过程中平行计算经过数据迁移后的迁出文件中的数据块的数据摘要B;比较数据摘要A和数据摘要B是否相同;本申请用于解决大数据迁移时完整性校验的问题,其可靠性高、速度快。
-
公开(公告)号:CN106779087B
公开(公告)日:2019-02-22
申请号:CN201611075837.8
申请日:2016-11-30
申请人: 福建亿榕信息技术有限公司 , 国家电网公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
IPC分类号: G06N20/00
摘要: 本发明提供一种通用机器学习数据分析平台,包括界面模块、数据存储模块、预处理模块、特征提取模块、特征转换模块、算法模块以及选择优化模块;所述特征提取模块根据用户设定的特征参数从所述待分析数据中提取所述特征参数;所述特征转换模块用于将用户设定的特征转换成用户所需的表示形式;所述算法模块包含多种算法模型供用户选择以及供用户构建模型,用户构建至少一组模型;所述选择优化模块从构建好的模型中选出最优的模型和最优的参数,然后保存所述最优的模型;上述各模块产生的数据均存储于所述数据存储模块中。本发明用户可以自由组合使用各个模块与算法模型,还可以建立复合模型,快速迭代开发出新型分析模型,大大提高工作效率。
-
公开(公告)号:CN107977345A
公开(公告)日:2018-05-01
申请号:CN201711121932.1
申请日:2017-11-14
申请人: 福建亿榕信息技术有限公司 , 国家电网公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
摘要: 本发明提供一种通用文本信息抽取方法,编写限定个数的正则表达式对原始语料进行抽取;从抽取的语料中切割出限定比例的语料作为训练语料;将训练语料通过自动模式归纳方法构建抽取模型;通过该抽取模型进行抽取;本发明还提供一种通用文本信息抽取系统,适用于不同要求级别的业务场景中,也利于培养相应要求的工程师,形成文本关键信息抽取的“流水线”作业。
-
-
-
-
-
-
-
-
-