-
公开(公告)号:CN109815476B
公开(公告)日:2023-03-24
申请号:CN201811465623.0
申请日:2018-12-03
IPC分类号: G06F40/30 , G06F40/284 , G06N3/0464 , G06N3/08
摘要: 一种基于中文语素和拼音联合统计的词向量表示方法,包括如下步骤:①采集互联网文本信息构建语料库,对构建的语料库进行正文清洗和分词处理;②对中文语料进行分词处理后转为不保留声调信息的拼音信息,然后分别对语素和拼音特征在训练集语料和全文档中统计词频和逆文档概率作统计权重TFc、IDFc、TFp和IDFp;③基于上下文语素和拼音联合统计的中文词表示模型,构造中文单个语素表示向量;④在步骤③的基础上训练一个三层神经网络以用于中心目标词的预测。该方法可满足离线词典和语料数据规模的适应性、可直接学习大规模无标注的互联网信息文本数据、可提高常规的词嵌入模型对于中文语言差异特性的兼顾性、可提高对错别字词语的表示和识别准确性。
-
公开(公告)号:CN109800310B
公开(公告)日:2021-11-09
申请号:CN201811465625.X
申请日:2018-12-03
发明人: 祝春捷 , 夏霖 , 潘坚跃 , 陈超 , 孔晓杭 , 泮莉莎 , 施婧 , 李雅 , 雷云 , 陈晨 , 陈文康 , 王汝英 , 李欣荣 , 赵光俊 , 周航帆 , 魏伟 , 边立云 , 刘畅 , 李艳
IPC分类号: G06F16/36 , G06F16/35 , G06F40/289 , G06F40/216 , G06F40/30
摘要: 一种基于结构化表达的电力运维文本分析方法,包括如下步骤:①通过采集电力运维日志并加入维基百科的开源中文语料库构建电力运维语料数据库,同时对所构建的语料数据库进行预处理;②基于所构建的电力运维语料库,针对这种中文记录文档特征设计基于拼音统计的词向量;③采用CBOW模型网络架构生成中文词表示向量;④采用基于Bi‑LSTM字符级提取方法识别实体关键词⑤对于所提取的实体关键词,构建多维特征语义槽结构;⑥提取影响事故发生的多类特征的类内和类间的关系。该方法可对庞大且冗杂的企业级文本数据资产实现对其进行统一管理,通过数据分析并高效获取相关设备网点运营状况,发现潜在的危险和隐患,在第一时间能够对异常事件做出响应。
-
公开(公告)号:CN109815476A
公开(公告)日:2019-05-28
申请号:CN201811465623.0
申请日:2018-12-03
摘要: 一种基于中文语素和拼音联合统计的词向量表示方法,包括如下步骤:①采集互联网文本信息构建语料库,对构建的语料库进行正文清洗和分词处理;②对中文语料进行分词处理后转为不保留声调信息的拼音信息,然后分别对语素和拼音特征在训练集语料和全文档中统计词频和逆文档概率作统计权重TFc、IDFc、TFp和IDFp;③基于上下文语素和拼音联合统计的中文词表示模型,构造中文单个语素表示向量;④在步骤③的基础上训练一个三层神经网络以用于中心目标词的预测。该方法可满足离线词典和语料数据规模的适应性、可直接学习大规模无标注的互联网信息文本数据、可提高常规的词嵌入模型对于中文语言差异特性的兼顾性、可提高对错别字词语的表示和识别准确性。
-
公开(公告)号:CN109800310A
公开(公告)日:2019-05-24
申请号:CN201811465625.X
申请日:2018-12-03
发明人: 祝春捷 , 夏霖 , 潘坚跃 , 陈超 , 孔晓杭 , 泮莉莎 , 施婧 , 李雅 , 雷云 , 陈晨 , 陈文康 , 王汝英 , 李欣荣 , 赵光俊 , 周航帆 , 魏伟 , 边立云 , 刘畅 , 李艳
摘要: 一种基于结构化表达的电力运维文本分析方法,包括如下步骤:①通过采集电力运维日志并加入维基百科的开源中文语料库构建电力运维语料数据库,同时对所构建的语料数据库进行预处理;②基于所构建的电力运维语料库,针对这种中文记录文档特征设计基于拼音统计的词向量;③采用CBOW模型网络架构生成中文词表示向量;④采用基于Bi-LSTM字符级提取方法识别实体关键词⑤对于所提取的实体关键词,构建多维特征语义槽结构;⑥提取影响事故发生的多类特征的类内和类间的关系。该方法可对庞大且冗杂的企业级文本数据资产实现对其进行统一管理,通过数据分析并高效获取相关设备网点运营状况,发现潜在的危险和隐患,在第一时间能够对异常事件做出响应。
-
公开(公告)号:CN106599087B
公开(公告)日:2019-10-18
申请号:CN201611049714.7
申请日:2016-11-24
申请人: 天津市普迅电力信息技术有限公司 , 国网信息通信产业集团有限公司
摘要: 本发明涉及一种空间信息服务的二次开发方法,该开发方法在Web开发环境管理并维护所开发的空间信息服务代码,在开发和调试过程中需要适配作为底层支撑的基础地理信息系统设施,包括文件组件、接口服务和数据对象,与部署环境相结合,形成一个完整的空间信息服务二次开发和调试发布环境。本发明可以简化空间信息服务的开发过程,提供统一的基于Web的开发环境,同时在后台适配多种地理信息系统平台的功能组件和服务接口,减少了开发环境搭建和配置环节,提高了服务开发的效率,同时可结合容器技术进行服务发布过程。
-
公开(公告)号:CN109459437A
公开(公告)日:2019-03-12
申请号:CN201811318451.4
申请日:2018-11-07
申请人: 天津市普迅电力信息技术有限公司 , 国网信息通信产业集团有限公司
摘要: 一种基于高精度定位的多旋翼无人机输电杆塔缺陷识别方法,包括如下步骤:①在输电杆塔巡视区域塔身处喷涂定位点;②在地表稳定区域标定控制点并测量控制点坐标;③在控制点处架设地基增强定位基准站;④配置多旋翼无人机悬停三维坐标及镜头方向并启动;⑤无人机在固定位置悬停并通过定位点校准拍摄方向,拍摄N张照片并编号;⑥巡检工作开展时,重复3~5操作进行复拍图像获取;⑦将复拍的N张照片分别与标准照片通过定位点进行校正;⑧使用图像识别程序遍历对应照片重叠相幅部分的像素点;⑨将像素差异超出阈值的区域进行标定;⑩判断标定部分的是否为杆塔缺陷或缺陷预警。本发明可提前发现设备缺陷,提升巡检工作的精细化、标准化程度。
-
公开(公告)号:CN106559488B
公开(公告)日:2019-09-06
申请号:CN201611049720.2
申请日:2016-11-24
申请人: 天津市普迅电力信息技术有限公司 , 国网信息通信产业集团有限公司
摘要: 本发明涉及一种建立租户驱动的电网地理信息空间服务的方法,包括步骤有:(1)建立该方法所需的系统,该系统包括多租户访问控制中心、监控调度、空间服务池、存储资源及计算资源;(2)多租户访问控制中心的部署;(3)建立监控调度;(4)建立空间服务池;(5)建立存储资源;(6)建立计算资源。本发明利用多租户技术有效度量各租户对于电网地理信息空间服务系统的资源使用情况,从而有针对性的改进占用计算资源更多的业务应用场景,通过对各租户的配额控制,避免造成整个电网空间信息服务系统的瘫痪,电网空间服务系统提供托管数据的统一管理和访问的权限控制。
-
公开(公告)号:CN109466176A
公开(公告)日:2019-03-15
申请号:CN201811355766.6
申请日:2018-11-14
申请人: 天津市普迅电力信息技术有限公司 , 国网信息通信产业集团有限公司
IPC分类号: B41J2/01 , B41J25/304 , B41J29/38
摘要: 本发明提供了一种能源消费企业画像打印装置及其工作方法,包括:第一伺服电机、第一X轴驱动轴、联轴器;所述第一X轴驱动轴设置在第一伺服电机的一侧,且第一X轴驱动轴与第一伺服电机通过联轴器相连接;所述第一轴承座设置在第一X轴驱动轴的右端;所述第二轴承座设置在第一X轴驱动轴的左端;所述第三轴承座设置在第二轴承座的一侧,且第三轴承座与第二轴承座通过第一Y轴导轨相连接;所述第四轴承座设置在第三轴承座的一侧,且第四轴承座与第三轴承座通过第二X轴驱动轴相连接。本发明通过对现有装置的改进,能够打印具有凹凸质感的画像,载体介质大小可调,装置通用性强,工作过程生动灵活等优点,从而有效的解决了现有装置中出现的问题和不足。
-
公开(公告)号:CN106599087A
公开(公告)日:2017-04-26
申请号:CN201611049714.7
申请日:2016-11-24
申请人: 天津市普迅电力信息技术有限公司 , 国网信息通信产业集团有限公司
摘要: 本发明涉及一种空间信息服务的二次开发方法,该开发方法在Web开发环境管理并维护所开发的空间信息服务代码,在开发和调试过程中需要适配作为底层支撑的基础地理信息系统设施,包括文件组件、接口服务和数据对象,与部署环境相结合,形成一个完整的空间信息服务二次开发和调试发布环境。本发明可以简化空间信息服务的开发过程,提供统一的基于Web的开发环境,同时在后台适配多种地理信息系统平台的功能组件和服务接口,减少了开发环境搭建和配置环节,提高了服务开发的效率,同时可结合容器技术进行服务发布过程。
-
公开(公告)号:CN106484895A
公开(公告)日:2017-03-08
申请号:CN201610915910.1
申请日:2016-10-21
申请人: 天津市普迅电力信息技术有限公司 , 国网信息通信产业集团有限公司
IPC分类号: G06F17/30
CPC分类号: G06F16/951
摘要: 本发明涉及一种基于多重分析的互联网信息精准爬取方法,包括步骤有:第一步,页面信息爬取,首先将页面信息分为静态页面信息和动态页面信息,然后将静态页面信息和动态页面信息分别进行爬取;第二步,对上述爬取信息进行解析处理,首先将上述爬取信息分类为满足dom模型的结构信息和非结构信息,然后对分类信息分别进行解析规则分析;第三步,对上述明确解析规则后的爬取任务进行多线程任务处理,并配置各种多线程任务的周期频度。本发明爬取准确度高,灵活性强,机动性强,操作简便,任务可视化直观,便于后期对爬取数据的各种分析。
-
-
-
-
-
-
-
-
-