-
公开(公告)号:CN104850734B
公开(公告)日:2017-09-15
申请号:CN201510188119.0
申请日:2015-04-21
申请人: 武大吉奥信息技术有限公司
IPC分类号: G06F19/00
摘要: 本发明涉及一种空气质量指数预测方法,尤其涉及一种基于时空分布特征的空气质量指数预测方法。本方法采用时间序列预测方法预测时间方向,即未来某个时间的空气质量指数;再采用克里格插值法,利用已知的监测站点经纬度坐标,结合时间序列预测结果,插值估计整个区域任意地点的空气质量指数。因此,本发明具有如下优点:1.降低了模型的复杂度,并且缩短了整体的计算时间,同时又保证了模型的准确性。2.可以更准确地预测区域内每个地方、一天内多个时段的空气质量指数。
-
公开(公告)号:CN104850734A
公开(公告)日:2015-08-19
申请号:CN201510188119.0
申请日:2015-04-21
申请人: 武大吉奥信息技术有限公司
IPC分类号: G06F19/00
摘要: 本发明涉及一种空气质量指数预测方法,尤其涉及一种基于时空分布特征的空气质量指数预测方法。本方法采用时间序列预测方法预测时间方向,即未来某个时间的空气质量指数;再采用克里格插值法,利用已知的监测站点经纬度坐标,结合时间序列预测结果,插值估计整个区域任意地点的空气质量指数。因此,本发明具有如下优点:1.降低了模型的复杂度,并且缩短了整体的计算时间,同时又保证了模型的准确性。2.可以更准确地预测区域内每个地方、一天内多个时段的空气质量指数。
-
公开(公告)号:CN108920461B
公开(公告)日:2022-03-08
申请号:CN201810669866.X
申请日:2018-06-26
申请人: 武大吉奥信息技术有限公司
IPC分类号: G06F40/295 , G06N3/04 , G06N3/08
摘要: 本发明适用于大数据抽取技术领域,提供一种多类型且含复杂关系的实体抽取方法及装置,所述方法包括:构建训练样本;构建样本的分词特征;建立skip‑gram神经网络模型将字符转为向量;针对每种不同类型实体建立一个实体抽取BiLSTM‑CRF模型;根据不同类型实体间或者同一类型的不同具体实体单元之间的关系建立距离正则表达式,优化实体提取结果。本发明针对不同的BiLSTM‑CRF模型分别建立模型进行实体抽取,保证了每种类型的实体提取的准确性,另外,在本方法中,提取实体的同时,也提取了实体在文本中的位置,并且利用位置关系建立实体间的正则表达式,优化了模型提取的过多的且复杂的实体。
-
公开(公告)号:CN107644089A
公开(公告)日:2018-01-30
申请号:CN201710882339.2
申请日:2017-09-26
申请人: 武大吉奥信息技术有限公司
摘要: 本发明适用于信息挖掘技术领域,提供一种基于网络媒体的热门事件提取方法,首先将新闻、评论文本发布的时间区间划分为若干个等间隔的时间片。其次,在每个时间片内提取新闻文本的关键词及权重,用优化增量聚类方法对这些新闻文本进行聚合分类,得到该时间片内的每个话题及其空间向量模型,并根据模型计算话题热度,按照热度保留有效话题。第三,对所有的时间片的话题再用优化增量聚类方法进行聚合分类,得到不同的事件,计算事件热度。最后,判断事件是否热门,并通过热度对热门的事件排序。本发明改进了普通的增量聚类算法,并建立多级的优化增量聚类模型,提高了计算速度;并且根据媒体的关注情况和网民的舆论情况计算事件的热度,并判断事件是否热门,对热门的事件排名,此方法更客观,减少了事件排名的误差。
-
公开(公告)号:CN107644089B
公开(公告)日:2020-08-04
申请号:CN201710882339.2
申请日:2017-09-26
申请人: 武大吉奥信息技术有限公司
IPC分类号: G06F16/28 , G06F16/2458 , G06F16/35 , G06F16/9535 , G06F40/258
摘要: 本发明适用于信息挖掘技术领域,提供一种基于网络媒体的热门事件提取方法,首先将新闻、评论文本发布的时间区间划分为若干个等间隔的时间片。其次,在每个时间片内提取新闻文本的关键词及权重,用优化增量聚类方法对这些新闻文本进行聚合分类,得到该时间片内的每个话题及其空间向量模型,并根据模型计算话题热度,按照热度保留有效话题。第三,对所有的时间片的话题再用优化增量聚类方法进行聚合分类,得到不同的事件,计算事件热度。最后,判断事件是否热门,并通过热度对热门的事件排序。本发明改进了普通的增量聚类算法,并建立多级的优化增量聚类模型,提高了计算速度;并且根据媒体的关注情况和网民的舆论情况计算事件的热度,并判断事件是否热门,对热门的事件排名,此方法更客观,减少了事件排名的误差。
-
公开(公告)号:CN108920460B
公开(公告)日:2022-03-11
申请号:CN201810669851.3
申请日:2018-06-26
申请人: 武大吉奥信息技术有限公司
IPC分类号: G06F40/279 , G06N3/08
摘要: 本发明适用于数据抽取技术领域,提供一种多类型实体识别的多任务深度学习模型的训练方法及装置,所述方法包括:数据预处理;建立skip‑gram神经网络模型将预处理后的文本语料数据转为向量;根据要识别和提取的实体类型构建样本数据集;构建样本数据的分词特征;建立多类型实体识别的多任务深度学习模型。本发明中,相关类型的实体采用参数共享的方式实现共同特征的提取,又使用独立的模型完成实体的标注,使得模型对于一个文本数据的多种实体识别和提取有更好的泛化能力,即实体识别的整体正确性得到提升;另外,本发明只训练一个模型,在一次迭代过程中共同特征只用训练一次,可以极大的缩减训练时间。
-
公开(公告)号:CN109711447A
公开(公告)日:2019-05-03
申请号:CN201811556037.7
申请日:2018-12-19
申请人: 武大吉奥信息技术有限公司
摘要: 本发明适用于城市综治管理技术领域,提供一种特殊人群事件预警和监测方法及装置,所述方法包括:每隔一定时间间隔获取特殊人群的GPS位置信息数据;针对每次获取的特殊人群的GPS位置信息数据进行密度聚类分析;如果聚类结果只有噪音类,不做任何预警;如果聚类结果含有聚集类,对于每个聚集类,根据聚集类中特殊人群的空间位置计算该类别对应的凸包,计算凸包特殊人群点密度值以及凸包面积,然后计算所有聚集类的特殊人群点密度均值和凸包面积均值;根据得到的所有特殊人群点密度均值和凸包面积均值,分析特殊人群聚集特征的变化趋势,评估需要预警的地方和需要重点监控的人员。本发明根据特殊人群的实时位置信息作出特殊人群的移动方向预测和安全预警。
-
公开(公告)号:CN109325116A
公开(公告)日:2019-02-12
申请号:CN201810963174.6
申请日:2018-08-23
申请人: 武大吉奥信息技术有限公司
摘要: 本发明适用于智慧城市信息智能化技术领域,提供一种基于深度学习的城市事件自动分类派发方法及装置,包括收集城市事件数据并预处理;根据收集处理的城市事件数据构建事件分类卷积神经网络模型;计算城市事件发生地的标准地理编码;构建城市事件派发卷积神经网络模型;接收当前输入的城市事件数据,调用所述分类卷积神经网络模型输出分类类别,获取当前城市事件数据的标准地理编码,然后调用派发卷积神经网络模型,输出具体的城市事件派发部门。本发明可以提高事件的分类正确性和派送准确性;通过卷积神经网络模型派发,相比人工派发带来的各种不确定性,机器派发的准确性更高,本发明中机器根据模型一次运算得到结果,可有效提升系统运行效率。
-
公开(公告)号:CN109325116B
公开(公告)日:2020-11-27
申请号:CN201810963174.6
申请日:2018-08-23
申请人: 武大吉奥信息技术有限公司
摘要: 本发明适用于智慧城市信息智能化技术领域,提供一种基于深度学习的城市事件自动分类派发方法及装置,包括收集城市事件数据并预处理;根据收集处理的城市事件数据构建事件分类卷积神经网络模型;计算城市事件发生地的标准地理编码;构建城市事件派发卷积神经网络模型;接收当前输入的城市事件数据,调用所述分类卷积神经网络模型输出分类类别,获取当前城市事件数据的标准地理编码,然后调用派发卷积神经网络模型,输出具体的城市事件派发部门。本发明可以提高事件的分类正确性和派送准确性;通过卷积神经网络模型派发,相比人工派发带来的各种不确定性,机器派发的准确性更高,本发明中机器根据模型一次运算得到结果,可有效提升系统运行效率。
-
公开(公告)号:CN108920461A
公开(公告)日:2018-11-30
申请号:CN201810669866.X
申请日:2018-06-26
申请人: 武大吉奥信息技术有限公司
IPC分类号: G06F17/27
摘要: 本发明适用于大数据抽取技术领域,提供一种多类型且含复杂关系的实体抽取方法及装置,所述方法包括:构建训练样本;构建样本的分词特征;建立skip-gram神经网络模型将字符转为向量;针对每种不同类型实体建立一个实体抽取BiLSTM-CRF模型;根据不同类型实体间或者同一类型的不同具体实体单元之间的关系建立距离正则表达式,优化实体提取结果。本发明针对不同的BiLSTM-CRF模型分别建立模型进行实体抽取,保证了每种类型的实体提取的准确性,另外,在本方法中,提取实体的同时,也提取了实体在文本中的位置,并且利用位置关系建立实体间的正则表达式,优化了模型提取的过多的且复杂的实体。
-
-
-
-
-
-
-
-
-