-
公开(公告)号:CN115376004A
公开(公告)日:2022-11-22
申请号:CN202210886586.0
申请日:2022-07-26
摘要: 本发明提供了一种面向AIS船舶轨迹大数据的航道边界和中心线挖掘方法及系统,包括:步骤S1:将AIS船舶轨迹数据的航迹点进行Delaunay三角网化,基于航迹点三角网中的三角形进行筛选得到航迹点的原始边界;步骤S2:对获取的航迹点的原始边界进行平滑处理,基于平滑处理后航迹点原始边界的顶点点集进一步进行Delaunay三角网化,基于顶点点集三角网进行筛选得到航道轮廓;步骤S3:基于航道轮廓构建航道图及航道的中心线。
-
公开(公告)号:CN115951429A
公开(公告)日:2023-04-11
申请号:CN202210895335.9
申请日:2022-07-26
IPC分类号: G01W1/10 , G06N3/0442 , G06N3/08
摘要: 本发明提供了一种基于循环神经网络的飓风路径预测方法及系统,包括:对划定的飓风路径区域进行网格化处理;计算每个坐标点的移动距离以及移动角度作为数据增强;使用三层长短期记忆网络作为预测模型的主干循环神经网络;主干网络为长短期记忆模型搭载比例系数为0.1的Dropout层;输出层为一个使用双曲正切函数激活的全连接层,模型的训练使用基于动量的梯度下降算法RMSProp,训练目标为预测经纬度坐标平方误差;预测模型的输出层由网格ID预测层与坐标修正两部分构成最终的飓风坐标预测。在预测阶段,基于循环神经网络推理预测仅依赖模型的前向传播,无需对历史数据库进行关联搜索,大大提高了飓风路径预测的性能。
-
公开(公告)号:CN115470260A
公开(公告)日:2022-12-13
申请号:CN202210886592.6
申请日:2022-07-26
IPC分类号: G06F16/2458 , G06F16/29
摘要: 本发明提供了一种面向AIS船舶轨迹大数据的航行模式频繁序列挖掘方法及系统,包括:步骤S1:根据AIS船舶轨迹大数据构建船舶航行模式序列;步骤S2:使用PrefixSpan频繁序列挖掘算法对船舶航行模式序列数据库进行船舶航行模式的频项挖掘;所述船舶航行模式序列包括船舶类型、坐标哈希值、航速档位、航角档位的四元组。
-
公开(公告)号:CN117077772A
公开(公告)日:2023-11-17
申请号:CN202311038321.6
申请日:2023-08-16
IPC分类号: G06N5/02 , G06F40/295 , G06N3/0464 , G06N3/08
摘要: 本发明提供了一种基于全局指针的军事需求文本实体与关系抽取方法和系统,包括:基于规则或者基于机器学习进行实体识别;进行基于全局指针的需求文本的实体关系联合抽取。本发明结合军事需求项目,涵盖军事领域的信息抽取与图谱构建技术。通过基于全局指针的联合学习技术,面向军事需求文档,使用单阶段解码方式对实体和关系进行联合抽取,并结合所提模型搭建军事需求领域的实体和关系抽取系统。
-
公开(公告)号:CN117493651A
公开(公告)日:2024-02-02
申请号:CN202311484701.2
申请日:2023-11-08
IPC分类号: G06F16/951 , G06F16/953
摘要: 本发明的技术方案是公开了一种开源数据分布式采集系统,其特征在于,基于容器技术,采用Python语言开发数据挖掘与搜集服务,采用Springboot+Vue开发数据挖掘与收集模块、采集任务管理模块、采集策略管理模块、采集驱动管理模块以及采集数据组织管理。本发明通过采集任务维护,自定义采集主题、采集策略和驱动模版,实现开源网页数据内容的定向分布式采集、清洗、分类、存储和检索,通过数据批量导出,实现采集数据整体打包后迁移到内部生成环境,实现对知识图谱构建等任务提供原始数据支撑。
-
公开(公告)号:CN117009441A
公开(公告)日:2023-11-07
申请号:CN202310754385.X
申请日:2023-06-25
IPC分类号: G06F16/28 , G06F16/36 , G06F16/901
摘要: 本发明提供了一种基于关系型数据库的知识图谱构建系统及方法,包括数据库接引模块、知识图谱构建模块和图谱编辑展现模块,基于对关系型数据库的表单结构梳理、表单关联关系识别与分析和表单基础条目获取,实现对关系型数据库的图谱化构建与融合集成;基于图谱可视化展现、图谱实体编辑、图谱实体关系编辑和图谱抽取信息配置实现图谱编辑展现能力。本发明支持多数据来源的图谱构建,打破数据孤岛,进行数据的多元联合,为用户提供联合信息分析基础,提供实体融合集成能力,有效提高图谱可用性,消除冗余数据。
-
公开(公告)号:CN116090610A
公开(公告)日:2023-05-09
申请号:CN202211640702.7
申请日:2022-12-20
摘要: 本发明提供了一种基于有限说服阈值模型的社会网络中信息传播方法及系统,包括获取社会网络数据;根据所述社会网络数据构建有限说服阈值模型,所述模型包括双阈值使得社会网络数据中的个体状态的改变是非对称的;通过所述有限说服阈值模型选择潜在说服者,确定最终接受信息的个体比例,进而完成信息传播。本发明提出的有限说服阈值模型能够更好的模拟现实生活中线上社交网络和线下朋友、亲属、同事等关系网络中的信息传播,能够更加准确有效地预测新闻、舆论、谣言、产品营销、品牌推广等信息的传播范围以及产生的影响。
-
公开(公告)号:CN115618862A
公开(公告)日:2023-01-17
申请号:CN202211293624.8
申请日:2022-10-21
IPC分类号: G06F40/284 , G06F40/295 , G06F40/216 , G06F16/335 , G06F16/33 , G06N3/04 , G06N3/08
摘要: 本发明提供了一种基于实体链接和大规模预训练模型的实体消歧方法及系统,包括:步骤S1:将文本输入到RoBERTa‑Large模型中,将文本转为固定词向量,设置目标消歧的实体;步骤S2:在RoBERTa‑Large模型的输出得到词向量的生成结果;步骤S3:根据实体筛选出知识库中数据,将实体数据进行拼接,输入到预训练模型中;步骤S4:从预训练模型中输出的知识库数据进行向量相似度计算。在计算向量相似度之后,本申请手动添加了阈值来决定是否输出实体的具体含义,同时增加了同义词替换的功能,这样会减少由于知识库语料不足而导致结果不准确的问题。
-
公开(公告)号:CN113609838B
公开(公告)日:2024-05-24
申请号:CN202110795366.2
申请日:2021-07-14
IPC分类号: G06F40/211 , G06F40/30 , G06F40/295 , G06F16/35 , G06F16/36
摘要: 本发明提供了一种文档信息抽取及图谱化方法和系统,包括:步骤1:通过自然语言理解技术和自然语言处理技术,从词特征和依存句法树上获取文档的构词特征,并制定规则用模式匹配的方法进行实体抽取;步骤2:通过自然语言理解技术和自然语言处理技术,从词特征和依存句法树上获取文档的构词特征,并制定规则用模式匹配的方法进行关系和对应实体属性抽取;步骤3:对抽取的实体、关系及属性三元组进行图谱化,生成文档图谱。本发明能够基于句法语义规则对文档进行关系及属性抽取,无需采用机器学习的方法进行数据的标注和训练,提升了抽取效率,降低了抽取时的计算机资源消耗。
-
公开(公告)号:CN117332776A
公开(公告)日:2024-01-02
申请号:CN202311213769.7
申请日:2023-09-19
IPC分类号: G06F40/216 , G06F40/157
摘要: 本发明提供了一种基于迪杰斯特拉算法的文本生成方法、系统、介质及终端,包括:获取给定文本;将给定文本作为初始概率累积,并将初始概率累积的负对数置为0,加入到一个空集合Path中;从空集合Path中选取一个元素输入至语言模型中训练,得到语言模型中字典里的每个令牌的生成概率;依次计算生成概率对应的负对数和所对应元素的累计负对数之和,得到备选令牌;将备选令牌和对应的元素拼接得到当前轮生成的最优文本,并加入集合Path中;直至当前轮生成的文本满足预设停止条件时,结束文本生成流程,输出最终生成的文本。本发明基于迪杰斯特拉最优路径发现算法,能够生成全局最优的文本,文本质量高。
-
-
-
-
-
-
-
-
-