一种应用于医学文本的实体关系自动标注方法

    公开(公告)号:CN111291568B

    公开(公告)日:2023-03-31

    申请号:CN202010151091.4

    申请日:2020-03-06

    发明人: 滕飞 白萌 杜军

    摘要: 本发明公开了一种应用于医学文本的实体关系自动标注方法,其包括以下步骤:S1、构造医学术语词典和先验知识库;S2、根据医学术语词典对目标医学文本进行统计共现并生成基础语料;S3、采用先验知识库对基础语料进行预标注,得到预标注后的语料;S4、对预标注后的语料进行实体校正,得到实体校正后的语料;S5、通过关系标志词对实体校正后的语料进行过滤,完成医学文本的实体关系自动标注。本发明采用自动标注的形式,减少了研究人员在关系抽取中对人力的投入,拥有较快的标注速度,同时本方法不需要依赖专家的标注,解决了医学文本标注困难的问题,且本方法通过关系标志词对标注过的文本进行进一步过滤,可以明显提高标注的精度。

    一种多模态情感识别方法、装置、设备及可读存储介质

    公开(公告)号:CN115270849A

    公开(公告)日:2022-11-01

    申请号:CN202210706585.3

    申请日:2022-06-21

    摘要: 本发明提供了一种多模态情感识别方法、装置、设备及可读存储介质,所述方法包括:获取多个历史数据,每个所述历史数据包括一个实验者在历史时间段内的脑电信号和眼动信号,所述脑电信号由电极帽所采集;对所述脑电信号进行重构处理,得到重构的脑电信号,对所述眼动信号进行重构处理,得到重构的眼动信号;基于所述重构的脑电信号和重构的眼动信号构建训练集,基于所述训练集对情感识别模型进行训练,得到训练后的情感识别模型;利用所述训练后的情感识别模型对待测试者的情感状态进行识别,得到所述测试者的情感状态。

    一种面向医学文本的实体关系联合抽取方法

    公开(公告)号:CN111368528B

    公开(公告)日:2022-07-08

    申请号:CN202010156316.5

    申请日:2020-03-09

    摘要: 本发明公开了一种面向医学文本的实体关系联合抽取方法,该方法包括对医学文本实体关系数据集按照三元组方式进行重组,将医学文本语句向量化表示,采用双向长短期记忆网络加自注意力机制构建参数共享层,采用softmax函数预测头实体标签,采用CNN‑softmax进行关系‑尾实体联合解码,结合头实体预测结果增强联合解码表示,采用联合损失函数优化方式训练参数共享层和联合解码层。本发明解决了医学文本中实体和关系类别和位置分布不均匀、多对关系同时出现在同一句的问题,能够提高医学文本实体关系抽取的质量和效率。

    一种基于3D反卷积的出行需求预测方法

    公开(公告)号:CN112862165B

    公开(公告)日:2022-04-26

    申请号:CN202110091885.0

    申请日:2021-01-23

    摘要: 本发明公开了一种基于3D反卷积的出行需求预测方法,该方法包括构建预测模型的步骤:构建时空栅格数据、根据时空栅格数据来构建预测方法的输入、使用3D卷积初步提取时空特征、使用3D反卷积来进一步提取空间信息、将三个信息融合、激活函数作用于融合结果来得到最终的模型输出结果。相对于现有技术,本发明提出了一种新的基于3D反卷积的端到端深度学习模型,用以预测城市区域出行需求,包括利用3D卷积和反卷积来提取时空特征,最后同时融合学习三个时间属性特征,即临近时间依赖性、日常时间依赖性和周期时间依赖性特征。引入了3D反卷积来提取时空数据的空间相关性,从而提高模型对于时空数据的空间建模,进一步提高预测性能。

    一种基于频繁序列的高铁大风预警方法

    公开(公告)号:CN111291943B

    公开(公告)日:2022-03-08

    申请号:CN202010156829.6

    申请日:2020-03-09

    IPC分类号: G06Q10/04 G06Q50/30

    摘要: 本发明公开了一种基于频繁序列的高铁大风预警方法,通过获取预警序列集和非预警序列集,再利用序列模式挖掘算法对符号化的预警序列集和非预警序列集进行挖掘,得到预警频繁序列集和非预警频繁序列集;剔除预警频繁序列集和非预警频繁序列集中前缀组成相同的非最长频繁序列模式,并剔除预警频繁序列中包含有非预警序列特征的子序列,得到预警模式库;将实时风速时间序列与预警模式库的序列进行模式匹配,若匹配成功则发出预警指令。本发明更符合高铁大风报警规则,且提升了高铁大风预警的精度和执行效率。

    基于特征融合增强的数据集缺失值填补方法

    公开(公告)号:CN113468156A

    公开(公告)日:2021-10-01

    申请号:CN202110772157.6

    申请日:2021-07-06

    摘要: 本发明公开了一种基于特征融合增强的数据集缺失值填补方法。首先,设计了一种新型神经网络隐藏层,通过去跟踪神经元与径向基函数神经元从不同维度学习数据特征。去跟踪神经元可以降低自编码器无效恒等映射问题,有效挖掘数据属性间的关联特征;径向基函数神经元的自动聚类能力,可以更好地学习到缺失样本间的共性特征。其次,采用了一种迭代优化的缺失值动态填补策略,缺失值被视为代价函数的变量与模型的参数一起随着优化函数动态变化,在训练期间缺失值的估计误差会随着迭代优化的深入而渐进降低,模型的准确性和填补精度得以持续提升,同时提升模型对不完整数据的学习填补适应能力。

    基于子标签增强的多视角评论质量排序方法

    公开(公告)号:CN118396475A

    公开(公告)日:2024-07-26

    申请号:CN202410662219.1

    申请日:2024-05-27

    摘要: 本发明公开了基于子标签增强的多视角评论质量排序方法,包括获取评论质量排序数据集,生成各视角相似度分数作为各视角训练的子标签;将训练的文本和图像输入编码器中得到文本特征和图像特征;将文本特征和图像特征输入信息交互模块,通过融合不同模态的特征以得到五个视角表征;将各视角表征串联以获得多视角表征,并利用评论质量分数标签和子标签监督与视角表征有关的训练参数的更新;训练完成后,将测试文本和图像通过编码器生成文本特征及图像特征;将文本特征和图像特征通过训练后的信息交互模块生成各视角表征,并将其串联后形成的多视角表征输入四层线性神经网络以得到评论质量预测分数。本发明在评论质量排序任务上的性能显著提升。

    一种上下文感知的对话信息提取系统及方法

    公开(公告)号:CN117933226A

    公开(公告)日:2024-04-26

    申请号:CN202311301516.5

    申请日:2023-10-09

    摘要: 本发明提供了一种上下文感知的对话信息提取系统及方法,属于对话信息提取技术领域。本发明为每种实体类型设置了独立的模型,包括编码器模块和上下文感知增强模块,这使得模型能够更加关注自己所属类型的特征信息,提高了对不同类型实体特征的感知能力;本发明引入了上下文感知增强模块CAEM,能够捕捉多轮对话间的语境关联信息,通过自注意力机制和多层感知机构建上下文全局特征,同时融合上下文增强的特征信息,从而更好地建模上下文信息。本发明解决了现有对话信息提取方法中上下文建模有限、对复杂上下文依赖关系建模能力不足的问题。