一种联合文本分类的多任务命名实体识别方法

    公开(公告)号:CN111209738A

    公开(公告)日:2020-05-29

    申请号:CN201911417834.1

    申请日:2019-12-31

    Applicant: 浙江大学

    Abstract: 本发明公开了一种联合文本分类的多任务命名实体识别方法。该方法包括如下步骤:(1)利用卷积神经网络构造文本分类器,度量文本的相似度;(2)选取合适的阈值,对于辅助任务的数据集,根据文本分类结果与阈值的比较来决定其是否参与共享层参数的更新;(3)将文本的字符向量与预训练好的词向量级联作为输入特征向量;(4)在共享层,利用双向LSTM对句子中每个单词的输入特征向量进行建模,学习各任务的公共特征;(5)在任务层依次训练每个任务,将共享层的输出传入主任务私有层或辅助任务私有层中的双向LSTM神经网络,再利用线性链条件随机场来对整个句子进行标签解码,并标注句子中的实体。本发明在多个生物医学领域的数据集上进行实验,可以有效提升语料难获取、标注成本高的特定领域的命名实体识别效果。

    一种基于多波长的宽筛分颗粒粒度在线测量系统和方法

    公开(公告)号:CN112798479B

    公开(公告)日:2025-04-22

    申请号:CN202110335205.5

    申请日:2021-03-29

    Abstract: 本发明公开一种基于多波长的宽筛分颗粒粒度在线测量系统:激光发生装置,包括三个不同波长的激光器、合束器和光纤准直器,三个不同波长的激光器发出的激光经合束器和光纤准直器后入射到输送带上形成光斑;散射光接收装置,包括透镜、散射光接收分束器和三条接收通道,三条接收通道均包括窄带滤波片和光电倍增管,颗粒经过光斑时发生散射信号,经透镜聚焦后,依次经散射光接收分束器、窄带滤波片和光电倍增管转换为电信号;处理装置,接收电信号并进行处理得到颗粒粒度。本发明还公开了采用上述装置的宽筛分颗粒粒度在线测量方法。该装置及方法基于光散射原理可以实现宽筛分布颗粒粒度的在线原位测量,测量过程无需人工操作,测量结果准确及时。

    一种基于博弈论的增量式异构图聚类方法

    公开(公告)号:CN108399268B

    公开(公告)日:2022-04-29

    申请号:CN201810271526.1

    申请日:2018-03-29

    Abstract: 本发明公开了一种基于博弈论的增量式异构图聚类方法。本发明利用Personalized Pagerank作为统一的距离度量方式;利用增量式计算提高Personalized Pagerank得分的计算效率;基于DBSCAN算法并且利用博弈论的方法对聚类结果进行调整;利用熵以及边权重更新的方式来平衡结构信息和属性信息之间的重要性。本方法使用Personalized Pagerank来度量图结构中任意两个结点之间的相似性,利用增量式计算方式计算结点之间的Personalized Pagerank得分;采用DBSCAN算法得到初步的聚类结果并根据博弈论来对聚类结果进行调整;根据聚类结果计算熵,更新不同类型的边的权重。本发明同时考虑异构图结点的结构相似性和属性相似性,提高了Personalized Pagerank得分的计算效率并对聚类结果进行优化,提出了一种效率高,聚类质量好的异构图聚类方法。

    一种针对样本集的信息去冗余方法

    公开(公告)号:CN112200255A

    公开(公告)日:2021-01-08

    申请号:CN202011110339.9

    申请日:2020-10-16

    Applicant: 浙江大学

    Abstract: 本发明提供一种针对样本集的信息去冗余方法,所述方法包括:获取待处理样本及对应的可训练标签,得到原始待处理样本集;基于预训练的机器学习模型对每条样本进行特征抽取,得到原始样本集的特征向量集合;输入特征向量集合至可学习的样本选择器模型,对特征向量集合进行样本挑选,根据预设阈值获取有代表性的特征向量子集;获取特征向量子集对应的原始样本作为去除冗余信息后的子样本集合。本发明技术方案,可以对原始样本集合进行高效精简,去除冗余信息而保留有价值信息的样本,可以提升算法在样本集上的训练效率。

    一种基于主题适应与原型编码的少样本视觉故事叙述方法

    公开(公告)号:CN111708904A

    公开(公告)日:2020-09-25

    申请号:CN202010857191.9

    申请日:2020-08-24

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于主题适应与原型编码的少样本视觉故事叙述方法。该方法首先将据集按主题划分,每一轮训练采样一批主题并将每个主题划分为支持集与查询集;对查询集中的样本提取时序视觉语义特征和图像序列特征,结合在支持集中预先提取好的的故事特征和图像序列特征计算原型向量;再将原型向量与图像序列特征结合,进一步解码获得故事性描述文本。整体视觉故事模型进一步通过元学习方法,根据在查询集上计算得到的综合损失来优化模型的初始参数。在推测阶段,模型通过少数样本调整参数,根据新图像序列生成故事文本。本发明结合原型编码及元学习方法,所构建的模型具有快速适应主题的能力,能更好地生成符合图像序列主题的故事性文本描述。

    一种基于Blogel的分布式时态图可达性查询处理方法

    公开(公告)号:CN110377795A

    公开(公告)日:2019-10-25

    申请号:CN201910566655.8

    申请日:2019-06-27

    Abstract: 本发明公开了一种基于Blogel的分布式时态图可达性查询处理方法。本发明提出了三种时态图可达性查询,一为普通时态图可达性查询;二为最短时间间隔查询;三为最早到达时间查询。本发明基于Blogel分布式计算框架,利用时态顶点标签索引TVL,有效组织时态图的时态信息和图拓扑结构;利用批量和并行技术,提升TVL索引的构建效率;利用索引判定方法和剪枝技术,缩小图搜索空间,提升查询效率。本发明先在TVL索引构建阶段为每个顶点计算其可达的规范顶点标签集合Lout和可达此顶点的规范顶点标签集合Lin。而后本发明在查询阶段利用剪枝技术有效地缩减查询搜索空间,依据索引判定方法快速返回查询结果。本发明极大地提高了可达性查询处理效率,提供了最佳的性能。

    一种基于多波长的宽筛分颗粒粒度在线测量系统

    公开(公告)号:CN216247609U

    公开(公告)日:2022-04-08

    申请号:CN202120633724.5

    申请日:2021-03-29

    Abstract: 本实用新型公开一种基于多波长的宽筛分颗粒粒度在线测量系统:激光发生装置,包括三个不同波长的激光器、合束器和光纤准直器,三个不同波长的激光器发出的激光经合束器和光纤准直器后入射到输送带上形成光斑;散射光接收装置,包括透镜、散射光接收分束器和三条接收通道,三条接收通道均包括窄带滤波片和光电倍增管,颗粒经过光斑时发生散射信号,经透镜聚焦后,依次经散射光接收分束器、窄带滤波片和光电倍增管转换为电信号;处理装置,接收电信号并进行处理得到颗粒粒度。该装置基于光散射原理可以实现宽筛分布颗粒粒度的在线原位测量,测量过程无需人工操作,测量结果准确及时。

    一种测量输送带上宽筛分颗粒粒度的测量装置

    公开(公告)号:CN216284812U

    公开(公告)日:2022-04-12

    申请号:CN202120632869.3

    申请日:2021-03-29

    Abstract: 本实用新型公开了一种测量输送带上宽筛分颗粒粒度的测量装置:单光源多光束激光发射系统,包括激光器、光纤分束器和准直扩束器;激光器发射的激光束依次经光纤分束器和准直扩束器限制成直径不同的准直平行光束,照射输送带形成直径不同的多光斑,颗粒经过光斑产生散射光信号;散射光信号采集系统,包括三条采集通道,用于将散射光信号依次经透镜和分束器分开记录在不同光电探测器上,得到散射光强度‑时间图像;散射光信号处理系统,通过对散射光强度‑时间图像进行模式识别和反演,获得颗粒的粒径。该装置基于光散射原理,可以实现宽筛分布颗粒粒度的在线原位测量,测量结果准确及时。

Patent Agency Ranking