-
公开(公告)号:CN114021549B
公开(公告)日:2024-10-22
申请号:CN202111202239.3
申请日:2021-10-15
Applicant: 华中科技大学 , 武汉烽火技术服务有限公司
IPC: G06F40/216 , G06F40/295 , G06F40/30 , G06F16/33 , G06N3/0464 , G06N3/08 , G06N3/044
Abstract: 本发明公开了一种基于词汇增强和多特征的中文命名实体识别方法及装置,属于信息抽取技术领域,方法包括:结合双向长短期记忆网络和卷积神经网络提取输入序列的字符特征、通过字符串模式匹配的方式引入字符对应的词汇信息并以词频加权平均的方式提取词汇特征以及使用预训练模型提取预训练特征;使用门控机制来控制词汇特征对字符特征的词汇增强;线性拼接经过词汇增强后的字符特征和预训练特征以构建多特征;基于多特征的上下文相关性以获取上下文特征;标签解码结合上下文特征预测输入序列最佳标签序列。从而使得,提取中文序列的字符特征更充分;提取的词汇特征更丰富且避免了中文分词误差的影响;使用多特征结合的策略模式提高了实体识别指标。
-
公开(公告)号:CN114021549A
公开(公告)日:2022-02-08
申请号:CN202111202239.3
申请日:2021-10-15
Applicant: 华中科技大学 , 武汉烽火技术服务有限公司
IPC: G06F40/216 , G06F40/295 , G06F40/30 , G06F16/33 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于词汇增强和多特征的中文命名实体识别方法及装置,属于信息抽取技术领域,方法包括:结合双向长短期记忆网络和卷积神经网络提取输入序列的字符特征、通过字符串模式匹配的方式引入字符对应的词汇信息并以词频加权平均的方式提取词汇特征以及使用预训练模型提取预训练特征;使用门控机制来控制词汇特征对字符特征的词汇增强;线性拼接经过词汇增强后的字符特征和预训练特征以构建多特征;基于多特征的上下文相关性以获取上下文特征;标签解码结合上下文特征预测输入序列最佳标签序列。从而使得,提取中文序列的字符特征更充分;提取的词汇特征更丰富且避免了中文分词误差的影响;使用多特征结合的策略模式提高了实体识别指标。
-
公开(公告)号:CN104714029A
公开(公告)日:2015-06-17
申请号:CN201510097429.1
申请日:2015-03-04
Applicant: 华中科技大学
IPC: G01N33/68
CPC classification number: G01N33/6896
Abstract: 本发明提供了糖尿病患者认知障碍的新型血清学标志物-GSK3β的检测方法,包括酶活性测定方法和相对定量的斑点印迹方法。酶活性检测是应用GENMED的GSK-3β激酶活性检测试剂盒,利用在GSK-3α抑制下GSK-3β磷酸化,进而由丙酮酸激酶和乳酸脱氢酶连续循环法反应系统,伴随着还原型烟酰胺腺嘌呤二核苷酸(NADH)的氧化反应,采用光度法测定其氧化后峰值的变化来反映样品中GSK3β活性。Dot-blot方法是依据抗原、抗体结合反应原理,将血小板蛋白质转移到NC膜上,然后利用抗体进行检测的方法。研究对患者血液中GSK-3β蛋白及酶活性表达的检测方法,可望成为AD早期诊断的血清学标志物。
-
公开(公告)号:CN112395879A
公开(公告)日:2021-02-23
申请号:CN202011244352.3
申请日:2020-11-10
Applicant: 华中科技大学
IPC: G06F40/295 , G06N3/04
Abstract: 本发明属于文本关键信息抽取领域,具体为一种科技文本命名实体识别方法,包括:采用实体识别标注模型对目标领域科技文本进行实体识别标注;其中该模型训练方法为:将目标领域的标注样本和源领域的部分样本输入源领域标注模型,分别得到目标领域和源领域的深层特征向量,计算该两个向量间的MMD;基于MMD调整源领域标注模型参数;采用新的源领域标注模型为目标领域每个未标注样本预测伪标签,将目标领域的标注样本和带伪标签的样本按比例混合并输入新的源领域标注模型,再次计算MMD,重复上述直至MMD最小,得到实体识别标注模型。本发明是面向多领域、多范围文本的基于迁移学习的命名实体识别,有效解决深度学习对特定领域少量数据学习能力不足的问题。
-
公开(公告)号:CN104698188A
公开(公告)日:2015-06-10
申请号:CN201510095987.4
申请日:2015-03-04
Applicant: 华中科技大学
IPC: G01N33/68
CPC classification number: G01N33/6893 , G01N2800/042 , G01N2800/2814
Abstract: 本发明提供了检测人血小板GSK-3β蛋白活性的斑点印迹方法。该斑点印迹方法是将血小板蛋白质配置成统一浓度,样品点于NC膜上,晾干,5%脱脂奶粉封闭,然后分别加入1:1000GSK-3β和Ser9-GSK-3β的一抗,洗脱后加Licor公司标记IRDyeT 800通道的1:10000荧光二抗,洗脱后荧光扫描。该方法依据抗原、抗体结合反应原理,对GSK-3β蛋白活性进行简单快速的定量分析,可用于老年性痴呆的诊断和预防。
-
公开(公告)号:CN112148916B
公开(公告)日:2024-12-13
申请号:CN202011044741.1
申请日:2020-09-28
Applicant: 华中科技大学
IPC: G06F16/583 , G06F16/538 , G06V10/74 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/09
Abstract: 本发明公开了一种基于监督的跨模态检索方法、装置、设备及介质,方法包括:对图像模态和文本模态的训练样本数据进行特征提取;将提取的图像数据特征和文本数据特征映射至公共表示空间;分别计算标签空间的损失、公共表示空间中各个模态内和不同模态间的损失、以及图像和文本模态间的不变性损失,并加以不同的权重,得到检索模型的损失函数;通过最小化损失函数来优化检索模型的参数;将目标检索数据利用优化后的检索模型映射到公共表示空间,计算目标检索数据与图文数据集中数据之间的相似度,得到对应的检索排序结果。如此,保留了不同语义数据样本的判别性以及原始数据的语义信息,能更有效地计算跨模态数据间的相关性,具有更高的检索准确率。
-
公开(公告)号:CN112148916A
公开(公告)日:2020-12-29
申请号:CN202011044741.1
申请日:2020-09-28
Applicant: 华中科技大学
IPC: G06F16/583 , G06F16/538 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于监督的跨模态检索方法、装置、设备及介质,方法包括:对图像模态和文本模态的训练样本数据进行特征提取;将提取的图像数据特征和文本数据特征映射至公共表示空间;分别计算标签空间的损失、公共表示空间中各个模态内和不同模态间的损失、以及图像和文本模态间的不变性损失,并加以不同的权重,得到检索模型的损失函数;通过最小化损失函数来优化检索模型的参数;将目标检索数据利用优化后的检索模型映射到公共表示空间,计算目标检索数据与图文数据集中数据之间的相似度,得到对应的检索排序结果。如此,保留了不同语义数据样本的判别性以及原始数据的语义信息,能更有效地计算跨模态数据间的相关性,具有更高的检索准确率。
-
-
-
-
-
-