-
公开(公告)号:CN118627494A
公开(公告)日:2024-09-10
申请号:CN202410725181.8
申请日:2024-06-05
Applicant: 福州大学
IPC: G06F40/232 , G06V30/19 , G06F40/126 , G06N3/0442 , G06N3/0455
Abstract: 本发明提供一种基于多种模态信息的中文拼写纠错方法,使用文本的语义信息、汉字的发音信息和字形信息,在发音信息中融入了拼音字母在键盘上的坐标信息,使得模型能够感知拼音字母在键盘上的位置信息,以提升模型对于拼音输入的错误文本的纠错性能;在字形信息中融入的每个汉字的图像,提升模型对于手写输入的错误文本的纠错性能。最后,通过特征融合的模块,将多种模态的信息选择性地进行融合,使模型能够处理不同输入方式产生的错误。
-
公开(公告)号:CN118427351A
公开(公告)日:2024-08-02
申请号:CN202410644687.6
申请日:2024-05-23
Applicant: 福州大学
IPC: G06F16/35 , G06F16/31 , G06F18/2413 , G06F18/23213
Abstract: 本发明提供一种基于提示学习的小样本持续关系抽取方法,通过在原始句子中添加预设的提示模板,将关系抽取任务转换成掩码语言模型任务,以此充分发挥预训练语言模型的能力。在训练阶段使用有监督的对比学习方法,使模型能够获取嵌入空间中更有区分度的嵌入表示。接着使用一个基于内存的重放机制来缓解持续学习中灾难性遗忘的问题。最后在预测阶段使用了最近邻类均值(Nearest‑Class‑Mean NCM)分类器来进行关系预测。
-
公开(公告)号:CN116881790A
公开(公告)日:2023-10-13
申请号:CN202310864457.6
申请日:2023-07-14
Applicant: 福州大学
IPC: G06F18/241 , G06F18/214 , G06N3/0895 , G06F18/22
Abstract: 本发明的目的在于提供一种基于交并比度量的异构图对比学习分类方法,首先对节点特征进行预处理;其次,通过基于注意力的一阶邻域信息感知模块,利用节点表示和关系表示计算一阶邻居的注意力得分,加权聚合邻域信息,使得模型具备感知一阶邻域信息的能力;然后,通过基于交并比度量的的高阶邻域信息感知模块,使用计算一阶邻居集合交并比的方式选择节点的正样本,使模型具备感知高阶邻域信息的能力。
-
公开(公告)号:CN102801430A
公开(公告)日:2012-11-28
申请号:CN201210291968.5
申请日:2012-08-16
Applicant: 福州大学
Abstract: 本发明涉及URL编码技术领域,特别是一种URL中文参数压缩算法,按如下步骤进行中文编码:把汉字Unicode值的二进制表示划分成长度分别为6位、6位、4位的三块,然后将汉字Unicode值左移两位,把汉字Unicode值的二进制表示分成长度分别为6位、6位、6位的三块;当第二块的二进制值为111110或111111时,将第二块前五位的任意一位与第三块的末位交换;当第一块的二进制值为111110时,将第一块后两位交换;将经过上述处理的汉字二进制编码进行Base64编码,实现URL中文参数的压缩。该算法压缩效果好,有利于减小URL的中文参数的编码长度。
-
-
-