-
公开(公告)号:CN119443089A
公开(公告)日:2025-02-14
申请号:CN202510026587.1
申请日:2025-01-08
Applicant: 贵州耕云科技有限公司 , 贵州大学
IPC: G06F40/232 , G06F40/211 , G06F40/186 , G06F40/284 , G06F40/30 , G06N3/0455 , G06N3/0895
Abstract: 本发明涉及自然语言处理技术领域,公开了一种多输入中文拼写纠错方法、系统、电子设备及介质,方法包括:获取不同类型的拼写纠错模型针对同一个待纠错句子输出的纠错结果;根据提示词模板和各个纠错结果组成的候选集合确定提示词;将提示词输入至大语言模型,确定输出结果;根据输出结果确定待纠错句子的正确中文拼写结果。本申请集合了多个不同类型的拼写纠错模型的纠错结果融入到提示词中,作为大语言模型的输入,提高了正确结果在集合中的召回率,另外,本申请通过特定的提示词模板,使得大语言模型不会直接生成纠错的句子,而是生成提示词模板对应的输出结果,从而有效避免大语言模型自由生成的纠错结果与原句存在较大的语义偏差。
-
公开(公告)号:CN110516068B
公开(公告)日:2023-05-26
申请号:CN201910785197.7
申请日:2019-08-23
Applicant: 贵州大学
IPC: G06F16/35
Abstract: 本发明公开了一种基于度量学习的多维度文本聚类方法,它主要包括以下步骤:一从数据集中选取两个维度并进行特征向量化表示;二使用K‑Means聚类方法并结合度量矩阵学习分别对两个维度进行初始化聚类;三判断当前的聚类结果是否达到结束条件,若不满足则设置约束对上限常数执行步骤四,否则结束算法,输出聚类结果辅助下游任务;四利用当前维度的聚类结果挑选满足条件的约束对;五将步骤四所生成的约束集合加入到维度的聚类过程中,调节目标函数和度量矩阵的学习,得到两个维度的聚类结果;六重复迭代步骤三至步骤五。此方法基于度量学习的多维度文本聚类算法综合考虑数据在不同特征空间的表现方式,进行多维度辅助聚类,有较好的聚类效果。
-
公开(公告)号:CN110516068A
公开(公告)日:2019-11-29
申请号:CN201910785197.7
申请日:2019-08-23
Applicant: 贵州大学
IPC: G06F16/35
Abstract: 本发明公开了一种基于度量学习的多维度文本聚类方法,它主要包括以下步骤:一从数据集中选取两个维度并进行特征向量化表示;二使用K-Means聚类方法并结合度量矩阵学习分别对两个维度进行初始化聚类;三判断当前的聚类结果是否达到结束条件,若不满足则设置约束对上限常数执行步骤四,否则结束算法,输出聚类结果辅助下游任务;四利用当前维度的聚类结果挑选满足条件的约束对;五将步骤四所生成的约束集合加入到维度的聚类过程中,调节目标函数和度量矩阵的学习,得到两个维度的聚类结果;六重复迭代步骤三至步骤五。此方法基于度量学习的多维度文本聚类算法综合考虑数据在不同特征空间的表现方式,进行多维度辅助聚类,有较好的聚类效果。
-
-