-
公开(公告)号:CN115048496A
公开(公告)日:2022-09-13
申请号:CN202210479506.X
申请日:2022-05-05
Applicant: 北京邮电大学
IPC: G06F16/332 , G06F16/33
Abstract: 本发明公开了一种面向虚拟数字人交互的基于文本片段的主题挖掘方法,包括:对文本数据进行处理,得到词串序列;基于词串序列构建文本片段序列;统计文本片段序列中的文本片段的词共现模式,构建词‑词共现矩阵;对词‑词共现矩阵进行归一化处理,得到词‑词相关度矩阵S;将词‑词相关度矩阵S分解成词语‑主题矩阵和它的转置之间的乘积。本申请的主题挖掘方法将重点从文档转换到局部上下文环境的文本片段能够带来更多语义相关的主题信息,同时也减少了错误的语义信息;另外,利用文本片段而不是文档能够用一种统一的方式来处理各式各样的文本,无论是长文本数据集、短文本数据集,还是单个的文档(比如说一部小说)。
-
公开(公告)号:CN116050481A
公开(公告)日:2023-05-02
申请号:CN202211740313.1
申请日:2022-12-29
Applicant: 北京邮电大学
IPC: G06N3/0475 , G06N3/0455 , G06N3/0895 , G06N3/096 , G06F18/25 , G06T11/00
Abstract: 本发明提供了一种基于对比学习的图像生成方法、装置、设备及介质,所述方法包括:将准备好的图文数据对构建为图文数据集,图文数据对为图文之间呈关联关系的图文数据,利用图文数据集对预先基于对比学习构建的图像生成模型进行训练,以得到训练后的图像生成模型,图像生成模型中包含用于对图文特征进行对齐的对齐模块以及用于对图文特征进行融合生成的生成模块,当获取到待处理的文本数据,则利用训练后的图像生成模型生成与待处理文本数据对应的图像。本方法在图文特征融合生成之前,先使用对比学习对图文特征进行对齐,使生成的图像更加具有多样性,且模型简单易于训练,容易落地实施。
-
公开(公告)号:CN119479646A
公开(公告)日:2025-02-18
申请号:CN202411591268.7
申请日:2024-11-08
Applicant: 北京邮电大学
Abstract: 本发明涉及语音识别技术领域,公开了一种基于BERT预训练语言模型的语音指令识别方法,该方法包括:接收待识别语音,并通过自动语音识别模型将待识别语音转化为文本序列;微调BERT预训练语言模型,并利用微调后的BERT预训练语言模型对文本序列进行文本分类,得到待识别语音对应的指令类别;利用知识蒸馏对微调后的BERT预训练语言模型进行模型压缩,得到序列分类模型;利用序列分类模型对文本序列进行特征提取,得到待识别语音对应的指令类别标签,本发明考虑到音频数据较文本数据更难获取的情况,选用BERT预训练语言模型,提高分类准确性,利用知识蒸馏进行模型压缩,识别到待识别语音指令类别标签,为人机交互提供数据支撑。
-
-