文本处理方法及装置
摘要:
本说明书提供文本处理方法及装置,其中所述文本处理方法包括:获取携带有多音字标识的初始文本,初始文本中包含至少一个多音字;确定初始文本对应的第i个拼音序列,并根据多音字标识和初始文本构建至少一个包含多音字的元词组,其中i从1取值且i为正整数;根据第i个拼音序列确定元词组的词组拼音序列,并将词组拼音序列输入至文本生成模块处理,获得词组拼音序列对应的参考词组;在元词组和参考词组不一致的情况下,i自增1,并执行确定初始文本对应的第i个拼音序列步骤;在元词组和参考词组一致的情况下,基于多音字标识、初始文本和第i个拼音序列创建文本拼音组,并写入多音字文本库。
公开/授权文献
0/0