一种基于文本字符特征的文本数据归属描述及生成方法
摘要:
本申请公开了一种基于文本字符特征的文本数据归属描述及生成方法,包括:获取待处理的文本数据,并对所述文本数据进行分解,得到若干个字符,并基于所述字符对所述文本数据进行特征空间表示;根据所述文本数据的特征空间表示,通过所述字符的水平位置和不同所述字符之间的关联对所述文本数据进行特征存储;根据所述文本数据的特征存储结果,生成文本数据归属。本申请能够通过特征空间的量化矩阵有效生成文本数据归属,有助于解决文本的自动生成及归属管理问题,丰富以中文为主的自然语言处理的基础理论和算法,为解决数据安全问题提供了一种新的思路,进而为未来文本大数据的科学管理提供理论和技术支持。
0/0