- 专利标题: 一种基于文本字符特征的文本数据归属描述及生成方法
-
申请号: CN202111041957.7申请日: 2021-09-07
-
公开(公告)号: CN113761231B公开(公告)日: 2022-07-12
- 发明人: 栗青生 , 张丽 , 罗志强 , 王雪梅 , 张莉 , 陶贵丽 , 陈莉 , 郑珺 , 殷伟凤 , 裘姝平
- 申请人: 浙江传媒学院 , 浙江传媒学院桐乡研究院有限公司
- 申请人地址: 浙江省杭州市钱塘新区学源街998号;
- 专利权人: 浙江传媒学院,浙江传媒学院桐乡研究院有限公司
- 当前专利权人: 浙江传媒学院,浙江传媒学院桐乡研究院有限公司
- 当前专利权人地址: 浙江省杭州市钱塘新区学源街998号;
- 代理机构: 北京东方盛凡知识产权代理事务所
- 代理商 李娜
- 主分类号: G06F16/387
- IPC分类号: G06F16/387 ; G06F16/383
摘要:
本申请公开了一种基于文本字符特征的文本数据归属描述及生成方法,包括:获取待处理的文本数据,并对所述文本数据进行分解,得到若干个字符,并基于所述字符对所述文本数据进行特征空间表示;根据所述文本数据的特征空间表示,通过所述字符的水平位置和不同所述字符之间的关联对所述文本数据进行特征存储;根据所述文本数据的特征存储结果,生成文本数据归属。本申请能够通过特征空间的量化矩阵有效生成文本数据归属,有助于解决文本的自动生成及归属管理问题,丰富以中文为主的自然语言处理的基础理论和算法,为解决数据安全问题提供了一种新的思路,进而为未来文本大数据的科学管理提供理论和技术支持。
公开/授权文献
- CN113761231A 一种基于文本字符特征的文本数据归属描述及生成方法 公开/授权日:2021-12-07