一种大数据中文文本无载体信息隐藏方法
Abstract:
本发明公开了一种大数据中文文本无载体信息隐藏方法,首先,对大数据中文文本进行预处理,主要包括对文本的分词、计算分词后词语的词频及TF-IDF特征信息、对文本进行LDA主题模型聚类。然后,发送方对秘密信息进行切分,然后通过词语索引表转换为关键词ID,并在大数据文本中搜索包含秘密信息关键词的文本。其次,将搜索到的文本根据对应文本的主题分布和对应文本中的关键词的TF-IDF特征作为索引标签,同时引入随机数控制秘密信息关键词顺序,最后将随机数与索引一起作为标签加密发送给接收方。实验表明,该方法在提升隐藏容量的同时,提高了秘密信息的隐蔽性与安全性。
Public/Granted literature
Patent Agency Ranking
0/0