基于非连续上下文建模和最大熵原则的基因压缩方法
Abstract:
本发明提供一种基于非连续上下文建模和最大熵原则的基因压缩方法,包括:在第一阶段,同时考虑了有参考序列和无参考序列两种实际情况,用字典方法表示基因序列内或间的重复序列,提高压缩效率;第二阶段,所述统计编码器由预测器和算术编码器构成,预测器对于非重复序列,采用在传统的连续型上下文模型的基础上引入非连续比特上下文组合式的建模方案,并利用基于最大熵原则产生的Logistic回归公式合并各个模型单独产生的预测概率,从而得到最终更准确的预测概率值送入算术编码器。该方法能显著提高压缩效率,实现高效存储。
Public/Granted literature
Patent Agency Ranking
0/0