基于PDF文档碎片化的行业动态交互式报告生成方法及系统
摘要:
本发明公开了一种基于PDF文档碎片化的动态交互式报告生成方法,它包括如下步骤:建立行业动态交互式报告的目录结构,并用于报告的导航;遴选可靠的信息资源,采集其元数据及PDF全文文档,整合存储到创建好的数据库中;对PDF全文文档进行碎片化加工,并以XML格式在数据库中进行结构化存储;针对碎片化加工后的细颗粒信息单元,采用基于机器学习的文本自动分类方法行业信息分类体系,对碎片化信息单元进行分类标注,再形成的行业报告目录进行碎片化信息的动态重组,最终形成行业动态交互式报告。其优点是:可实现有针对性的阅读,提升信息输入的效率;能够一键生成定制化报告,进行多维度检索查询,提高查找资料或素材的效率。
0/0