-
公开(公告)号:WO2014073941A1
公开(公告)日:2014-05-15
申请号:PCT/KR2013/010248
申请日:2013-11-12
Applicant: 한국과학기술정보연구원
IPC: G06F17/21
CPC classification number: G06F17/2264 , G06F17/2247 , G06F17/227 , G06F17/243
Abstract: 본 발명은 전자 서식 변환 방법 및 장치가 개시되어 있다. 이러한 본 발명에 따르면, 변환 요청된 PDF 문서 파일의 표준 오퍼레이션에 따라 요청된 PDF 문서 파일의 표를 분석하고 분석된 표를 미리 정의된 기준 정보를 기준으로 표준 문서로 변환하여 표를 텍스트 대신 셀 범위 정보의 이미지로 추출한 후, 변환된 PDF 문서의 표에 대응되는 셀 범위 정보를 포함하는 표준 문서를 XML 서신 변환 포맷에 따라 XML 문서로 변환한 후 변환된 XML 문서를 이미 정의된 XML 기준 정보 및 XML 스키마에 따라 XML 구조화하여 제공함에 따라, PDF 문서 파일을 XML 문서 파일로 정확하게 변환하여 제공하여 문서의 서식 변환 품질을 근본적으로 향상시킬 수 있게 된다.
Abstract translation: 本发明公开了一种转换电子表格的方法和装置。 根据本发明的方法和装置根据请求转换的PDF文件文件的标准操作来分析被请求转换的PDF文件文件的表格,基于预定义的参考信息将分析的表格转换成标准文档,因此 为了将表提取为单元格范围信息而不是文本的图像,转换包含与PDF文档的转换表相对应的单元格范围信息的标准文档,基于预定义的XML参考信息对结构化转换的XML文档进行XML结构化; XML模式,并提供XML结构化文档。 因此,可以将PDF文档文件精确地转换成XML文档并提供,从而基本上提高文档格式的转换质量。