基于深度学习的基因检测报告信息识别方法、系统及设备
摘要:
本发明提供一种基于深度学习的基因检测报告信息识别方法、系统及设备,包括:获取基因检测报告并处理为目标图片格式文件;通过OCR文字识别技术提取目标图片格式文件中每个页面的文本信息数据,对其进行基因测序信息识别以得到包含基因测序信息的基因测序信息页;对其进行表格提取,并对提取到的所有表格进行分类识别以得到包含基因测序信息的基因测序信息表格;对其进行表头识别,根据预设标准表头信息在基因测序信息表格中提取相关基因测序信息并进行结构化处理,以得到基因测序信息的结构化内容。本申请使用人工智能技术以获取遗传性肿瘤的基因检测报告的信息结构化和规范化格式输出,减少临床医生负担以及知识背景差异导致的信息理解偏差。
0/0