-
公开(公告)号:CN109102844B
公开(公告)日:2022-02-15
申请号:CN201810970722.8
申请日:2018-08-24
申请人: 北京锐客科技有限公司
IPC分类号: G16H10/00 , G16H70/00 , G06F40/279 , G06N3/04
摘要: 本发明公开一种临床试验源数据自动校验方法,包括步骤:使用CTPN网络模型对获取的临床试验的源数据图像识别,确定文本区域,然后进行文本区域切割,切出每一行文本;对切出每一行文本进行垂直投影列切割,得到每一行文本的有效文本区域;将有效文本区域的集合依次输入经训练的CRNN网络,得到可变长序列识别结果,然后使用正则表达式提取出文本识别结果;对文本识别结果进行纠错,获得纠错结果;依据特征值集合逐一从纠错结果中提取特征值,与数据库中记录的标准特征值比对,对与标准特征值不符的提取的特征值,标志告警状态,形成错误提醒。本发明以CPTN和CRNN为核心进行临床试验源数据图像文字识别,进而实现自动化的数据校验。
-
公开(公告)号:CN109102844A
公开(公告)日:2018-12-28
申请号:CN201810970722.8
申请日:2018-08-24
申请人: 北京锐客科技有限公司
摘要: 本发明公开一种临床试验源数据自动校验方法,包括步骤:使用CTPN网络模型对获取的临床试验的源数据图像识别,确定文本区域,然后进行文本区域切割,切出每一行文本;对切出每一行文本进行垂直投影列切割,得到每一行文本的有效文本区域;将有效文本区域的集合依次输入经训练的CRNN网络,得到可变长序列识别结果,然后使用正则表达式提取出文本识别结果;对文本识别结果进行纠错,获得纠错结果;依据特征值集合逐一从纠错结果中提取特征值,与数据库中记录的标准特征值比对,对与标准特征值不符的提取的特征值,标志告警状态,形成错误提醒。本发明以CPTN和CRNN为核心进行临床试验源数据图像文字识别,进而实现自动化的数据校验。
-