一种临床试验源数据自动校验方法

    公开(公告)号:CN109102844B

    公开(公告)日:2022-02-15

    申请号:CN201810970722.8

    申请日:2018-08-24

    摘要: 本发明公开一种临床试验源数据自动校验方法,包括步骤:使用CTPN网络模型对获取的临床试验的源数据图像识别,确定文本区域,然后进行文本区域切割,切出每一行文本;对切出每一行文本进行垂直投影列切割,得到每一行文本的有效文本区域;将有效文本区域的集合依次输入经训练的CRNN网络,得到可变长序列识别结果,然后使用正则表达式提取出文本识别结果;对文本识别结果进行纠错,获得纠错结果;依据特征值集合逐一从纠错结果中提取特征值,与数据库中记录的标准特征值比对,对与标准特征值不符的提取的特征值,标志告警状态,形成错误提醒。本发明以CPTN和CRNN为核心进行临床试验源数据图像文字识别,进而实现自动化的数据校验。

    一种临床试验源数据自动校验方法

    公开(公告)号:CN109102844A

    公开(公告)日:2018-12-28

    申请号:CN201810970722.8

    申请日:2018-08-24

    摘要: 本发明公开一种临床试验源数据自动校验方法,包括步骤:使用CTPN网络模型对获取的临床试验的源数据图像识别,确定文本区域,然后进行文本区域切割,切出每一行文本;对切出每一行文本进行垂直投影列切割,得到每一行文本的有效文本区域;将有效文本区域的集合依次输入经训练的CRNN网络,得到可变长序列识别结果,然后使用正则表达式提取出文本识别结果;对文本识别结果进行纠错,获得纠错结果;依据特征值集合逐一从纠错结果中提取特征值,与数据库中记录的标准特征值比对,对与标准特征值不符的提取的特征值,标志告警状态,形成错误提醒。本发明以CPTN和CRNN为核心进行临床试验源数据图像文字识别,进而实现自动化的数据校验。