一种基于OCR技术的辅助审计方法
    4.
    发明公开

    公开(公告)号:CN112861865A

    公开(公告)日:2021-05-28

    申请号:CN202110127714.9

    申请日:2021-01-29

    摘要: 本发明公开了一种基于OCR技术的辅助审计方法,包括获取待识别的审计文档图像,对审计文档图像进行预处理,得到审计文档图像的预处理图像,对预处理图像进行版面分析,得到预处理图像的多个文本行,采用优化的字符切割方法对多个文本行中的字符串进行切割,得到多个单个字符的切割图像,对多个单个字符的切割图像进行特征提取与识别,得到识别结果,将识别结果进行版面恢复,输出可编辑文档,根据审计工作流程对可编辑文档进行结构化处理,生成审计数据报表并输出。本发明将传统的文字识别方法与审计工作流程相融合,通过对传统的文字识别算法进行优化改进,提高了文字识别的准确率,方便了审计人员的审计工作,提高了工作效率。

    用户画像模型的构建系统
    7.
    发明公开

    公开(公告)号:CN114119057A

    公开(公告)日:2022-03-01

    申请号:CN202110914043.0

    申请日:2021-08-10

    摘要: 本发明公开了一种用户画像模型的构建系统,包括数据采集模块,用于利用词袋模型获取待分析用户的历史数据;特征构建模块,用于基于历史数据构建用户特征库;特征提取模块,用于对用户特征库进行特征提取,得到用户关键特征子库;特征选择模块,用于对用户关键特征子库进行降维,并确定其索引标签,生成用户画像标签库;模型确定模块,用于基于神经网络算法对用户画像标签库进行训练;根据多个时间区间的训练数据的权重值对每一时间区间的训练数据的索引标签进行训练,得到用户画像模型。本发明通过在多个数据维度对特殊领域用户进行画像,构建可标签化模型,对于异构数据源可以快速形成立体化智能画像生成模型,识别异常用户。

    一种基于OCR技术的辅助审计方法

    公开(公告)号:CN112861865B

    公开(公告)日:2024-03-29

    申请号:CN202110127714.9

    申请日:2021-01-29

    摘要: 本发明公开了一种基于OCR技术的辅助审计方法,包括获取待识别的审计文档图像,对审计文档图像进行预处理,得到审计文档图像的预处理图像,对预处理图像进行版面分析,得到预处理图像的多个文本行,采用优化的字符切割方法对多个文本行中的字符串进行切割,得到多个单个字符的切割图像,对多个单个字符的切割图像进行特征提取与识别,得到识别结果,将识别结果进行版面恢复,输出可编辑文档,根据审计工作流程对可编辑文档进行结构化处理,生成审计数据报表并输出。本发明将传统的文字识别方法与审计工作流程相融合,通过对传统的文字识别算法进行优化改进,提高了文字识别的准确率,方便了审计人员的审计工作,提高了工作效率。