检错模型训练方法、医学影像报告检测方法、系统及设备

    公开(公告)号:CN116258136A

    公开(公告)日:2023-06-13

    申请号:CN202310144833.4

    申请日:2023-02-14

    摘要: 本申请提供了一种检错模型训练方法、医学影像报告检测方法、系统及设备。训练方法包括:确定基于医学影像报告的多个第一样本文本训练得到的第一识别模型;获取医学影像报告的多个第二样本文本,第二样本文本包括的至少一个样本语句中带第一标签的样本语句为含错误词的错误样本语句;基于至少一个样本语句,训练第一识别模型以得到第二识别模型;在训练第一识别模型过程中,若监测到第一识别模型无法识别至少一个样本语句中的第一错误样本语句,则将第一错误样本语句发送至用户,由用户确定第一错误样本语句中的第一错误词并添加至检错规则集;根据第二识别模型及检错规则集,确定检错模型。本方案能以低训练成本来训练得到性能较优的检错模型。

    基于医疗大模型的报告生成方法、系统、终端及存储介质

    公开(公告)号:CN118824456A

    公开(公告)日:2024-10-22

    申请号:CN202410830633.9

    申请日:2024-06-25

    摘要: 本发明提供了一种基于医疗大模型的报告生成方法、系统、终端及存储介质,该方法包括:将异常所见样本与报告模板进行数据对齐,得到模型样本;根据模型样本对医疗大模型进行模型训练,直至医疗大模型收敛,将影像异常所见和目标报告模板输入收敛后的医疗大模型进行特征映射,得到映射内容,根据映射内容确定映射关联关系,根据映射关联关系对目标报告模板进行内容修正,得到影像报告。本发明实施例,基于映射内容能有效地确定影像异常所见与对应映射文本之间的映射关联关系,基于映射关联关系能有效地对目标报告模板进行内容修正,以达到自动生成影像报告的效果,无需采用人工的方式进行影像报告模板内容的填写,提高了影像报告生成的准确性。

    中文分词方法、装置及设备
    5.
    发明公开

    公开(公告)号:CN116205223A

    公开(公告)日:2023-06-02

    申请号:CN202211728809.7

    申请日:2022-12-30

    摘要: 本发明实施例提供一种中文分词方法、装置及设备,该方法包括:获取待分词的DR报告;对DR报告中的文本进行字嵌入处理,获得文本中每个字所对应的字向量;确定文本中各个字向量之间的关联关系;基于关联关系,对文本进行分词处理,获得多个分词标签以及多个分词标签各自对应的概率;根据多个分词标签以及多个分词标签各自对应的概率,确定待分词的DR报告的分词结果。在上述方案中,通过DR报告中各个字向量之间的关联关系,对DR报告中的文本进行多种形式的分词,获得多个分词标签以及多个分词标签各自对应的概率,并基于多个分词标签以及多个分词标签各自对应的概率,确定待分词的DR报告的最终分词结果,实现了对DR报告的精准分词。

    文章生成方法、设备和存储介质
    6.
    发明公开

    公开(公告)号:CN118627472A

    公开(公告)日:2024-09-10

    申请号:CN202410558866.8

    申请日:2024-05-07

    IPC分类号: G06F40/166 G06N20/00

    摘要: 本发明提供一种文章生成方法、设备和存储介质,该方法包括:获取待处理文章;从文章数据库中选择出与所述待处理文章相似度符合要求的参考文章;确定所述参考文章的文章热度值;根据所述参考文章和所述文章热度值,对预训练语言模型进行微调,以获得文章生成模型;利用所述文章生成模型,对所述待处理文章进行处理,生成与所述待处理文章相对应的目标文章。在上述方案中,通过从文章数据库中选择出与待处理文章相似度符合要求的参考文章,并利用参考文章和参考文章的文章热度值,有针对性地优化预训练语言模型,以生成更适用于对待处理文章进行处理的文章生成模型,进而利用文章生成模型生成更符合当前时代潮流且具有所属领域特点的目标文章。