一种唇音同步视频生成方法、装置、设备及介质

    公开(公告)号:CN117612551A

    公开(公告)日:2024-02-27

    申请号:CN202311518780.4

    申请日:2023-11-15

    发明人: 刘莉 李林 戴彬

    摘要: 本发明提供了一种唇音同步视频生成方法、装置、设备及介质,涉及唇音同步视频生成技术领域,主要贡献包括两个方面:第一采用尺度不变人脸检测器(single shot scale‑invariant face detector,S3FD)算法清除数据集的噪声数据,显著减少唇音同步模型的收敛时间,也对唇形同步准确性有一定改善;第二,提出使用残差网络(residual network,resNet)算法识别数据集中人物的性别和年龄,生成分类人物的唇音同步子模型,在确保整体模型泛化能力的前提下,提高了生成的唇形图像质量。

    一种表情的识别方法、装置、设备及可读存储介质

    公开(公告)号:CN116189256A

    公开(公告)日:2023-05-30

    申请号:CN202211692316.2

    申请日:2022-12-28

    摘要: 本发明提供了一种表情的识别方法、装置、设备及可读存储介质,包括:获取待识别图像,并将所述待识别图像发送至训练好的双链式网络模型进行特征提取;其中,所述双链式网络模型第一通道第n层能够对第一通道第(n‑1)层和第二通道第(n‑1)层的叠加特征进行提取,其中,n>1;接收双链式网络模型第一通道最后一层输出的表情特征,并基于softmax分类器对所述表情特征进行分类,以完成表情识别,解决了用于识别表情的模型复杂度越来越高,导致边缘端设备不好被部署的问题。

    基于深度网络的图像分类模型和图片分类方法

    公开(公告)号:CN116152549A

    公开(公告)日:2023-05-23

    申请号:CN202211648328.5

    申请日:2022-12-21

    发明人: 戴彬 李祥 李林

    摘要: 本发明实施例提供基于深度网络的图像分类模型和图片分类方法,涉及图像分类技术领域。图片分类方法包含S1获取待分类图片。S2将待分类图片输入由基于深度网络的图像分类模型经过训练得到图片分类模型。S3获取图片的分类。基于深度网络的图像分类模型包括第一卷积层、第一激活层、第一池化层、第二卷积层、第二激活层、第三卷积层、第三激活层、第二池化层、第四卷积层、第四激活层、第五卷积层、第五激活层、第六卷积层、第六激活层、第三池化层、第一随机失活层、第一全连接层、第七激活层、第二随机失活层、第二全连接层、第八激活层、第三全连接层、归一化层。第一卷积层用以对输入图像进行特征提取。归一化层用以输出图像属于分类类目的概率。

    基于邻域相似度的医保欺诈识别方法、装置、设备和介质

    公开(公告)号:CN115829760A

    公开(公告)日:2023-03-21

    申请号:CN202211488104.2

    申请日:2022-11-25

    摘要: 本发明实施例提供基于邻域相似度的医保欺诈识别方法、装置、设备和介质,涉及医疗大数据技术领域。医保欺诈识别方法包含S1、根据医疗数据构建医疗异构图。S2、根据各种行为模式的元路径进行采样,获取异构子图。S3、根据异构子图,进行编码获取初始邻域集合。S4、根据初始邻域集合分别计算各个邻域的相似性并进行筛选,获取最终邻域集合。S5、通过第一个注意力机制分别融合最终邻域集合,获取各个患者节点的各个为模式下的嵌入表示。S6、根据嵌入表示,获取各种行为模式的重要性。S7、根据重要性,通过第二个注意力机制融合嵌入表示,获取各个患者节点的最终嵌入表示。S8、对最终嵌入表示进行分类,以判断各个患者节点是否为医保欺诈患者。