基于无监督聚类的长文本可信度评估方法及系统

    公开(公告)号:CN110287314B

    公开(公告)日:2021-08-06

    申请号:CN201910418900.0

    申请日:2019-05-20

    IPC分类号: G06F16/35

    摘要: 本发明涉及一种基于无监督聚类的长文本可信度评估方法,包括:以已知长文本获取训练数据,提取该训练数据的训练特征以构建训练特征向量集,对该训练特征向量集进行无监督聚类,得到多个训练类心;以待评估长文本获取评估数据,提取该评估数据的评估特征向量;获取该评估特征向量相对该训练类心的评估值,并以该评估值得到该待评估长文本的可信度。本发明通过无监督聚类对长文本进行可信度评估,在实施过程中不需要标注数据,节省了人力、物力与时间,避免了数据中标签稀疏带来的困扰;提取了长文本的文本特征,对于可信度评估任务更加适用,使用该模型得到的文本的可信度更具有可解释性,同时在平台之间可以迁移。

    基于无监督聚类的长文本可信度评估方法及系统

    公开(公告)号:CN110287314A

    公开(公告)日:2019-09-27

    申请号:CN201910418900.0

    申请日:2019-05-20

    IPC分类号: G06F16/35

    摘要: 本发明涉及一种基于无监督聚类的长文本可信度评估方法,包括:以已知长文本获取训练数据,提取该训练数据的训练特征以构建训练特征向量集,对该训练特征向量集进行无监督聚类,得到多个训练类心;以待评估长文本获取评估数据,提取该评估数据的评估特征向量;获取该评估特征向量相对该训练类心的评估值,并以该评估值得到该待评估长文本的可信度。本发明通过无监督聚类对长文本进行可信度评估,在实施过程中不需要标注数据,节省了人力、物力与时间,避免了数据中标签稀疏带来的困扰;提取了长文本的文本特征,对于可信度评估任务更加适用,使用该模型得到的文本的可信度更具有可解释性,同时在平台之间可以迁移。

    一种社交平台的早期争议性消息检测方法及系统

    公开(公告)号:CN111694955B

    公开(公告)日:2023-09-12

    申请号:CN202010382894.0

    申请日:2020-05-08

    IPC分类号: G06F16/35 G06Q50/00

    摘要: 本发明提出一种社交平台的早期争议性消息检测方法及系统,包括:收集社交平台中关于预设话题下的所有消息,并根据每一条消息的评论信息为每一条消息的争议性进行标记,提取标记后消息的多维度争议性特征作为训练数据,以该训练数据训练梯度提升树模型,得到争议性消息检测模型;从该社交平台获取待发表的消息作为待检测消息,并将该待检测消息的多维度争议性特征输入至该争议性消息检测模型,得到该待检测消息的争议性消息检测结果。本发明可得到社交平台中待审核发表消息的争议性。

    基于面部划分的人脸深度伪造检测方法及系统

    公开(公告)号:CN113537027B

    公开(公告)日:2023-09-01

    申请号:CN202110776853.4

    申请日:2021-07-09

    摘要: 本发明提出一种基于面部划分的人脸深度伪造检测方法和系统,包括:对训练数据,提取全局人脸特征;根据获取全局人脸特征过程中产生的浅层卷积特征,将该浅层卷积特征根据预设的面部划分方式,划分为多个图像区域,分别将该图像区域输入至局部人脸特征提取模型,得到该人脸图像的多个局部特征;通过注意力模型提取该多个局部特征间的关系特征,并将该关系特征与该全局特征拼接后输入至二分类模型,得到该训练数据的检测结果,根据该结果和该标签构建损失函数,以训练该全局人脸特征提取模型、局部人脸特征提取模型、注意力模型和该二分类模型。

    图像增强方法、真伪商品鉴别方法及设备

    公开(公告)号:CN112699726B

    公开(公告)日:2023-04-07

    申请号:CN202011251301.3

    申请日:2020-11-11

    摘要: 本发明涉及一种图像增强方法、真伪商品鉴别方法及设备。本发明的目的是提供一种图像增强方法、真伪商品鉴别方法及设备,以避免数据集有偏导致分类模型过拟合到无关因子。本发明的技术方案是:一种图像增强方法,其特征在于:S01、对于具体的图像分类任务分析其中分类无关的有偏因子,控制有偏因子对应的属性为唯一变量,摄取图像作为源域数据集;S02、通过GAN网络结构训练有偏因子对应属性迁移模型,学习一个生成器G,x’=G(x,a);S03、在目标数据集上,应用经训练的生成器G扩充样本,对于目标数据集上的每一个样本,通过遍历有偏因子对应属性所有的取值a,得到无偏的生成样本。本发明适用于计算机视觉领域。