基于无监督聚类的长文本可信度评估方法及系统

    公开(公告)号:CN110287314B

    公开(公告)日:2021-08-06

    申请号:CN201910418900.0

    申请日:2019-05-20

    IPC分类号: G06F16/35

    摘要: 本发明涉及一种基于无监督聚类的长文本可信度评估方法,包括:以已知长文本获取训练数据,提取该训练数据的训练特征以构建训练特征向量集,对该训练特征向量集进行无监督聚类,得到多个训练类心;以待评估长文本获取评估数据,提取该评估数据的评估特征向量;获取该评估特征向量相对该训练类心的评估值,并以该评估值得到该待评估长文本的可信度。本发明通过无监督聚类对长文本进行可信度评估,在实施过程中不需要标注数据,节省了人力、物力与时间,避免了数据中标签稀疏带来的困扰;提取了长文本的文本特征,对于可信度评估任务更加适用,使用该模型得到的文本的可信度更具有可解释性,同时在平台之间可以迁移。

    基于无监督聚类的长文本可信度评估方法及系统

    公开(公告)号:CN110287314A

    公开(公告)日:2019-09-27

    申请号:CN201910418900.0

    申请日:2019-05-20

    IPC分类号: G06F16/35

    摘要: 本发明涉及一种基于无监督聚类的长文本可信度评估方法,包括:以已知长文本获取训练数据,提取该训练数据的训练特征以构建训练特征向量集,对该训练特征向量集进行无监督聚类,得到多个训练类心;以待评估长文本获取评估数据,提取该评估数据的评估特征向量;获取该评估特征向量相对该训练类心的评估值,并以该评估值得到该待评估长文本的可信度。本发明通过无监督聚类对长文本进行可信度评估,在实施过程中不需要标注数据,节省了人力、物力与时间,避免了数据中标签稀疏带来的困扰;提取了长文本的文本特征,对于可信度评估任务更加适用,使用该模型得到的文本的可信度更具有可解释性,同时在平台之间可以迁移。

    基于解耦自增强的细节可控个性化图像生成方法及系统

    公开(公告)号:CN117876522A

    公开(公告)日:2024-04-12

    申请号:CN202410069798.9

    申请日:2024-01-17

    摘要: 本发明提出一种基于解耦自增强的细节可控个性化图像生成方法和系统,包括:获取参考概念图像和文本指令,构造文本指令的属性描述,基于概念图像的概念特征和属性描述,生成多个初始图像并筛选,将筛选后的每张初始图像与其对应的属性描述作为训练样本;为训练样本中初始图像添噪得到噪声图像,将噪声图像和其对应的属性描述送入包括文本编码器的扩散网络,扩散网络根据属性描述,预测噪声图像中所添加的噪声,根据预测结果和真实添加噪声构建损失函数训练扩散网络,得到图像生成模型;将具有目标属性的图像生成文本指令和噪声图像输入图像生成模型,图像生成模型根据图像生成文本指令为噪声图像去噪,得到图像生成文本指令对应的图像生成结果。

    一种长尾目标检测方法与系统

    公开(公告)号:CN111832406A

    公开(公告)日:2020-10-27

    申请号:CN202010508103.4

    申请日:2020-06-05

    IPC分类号: G06K9/00 G06K9/34 G06K9/62

    摘要: 本发明提出的基于平衡分组Softmax的长尾目标检测方法与系统,该方法在网络结构上,改变网络的最后一个全连接层,对拥有不同训练样本数量的类别进行分组,将背景类别单独分为一组,在每组中都加入其它类别;在训练过程中,按照组内普通类别训练样本数量采样一定数量的其它类别样本进行训练,并在每个组内分别用Softmax函数激活并计算交叉熵损失;在测试过程中,在每个组内分别用Softmax函数激活,去掉组内其它类别,仅保留正常类别得分,用背景组的“其它”类别得分为所有正常类别加权,组成最终得分,用于后处理。该发明提升了在大规模长尾目标数据集上的目标检测以及实例分割性能。

    一种车联网服务动态迁移方法

    公开(公告)号:CN110647382A

    公开(公告)日:2020-01-03

    申请号:CN201910885221.4

    申请日:2019-09-19

    IPC分类号: G06F9/455 G06F9/48 G06Q10/06

    摘要: 本发明提供一种车联网服务动态迁移方法,充分考虑移动速度对迁移决策的影响,建立移动速度与服务迁移的好处和成本的关系模型,设计动态的迁移机制,根据车辆的移动速度进行迁移成本和服务QoS的动态均衡。与现有技术相比,本发明根据车辆移动速度进行动态迁移策略设计,有效增加运营商收益且能够更好的保障业务的QoS;充分考虑车辆的移动速度和业务的迁移时间,保障业务被迁移到当迁移完成时距离用户最近的MEC服务器,与现有技术相比,有效增加迁移收益。

    基于风格引导的双线性神经网络虚假新闻检测方法及系统

    公开(公告)号:CN110210016A

    公开(公告)日:2019-09-06

    申请号:CN201910341056.6

    申请日:2019-04-25

    IPC分类号: G06F17/27 G06N3/04 G06N20/00

    摘要: 本发明提出一种基于风格引导的双线性神经网络虚假新闻检测方法及系统,包括:获取待网络虚假新闻检测的新闻文本,通过神经网络量化该新闻文本的语言风格特征,得到该新闻文本的风格向量,将该新闻文本输入文本特征提取器,得到该新闻文本的文本向量;将该风格向量和该文本向量输入双线性神经网络,该双线性神经网络包括双线性函数,用于建模该风格向量和该文本向量之间的相关性,以得到该新闻文本的的风格-文本特征矩阵,使用该风格-文本特征矩阵中最大分数向量组成引导向量,并将该引导向量输入至全连接层,判定该新闻文本的虚假新闻标签。本发明依据虚假新闻共性的语言风格来引导深度学习模型的学习过程,提升了模型的识别准确度与泛化性能。

    一种用户自生产内容检测方法和系统

    公开(公告)号:CN110019812A

    公开(公告)日:2019-07-16

    申请号:CN201810164771.2

    申请日:2018-02-27

    IPC分类号: G06F16/35 G06N3/04 G06Q50/00

    摘要: 本发明涉及一种用户自生产内容检测方法和系统,包括:获取社交媒体中用户自生产内容的文本内容、图像内容和社交属性,并从文本内容中抽取词向量特征,从社交属性中抽取社交属性特征以及从图像内容中抽取图像特征;通过递归神经网络融合词向量特征和社交属性特征,得到文本、社交融合特征;根据递归神经网络得到注意力向量,并通过注意力机制将图像特征处理为注意力融合特征,将注意力融合特征与文本、社交融合特征相融合,生成多模态融合特征;利用多模态融合特征训练分类器,以检测社交媒体中指定的用户自生产内容。本发明通过深度神经网络,融合内容检测涉及的多种模态内容,能够全面地进行用户自生产内容检测,得到更加准确的检测结果。