一种对社交平台上的媒体账号进行画像的方法和系统

    公开(公告)号:CN114077705A

    公开(公告)日:2022-02-22

    申请号:CN202111120139.6

    申请日:2021-09-24

    Abstract: 本发明实施例提供了一种对社交平台上的媒体账号进行画像的方法和系统,该方法包括:获取社交平台的账号信息,识别其中符合第一筛选条件的媒体账号以构建第一集合,采集第一集合内的媒体账号的属性数据和历史贴文数据并存储于数据库,第一筛选条件包括地域条件和媒体类型条件;标注种子媒体账号,根据种子媒体账号从数据库检索符合第二筛选条件的关联媒体账号以共同构建第二集合,第二筛选条件从粉丝数、活跃度、双向信息交流的频次、新闻相关性中的至少一个方面进行筛选;基于第二集合中各个媒体账号的属性数据和历史贴文数据,从多个维度对相应媒体账号进行画像,得到多个维度的指标,并根据多个维度的指标计算媒体价值指数以标识媒体价值。

    一种面向文本的粤语识别模型及系统的训练、识别方法

    公开(公告)号:CN114065749A

    公开(公告)日:2022-02-18

    申请号:CN202111332368.4

    申请日:2021-11-11

    Abstract: 本发明提供了一种面向文本的粤语识别系统的训练方法,所述方法包括:A1、获取粤语和普通话文本语料,对语料所属语种进行人工标注以获得标注数据集,采用改进停用词表过滤标注数据集并进行分词获得训练数据集;A2、利用步骤A1中获得的训练数据集,训练浅层网络至收敛以获得粤语识别模型;A3、构建粤语特色词表,以步骤A1中获得的训练数据集中的语料为输入、以语料是否为粤语的判断结果为输出,基于粤语特色词表构建用于检索语料是否命中粤语特色词表的规则匹配模型;A4、以步骤A1中获得的训练数据集中的语料为输入、以语料是否为繁体中文的判断结果为输出构建简繁识别模型;A5、以粤语识别模型、规则匹配模型和简繁识别模型的输出训练融合模块。

    一种同质关系大图的摘要提取方法及系统

    公开(公告)号:CN113139098A

    公开(公告)日:2021-07-20

    申请号:CN202110308958.7

    申请日:2021-03-23

    Abstract: 本发明提出一种同质关系大图的摘要提取方法及系统,包括:获取待摘要提取的关系图数据作为当前图数据,且该关系图数据为同质关系大图,并将该当前图数据中每个节点均看作超点;根据该当前图数据的邻接矩阵,通过局部敏感哈希对该当前图数据中节点进行分组;从组中随机选择多个超点对,分别计算该超点对若合并后和该关系图数据之间的差距,选择差距最小的超点对进行合并,得到重构图数据;输出该重构图数据作为摘要提取结果。

    面向网页的阅读理解模型的训练方法、装置、存储介质

    公开(公告)号:CN118445392A

    公开(公告)日:2024-08-06

    申请号:CN202410577965.0

    申请日:2024-05-10

    Abstract: 本发明提出一种面向网页的阅读理解模型的训练方法、装置、存储介质,该方法包括:获取网页基于DOM树结构的路径信息,利用该路径信息表征网页的逻辑结构信息表示;获取网页基于网页快照的坐标信息,利用该坐标信息表征网页的空间结构信息表示;获取网页中的提示词,利用该提示词对初始问题文本进行信息增强,得到目标问题文本;将该逻辑结构信息表示与该空间结构信息表示融合,输入到网页阅读理解模型中;以及将该目标问题文本与该网页内容文本拼接,输入到该网页阅读理解模型中,获取答案。该方法提升了模型的网页理解能力,进而提高答案的准确性和相关性。

    基于神经网络表示的神经网络模型后门检测方法及装置

    公开(公告)号:CN118194305A

    公开(公告)日:2024-06-14

    申请号:CN202410459109.5

    申请日:2024-04-16

    Abstract: 本发明提出一种基于神经网络表示的神经网络模型后门检测方法和装置,包括:根据神经网络模型中每个操作单元的操作类型和在计算流图中的位置,提取该神经网络模型的结构特征;根据神经网络模型中每个操作单元的参数矩阵,提取该神经网络模型的参数特征;结合该结构特征和该参数特征,得到该神经网络模型的表示特征;使用该表示特征训练后门检测器,将待后门检测的神经网络模型的表示特征输入训练完成后的后门检测器,得到其是否具有后门的后门检测结果。本发明可应用于图像识别领域,以提高图像分类模型的分类准确性和安全性,避免图像分类模型对特殊图像给出错误图像分类结果。

    人工智能模型的个体公平性度量方法和装置

    公开(公告)号:CN118193995A

    公开(公告)日:2024-06-14

    申请号:CN202410323557.2

    申请日:2024-03-20

    Abstract: 本发明提出一种人工智能模型的个体公平性度量方法,包括:根据人工智能模型的数据的输入数据范围,构建人工智能模型的输入样本集合;从输入样本集合中选择样本构成样本对,计算样本对中两样本间的样本相似性,将样本对中样本分别输入人工智能模型,得到样本对经过人工智能模型处理的结果对,计算结果对中结果间的结果相似性,判断结果相似性和样本相似性的差异绝对值是否低于阈值,若是则为样本对分配代表公平对待的公平性度量结果,否则为样本对分配代表不公平对待的公平性度量结果;重复多次公平性确定步骤,得到公平性报告,公平性报告包含多个样本对及各样本对的公平性度量结果。本发明可揭示和证明人工智能模型算法中存在的个体不公平现象。

    一种基于类别的社交机器人检测方法及检测系统

    公开(公告)号:CN118014752A

    公开(公告)日:2024-05-10

    申请号:CN202410245083.4

    申请日:2024-03-04

    Abstract: 本发明提供一种基于类别的社交机器人检测方法及检测系统,该检测方法包括以下步骤:依据行为模式和目的将社交机器人分成n个类别,其中n为正整数;基于所述类别构建通用模型加专用模型的集成学习检测框架;获取社交平台的用户数据作为样本,将所述样本输入所述集成学习检测框架并依据一投票模式判定所述样本是否为社交机器人。本发明的检测方法形成了行为模式更加鲜明的社交机器人分类,在将社交机器人归类的同时辅以相应的集成学习检测框架,识别泛化性和准确性均有提升。

Patent Agency Ranking