-
公开(公告)号:CN119068503A
公开(公告)日:2024-12-03
申请号:CN202411015967.7
申请日:2024-07-26
Applicant: 中国科学院计算技术研究所
IPC: G06V30/412 , G06V30/19 , G06V10/774 , G06V10/82
Abstract: 本发明提出一种文本检测方法、装置、介质,该方法包含:对待测文本进行扰动处理,得到扰动文本;对该扰动文本进行语法树分析,识别文本的若干词语及词语间的语法结构,生成语法树;遍历该语法树,将该语法树中的每一个词语构建为图神经网络训练所需的节点,并将词语间的语法结构编码为邻接矩阵;对该扰动文本进行向量化处理,得到文本的高维向量表示;融合该高维向量表示和该邻接矩阵,通过图卷积神经网络进行训练,以预测该待测文本的类别标签。该方法实现了对扰动后生成文本的高精准度检测,同时使检测方法具有很强的鲁棒性。
-
公开(公告)号:CN119089890A
公开(公告)日:2024-12-06
申请号:CN202410585948.1
申请日:2024-05-13
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种推荐系统评论区的群体极化问题检测方法和装置,包括:对推荐系统指定的评论主帖进行话题观点提取,得到主帖观点;对评论主帖的评论区进行立场检测,得到评论区各条评论相对主帖观点的立场类别;通过提取各条评论的关键词,得到各条评论的立场类别对应的强烈程度;按照评论时间将评论区的评论排序,统计评论初始时间段内各立场类别的评论数量,并根据初始时间段内各条评论的强烈程度,得到各立场类别的平均极化程度,作为基准;持续抽取与初始时间段相同长度但时间靠后的后续时间段,计算后续时间段各立场类别的平均极化程度,并与基准进行对比,得到立场的极化偏离程度,当极化偏离程度超出阈值时进行报警。
-
公开(公告)号:CN119004104A
公开(公告)日:2024-11-22
申请号:CN202411083246.X
申请日:2024-08-08
Applicant: 中国科学院计算技术研究所
IPC: G06F18/214 , G06F18/2431 , G06F40/216
Abstract: 本发明提出一种面向大模型安全评测的评测样本自动生成方法和装置,包括:测评问题集包含多个用于测试大语言模型安全性的评测样本,以具有诱导内容的任务提示为输入,以该任务提示对应的该评测样本标签,微调训练大语言模型输出评测样本,得到评测样本生成模型;根据评测样本的安全风险类别,构建检索问句,检索互联网中属于该安全风险类别的数据资料;根据该安全风险类别以及该数据资料,合成提示文本;从该测评问题集中抽取属于该安全风险类别的评测样本填充至该提示文本后作为任务提示输入该评测样本生成模型,生成用于测试大语言模型的测试样本。
-
-