一种暴力词汇的分析方法、系统、装置及介质

    公开(公告)号:CN116629250B

    公开(公告)日:2024-01-12

    申请号:CN202310482598.1

    申请日:2023-04-28

    摘要: 言处理技术领域。本发明公开了一种暴力词汇的分析方法、系统、装置及介质。该方法通过获取待检测的目标词汇;根据更新后的万有引力模型对目标词汇进行效价分析,得到目标词汇的暴力效价值;更新后的万有引力模型通过以下步骤得到:获取目标暴力词汇语料库;根据目标暴力词汇语料库,得到训练暴力词汇集和核心暴力词汇集;获取训练暴力词汇集中,与各个训练暴力词汇对应的训练暴力效价值;根据核心暴力词汇集、训练暴力词汇集、目标暴力词汇语料库和各个训练暴力效价值,得到更新后的万有引力模型。该方法通过构

    用于学习者认知结构的处理方法、系统、装置及存储介质

    公开(公告)号:CN114090839B

    公开(公告)日:2022-05-03

    申请号:CN202210063014.2

    申请日:2022-01-20

    IPC分类号: G06F16/901 G06Q50/20

    摘要: 本发明公开一种用于学习者认知结构的处理方法、系统、装置及存储介质,涉及计算机技术领域。用于学习者认知结构的处理方法包括:获取表示知识点关系的有向图和第一学习者测评的题目得分;将题目得分输入题目知识点映射模型得到表示第一学习者知识点认知水平的第一矩阵;根据有向图生成第二矩阵;拼接第一矩阵和第二矩阵得到第三矩阵;提取第三矩阵中知识点认知水平特征和知识结构特征;通过图卷积神经网络和自编码器融合知识点认知水平特征和知识结构特征,得到第一学习者的认知结构表示矩阵和第一学习者的认知结构特征表示向量。本申请能够提高学习者认知结构的准确性,从而提高基于认知结构分析结果的准确性和全面性。

    一种无监督概念提取方法、装置、电子设备及存储介质

    公开(公告)号:CN116975595B

    公开(公告)日:2024-03-26

    申请号:CN202310811116.2

    申请日:2023-07-03

    摘要: 本发明公开了一种无监督概念提取方法、装置、电子设备及存储介质,方法:从候选概念中获取目标领域的第一概念集和非目标领域的第二概念集,根据第一概念集确定种子概念训练集,进而结合第二概念集确定随机概念测试集;对种子概念训练集进行第一预处理,得到第一词向量表示;对第一词向量表示进行聚类处理,获得多个聚类簇,确定聚类簇中每个数据点与质心的距离集;对随机概念测试集进行第一预处理,得到第二词向量表示;将第二词向量表示和距离集合并得到多个簇数据;对簇数据进行正态性调整,获得正态化数据集;通过基于质心的判别函数,从正态化数据集中提取目标领域的概念。本发明能够准确、高效地提取概念,可广泛应用于数据处理技术领域。

    一种文本聚类方法、装置、电子设备及存储介质

    公开(公告)号:CN116992026A

    公开(公告)日:2023-11-03

    申请号:CN202310859085.8

    申请日:2023-07-12

    摘要: 本发明公开了一种文本聚类方法、装置、电子设备及存储介质,方法:获取目标语料数据,预处理后得到目标文本数据;对目标文本数据进行向量化处理,获得第一句向量矩阵;并对第一句向量矩阵进行降维处理,获得第二句向量矩阵;根据目标文本数据构建词汇库,对词汇库进行主题建模,获得概率矩阵;对第二句向量矩阵和概率矩阵进行拼接处理,获得目标矩阵;根据目标矩阵,拟合得到目标聚类质心,基于目标聚类质心进行文本聚类,得到文本聚类结果。本发明能够缓解主题聚类忽略文本的上下文信息的问题,同时也能捕捉到长尾词汇对语义的作用,能减少噪声与异常值的影响;并且能提高聚类的精度,从而提高对文本聚类的效果,可广泛应用于数据处理技术领域。

    用于学习者认知结构的处理方法、系统、装置及存储介质

    公开(公告)号:CN114090839A

    公开(公告)日:2022-02-25

    申请号:CN202210063014.2

    申请日:2022-01-20

    IPC分类号: G06F16/901 G06Q50/20

    摘要: 本发明公开一种用于学习者认知结构的处理方法、系统、装置及存储介质,涉及计算机技术领域。用于学习者认知结构的处理方法包括:获取表示知识点关系的有向图和第一学习者测评的题目得分;将题目得分输入题目知识点映射模型得到表示第一学习者知识点认知水平的第一矩阵;根据有向图生成第二矩阵;拼接第一矩阵和第二矩阵得到第三矩阵;提取第三矩阵中知识点认知水平特征和知识结构特征;通过图卷积神经网络和自编码器融合知识点认知水平特征和知识结构特征,得到第一学习者的认知结构表示矩阵和第一学习者的认知结构特征表示向量。本申请能够提高学习者认知结构的准确性,从而提高基于认知结构分析结果的准确性和全面性。

    一种无监督概念提取方法、装置、电子设备及存储介质

    公开(公告)号:CN116975595A

    公开(公告)日:2023-10-31

    申请号:CN202310811116.2

    申请日:2023-07-03

    摘要: 本发明公开了一种无监督概念提取方法、装置、电子设备及存储介质,方法:从候选概念中获取目标领域的第一概念集和非目标领域的第二概念集,根据第一概念集确定种子概念训练集,进而结合第二概念集确定随机概念测试集;对种子概念训练集进行第一预处理,得到第一词向量表示;对第一词向量表示进行聚类处理,获得多个聚类簇,确定聚类簇中每个数据点与质心的距离集;对随机概念测试集进行第一预处理,得到第二词向量表示;将第二词向量表示和距离集合并得到多个簇数据;对簇数据进行正态性调整,获得正态化数据集;通过基于质心的判别函数,从正态化数据集中提取目标领域的概念。本发明能够准确、高效地提取概念,可广泛应用于数据处理技术领域。

    一种暴力词汇的分析方法、系统、装置及介质

    公开(公告)号:CN116629250A

    公开(公告)日:2023-08-22

    申请号:CN202310482598.1

    申请日:2023-04-28

    摘要: 本发明公开了一种暴力词汇的分析方法、系统、装置及介质。该方法通过获取待检测的目标词汇;根据更新后的万有引力模型对目标词汇进行效价分析,得到目标词汇的暴力效价值;更新后的万有引力模型通过以下步骤得到:获取目标暴力词汇语料库;根据目标暴力词汇语料库,得到训练暴力词汇集和核心暴力词汇集;获取训练暴力词汇集中,与各个训练暴力词汇对应的训练暴力效价值;根据核心暴力词汇集、训练暴力词汇集、目标暴力词汇语料库和各个训练暴力效价值,得到更新后的万有引力模型。该方法通过构建并利用万有引力模型对暴力词汇进行效价分析,有效提高暴力词汇效价分析的可解释性和针对性,准确度较高。本发明可广泛应用于自然语言处理技术领域。