问答处理方法、装置、系统、计算设备及计算机存储介质

    公开(公告)号:CN116860949B

    公开(公告)日:2024-04-05

    申请号:CN202311056160.3

    申请日:2023-08-21

    摘要: 本发明公开了一种问答处理方法、装置、系统、计算设备及计算机存储介质,该方法包括:获取用户端发送的问题查询语句;根据问题查询语句查询目标提示词演示库及政务知识图谱,得到知识图谱数据集以及与问题查询语句相关的E个提示词演示;将问题查询语句、E个提示词演示、知识图谱数据集输入至经过训练的自然语言生成模型,得到问题查询语句对应的答复结果,将答复结果返回至用户端。通过上述方式,本发明能够准确地向用户提供答复结果,提高了回复的准确性及流畅度,帮助用户在办理政府服务事项时精确定位事项信息,解决重复提交材料等问题,提高用户线上线下办事效率。

    基于超图建模文档级因果结构的事件因果关系识别方法

    公开(公告)号:CN116719900A

    公开(公告)日:2023-09-08

    申请号:CN202310595004.8

    申请日:2023-05-24

    摘要: 本发明公开了一种基于超图建模文档级因果结构的事件因果关系识别方法,基于该方法提出了因果超图神经网络模型,模型中设计了成对事件语义学习模块与文档级因果结构学习模块。本发明首先对文本按照成对事件和事件两种方式进行预处理;采用基于提示学习的预训练语言模型对成对事件句子建模,经过成对事件语义学习得到事件提及表示,同时预测事件对因果关系;采用预训练语言模型对句子建模,得到超图节点初始表示;结合预测的事件对因果关系,建模文档级因果超图;结合超图卷积学习,得到文档级事件表示;最后经过多层感知器处理,得到事件对的因果关系识别结果。本发明融合了提示学习和超图神经网络的优点,能有效提高事件因果关系识别的准确度。

    负样本构造方法、装置、计算设备及存储介质

    公开(公告)号:CN116432035A

    公开(公告)日:2023-07-14

    申请号:CN202310423240.1

    申请日:2023-04-19

    摘要: 本发明公开了一种负样本构造方法、装置、计算设备及存储介质,该方法包括:根据目标用户的社交数据确定一批潜在曝光用户;获取该批潜在曝光用户的社交状态;若目标用户的已发布内容被曝光给任一潜在曝光用户且该潜在曝光用户的社交状态为活跃状态,将该潜在曝光用户标记为可信曝光用户;根据各个可信曝光用户的指定交互行为数据,构造第一数据集;以及,根据已发布内容的各个真实交互用户的指定交互行为数据,构造第二数据集;对第一数据集和第二数据集求取差集数据,得到各个负样本数据。通过上述方式,解决了在社交媒体行为预测任务中负样本难获得的不足,该方法简单易行,能够高效获得置信度较高的负样本数据。

    基于大语言模型知识蒸馏的知识图谱构建方法及装置

    公开(公告)号:CN117313851A

    公开(公告)日:2023-12-29

    申请号:CN202311520660.8

    申请日:2023-11-15

    IPC分类号: G06N5/022

    摘要: 本发明实施例公开了一种基于大语言模型知识蒸馏的知识图谱构建方法及装置,方法包括:获取元数据;元数据包括知识图谱的关系描述信息以及与关系描述信息对应的多个实体对;将元数据的关系描述信息与实体对进行拼装,得到拼装语句,对拼装语句进行同义改写,提取改写后的拼装语句,得到关系描述集合;关系描述集合包含改写后的拼装语句中的多个关系描述信息;根据关系描述集合以及实体对构建提示词,根据提示词,利用知识蒸馏模块得到候选实体对集合;根据候选实体对集合以及元数据的关系描述信息生成知识图谱。基于元数据快速地从大语言模型中提取、整理和构建候选实体对,实现对知识图谱的更新和扩充,从而高效、可靠、低成本构建知识图谱。

    基于用户依赖关系的社交网络转发行为预测方法及装置

    公开(公告)号:CN115878907B

    公开(公告)日:2023-08-11

    申请号:CN202211697432.3

    申请日:2022-12-28

    摘要: 本发明实施例公开了一种基于用户依赖关系的社交网络转发行为预测方法及装置,方法包括:根据用户社交关系确定用户群体,得到用户群体中各用户的第一嵌入向量;根据转发过程以及用户的第一嵌入向量,计算得到包含上下文依赖向量的用户的第二嵌入向量;根据用户的第二嵌入向量以及预设方向掩码,基于自注意力机制,按照用户转发文本内容的顺序进行跨层连接及归一化处理,得到转发过程的转发用户序列嵌入;根据文本内容,确定文本内容的转发文本嵌入向量;根据文本内容的转发文本嵌入向量以及转发用户序列嵌入,计算得到转发用户序列嵌入对文本内容的注意力结果,根据注意力结果得到用户转发文本内容的预测概率。

    反讽识别方法、装置、计算设备及存储介质

    公开(公告)号:CN117436457B

    公开(公告)日:2024-05-03

    申请号:CN202311443301.7

    申请日:2023-11-01

    摘要: 本发明公开了一种反讽识别方法、装置、计算设备及存储介质,该方法包括:根据各个有标注文本的反讽标签信息,构建各个有标注文本的标准推理结果;根据各个有标注文本及其标准推理结果,对大语言模型进行微调处理,得到目标语言模型;利用目标语言模型对任一无标注文本进行反讽推理处理,根据该无标注文本的反讽推理结果,确定该无标注文本的伪标签信息;根据各个无标注文本及其伪标签信息对中间识别模型进行微调处理,得到目标识别模型;中间识别模型用于提取输入文本的文本表示向量;利用目标识别模型进行文本的反讽识别处理。通过上述方式,实现了基于少量数据的有标注样本数据扩充,提升了模型的反讽识别性能,提升了模型构建的效率。

    基于大语言模型知识蒸馏的知识图谱构建方法及装置

    公开(公告)号:CN117313851B

    公开(公告)日:2024-04-02

    申请号:CN202311520660.8

    申请日:2023-11-15

    IPC分类号: G06N5/022

    摘要: 本发明实施例公开了一种基于大语言模型知识蒸馏的知识图谱构建方法及装置,方法包括:获取元数据;元数据包括知识图谱的关系描述信息以及与关系描述信息对应的多个实体对;将元数据的关系描述信息与实体对进行拼装,得到拼装语句,对拼装语句进行同义改写,提取改写后的拼装语句,得到关系描述集合;关系描述集合包含改写后的拼装语句中的多个关系描述信息;根据关系描述集合以及实体对构建提示词,根据提示词,利用知识蒸馏模块得到候选实体对集合;根据候选实体对集合以及元数据的关系描述信息生成知识图谱。基于元数据快速地从大语言模型中提取、整理和构建候选实体对,实现对知识图谱的更新和扩充,从而高效、可靠、低成本构建知识图谱。

    社交媒体行为预测方法、装置、计算设备及存储介质

    公开(公告)号:CN116596143A

    公开(公告)日:2023-08-15

    申请号:CN202310575128.X

    申请日:2023-05-19

    摘要: 本发明公开了一种社交媒体行为预测方法、装置、计算设备及存储介质,该方法包括:根据推荐给目标用户的目标社交媒体内容的特征数据,构建多个类别的待预测特征向量;将多个类别的待预测特征向量进行拼接,得到待预测拼接特征向量;将待预测拼接特征向量输入至多行为预测模型中进行处理,得到目标用户对所述目标社交媒体内容的多种社交媒体行为的预测结果。通过上述方式,基于多行为预测模型实现用户对社交媒体内容的多行为预测,无需多个社交媒体行为之间具有强相关性,能够挖掘多种社交媒体行为之间潜在的关联性和差异性,能够提高社交媒体行为的预测准确性。

    一种社交媒体内容传播预测方法和装置

    公开(公告)号:CN115759482A

    公开(公告)日:2023-03-07

    申请号:CN202211708983.5

    申请日:2022-12-29

    摘要: 本发明公开了一种社交媒体内容传播预测方法和装置,该方法包括:获取历史社交媒体内容以及历史社交媒体内容对应的历史转发关系数据,依据历史社交媒体内容以及历史转发关系数据构建得到内容传播过程对应的级联结构图;通过基于注意力机制的Transformer网络为级联结构图中的节点设置时间特征,得到第一处理结果;利用变分编码器对级联结构图在节点维度和时间维度进行处理,得到第二处理结果;根据待预测社交媒体内容、第一处理结果和第二处理结果,预测待预测社交媒体内容在指定预测时段内的传播数据。本发明聚合了社交媒体内容传播过程中的拓扑信息,对历史内容发布、转发时间、转发用户层面和时间层面的不确定性进行建模,提升了预测效果。

    反讽识别方法、装置、计算设备及存储介质

    公开(公告)号:CN117436457A

    公开(公告)日:2024-01-23

    申请号:CN202311443301.7

    申请日:2023-11-01

    摘要: 本发明公开了一种反讽识别方法、装置、计算设备及存储介质,该方法包括:根据各个有标注文本的反讽标签信息,构建各个有标注文本的标准推理结果;根据各个有标注文本及其标准推理结果,对大语言模型进行微调处理,得到目标语言模型;利用目标语言模型对任一无标注文本进行反讽推理处理,根据该无标注文本的反讽推理结果,确定该无标注文本的伪标签信息;根据各个无标注文本及其伪标签信息对中间识别模型进行微调处理,得到目标识别模型;中间识别模型用于提取输入文本的文本表示向量;利用目标识别模型进行文本的反讽识别处理。通过上述方式,实现了基于少量数据的有标注样本数据扩充,提升了模型的反讽识别性能,提升了模型构建的效率。