-
公开(公告)号:CN105760439A
公开(公告)日:2016-07-13
申请号:CN201610073885.7
申请日:2016-02-02
Applicant: 西安交通大学
CPC classification number: G06F17/30864 , G06F17/2705 , G06K9/6269
Abstract: 本发明公开了一种基于特定行为共现网络的人物共现关系图谱构建方法。首先构建标准训练数据集和触发词表,用字符串匹配的方法,对所有待测试句子进行过滤得到候选特定行为句的集合;然后抽取标准训练数据集中所有句子的全词特征向量,用于训练SVM分类器识别特定行为,用训练好的SVM分类器对候选特定行为句进行分类,识别出特定行为句;最后构建出包含命名实体及其共现关系的特定行为共现网,在特定行为共现网的基础上构建人物共现关系图谱。本发明能在大量真实网络舆情数据上有效识别特定行为句,并在此基础上构建出特定行为共现网和人物共现关系图谱,为舆情分析提供新的可视化分析方法。
-
公开(公告)号:CN119739823A
公开(公告)日:2025-04-01
申请号:CN202411744148.6
申请日:2024-11-30
Applicant: 西安交通大学
IPC: G06F16/3329 , G06F40/30 , G06F40/216 , G06N3/045 , G06N5/04
Abstract: 一种基于大语言模型的可控多跳问题生成方法、系统及设备,方法包括将给定的一段上下文C和需要生成问题的跳数h输入预先建立的大语言模型;根据问题从上下文C中获取支持证据,并根据支持证据中的三元组谓词是否相同,将多跳问题生成分为组合型多跳问题生成和比较型多跳问题生成;利用大语言模型依次生成组合型多跳问题与比较型多跳问题,获得多跳问题及其答案。本发明的可控多跳问题生成方法在性能上实现了显著的提升,能够深入地捕捉问题的深层结构和语义信息,从而更加准确地理解并处理这些关系,并且减少在处理复杂问题时可能出现的错误和偏差。本发明能够对整个多跳问题的生成过程进行精细的控制,确保生成的问题在逻辑上连贯,跳数上准确。
-
公开(公告)号:CN117112758A
公开(公告)日:2023-11-24
申请号:CN202311074287.8
申请日:2023-08-24
Applicant: 西安交通大学
IPC: G06F16/332 , G06F16/35 , G06F40/35 , G06F18/2415 , G06F18/25 , G06N3/0442 , G06N3/0455
Abstract: 一种基于两阶段注意力的多特征融合问题生成方法及系统,多特征融合问题生成方法包括将上下文输入多特征编码器,由多特征编码器嵌入特征向量,并采用两阶段注意力编码;将上下文输入问题类型编码器,预测得到问题类型并且编码;将所述多特征编码器以及所述问题类型编码器得到的两种编码,采用交叉注意力机制融合输入到问题解码器,由所述问题解码器输出生成的问题。本发明使用Bi‑LSTM模型提取上下文特征,并结合软注意力矩阵,将模型的注意力重心放在与答案相关的部分,采用门控自注意力机制对特征进行过滤和整合,解决了文本长距离依赖的问题,引入疑问词预测引导机制,指导问题的生成,可以生成更加准确和相关的上下文信息向量。
-
公开(公告)号:CN116775836A
公开(公告)日:2023-09-19
申请号:CN202310776007.1
申请日:2023-06-28
Applicant: 西安交通大学
IPC: G06F16/332 , G06F40/284 , G06F40/205 , G06N3/045 , G06N3/048 , G06N3/082
Abstract: 一种基于多层次注意力的教科书文本问答方法及系统,方法包括:将问题文本与对应章节的上下文段落进行分词并编码后输入第一层注意力模型,在句内进行自注意力计算与池化,得到句子的表征向量;取问题句子的表征向量与所有上下文段落句子的表征向量计算余弦相似度,每个段落仅保留相似度最大的一句话所对应的表征向量,作为每个段落对应问题的上下文表征向量;将问题及每个段落对应问题的上下文表征向量输入第二层注意力模型,进行段落与段落、段落与问题间的自注意力计算与池化,获得问题所对应的答案表征向量作为分类器的输入;由分类器输出答案选项,并得出答案文本对应章节的上下文段落。本发明可以针对教科书文本问题选择出更准确的回答选项。
-
公开(公告)号:CN112800214B
公开(公告)日:2023-04-18
申请号:CN202110128830.2
申请日:2021-01-29
Applicant: 西安交通大学
IPC: G06F16/34 , G06F40/289 , G06N3/08
Abstract: 本发明公开了一种基于主题共现网络和外部知识的主题识别方法,方法具体为:基于标注数据的主题共现网络构建:使用已有带主题标注的领域知识文本,检测文本中的主题子词并以此构建主题共现网络;融合外部知识和主题共现网络的开关模块构建:使用共现网络对带主题标注的领域知识文本进行信息丰富度排序,并以此排序结合外部知识构成开关模块;引入开关模块的改进领域知识文本主题识别模型自训练:使用自训练方法训练领域知识文本主题识别模型,尽可能使用无主题标注的领域知识文本的信息,防止自训练不加选择地学习无主题标注领域知识文本导致泛化性能下降;更充分更高效地利用有限语料信息,提升领域知识文本主题识别模型的性能。
-
公开(公告)号:CN113221882B
公开(公告)日:2022-12-09
申请号:CN202110512070.5
申请日:2021-05-11
Applicant: 西安交通大学
Abstract: 本发明公开了一种面向课程领域的图像文本聚合方法及系统,将对象特征及邻接矩阵作为输入构建图像对应的对象关系图,利用图卷积神经网络更新关系图中节点的特征;将所有语块特征向量的集合作为整个文本描述的特征表示;以对象特征集合和步语块特征集合作为输入,构建图文对之间的局部相似度矩阵;计算整个课程领域图像和文本描述之间的全局相似度;通过梯度下降法训练图文匹配模型的参数,通过已学习到的参数得出全局相似度最高的一段文本描述作为和该张图像相匹配的描述文本,实现图像文本聚合。本发明能够有效提取课程领域图像和文本描述的特征,从而将课程领域示意图和文本知识碎片聚合,进而自动化构建跨模态的知识碎片。
-
公开(公告)号:CN115424271A
公开(公告)日:2022-12-02
申请号:CN202211145293.3
申请日:2022-09-20
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于自监督学习的示意图表征增强方法及系统,在图像和文本特征提取阶段,对示意图进行增广变换,识别出示意图中的文本框内容,对文本内容和示意图分别进行编码得到文本特征和图像特征;在文本指导下的示意图表征增强阶段,以文本特征为依据,应用指导注意力单元对图像特征进行增强;在对比自监督学习阶段,本发明通过投影函数将原图像和增广示意图增强特征映射至低维向量空间中,以低维向量计算损失并优化模型。
-
公开(公告)号:CN115393694A
公开(公告)日:2022-11-25
申请号:CN202211144391.5
申请日:2022-09-20
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于多粒度文本推理的示意图目标检测方法及系统,将示意图的文本特征与图像特征融合得到经过文本特征增强的视觉特征;根据增强视觉特征提取视觉节点,根据示意图本身特征提取文本节点,将提取到示意图的文本节点与视觉节点作为图节点,根据文本节点与视觉节点的相对位置空间以及文本语义相似性构造边,细粒度融合文本特征与视觉特征,得到增强后的视觉节点特征,完成局部文本推理;提取全局文本关键词;使用文本节点和全局文本关键词之间的相似度筛选出有效的局部文本节点;将有效的局部文本节点、全局文本推理和局部文本推理进行多粒度融合,完成示意图目标检测。本发明有效提升了检测精度。
-
公开(公告)号:CN109165289B
公开(公告)日:2022-08-16
申请号:CN201811013087.0
申请日:2018-08-31
Applicant: 西安交通大学
IPC: G06F16/335 , G06F16/35
Abstract: 本发明提供一种通过深度卷积神经网络进行社区问答网站问题质量预测的方法:1)爬取社区问答网站中多门课程的问题网页数据集;2)抽取问题网页数据集中的问题社区特征、问题文本特征和提问者特征集合;3)基于问题社区特征定义多门课程的问题质量计算公式;4)将向量化表示的问题文本特征和提问者特征与问题质量计算公式一起作为深度卷积神经网络的输入,从而训练得到问题质量的分类标签。本发明构建深度卷积神经网络进行问题质量的预测,最终得到多门课程的高质量问题集合,方便用户学习和使用。
-
公开(公告)号:CN110866162A
公开(公告)日:2020-03-06
申请号:CN201910959395.0
申请日:2019-10-10
Applicant: 西安交通大学
IPC: G06F16/906 , G06K9/62 , G06Q50/20
Abstract: 本发明公开了一种基于MOOC数据中辍学行为的因果关系模型的建立方法,通过分析MOOC日志数据集和构建影响辍学行为的候选自变量,定性分析所述候选自变量与因变量之间的相关性;设计所述候选自变量与因变量之间依赖性的定量度量方法,来构建无向图,得到由自变量和因变量组成的节点集构成的无向图,使用基于互信息的局部因果网络结构发现算法,通过无向图中基于回归分析方程剔除错误变量和基于条件独立性测试生成局部网络,构建面向辍学行为的带方向的局部因果网络结构,对于任何一种目标学习效果变量,都可以通过无向图生成、错误节点剔除和局部网络结构构建来进行关于该学习效果的局部因果网络结构的构建工作,进行学习效果的因果关系挖掘。
-
-
-
-
-
-
-
-
-