-
公开(公告)号:CN110866162B
公开(公告)日:2021-11-19
申请号:CN201910959395.0
申请日:2019-10-10
Applicant: 西安交通大学
IPC: G06F16/906 , G06K9/62 , G06Q50/20
Abstract: 本发明公开了一种基于MOOC数据中辍学行为的因果关系模型的建立方法,通过分析MOOC日志数据集和构建影响辍学行为的候选自变量,定性分析所述候选自变量与因变量之间的相关性;设计所述候选自变量与因变量之间依赖性的定量度量方法,来构建无向图,得到由自变量和因变量组成的节点集构成的无向图,使用基于互信息的局部因果网络结构发现算法,通过无向图中基于回归分析方程剔除错误变量和基于条件独立性测试生成局部网络,构建面向辍学行为的带方向的局部因果网络结构,对于任何一种目标学习效果变量,都可以通过无向图生成、错误节点剔除和局部网络结构构建来进行关于该学习效果的局部因果网络结构的构建工作,进行学习效果的因果关系挖掘。
-
公开(公告)号:CN109344259A
公开(公告)日:2019-02-15
申请号:CN201810803364.1
申请日:2018-07-20
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于多层划分框架的RDF分布式存储方法,主要步骤包括:(1)通过MMA算法优化RDF图中的顶点移动,保护了RDF图中小社团;(2)通过MSLM算法对RDF图进行粗糙化,发现了RDF图中的社团结构,并且在此基础了缩小了RDF数据的规模;(3)通过B_AP算法实现了对RDF图的k-way分割,使得各个物理存储节点之间的数据量相对平衡并且降低了节点之间的通信代价。本发明提出了完整的RDF分布式存储方法,为提升RDF的查询效率奠定了基础。
-
公开(公告)号:CN109165289B
公开(公告)日:2022-08-16
申请号:CN201811013087.0
申请日:2018-08-31
Applicant: 西安交通大学
IPC: G06F16/335 , G06F16/35
Abstract: 本发明提供一种通过深度卷积神经网络进行社区问答网站问题质量预测的方法:1)爬取社区问答网站中多门课程的问题网页数据集;2)抽取问题网页数据集中的问题社区特征、问题文本特征和提问者特征集合;3)基于问题社区特征定义多门课程的问题质量计算公式;4)将向量化表示的问题文本特征和提问者特征与问题质量计算公式一起作为深度卷积神经网络的输入,从而训练得到问题质量的分类标签。本发明构建深度卷积神经网络进行问题质量的预测,最终得到多门课程的高质量问题集合,方便用户学习和使用。
-
公开(公告)号:CN110866162A
公开(公告)日:2020-03-06
申请号:CN201910959395.0
申请日:2019-10-10
Applicant: 西安交通大学
IPC: G06F16/906 , G06K9/62 , G06Q50/20
Abstract: 本发明公开了一种基于MOOC数据中辍学行为的因果关系模型的建立方法,通过分析MOOC日志数据集和构建影响辍学行为的候选自变量,定性分析所述候选自变量与因变量之间的相关性;设计所述候选自变量与因变量之间依赖性的定量度量方法,来构建无向图,得到由自变量和因变量组成的节点集构成的无向图,使用基于互信息的局部因果网络结构发现算法,通过无向图中基于回归分析方程剔除错误变量和基于条件独立性测试生成局部网络,构建面向辍学行为的带方向的局部因果网络结构,对于任何一种目标学习效果变量,都可以通过无向图生成、错误节点剔除和局部网络结构构建来进行关于该学习效果的局部因果网络结构的构建工作,进行学习效果的因果关系挖掘。
-
公开(公告)号:CN110209814A
公开(公告)日:2019-09-06
申请号:CN201910435042.0
申请日:2019-05-23
Applicant: 西安交通大学
IPC: G06F16/35 , G06F16/951 , G06F17/27
Abstract: 本发明公开了一种利用领域建模从百科知识网站抽取知识主题的方法,首先从给定领域中提取出知识术语集并进行少量主题标注,然后通过向量化表示已标注知识术语的语义属性与拓扑特征构建训练样本集,并对二元分类器进行训练,从而得到主题特征分类模型,通过主题特征分类模型实现知识主题抽取。本发明可以实现从百科知识类网站高效且全面的抽取特定领域的知识主题。
-
公开(公告)号:CN109344259B
公开(公告)日:2022-02-22
申请号:CN201810803364.1
申请日:2018-07-20
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于多层划分框架的RDF分布式存储方法,主要步骤包括:(1)通过MMA算法优化RDF图中的顶点移动,保护了RDF图中小社团;(2)通过MSLM算法对RDF图进行粗糙化,发现了RDF图中的社团结构,并且在此基础了缩小了RDF数据的规模;(3)通过B_AP算法实现了对RDF图的k‑way分割,使得各个物理存储节点之间的数据量相对平衡并且降低了节点之间的通信代价。本发明提出了完整的RDF分布式存储方法,为提升RDF的查询效率奠定了基础。
-
公开(公告)号:CN109815495B
公开(公告)日:2020-06-05
申请号:CN201910041002.8
申请日:2019-01-16
Applicant: 西安交通大学
IPC: G06F40/284 , G06F40/30
Abstract: 本发明公开了一种通过标签传播算法进行主题分面挖掘的方法:对于每个主题,把页面的简介部分的单词用词向量表示,形成一个矩阵,计算每两个主题简介部分矩阵之间的相似度作为主题之间的相似度;爬取每个主题对应的页面的目录部分的内容;对目录部分内容进行预处理,得到主题的初始分面集;把主题之间的相似度用一个相似矩阵P来表示;把主题的初始分面集用一个主题‑分面矩阵F0来表示;对两个矩阵迭代地进行乘法运算从而实现分面的传播;对于收敛之后的主题‑分面矩阵,对每个主题,选取矩阵中对应的分面作为最终分面集中的分面。本发明利用标签传播算法在领域主题之间传播分面,使得所有主题都可以被挖掘到较为完整的分面。
-
公开(公告)号:CN110110326A
公开(公告)日:2019-08-09
申请号:CN201910339645.0
申请日:2019-04-25
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于主题信息的文本切割方法,具体操作如下:对输入文本以及训练集进行预处理,获得一系列单词组成的句子;然后进行特征提取,得到其特征向量;再根据其蕴含的语义信息对输入文本进行聚类操作,得到一系列句子簇,并为每个簇按顺序分配一个数字标号,得到一系列带有数字标号的单句;为每一个句子分配一个训练集中已有的主题标签,使得训练集中已有的主题标签分配至文本中的所有句子;利用数字标签标注结果和主题标签标注结果,进行修正,得到带主题标签的文本片段,将主题标签分配到切割后的文本上,使句子描述的主题都清晰可见,可以方便的根据主题定位到文本中描述该主题的位置,使得检索更为方便。
-
公开(公告)号:CN109815495A
公开(公告)日:2019-05-28
申请号:CN201910041002.8
申请日:2019-01-16
Applicant: 西安交通大学
IPC: G06F17/27
Abstract: 本发明公开了一种通过标签传播算法进行主题分面挖掘的方法:对于每个主题,把页面的简介部分的单词用词向量表示,形成一个矩阵,计算每两个主题简介部分矩阵之间的相似度作为主题之间的相似度;爬取每个主题对应的页面的目录部分的内容;对目录部分内容进行预处理,得到主题的初始分面集;把主题之间的相似度用一个相似矩阵P来表示;把主题的初始分面集用一个主题-分面矩阵F0来表示;对两个矩阵迭代地进行乘法运算从而实现分面的传播;对于收敛之后的主题-分面矩阵,对每个主题,选取矩阵中对应的分面作为最终分面集中的分面。本发明利用标签传播算法在领域主题之间传播分面,使得所有主题都可以被挖掘到较为完整的分面。
-
公开(公告)号:CN110209814B
公开(公告)日:2021-02-02
申请号:CN201910435042.0
申请日:2019-05-23
Applicant: 西安交通大学
IPC: G06F16/35 , G06F16/951 , G06F40/30
Abstract: 本发明公开了一种利用领域建模从百科知识网站抽取知识主题的方法,首先从给定领域中提取出知识术语集并进行少量主题标注,然后通过向量化表示已标注知识术语的语义属性与拓扑特征构建训练样本集,并对二元分类器进行训练,从而得到主题特征分类模型,通过主题特征分类模型实现知识主题抽取。本发明可以实现从百科知识类网站高效且全面的抽取特定领域的知识主题。
-
-
-
-
-
-
-
-
-