一种基于MOOC数据中辍学行为的因果关系挖掘方法

    公开(公告)号:CN110866162B

    公开(公告)日:2021-11-19

    申请号:CN201910959395.0

    申请日:2019-10-10

    Abstract: 本发明公开了一种基于MOOC数据中辍学行为的因果关系模型的建立方法,通过分析MOOC日志数据集和构建影响辍学行为的候选自变量,定性分析所述候选自变量与因变量之间的相关性;设计所述候选自变量与因变量之间依赖性的定量度量方法,来构建无向图,得到由自变量和因变量组成的节点集构成的无向图,使用基于互信息的局部因果网络结构发现算法,通过无向图中基于回归分析方程剔除错误变量和基于条件独立性测试生成局部网络,构建面向辍学行为的带方向的局部因果网络结构,对于任何一种目标学习效果变量,都可以通过无向图生成、错误节点剔除和局部网络结构构建来进行关于该学习效果的局部因果网络结构的构建工作,进行学习效果的因果关系挖掘。

    一种基于多层划分框架的RDF分布式存储方法

    公开(公告)号:CN109344259A

    公开(公告)日:2019-02-15

    申请号:CN201810803364.1

    申请日:2018-07-20

    Abstract: 本发明公开了一种基于多层划分框架的RDF分布式存储方法,主要步骤包括:(1)通过MMA算法优化RDF图中的顶点移动,保护了RDF图中小社团;(2)通过MSLM算法对RDF图进行粗糙化,发现了RDF图中的社团结构,并且在此基础了缩小了RDF数据的规模;(3)通过B_AP算法实现了对RDF图的k-way分割,使得各个物理存储节点之间的数据量相对平衡并且降低了节点之间的通信代价。本发明提出了完整的RDF分布式存储方法,为提升RDF的查询效率奠定了基础。

    一种基于MOOC数据中辍学行为的因果关系挖掘方法

    公开(公告)号:CN110866162A

    公开(公告)日:2020-03-06

    申请号:CN201910959395.0

    申请日:2019-10-10

    Abstract: 本发明公开了一种基于MOOC数据中辍学行为的因果关系模型的建立方法,通过分析MOOC日志数据集和构建影响辍学行为的候选自变量,定性分析所述候选自变量与因变量之间的相关性;设计所述候选自变量与因变量之间依赖性的定量度量方法,来构建无向图,得到由自变量和因变量组成的节点集构成的无向图,使用基于互信息的局部因果网络结构发现算法,通过无向图中基于回归分析方程剔除错误变量和基于条件独立性测试生成局部网络,构建面向辍学行为的带方向的局部因果网络结构,对于任何一种目标学习效果变量,都可以通过无向图生成、错误节点剔除和局部网络结构构建来进行关于该学习效果的局部因果网络结构的构建工作,进行学习效果的因果关系挖掘。

    一种基于多层划分框架的RDF分布式存储方法

    公开(公告)号:CN109344259B

    公开(公告)日:2022-02-22

    申请号:CN201810803364.1

    申请日:2018-07-20

    Abstract: 本发明公开了一种基于多层划分框架的RDF分布式存储方法,主要步骤包括:(1)通过MMA算法优化RDF图中的顶点移动,保护了RDF图中小社团;(2)通过MSLM算法对RDF图进行粗糙化,发现了RDF图中的社团结构,并且在此基础了缩小了RDF数据的规模;(3)通过B_AP算法实现了对RDF图的k‑way分割,使得各个物理存储节点之间的数据量相对平衡并且降低了节点之间的通信代价。本发明提出了完整的RDF分布式存储方法,为提升RDF的查询效率奠定了基础。

    一种通过标签传播算法进行主题分面挖掘的方法

    公开(公告)号:CN109815495B

    公开(公告)日:2020-06-05

    申请号:CN201910041002.8

    申请日:2019-01-16

    Abstract: 本发明公开了一种通过标签传播算法进行主题分面挖掘的方法:对于每个主题,把页面的简介部分的单词用词向量表示,形成一个矩阵,计算每两个主题简介部分矩阵之间的相似度作为主题之间的相似度;爬取每个主题对应的页面的目录部分的内容;对目录部分内容进行预处理,得到主题的初始分面集;把主题之间的相似度用一个相似矩阵P来表示;把主题的初始分面集用一个主题‑分面矩阵F0来表示;对两个矩阵迭代地进行乘法运算从而实现分面的传播;对于收敛之后的主题‑分面矩阵,对每个主题,选取矩阵中对应的分面作为最终分面集中的分面。本发明利用标签传播算法在领域主题之间传播分面,使得所有主题都可以被挖掘到较为完整的分面。

    一种基于主题信息的文本切割方法

    公开(公告)号:CN110110326A

    公开(公告)日:2019-08-09

    申请号:CN201910339645.0

    申请日:2019-04-25

    Abstract: 本发明公开了一种基于主题信息的文本切割方法,具体操作如下:对输入文本以及训练集进行预处理,获得一系列单词组成的句子;然后进行特征提取,得到其特征向量;再根据其蕴含的语义信息对输入文本进行聚类操作,得到一系列句子簇,并为每个簇按顺序分配一个数字标号,得到一系列带有数字标号的单句;为每一个句子分配一个训练集中已有的主题标签,使得训练集中已有的主题标签分配至文本中的所有句子;利用数字标签标注结果和主题标签标注结果,进行修正,得到带主题标签的文本片段,将主题标签分配到切割后的文本上,使句子描述的主题都清晰可见,可以方便的根据主题定位到文本中描述该主题的位置,使得检索更为方便。

    一种通过标签传播算法进行主题分面挖掘的方法

    公开(公告)号:CN109815495A

    公开(公告)日:2019-05-28

    申请号:CN201910041002.8

    申请日:2019-01-16

    Abstract: 本发明公开了一种通过标签传播算法进行主题分面挖掘的方法:对于每个主题,把页面的简介部分的单词用词向量表示,形成一个矩阵,计算每两个主题简介部分矩阵之间的相似度作为主题之间的相似度;爬取每个主题对应的页面的目录部分的内容;对目录部分内容进行预处理,得到主题的初始分面集;把主题之间的相似度用一个相似矩阵P来表示;把主题的初始分面集用一个主题-分面矩阵F0来表示;对两个矩阵迭代地进行乘法运算从而实现分面的传播;对于收敛之后的主题-分面矩阵,对每个主题,选取矩阵中对应的分面作为最终分面集中的分面。本发明利用标签传播算法在领域主题之间传播分面,使得所有主题都可以被挖掘到较为完整的分面。

Patent Agency Ranking