-
公开(公告)号:CN117743699A
公开(公告)日:2024-03-22
申请号:CN202410188406.0
申请日:2024-02-20
IPC分类号: G06F16/9536 , G06Q50/20
摘要: 本发明涉及一种基于DKT与汤普森采样算法的习题推荐方法及系统,属于新一代信息技术和在线教育技术领域;本发明将汤普森采样算法与基于用户的协同过滤算法相结合,特别为新用户设计了一种基于用户的协同过滤算法,解决深度知识追踪模型面临的冷启动问题。而且考虑了用户的个人背景和需求进行相关习题的推荐。本发明采用了基于多头注意力机制的知识追踪模型,加入习题类型特征,通过对用户的答题数据和答题结果进行深入分析,准确预测用户对未尝试习题的答题表现以及知识掌握情况。使推荐系统能够动态地调整习题难度和类型,以匹配用户的实际学习进度和能力。
-
公开(公告)号:CN117370288A
公开(公告)日:2024-01-09
申请号:CN202311223122.2
申请日:2023-09-21
IPC分类号: G06F16/174 , G06F16/13 , G06F16/22 , G06F16/23 , G06F16/2455 , G06F9/50
摘要: 本发明涉及一种基于热点预测的Hudi异步压缩的方法和系统,包括:步骤一:将原始数据入湖和更新操作后的数据入湖;步骤二:数据入湖后,获取数据集;步骤三:基于获取的时间戳和数据操作的次数,采用训练好的LSTM模型预测热点时间段和非热点时间段;步骤四:基于训练好的LSTM模型输出的预测热点时间段和非热点时间段,执行数据异步压缩。本发明兼顾提升查询效率和获得较新的数据。解决了MOR表默认同步压缩会造成计算资源浪费的问题,以实现计算资源负载均衡,提高了资源利用率。
-
公开(公告)号:CN117633232A
公开(公告)日:2024-03-01
申请号:CN202311661689.8
申请日:2023-12-06
IPC分类号: G06F16/35 , G06N3/0442
摘要: 本发明涉及一种基于热点预测的Hudi异步数据聚类的方法和系统;包括:SQL查询语句解析,包括收集SQL语句、分词处理、建立词汇表、建立嵌入层;基于获取并解析后的SQL语句,采用训练好的基于在线学习算法的LSTM模型预测查询热点字段和查询热点表;获取训练好的基于在线学习算法的LSTM模型预测的查询热点字段和查询热点表,多次自动化进行异步数据聚类分析。本发明可以一定程度地避免异步聚类时产生的数据不一致问题,使得分区中的数据文件有较高的新鲜度;另外,通过优化热点数据布局,大大提高了以Hudi作为Presto引擎数据源时的查询效率。
-
公开(公告)号:CN117743699B
公开(公告)日:2024-05-14
申请号:CN202410188406.0
申请日:2024-02-20
IPC分类号: G06F16/9536 , G06Q50/20
摘要: 本发明涉及一种基于DKT与汤普森采样算法的习题推荐方法及系统,属于新一代信息技术和在线教育技术领域;本发明将汤普森采样算法与基于用户的协同过滤算法相结合,特别为新用户设计了一种基于用户的协同过滤算法,解决深度知识追踪模型面临的冷启动问题。而且考虑了用户的个人背景和需求进行相关习题的推荐。本发明采用了基于多头注意力机制的知识追踪模型,加入习题类型特征,通过对用户的答题数据和答题结果进行深入分析,准确预测用户对未尝试习题的答题表现以及知识掌握情况。使推荐系统能够动态地调整习题难度和类型,以匹配用户的实际学习进度和能力。
-
公开(公告)号:CN117312989A
公开(公告)日:2023-12-29
申请号:CN202311380815.2
申请日:2023-10-24
IPC分类号: G06F18/2415 , G06F40/30 , G06N3/042 , G06N3/0464 , G06N3/0455
摘要: 本发明涉及一种基于GCN和RoBERTa的上下文感知的列语义识别方法和系统,包括:数据预处理:设置增量同步数据获取任务,进行数据采集和清洗,加载到Mysql环境当中;列语义识别:基于数据集的列关系属性及属性关系构建词汇关系图,作为双层GCN图卷积网络输入来获取GCN全局语义特征嵌入;通过RoBERTa预训练模型线性化编码,将初步列向量输入到三层Tansformer使用其多头列注意力机制来获取局部语义特征嵌入,将并联输出的嵌入向量通过注意力机制融合权值,得到全局‑局部交互的上下文语义信息,并使用Adaline进行分类预测;本发明构建了上下文列语义识别模型,基于关系列投影进行元数据的语义识别。
-
-
-
-