-
公开(公告)号:CN113065002A
公开(公告)日:2021-07-02
申请号:CN202110417960.8
申请日:2021-04-19
Applicant: 北京理工大学
IPC: G06F16/36 , G06F40/30 , G06F40/289 , G06F40/242
Abstract: 本发明涉及一种基于知识图谱和上下文语境的中文语义消歧方法,属于自然语言处理技术领域。本发明通过构建消歧知识图谱和基于上下文语境的语义消歧,可以在没有显式语义标注的由原句和完成消歧修改后的结果组成的获取数据集中抽取歧义词实体和消歧词实体以及它们之间的关系,同时将上下文语境作为消歧词实体的属性,从而将消歧知识沉淀于知识图谱,赋能语义消歧工作。本发明可以在新的待消歧文本中准确地发现已登录的歧义词。本发明实现了上下文语境的向量表示和基于向量的相似度计算,使得利用本发明的软件可以更精准地感知歧义词所处的上下文语境。
-
公开(公告)号:CN104636425B
公开(公告)日:2018-02-13
申请号:CN201410795679.8
申请日:2014-12-18
Abstract: 本发明涉及一种网络个体或群体情绪认知能力预测与可视化方法,属于互联网舆情信息挖掘与分析领域。本发明对现有情感词典中收录的常用情感词做了整合,同时考虑了网络环境中具有情感倾向的网络情感新词及表情字符,最大限度地包含了社交媒体平台上的情感元素,并在此基础上构建了情感词本体库;确定网络个体情绪分叉点位置,用情绪认知能力指数描述网络个体的情绪认知能力水平,并以可视化的方式对多个网络个体之间的情绪分叉点差异进行展示。通过本发明可揭示网络个体或群体情绪认知能力水平的演化规律,尤其是对典型网络个体或群体的情绪动态变化过程及其情绪突变的临界点进行预测,帮助相关管理者对网络舆论进行合理引导,营造和谐网络环境。
-
公开(公告)号:CN114443855B
公开(公告)日:2025-05-06
申请号:CN202210020693.5
申请日:2022-01-10
Applicant: 北京理工大学
IPC: G06F16/36 , G06F16/31 , G06F16/951 , G06F16/35 , G06F40/263 , G06F40/295 , G06F40/30 , G06N3/045 , G06N3/0464 , G06N3/042
Abstract: 本发明涉及一种基于图表示学习的知识图谱跨语言对齐方法,属于自然语言处理技术领域。在知识图谱构建阶段,通过爬取网站数据作为来源。然后,过滤筛选多语言实体并抽取其结构化数据组成三元组,构建知识图谱。在对齐阶段,通过图表示学习,将不同来源的知识图谱生成对应的嵌入矩阵,在图嵌入基础上,依靠已对齐实体,将不同语言知识图谱中的实体合并到统一的空间中,并根据实体在联合语义空间中的距离进行对齐。本方法充分利用了知识图谱结构信息,通过图表示学习方法将不同语言知识图谱中的实体合并到统一的空间中,并根据实体在联合语义空间中的距离进行对齐,保证了融合后的数据更准确全面,提高了在跨语言领域进行快速分析和智能搜索的效率。
-
公开(公告)号:CN119271873A
公开(公告)日:2025-01-07
申请号:CN202411045781.6
申请日:2024-08-01
Applicant: 北京理工大学
IPC: G06F16/9535 , G06Q50/20 , G06Q10/0639 , G06F18/213 , G06N3/0455 , G06N3/0895
Abstract: 本发明涉及一种基于知识追踪模型的个性化编程题推荐方法,属于信息推荐技术领域。本方法通过知识追踪模型,将学习者的知识状态变化过程融合到编程题推荐过程中,使所推荐的编程题符合学习者当前的学习进程和学习能力。本发明提出了一种基于特征增强和注意力机制的知识追踪模型,充分利用编程题信息和学习者历史知识状态信息更准确地预测学习者未来的答题表现。结合上述模型,本发明采用了个性化编程题推荐策略,将学习者的知识状态变化情况融入推荐过程,从而推荐出符合学习者当前的学习进程和学习能力的编程题。本方法能够更加准确地预测学习者在下一个时间步的答题表现,使编程题推荐策略能够及时根据学习者的知识状态变化情况调整推荐题目。
-
公开(公告)号:CN118446202A
公开(公告)日:2024-08-06
申请号:CN202410558437.0
申请日:2024-05-08
Applicant: 北京理工大学
IPC: G06F40/194 , G06F40/16 , G06F18/22 , G06F18/214 , G06F18/21 , G06F18/25
Abstract: 本发明涉及一种基于写作风格的生成文本来源检测方法,属于人工智能与文本检测技术领域,该方法包括:S1,生成文本内容的识别与编码;S2,特征提取;S3,特征输入与融合;S4,损失函数计算与优化;S5,训练模型;S6,根据训练好的模型,验证集评估模型的准确率和召回率,根据结果优化模型参数。在步骤S3中,对于每个文本样本,使用Llama2计算其困惑度分数。本发明使用多维特征融合框架,通过计算文本困惑度分数和嵌入向量并将其融合来代表各个文本生成源的写作风格,有效捕获了群体写作风格的核心特征,增强了文本源的区分能力,显著地提升了基于写作风格的识别性能,对保护文本的真实性有重要的意义。
-
公开(公告)号:CN117407703A
公开(公告)日:2024-01-16
申请号:CN202310673127.9
申请日:2023-06-07
Applicant: 北京理工大学
IPC: G06F18/214 , G06N3/045 , G06N3/048 , G06N3/082 , G06F18/22 , G06F40/30 , G06F40/216
Abstract: 本发明涉及一种基于机器阅读理解的冲突因素编码预测方法,属于自然语言处理技术领域。本方法根据冲突文本发布时间判断当前冲突发展阶段,确定可选因素列表;通过BERT微调的模型对冲突文本和可选冲突因素进行向量化表示;计算冲突文本和冲突因素的语义相似度,筛选与冲突文本最相关的冲突因素和冲突因素最相关的冲突文本句子;利用“冲突文本‑相关冲突因素”集合,生成原始冲突因素标注数据集;利用基于BERT微调的机器阅读理解模型,将处理好的冲突因素标注数据输入模型,获得冲突文本的相关冲突因素标注预测。本发明有效解决了基于海量新闻文本的冲突因素标注预测问题,提高了冲突量化分析效率。降低了冲突量化模型的使用者门槛。
-
公开(公告)号:CN117150113A
公开(公告)日:2023-12-01
申请号:CN202310625164.2
申请日:2023-05-30
Applicant: 北京理工大学
IPC: G06F16/9535 , G06F40/126 , G06N3/0442 , G06N3/045 , G06N3/048
Abstract: 本发明涉及一种基于长短期偏好的科技情报推荐方法,属于推荐系统领域,可用于为用户提供个性化的科技情报推荐。该方法包括:利用多头自注意力机制分别提取情报标题和摘要的表示,然后结合情报来源表示以获取更准确的情报表示;采用长短期记忆网络和用户ID嵌入的方法学习长短期偏好表示;以及将长短期偏好表示与情报表示相结合,计算推荐得分,从而实现个性化的科技情报推荐。本发明解决了现有推荐系统在情报表示方面的不足以及在捕捉用户长短期兴趣方面不精确的问题,可以在推荐过程中捕捉到新颖性和突发性的科技情报,适用于国防、科研、教育等领域的情报推荐场景,有助于提高情报工作人员的工作效率,促进知识传播和技术创新。
-
公开(公告)号:CN115358234A
公开(公告)日:2022-11-18
申请号:CN202210828795.X
申请日:2022-07-14
Applicant: 北京理工大学
IPC: G06F40/295 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明公开了基于图卷积网络与关系证据互指导的篇章关系抽取方法,属于计算机自然语言处理技术领域。本发明针对文档级别的文本,构造包含实体提及和实体关系两种节点的文档图,利用图卷积神经网络学习关系表征。同时,利用关系表征指导证据集抽取网络抽取对应的证据集,最后将证据集表征融入关系表征进行关系判别。本发明通过关系抽取和证据集抽取两通道任务的联合训练。关系抽取为证据集抽取提供特定关系信息,证据集抽取为关系抽取提供依据信息,从而提高篇章关系抽取的效果。同时,在文档图中创新性的增加关系节点促进了实体之间的消息传递,有利于模型充分学习语义表征。
-
公开(公告)号:CN114707516A
公开(公告)日:2022-07-05
申请号:CN202210322393.2
申请日:2022-03-29
Applicant: 北京理工大学
Abstract: 本发明公开了一种基于对比学习的长文本语义相似度计算方法,属于人工智能、自然语言处理技术领域。本发明主要解决的技术问题为小样本场景下长文本语义匹配问题。首先通过爬虫、人工采集手段构建通用、领域数据库。其次使用领域数据库和通用数据库中包含的主题、标题、关键短语等篇章结构信息构建模型,通过有监督的文本表示学习方法对比学习进行训练。最后使用该模型对待评价文本进行预测来获得相似度打分,经过人工修正模块对该语义打分进行修正,并决定是否将该文本加入领域数据库进一步扩大训练资源。定期使用领域资源库更新模型,实现小样本下高精度语义相似度计算。
-
公开(公告)号:CN110991167B
公开(公告)日:2021-10-08
申请号:CN201911233518.9
申请日:2019-12-05
Applicant: 北京理工大学
IPC: G06F40/247 , G06F40/30 , G06F40/279
Abstract: 本发明涉及一种基于情感层次体系的情感词典构建方法,属于情感分析领域。包含如下步骤:步骤一:将语料按照情感层次体系进行拆分,并提取出未知情感词;步骤二:按照未知情感词构字,计算未知情感词的权重,构建基于字的情感词典;步骤三:通过复合句推到未知情感值的单句的情感值并通过语境计算未知情感词的权重,构建基于语境的情感词典;步骤四:将二和三得情感词典融合;步骤六:利用新的情感词典重新迭代计算直到没有新的情感词。所述方法将语料划分六层层次体系,然后通过构字和语境方法计算权重,得到了更加准确、全面的情感词典;将得到的情感词典运用到情感分析任务中,可以提高情感分析的效率和准确率。
-
-
-
-
-
-
-
-
-