-
公开(公告)号:CN109308316A
公开(公告)日:2019-02-05
申请号:CN201810823424.6
申请日:2018-07-25
Applicant: 华南理工大学
IPC: G06F16/332 , G06F16/35
Abstract: 本发明公开了基于主题聚类的自适应对话生成系统,包括对话数据模块、向量化模块、聚类模块、Seq2Seq模块;对话数据模块,用于在训练之前构建对话数据集;向量化模块,用于在聚类之前将对话数据集向量化并作为聚类模型的输入,成为聚类的依据;聚类模块,用于将向量化后的对话数据集聚类为多个簇;Seq2Seq模块,用于构建Seq2Seq模型,对聚类模块得到的簇中的对话数据集生成对应的回复。本发明可以将对话数据按照主题进行聚类,针对不同类别的对话数据使用特定的Seq2Seq模型进行训练。在经典的Seq2Seq模型下,往往会产生无意义的回复。而通过本发明提出的模型可以让对话系统生成更符合主题、更有意义的回复。这样的回复能让用户更愿意去和对话系统进行交流,提升用户体验度。
-
公开(公告)号:CN104933164B
公开(公告)日:2018-10-09
申请号:CN201510366176.3
申请日:2015-06-26
Applicant: 华南理工大学
IPC: G06F17/30
Abstract: 本发明公开了一种互联网海量数据中命名实体间关系提取方法,包括以下步骤:网络信息爬取和语料库构建;文本预处理;提取代表短文档特征的关键词;获得代表实体关系的“实体‑关系模式”;关系标注,利用这些模式在大量的无结构文本中寻找新的“实体关系对”;实体关系对评估;本发明还公开了一种实现互联网海量数据中命名实体间关系提取方法的系统,包括:网络信息爬取模块、信息预处理模块、特征词提取模块、实体关系提取和评估模块。具有使关系查找系统更加方便扩展和具有较高的运行效率等优点。
-
公开(公告)号:CN107798725A
公开(公告)日:2018-03-13
申请号:CN201710783949.7
申请日:2017-09-04
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于Android的二维住房户型识别和三维呈现方法,该方法包括下列步骤:二维户型图信息提取与分类,三维户型图建模元素的构建;选取图像格式的二维户型图;对二维户型图片进行尺寸上的适当裁剪和修正,并对二维户型图片进行二值化操作和形态学操作;提取进行三维绘制的各建模元素的基本数据;自动绘制三维户型图;实现通过手势操作来对三维户型图进行漫游操作。本方法发明不仅可以快速便捷地识别二维住房户型同时在移动终端上三维呈现,而且还提供了便捷的交互操作。因此,本发明具有建模难度低、效率高的特点,可以最大程度帮助用户理解和提升用户体验的优点。
-
公开(公告)号:CN106055713A
公开(公告)日:2016-10-26
申请号:CN201610519445.X
申请日:2016-07-01
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于用户兴趣和社交主题提取的社交网络用户推荐方法,包括以下步骤:获取社交网络中用户的“follower‑followee”关系以及“mutual‑following”关系信息;提取用户的社交主题和兴趣主题;在这些主题的基础上分别形成用户的社交社区和兴趣社区;将各个社区分别整理成矩阵形式,使用矩阵分解方法对各个社区矩阵进行分解以计算各用户对在各个社区矩阵的意愿关注分数,取各个用户对在所有社区的意愿关注分数的最大值为最终意愿关注分数,为目标用户排序其与其他用户的最终意愿关注分数,最终选取分数最高的TOP‑N用户为推荐关注用户。具有得到了更准确的社交网络用户推荐结果等优点。
-
公开(公告)号:CN119598394A
公开(公告)日:2025-03-11
申请号:CN202411640044.0
申请日:2024-11-18
Applicant: 华南理工大学
Abstract: 本发明公开了一种面向视觉语言导航的多粒度指令生成方法及装置,方法包括:提取粗粒度的全景图像特征与动作特征,细粒度的区域特征与网格特征;采用Bi‑LSTM和注意力机制对全局特征进行编码与融合,得到粗粒度的轨迹表征;设计基于时间约束的空间自注意力,时间自注意力以及基于时间和局部约束的交叉注意力,对局部特征进行编码与融合,得到细粒度的轨迹表征;融合粗粒度与细粒度的表征,生成多粒度的轨迹表征;通过LSTM‑RNN进行解码,合成导航指令;合成的指令和采样得到的轨迹组成增强的数据,用于训练导航智能体。本发明从数据增强的角度出发、合成高质量的自然语言导航指令,并提升智能体的泛化能力,提供了一种创新且实用的解决方案。
-
公开(公告)号:CN111723563B
公开(公告)日:2023-09-26
申请号:CN202010391845.3
申请日:2020-05-11
Applicant: 华南理工大学
IPC: G06F40/237 , G06F40/30
Abstract: 本发明公开了一种基于词共现网络的主题建模方法,包括步骤:根据给定的语料库或者文本集合构建词共现网络;根据得到的词共现网络构造出一个新的文档集合;将得到的新的文档集合输入到一个标准主题模型LDA的Gibbs sampling算法中,得到新文档集合对应的文档‑主题矩阵和主题‑词矩阵。本发明不需要依赖任何的外部知识,避免了收集额外知识的精力,仅仅是利用数据集本身包含的信息去改善主题模型的结果。
-
公开(公告)号:CN112541355B
公开(公告)日:2023-07-18
申请号:CN202011443134.2
申请日:2020-12-11
Applicant: 华南理工大学
IPC: G06F40/295 , G06N3/0442 , G06N3/084
Abstract: 本发明涉及一种实体边界类别解耦的少样本命名实体识别方法及系统,其方法包括步骤:S1、通过共享的词嵌入层,将句子中的单词映射为词嵌入向量;S2、通过双向长短期记忆网络提取出特征向量;S3、利用边界检测模块获取查询集实体边界标签预测结果,并提取出实体块;S4、基于原型网络获取实体块类别原型表示;S5、进行度量计算,根据度量结果进行分类,获取查询集实体块在各类别上的概率分布;S6、联合训练模型;S7、完成少样本命名实体识别。本发明通过实体边界检测获取实体块表示,基于原型网络使用支持集少量样本计算类别原型,实现了获取类别区分能力更强的原型网络类别原型表示,提高了少样本命名实体识别任务的准确率。
-
公开(公告)号:CN112380874B
公开(公告)日:2023-07-18
申请号:CN202011076361.6
申请日:2020-10-10
Applicant: 华南理工大学
IPC: G06F40/35 , G06F40/211 , G06F40/284 , G06N3/042 , G06N3/0464 , G06N3/044 , G06N3/082
Abstract: 本发明涉及一种基于图卷积网络的多人对话语篇分析方法,包括以下步骤:S1、通过句子编码模块将对话中的句子映射为局部句子向量;S2、通过图卷积网络捕捉句子之间的语义关系,输出全局句子向量;S3、通过拼接句子向量和全局句子向量,输入到语义连接预测模块预测连接的目标句子;S4、通过拼接句子向量和全局句子向量,输入到语义分类模块获取句子间的语义关系;S5、通过模型训练语义连接预测和语义关系分类任务,获取模型参数;S6、模型训练完毕后,输入整个对话的句子,输出句子间存在的语义连接及语义关系,完成多人对话的语篇分析。本发明利用图卷积网络捕捉多人对话的句子间存在的语义关系,从而提高语篇分析的性能。
-
公开(公告)号:CN111563148B
公开(公告)日:2023-06-20
申请号:CN202010304195.4
申请日:2020-04-17
Applicant: 华南理工大学
IPC: G06F16/332 , G06F16/35 , G06F16/33 , G06F40/284 , G06N3/0455 , G06N3/044 , G06N3/047 , G06N3/082
Abstract: 本发明公开了一种基于词组多样性的对话生成方法,构造对话生成模型,包括句子编码器、上下文编码器、转化层、条件变分自编码器、解码器以及词袋层,包括步骤:将对话上下文编码为一个上下文向量;将上下文向量映射为符合解码器输入大小的隐含状态,并将得到的隐含状态作为解码器的初始隐含状态;获取随机潜在变量;将得到的随机潜在变量、上下文向量、前一个词的词向量以及前一个时间步的隐含状态输入解码器的循环神经网络单元,得到循环神经网络单元输出的当前时间步的隐含状态;将解码器输出的当前时间步的隐含状态输入到词分类器,得到词分类器输出的一个词表大小的概率分布向量。本发明能够生成较为流畅且具词组层级多样性的对话回复。
-
公开(公告)号:CN111159556B
公开(公告)日:2023-04-21
申请号:CN201911405967.7
申请日:2019-12-31
Applicant: 华南理工大学
IPC: G06F16/9535
Abstract: 本发明公开了一种基于用户好奇心的贝叶斯个性化排序推荐方法,包括步骤:使用有好友关系的数据集,遍历数据集中每一个用户的历史数据,对于数据集中的每一个用户u,构建用户u的正向物品集合Pu,令用户u感到好奇的物品集合Cu以及用户u的负向物品集合Nu;提出优化排序准则,获取用户矩阵P和物品矩阵Q;对于每一个用户u,随机从Pu、Cu、Nu中选择物品组成物品对(positive,negative)和(curiosity,negative)进行训练,在每一次的训练迭代中不断地更新用户矩阵P和物品矩阵Q;对用户u所有没有过反馈的物品进行预测评分,选取分数最高的TopN个物品进行推荐。
-
-
-
-
-
-
-
-
-