一种支持跨语言迁移的细粒度情感分析方法

    公开(公告)号:CN111160037A

    公开(公告)日:2020-05-15

    申请号:CN201911214600.7

    申请日:2019-12-02

    申请人: 广州大学

    发明人: 胡勇军

    摘要: 本发明公开了一种支持跨语言迁移的细粒度情感分析方法,方法包括以下步骤:对电商评论文本进行随机抽样,并对抽样文本进行人工标注,获得该文本的主题情感标注数据集;把标注数据集放进语义-长短时记忆网络进行训练,得到文本的语义团;把得到的语义团与抽样文本一同通过基于层面的情感模型进行训练,得到该文本的主题特征;通过微调网络对标注数据集与主题特征进行训练,得到抽样文本的嵌入向量;将嵌入向量与主题特征进行特征融合,得到该文本的情感分类结果。本发明考虑到产品评论中极性分布不对称、层面稀疏和情感词分布不均匀的情况,提高了情感分析的准确度,可广泛应用于文本数据挖掘领域。

    一种个性化定制下的价值链知识发现方法

    公开(公告)号:CN115168600B

    公开(公告)日:2023-07-11

    申请号:CN202210715356.8

    申请日:2022-06-23

    申请人: 广州大学

    发明人: 胡勇军 朱柳茜

    摘要: 本发明公开了一种个性化定制下的价值链知识发现方法,属于信息技术领域。由以下步骤组成:对给定领域文本划定价值主题,进行价值锚定种子词抽取;根据所述价值锚定种子词构建价值语义拓扑空间;对所述价值锚定种子词进行扩充,得到初始主题锚定词集;对所述初始主题锚定词进行更新,得到优化主题锚定词集;以所述优化主题锚定词为约束,获得价值语义文本的多簇网状结构表示;对多个跨领域文本进行锚定约束,构建价值链知识图谱。本发明可以提高模型对文本语料在价值链决策目标约束下的表示学习能力,并支持价值链跨领域、多主体文本语料的关联分析,以了解各主体之间的价值主张与协同程度,为产业价值链协同提供决策支持方法与工具。

    基于区块链的信息标注方法

    公开(公告)号:CN111737343B

    公开(公告)日:2021-12-07

    申请号:CN202010391912.1

    申请日:2020-05-11

    申请人: 广州大学

    发明人: 胡勇军

    摘要: 本发明公开了基于区块链的信息标注方法,包括以下步骤:根据获取的原始信息对生产者和消费者进行标注,确定生产者代表和评论者代表,得到原始标注数据;通过区块链对原始标注数据进行打包,并计算打包结果的哈希值;将所述哈希值记录至区块链中;构建查询者记录表,通过所述查询者记录表对信息的查询状态进行记录。本发明能够防止查询记录被人为篡改,保证了信息的真实可靠,可广泛应用于区块链技术领域。

    一种个性化定制下的价值链知识发现方法

    公开(公告)号:CN115168600A

    公开(公告)日:2022-10-11

    申请号:CN202210715356.8

    申请日:2022-06-23

    申请人: 广州大学

    发明人: 胡勇军 朱柳茜

    摘要: 本发明公开了一种个性化定制下的价值链知识发现方法,属于信息技术领域。由以下步骤组成:对给定领域文本划定价值主题,进行价值锚定种子词抽取;根据所述价值锚定种子词构建价值语义拓扑空间;对所述价值锚定种子词进行扩充,得到初始主题锚定词集;对所述初始主题锚定词进行更新,得到优化主题锚定词集;以所述优化主题锚定词为约束,获得价值语义文本的多簇网状结构表示;对多个跨领域文本进行锚定约束,构建价值链知识图谱。本发明可以提高模型对文本语料在价值链决策目标约束下的表示学习能力,并支持价值链跨领域、多主体文本语料的关联分析,以了解各主体之间的价值主张与协同程度,为产业价值链协同提供决策支持方法与工具。

    一种支持跨语言迁移的细粒度情感分析方法

    公开(公告)号:CN111160037B

    公开(公告)日:2021-10-26

    申请号:CN201911214600.7

    申请日:2019-12-02

    申请人: 广州大学

    发明人: 胡勇军

    摘要: 本发明公开了一种支持跨语言迁移的细粒度情感分析方法,方法包括以下步骤:对电商评论文本进行随机抽样,并对抽样文本进行人工标注,获得该文本的主题情感标注数据集;把标注数据集放进语义‑长短时记忆网络进行训练,得到文本的语义团;把得到的语义团与抽样文本一同通过基于层面的情感模型进行训练,得到该文本的主题特征;通过微调网络对标注数据集与主题特征进行训练,得到抽样文本的嵌入向量;将嵌入向量与主题特征进行特征融合,得到该文本的情感分类结果。本发明考虑到产品评论中极性分布不对称、层面稀疏和情感词分布不均匀的情况,提高了情感分析的准确度,可广泛应用于文本数据挖掘领域。

    基于区块链的信息标注方法

    公开(公告)号:CN111737343A

    公开(公告)日:2020-10-02

    申请号:CN202010391912.1

    申请日:2020-05-11

    申请人: 广州大学

    发明人: 胡勇军

    摘要: 本发明公开了基于区块链的信息标注方法,包括以下步骤:根据获取的原始信息对生产者和消费者进行标注,确定生产者代表和评论者代表,得到原始标注数据;通过区块链对原始标注数据进行打包,并计算打包结果的哈希值;将所述哈希值记录至区块链中;构建查询者记录表,通过所述查询者记录表对信息的查询状态进行记录。本发明能够防止查询记录被人为篡改,保证了信息的真实可靠,可广泛应用于区块链技术领域。

    基于主题相似度的网页信息获取方法、装置及系统

    公开(公告)号:CN107704535A

    公开(公告)日:2018-02-16

    申请号:CN201710862871.8

    申请日:2017-09-21

    申请人: 广州大学

    IPC分类号: G06F17/30 H04L29/08

    摘要: 本发明公开了一种基于主题相似度的网页信息获取方法、装置及系统。所述基于主题相似度的网页信息获取方法包括:响应于用户交互端发送的目标主题,生成网页获取请求;将所述网页获取请求发送至目标服务器;接收所述目标服务器返回的所有所述目标网页;对每个所述目标网页进行解析,获得至少一个网页信息;根据预先设置的与所述目标主题相对应的主题相似度计算模型,对每个所述网页信息进行计算,获得每个所述网页信息的主题与所述目标主题之间的主题相似度;将所述主题相似度大于预设阈值的每个所述网页信息返回至所述用户交互端。采用本发明,能够提高所获取的网页信息的针对性和准确度。