中文命名实体识别方法、装置及计算机可读存储介质

    公开(公告)号:CN110909548B

    公开(公告)日:2024-03-12

    申请号:CN201910965462.X

    申请日:2019-10-10

    发明人: 邓悦 金戈 徐亮

    IPC分类号: G06F40/30 G06F16/35

    摘要: 本发明涉及一种人工智能技术,揭露了一种中文命名实体识别方法,包括:接收原始文本集并进行去噪、去停用词及标注处理后得到标准文本集,将所述标准文本集进行聚类操作得到类簇个数及聚类中心,基于所述类簇个数及所述聚类中心,将所述标准文本集建立后验概率模型,优化所述后验概率模型得到标准词向量集,将所述标准词向量集输入至预先构建的命名实体识别模型中训练得到训练后的命名实体识别模型,接收用户输入的文本集,计算所述文本集得到词向量集,将所述词向量集输入至所述训练后的命名实体识别模型得到命名识别结果。本发明还提出一种中文命名实体识别装置以及一种计算机可读存储介质。本发明可以实现精准的中文命名实体识别功能。

    分析语义情感的方法、装置、设备及存储介质

    公开(公告)号:CN112131888B

    公开(公告)日:2023-11-14

    申请号:CN202011009900.4

    申请日:2020-09-23

    发明人: 邓悦 郑立颖 徐亮

    摘要: 本申请涉及人工智能中的智能决策领域,揭示了分析语义情感的方法,包括:获取待分析语句中每个单词分别对应的重要性度量值;根据待分析语句中每个单词分别对应的重要性度量值,通过两个并行运行的循环神经网络模型,得到待分析语句对应的隐式表达式;将待分析语句对应的隐式表达式以及待分析语句对应的句子标签,输入语义情感分析分类器;接收语义情感分析分类器对待分析语句的情感分析分类结果。通过引入自注意力机制,将句中每个单词的重要性通过重要性度量值进行量化,然后根据重要单词所处位置,获取当前单词在整个句子中的含义,从而使得最终输出的整个句子的隐藏状态中,融合了句中每个单词及其相应的重要性度量值。

    基于大数据的保险代理人培养方案生成方法及相关设备

    公开(公告)号:CN109919811B

    公开(公告)日:2023-09-15

    申请号:CN201910070437.5

    申请日:2019-01-25

    发明人: 邓悦 金戈 徐亮

    摘要: 本申请涉及大数据分析技术领域,尤其涉及一种基于大数据的保险代理人培养方案生成及相关设备,包括:获取绩优保险代理人LBS数据和非LBS数据,抽取所述绩优保险代理人LBS数据和非LBS数据中的行为因子,建立绩优代理人分类模型;获取非绩优代理人的初始LBS数据和初始非LBS数据,将所述非绩优代理人的初始LBS数据和初始非LBS数据入参到所述绩优代理人分类模型得到初始培养方案;获取所述非绩优保险代理人在执行所述初始培养方案后产生的新LBS数据和新非LBS数据,根据新LBS数据和新非LBS数据修正所述初始培养计划后得到新培养方案。本申请有效建立保险代理人的培养方案从而提升了保险代理人的业务水平。

    多轮问答识别方法、装置、计算机设备及存储介质

    公开(公告)号:CN110825857B

    公开(公告)日:2023-07-21

    申请号:CN201910906819.7

    申请日:2019-09-24

    发明人: 邓悦 金戈 徐亮

    IPC分类号: G06F16/332 G06F40/30

    摘要: 本发明涉及人工智能技术领域,提供了一种多轮问答识别方法、装置、计算机设备及存储介质,所述多轮问答识别方法包括:将获取到的用户历史问题、用户历史答案和用户当前问题导入到预先训练好的目标多轮问答模型中;利用目标多轮问答模型中的编码单元进行向量特征转换处理,得到第一向量特征、第二向量特征和第三向量特征;将第一向量特征、第二向量特征和第三向量特征导入到长短期记忆单元中进行语义特征提取,得到目标语义特征;将目标语义特征导入到全连接单元中进行相似度计算,输出相似度最大的识别结果。本发明的技术方案实现提高用户根据目标多轮问答模型获取信息的准确性及效率。

    用于AI智能面试的识别的方法、装置、计算机设备及存储介质

    公开(公告)号:CN111694936B

    公开(公告)日:2023-06-06

    申请号:CN202010340339.1

    申请日:2020-04-26

    发明人: 邓悦 金戈 徐亮

    摘要: 本申请实施例属于语义识别领域,涉及一种用于AI智能面试的识别的方法,包括获取文本数据;对所述文本数据逐句进行向量分词,并确定至少一组第一文本向量以及与所述第一文本向量相对应的第二文本向量;将至少一组所述第一文本向量和第二文本向量导入至预设的表征模型中进行处理,以获得所述若干第一文本向量与第二文本向量的影响概率数据;将各个所述影响概率数据按照由高到低的顺序进行排序,并返回预设数量排序在前的影响概率数据对应的候选人作为智能面试的识别结果,并将所述结果存储于区块链网络中。本申请还提供一种用于AI智能面试的识别的装置、计算机设备及存储介质。本申请能够高效的完成面试结果的识别,并且识别精度高。

    基于对抗网络的商品推荐方法、电子装置及存储介质

    公开(公告)号:CN109509056B

    公开(公告)日:2023-05-09

    申请号:CN201811202557.8

    申请日:2018-10-16

    发明人: 邓悦 金戈 徐亮 肖京

    摘要: 本发明涉及大数据分析,提供基于对抗网络的商品推荐方法、电子装置及存储介质,包括:获得用户对商品的行为数据,所述行为数据包括购买数据和浏览数据;根据行为数据生成随机输入向量;将随机输入向量和行为数据输入对抗网络模型,所述对抗网络模型包括生成器和判别器,所述随机输入向量输入生成器得到随机生成向量,所述随机生成向量作为判别器的虚拟输入,所述行为数据作为判别器的真实输入;所述判别器判断所述真实输入和虚拟输入,输出判定为真实与虚拟的比例,判断判别器是否收敛,当判别器不收敛时,驱动生成器更新直至判别器收敛,将所述生成器的随机生成向量作为推荐序列。所述方法、装置及介质准确学习推荐实体的特征。

    命名实体识别方法、装置、设备及计算机可读存储介质

    公开(公告)号:CN110298019B

    公开(公告)日:2023-04-18

    申请号:CN201910420794.X

    申请日:2019-05-20

    发明人: 邓悦 金戈 徐亮

    摘要: 本申请提供一种命名实体识别方法、装置、设备及计算机可读存储介质,该方法包括:根据监测到的命名实体识别请求,确定待识别的目标语句,并获取命名实体识别模型;将目标语句输入至所述词编码层,得到目标语句中的每个词分别对应的第一词向量;将目标语句输入字编码层,得到目标语句中的每个字分别对应的目标字向量;以词为单位,将每个词中的各个字的目标字向量依次输入至双向长短期记忆网络层,得到每个词分别对应的第二词向量;将每个词分别对应的第一词向量和第二词向量输入至命名实体识别层,得到目标语句中的命名实体。本申请采用深度学习和自然语言处理技术表征语义信息,减少语义信息的丢失,可以提高命名实体的识别精确性。

    获取KPI异常数据样本的方法、装置和计算机设备

    公开(公告)号:CN111897695B

    公开(公告)日:2022-06-17

    申请号:CN202010762945.2

    申请日:2020-07-31

    发明人: 邓悦 郑立颖 徐亮

    IPC分类号: G06F11/30 G06F11/34 G06K9/62

    摘要: 本发明涉及人工智能技术,应用于智慧城市中,提出的获取KPI异常数据样本的方法、装置、计算机设备和存储介质,其中方法包括:获取预设时间段的KPI数据;将KPI数据进行异常检测得到潜在异常数据点,以潜在异常数据点为终点,按时间顺序回溯截取一指定片段KPI数据作为候选KPI异常数据;对候选KPI异常数据与已知KPI异常数据进行调整,使两者时间长度一致,并将两者的对应数据点进行相似距离计算得到多个规整路径距离;依据各规整路径距离判断候选KPI异常数据是否为KPI异常数据;若是,则将候选KPI异常数据标记成KPI异常数据,以作为训练智能KPI异常识别模型的样本,通过少量已知的KPI异常数据样本即可得到大量的KPI异常数据样本,大大地降低运维成本。

    中文文本纠错方法、系统及介质
    100.
    发明公开

    公开(公告)号:CN113239683A

    公开(公告)日:2021-08-10

    申请号:CN202110603437.4

    申请日:2021-05-31

    发明人: 邓悦 郑立颖 徐亮

    摘要: 本申请提供了一种中文文本纠错方法、系统及介质,将待纠错文本输入别字检测单元检测错别字,得到错别字集合;别字检测单元包括De检测板块,De检测板块用于检测目标错别字,目标错别字包括“的”、“得”以及“地”;根据错别字集合,获取错别字集合中错别字的音近词、同型词以及相似拼音词,错别字的音近词、同型词以及相似拼音词形成候选字集合;根据候选字集合,通过基于语言模型的别字纠错单元得到待纠错文本的纠错后文本;纠错后文本为采用候选字集合中的候选字替换待纠错文件中相应的错别字后得到的;其中,基于语言模型的别字纠错单元包括基于self‑attention的双向编码器,双向编码器包括self‑attention层和前馈神经网络层。本申请预测更优并提高了改正的准确度。