一种文本核心内容提取方法及装置

    公开(公告)号:CN111767393A

    公开(公告)日:2020-10-13

    申请号:CN202010575748.X

    申请日:2020-06-22

    IPC分类号: G06F16/34 G06F16/31

    摘要: 一种文本核心内容提取方法及装置,所述方法包括:获取待处理文本并提取所述待处理文本中的关键词;将所述待处理文本中的各段落划分为多个主题;根据所述主题中各句子对应的指标参数分别提取各所述主题的核心句子,其中,所述指标参数包括:各句子在所述待处理文本的位置、各句子的词频总数占所在主题词频总数的比重、各句子的设定词汇的数量及各句子包含的关键词的频次;将所述核心句子按照预设的组合策略进行组合,形成摘要文本。本申请提供的文本核心内容提取方法及装置,采用多维度的综合评价策略,能够根据文本中的不同主题,对文本核心内容进行有代表性的提取,全面客观地反映文本内容。

    一种短会话新问题生成方法、存储介质和人机交互装置

    公开(公告)号:CN111159370A

    公开(公告)日:2020-05-15

    申请号:CN201911321137.6

    申请日:2019-12-20

    IPC分类号: G06F16/332 G06F16/35

    摘要: 本实施例公开一种短会话新问题生成方法,获取候选新问题;形成相似候选新问题集合,将所述候选新问题按照相似程度聚类,获得相似候选新问题集合;提取标签词,提取所述相似候选新问题集合中的预定词频的业务词汇作为所述相似候选新问题集合的标签词;生成主旨句,根据所述相似候选新问题集合的内容生成主旨句;生成新问题,根据所述相似候选新问题集合中预定数量的候选新问题、所述主旨句和所述标签词生成新问题。本实施例考量了候选新问题内容之间的相似性,可以对从多个角度提出的具有业务含义相近似新问题能够精准聚类,匹配到准确答复,业务意图理解能力更接近真实应用场景,适用性更强,可适用于多种业务场景。

    一种业务流程处理方法、装置、设备及可读存储介质

    公开(公告)号:CN118333551A

    公开(公告)日:2024-07-12

    申请号:CN202410357160.5

    申请日:2024-03-27

    摘要: 本申请公开了一种业务流程处理方法、装置、设备及可读存储介质,涉及数据处理领域。该方法包括:获取目标界面的操作数据和目标流程节点数据,目标流程节点数据包括业务流程中的目标流程节点的数据;根据操作数据和流程节点数据,从数据库中调取与操作数据和目标流程节点数据对应的第一策略信息,第一策略信息包括与操作数据和目标流程节点数据对应的至少一个问询问题;在目标界面的业务问答窗口显示至少一个问询问题;接收至少一个问询问题的选择输入,选择输入用于指示从至少一个问询问题中选择目标问询问题;在目标界面显示目标问询问题对应的问询结果。本申请实施例能够使问答过程和业务办理流程不脱节,提高了业务流程处理效率。

    一种基于短会话的新词发现方法、存储介质和电子装置

    公开(公告)号:CN111125327A

    公开(公告)日:2020-05-08

    申请号:CN201911268368.5

    申请日:2019-12-11

    摘要: 本发明公开一种基于短会话的新词发现方法,获取会话内容;分词处理,对所述获取的会话内容进行分词,对分词结果进行处理得到具有业务含义的目标词汇,所述目标词汇由基础单一词汇独立或组合形成;候选词汇筛选,获取所述目标词汇的属性和词频,根据所述目标词汇的属性和词频将符合预定条件的目标词汇作为候选词汇;成词指标计算,计算所述候选词汇的互信息值和左右熵值;候选新词筛选,将满足预设互信息阈值和左右熵阈值的候选词汇作为候选新词;输出新词,对所述候选新词按照词频排序,输出预定数量的新词。结合多重阈值筛选策略进行新词发现,覆盖了单一成词和组合成词的范围,提高了新词发现的可能性。

    一种数据处理方法和装置
    6.
    发明公开

    公开(公告)号:CN117171321A

    公开(公告)日:2023-12-05

    申请号:CN202311132531.1

    申请日:2023-09-04

    摘要: 本申请提供一种数据处理方法和装置,应用于人工智能技术领域,用于提高构建问句泛化表达的效率和降低人力成本。该方法包括:构建问句分类体系,所述问句分类体系包括多级语义表达层,多级语义表达层中的每一级语义表达层包含多个语义表达类型,多级关联的语义表达类型组成一条关联路径;根据所述问句分类体系构建初始问句泛化表达模型库,所述初始问句泛化表达模型库中包括多个语义表达分类结果,所述多个语义表达分类结果中每个语义表达分类结果对应所述问句分类体系中的一条关联路径;根据问句库中的样本问句对所述初始问句泛化表达模型库中的每个语义表达分类结果添加问句泛化表达,得到构建好的问句泛化表达模型库。