-
公开(公告)号:CN118446228A
公开(公告)日:2024-08-06
申请号:CN202410626438.4
申请日:2024-05-20
申请人: 北京中关村科金技术有限公司
IPC分类号: G06F40/35 , G06F40/284 , G06F16/35 , G06F16/34 , G06F16/33
摘要: 本申请实施例提供了一种对话要素抽取方法及装置、设备、存储介质、计算机软件,该方法包括获取目标轮对话的语音识别的文本;基于所述文本确定所述目标轮对话的主题类型,主题类型基于业务流程划分,各主题类型包括多个要素;如果所述目标轮对话的主题类型与所述目标轮对话的上一轮对话的主题类型一致,则合并所述目标轮的文本和上一轮对话的文本;基于合并后的文本和所述目标轮对话的主题类型,抽取所述目标轮对话的要素。
-
公开(公告)号:CN118228740B
公开(公告)日:2024-07-26
申请号:CN202410649814.1
申请日:2024-05-24
申请人: 北京中关村科金技术有限公司
IPC分类号: G06F40/35 , G06F40/205 , G06F18/213 , G06F18/27 , G06N3/0499 , G06N3/08
摘要: 本申请提供一种会话信息处理方法、装置、设备、存储介质及产品,涉及人工智能领域,该方法包括:获取目标用户在目标会话中的会话信息;对所述会话信息进行特征提取,得到会话行为特征和会话内容标签,所述会话行为特征用于指示所述目标会话中的会话流程以及所述会话流程对应的持续时间,所述会话内容标签用于指示所述会话内容对应的标签信息;将所述会话行为特征和所述会话内容标签输入至逻辑回归模型中进行预测,得到预测结果。本申请通过获取目标用户在目标会话中的会话信息,从而提取出会话行为特征和会话内容标签,由此根据会话行为特征和会话内容标签在逻辑回归模型中进行预测,得到预测结果,从而提高会话的处理效率。
-
公开(公告)号:CN118312614A
公开(公告)日:2024-07-09
申请号:CN202410467171.9
申请日:2024-04-18
申请人: 北京中关村科金技术有限公司
IPC分类号: G06F16/35 , G06F16/383 , G06F40/30
摘要: 本公开提供了一种要素抽取方法及装置、电子设备,该方法包括:获取与当前滑动窗口相对应的实时文本片段;根据预设的要素类型特征,确定实时文本片段的类型识别结果;其中,要素类型特征包括:单要素类型特征以及多要素类型特征,且类型识别结果包括:与单要素类型特征相对应的第一类识别结果,以及与多要素类型特征相对应的第二类识别结果;根据类型识别结果,确定与实时文本片段相对应的目标文本数据;针对目标文本数据执行要素抽取处理,得到目标文本数据中包含的目标要素;其中,第一文本数据的数据量不同于第二文本数据。该方式便于根据文本片段的类型,灵活提取不同长度的目标文本数据进行要素抽取,从而提升要素抽取的效率和准确性。
-
公开(公告)号:CN118095433A
公开(公告)日:2024-05-28
申请号:CN202410202145.3
申请日:2024-02-23
申请人: 北京中关村科金技术有限公司
IPC分类号: G06N5/04 , G06V30/413 , G06V30/148
摘要: 本发明实施例提供一种文档处理方法、装置及设备。所述方法包括:获取待处理的图像文档;利用目标领域高效微调LoRA模型对所述待处理的图像文档进行处理,得到问答结果;其中,所述目标LoRA模型是基于多模态语言模型对多个问答子任务分别进行处理得到的。本发明实施例利用基于多模态语言模型对多个问答子任务分别进行处理得到的LoRA模型对图像文档进行处理,既保留了通用多模态语言模型的基本能力,同时提升了通用多模态语言模型在不同子任务上的性能,且提升了视觉文档问答方法的性能。
-
公开(公告)号:CN117909731A
公开(公告)日:2024-04-19
申请号:CN202311768520.2
申请日:2023-12-21
申请人: 北京中关村科金技术有限公司
IPC分类号: G06F18/214 , G06F40/216
摘要: 本申请实施例提供了一种加噪方法、装置、电子设备和存储介质,该加噪方法包括:获取微调数据集,微调数据集包括N条数据,每条数据包括n个特定字段;统计每条数据中n个特定字段中目标字段的文本长度;根据文本长度将第一数据集划分为第一数据子集和第二数据子集,第一数据子集中包括M条数据,第二数据子集中包括N‑M条数据;从第一数据子集或第二数据子集中选取第一数据作为待加噪数据;从第一数据子集或第二数据子集中选取第二数据作为噪声数据,将待加噪数据和噪声数据进行拼接,得到加噪数据。
-
公开(公告)号:CN117632869A
公开(公告)日:2024-03-01
申请号:CN202311635619.5
申请日:2023-12-01
申请人: 北京中关村科金技术有限公司
IPC分类号: G06F16/14 , G06F16/16 , G06F40/186
摘要: 本申请提供一种文档处理方法、装置及电子设备,该方法包括:获取文档要求以及文档要求对应的内容数据;根据文档要求以及内容数据,生成文档页面布局模板,文档页面布局模板包括N个待填充版块;根据文档页面布局模板、文档要求以及内容数据,生成N个填充内容,N个填充内容与N个待填充版块一一对应;将N个填充内容填充到文档页面布局模板对应的版块中,得到目标文档,以提高文档生成的灵活性。
-
公开(公告)号:CN117609461A
公开(公告)日:2024-02-27
申请号:CN202311621289.4
申请日:2023-11-30
申请人: 北京中关村科金技术有限公司
IPC分类号: G06F16/332 , G06F16/33 , G06F18/22
摘要: 本申请提供了文本生成方法、智能问答方法、装置和电子设备和介质。所述文本生成方法,包括:获取初始文本内容;对初始文本内容进行切片处理,得到多个第一文本切片;将所述多个第一文本切片中,相似度超过第一阈值的第一文本切片进行合并处理,得到至少一个合并文本切片;将所述至少一个合并文本切片中,每个合并文本切片与所对应的问题信息进行拼接,得到至少一个目标文本,所述问题信息的答案位于所述问题信息所对应的合并文本切片内。本申请可以提高所生成的目标文本的质量。
-
公开(公告)号:CN117350407A
公开(公告)日:2024-01-05
申请号:CN202311549066.1
申请日:2023-11-20
申请人: 北京中关村科金技术有限公司
摘要: 本申请公开了一种模型处理方法、装置、电子设备及可读存储介质,属于人工智能技术领域。本申请实施例中的模型处理方法包括:获取训练数据;根据所述训练数据以及预先建立的prompt模板,生成第一prompt数据和第二prompt数据;所述第一prompt数据与第一任务相关,所述第一任务至少包括目标原子任务;所述第二prompt数据与第二任务相关,所述第二任务包括所述目标原子任务,且所述第二任务包括的原子任务的个数比第一任务包括的原子任务的个数多;利用所述第一prompt数据对预训练模型进行训练,获得初始任务执行模型;利用所述第二prompt数据对所述初始任务执行模型进行调整,获得目标任务执行模型。由此,可以有效提升模型的任务执行能力。
-
公开(公告)号:CN117035846A
公开(公告)日:2023-11-10
申请号:CN202311201534.6
申请日:2023-09-18
申请人: 北京中关村科金技术有限公司
IPC分类号: G06Q30/0202 , G06Q30/0601 , G06F18/214
摘要: 本公开提供一种信息预测方法、装置及相关设备,涉及信息处理技术领域。其中,所述方法包括:获取目标用户对应的多个事件信息,其中,每一所述事件信息包括用于指示目标用户与目标商品之间的交互事件的事件类型的数据,以及用于指示所述交互事件的发生时间信息的数据,交互事件包括购买事件;基于多个事件信息对用于指示所述购买事件对应的时序点过程的初始模型进行训练,获得目标模型;根据目标模型预测购买意向信息,所述购买意向信息用于指示所述目标用户在目标时刻购买所述目标商品的概率,本公开能从时间维度对用户的行为特征进行深入分析,使所获得的预测结果更加可靠。
-
公开(公告)号:CN116991976A
公开(公告)日:2023-11-03
申请号:CN202311147535.7
申请日:2023-09-07
申请人: 北京中关村科金技术有限公司
IPC分类号: G06F16/33 , G06F40/289 , G06F40/30 , G06F16/35
摘要: 本发明提供一种模型训练方法、装置、电子设备及可读存储介质,属于自然语言处理技术领域。该方法包括:获取第一文本数据集,所述第一文本数据集包括多个第一指令任务的表述文本;获取每个第一指令任务的层次等级,所述层次等级用于指示所述第一指令任务在自然语言处理的认知难度;按照层次等级在认知难度上从低至高的顺序,依次基于所述第一文本数据集中所述层次等级的第一指令任务的表述文本,对第一模型进行训练。本发明可以使得大模型具有多层次等级的认知能力,解决更复杂的问题。
-
-
-
-
-
-
-
-
-