-
公开(公告)号:CN118657134B
公开(公告)日:2024-10-29
申请号:CN202411126765.X
申请日:2024-08-16
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F40/186 , G06F16/31 , G06F16/34 , G06F16/36 , G06F16/33 , G06F16/332 , G06T11/60
Abstract: 本申请实施例公开了一种信息处理方法、装置、电子设备和存储介质;本申请实施例可以获取文本以及文本的摘要简介;获取目标章节的对象整合信息;根据目标章节的对象整合信息以及摘要简介,生成后一章节的对象提取提示;采用大语言模型根据后一章节的对象提取提示,在后一章节中确定后一章节的局部对象信;将后一章节的局部对象信息与目标章节的对象整合信息进行整合处理,得到后一章节的对象整合信息;得到全文对象信息,全文对象信息包括文本中最后一个章节的对象整合信息。本申请按照章节进行划分,提取出每个章节中出现对象的描述信息,并将所有章节的描述信息整合,最终得出准确的对象信息,由此,本方案可以提升信息处理方法的准确性。
-
公开(公告)号:CN114328884B
公开(公告)日:2024-07-09
申请号:CN202111466812.1
申请日:2021-12-03
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/335 , G06F16/583 , G06F40/166 , G06F40/194 , G06F40/295
Abstract: 本申请涉及计算机技术领域,提供一种图文去重方法及装置,可以高效且准确的计算两个图文之间的相似度。通过文本、图像以及多模态召回,能够更全面的对图文中的图像和文本进行相似度的衡量,平衡了召回率和准确率。通过对召回阶段的图文进行粗过滤,可以减轻校准阶段的计算压力,提高去重效率;并且,对粗过滤的结果从相似度层面和模版类图文层面进行去重校准,在相似度层面,使用编辑距离对粗过滤的图文进行校准,解释性更强,提升了去重的准确率,在模版类图文层面,使用根据实体名词对模版类图文之间的相似度进行了优化,进一步提高了去重的准确率。该方法能够较好的解决当前方案召回少、效率低、准确率不高的问题。
-
公开(公告)号:CN117372731A
公开(公告)日:2024-01-09
申请号:CN202311438209.1
申请日:2023-10-31
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请公开了一种基于人工智能技术实现的图像检测方法,具体涉及计算机视觉技术。本申请方法包括:获取原始图像和目标图像;根据原始图像的版式,对目标图像进行尺寸调整,得到待匹配图像;基于待匹配图像,通过滑动窗口和预设滑动步长,对原始图像进行遍历处理,得到K个子图像;对待匹配图像和K个子图像进行哈希编码,得到至少一个相似度列表,每个相似度列表包括K个相似距离;根据至少一个相似度列表,确定目标最小距离;在目标最小距离小于或等于最小距离阈值的情况下,从原始图像中检测出与目标图像匹配成功的图像裁剪区域。本申请能够有效对抗图像拉伸和变型等干扰,从而提升图像匹配的准确率,进而能够准确地识别出图像裁剪位置。
-
公开(公告)号:CN116975301A
公开(公告)日:2023-10-31
申请号:CN202311231947.9
申请日:2023-09-22
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/35 , G06F40/284
Abstract: 本发明实施例公开了一种文本聚类方法、装置、电子设备和计算机可读存储介质;本发明实施例在获取目标应用的多个程序反馈文本后,对程序反馈文本中的文本内容进行文本分词,得到每一程序反馈文本对应的至少一个文本词,并对文本词进行特征提取,得到文本词的词特征,然后,基于词特征,确定程序反馈文本中每一文本词的关联权重,根据关联权重,对词特征进行特征变换,以得到每一程序反馈文本的目标文本特征,然后,基于目标文本特征,对多个程序反馈文本进行聚类,得到每一程序反馈文本的文本类别;该方案可以提升文本聚类的准确性。
-
公开(公告)号:CN116680439A
公开(公告)日:2023-09-01
申请号:CN202210157903.5
申请日:2022-02-21
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/783 , G06F16/732 , G06F16/75 , G06F16/735 , G06V40/16 , G06V10/764 , G06V10/74 , G06V10/77
Abstract: 本申请涉及一种基于主角指纹的关联识别方法、装置和计算机设备。所述方法涉及人工智能,包括:获取待处理的视频内容数据,包括第一发布对象发布的第一视频内容数据、第二发布对象发布的第二视频内容数据,基于视频内容数据进行实体识别,得到对应的实体识别结果。根据实体识别结果进行主角识别,确定第一发布对象的第一主角指纹、第二发布对象的第二主角指纹,并根据第一主角指纹与第二主角指纹之间的相似度,确定第一发布对象与第二发布对象之间的关联程度。采用本方法可实现基于更核心的主角指纹进行相似度识别,减少冗杂信息存储占用和数据计算时的信息加载时间,以提升所确定出的不同内容分发平台上各发布对象的关联程度的准确性。
-
公开(公告)号:CN111753076A
公开(公告)日:2020-10-09
申请号:CN202010808251.8
申请日:2020-08-12
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/332 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本申请涉及人工智能技术领域,公开了一种对话方法、装置、电子设备及可读存储介质,对话方法包括:获取用户输入的目标问句;基于训练后的强化学习模型,确定与所述目标问句对应的反馈动作;其中,所述强化学习模型是基于至少两轮样本对话、以及至少两轮样本对话所确定的奖励函数训练得到的;每一轮样本对话包括样本问句和对应的样本答句;确定与所述反馈动作对应的目标答句,并输出所述目标答句。本申请提供的对话方法使得最终训练得到的强化学习模型的预测准确率更高。
-
公开(公告)号:CN111538908A
公开(公告)日:2020-08-14
申请号:CN202010570799.3
申请日:2020-06-22
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/9535 , G06F16/9538 , G06F16/332 , G06F16/33 , G06F16/338 , G06F16/35 , G06F40/205 , G06F40/289 , G06K9/62
Abstract: 本申请涉及一种搜索排序方法、装置、计算机设备和存储介质。所述方法包括:获取搜索语句和对应的各个待排序召回语句。分别将搜索语句和各个待排序召回语句向量化,得到搜索语句向量和各个待排序召回语句向量,计算搜索语句向量分别与各个待排序召回语句向量的相似度,得到各个相似特征。基于搜索语句和各个待排序召回语句进行文本匹配,得到各个文本匹配特征。计算搜索语句和各个待排序召回语句对应的各个自注意力矩阵,基于自注意力矩阵计算得到各个交互特征。基于文本匹配特征、相似特征和交互特征计算搜索语句分别与各个待排序召回语句的相关程度。根据相关程度得到各个待排序召回语句的排序结果。采用本方法能够提高排序结果的精确性。
-
公开(公告)号:CN111339252A
公开(公告)日:2020-06-26
申请号:CN202010115111.2
申请日:2020-02-25
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请实施例提供一种搜索方法、装置及存储介质,方法包括:获取搜索信息;基于所述搜索信息得到至少一个症状特征;根据症状特征与症状的语义关联度,分别为各症状特征设置权重;获取设置了权重的各症状特征与至少一个预设症状实体之间的目标相似度;根据所述目标相似度,从所述至少一个预设症状实体中确定目标症状实体并输出。通过本方案,能够识别症状实体的准确性,以及有效区分相似症状和非相似症状。
-
公开(公告)号:CN111180070A
公开(公告)日:2020-05-19
申请号:CN201911403991.7
申请日:2019-12-30
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请涉及计算机技术领域,尤其涉及一种病历数据分析方法及装置,获取待检测用户的电子病历;根据所述电子病历,提取与目标疾病相关的特征信息;基于已训练的疾病风险评估模型,以所述与目标疾病相关的特征信息为输入参数,获得所述待检测用户的目标疾病发生的风险评估结果,其中,所述疾病风险评估模型为根据正样本集和负样本集进行迭代训练获得的,所述正样本集为所述目标疾病发生的电子病历,所述负样本集为非所述目标疾病的其它疾病发生的电子病历,这样,基于电子病历和疾病风险评估模型风险评估结果,不需要主动采集信息,节省成本,提高了效率,并提高了风险评估准确性。
-
公开(公告)号:CN118673110A
公开(公告)日:2024-09-20
申请号:CN202410692102.8
申请日:2024-05-30
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/332 , G06F16/36 , G06F18/214 , G06F18/2415 , G06F18/25
Abstract: 本公开实施例公开了一种词嵌入数据处理方法、装置、电子设备及存储介质,该方法包括:在语料库中挖掘第一词语,第一词语为语言模型的原始词表中未记载的词语,语言模型是基于第一训练文本预训练得到的,第一训练文本包括原始词表中已记载的词语;获取包括第一词语的第二训练文本,基于第二训练文本训练语言模型,得到第一词语的目标词嵌入向量,在训练语言模型过程中,冻结语言模型中除了目标词嵌入向量以外的参数;基于扩展词表关联存储第一词语与目标词嵌入向量,扩展词表与原始词表为相互独立的词表;本公开实施例能够提高语言模型的泛化性能,从而提升语言模型在自然语言处理任务上的表现,可广泛应用于云技术、人工智能、智慧交通等场景。
-
-
-
-
-
-
-
-
-