基于大模型的交通盗抢识别方法、装置、系统及存储介质

    公开(公告)号:CN118451417A

    公开(公告)日:2024-08-06

    申请号:CN202480000783.5

    申请日:2024-03-25

    发明人: 林旭南

    摘要: 本申请涉及安全驾驶领域,尤其涉及基于大模型的交通盗抢识别方法、装置、系统及存储介质。该方法包括:获取车辆的多模态数据;通过视频编码模块提取视频数据中的图像特征,通过音频编码模块提取音频数据中的音频特征;通过视频适配模块将图像特征转换为大语言模型适配的视频查询向量;通过音频适配模块将音频特征转换为大语言模型适配的音频查询向量;将音频查询向量和视频查询向量输入大语言模型,输出视频数据和音频数据对应的关于交通盗抢的文本描述。由于该方法使用的大语言模型、基于视频数据和音频数据可以学习到更为丰富的表示信息,具有更强的泛化能力,可有效的捕获复杂的数据模式,有利于提升识别准确率。

    基于语音识别的身份证号匹配方法及系统

    公开(公告)号:CN110176236B

    公开(公告)日:2024-07-16

    申请号:CN201910441924.8

    申请日:2019-05-24

    发明人: 汪旭

    摘要: 本发明适用于人工智能领域,提供了一种基于语音识别的身份证号匹配方法及系统,通过主服务器在对语音进行识别后得到目标数列,并根据目标数列中前预设个数的数字对顶与目标数列对应的目标子服务器,将目标数列发送至目标子服务器;各个目标子服务器在判定自身未过载后,才分别计算其本地存储的一个以上的数据集群中的身份证号与目标数列的差异位数;目标子服务器每当一个数据集群中的全部身份证号均已被选取后,将该数据集群中各个身份证号与目标数列的差异位数的最小值发送至主服务器;若该参考差异位数为0,则主服务器将参考差异位数对应的身份证号作为被选身份证号,并向所有目标子服务器发送搜索停止指令,以提高对身份证号的匹配效率。

    一种声纹识别方法、歌手认证方法、电子设备及存储介质

    公开(公告)号:CN113366567B

    公开(公告)日:2024-06-04

    申请号:CN202180001166.3

    申请日:2021-05-08

    发明人: 胡诗超 陈灏

    摘要: 一种声纹识别方法、一种歌手认证方法、一种电子设备及一种存储介质,所述声纹识别方法包括:接收用户音频,并确定所述用户音频对应的目标音频;确定所述目标音频和所述用户音频的用户声纹相似度,以及所述目标音频分别与多个参考音频中每一参考音频的参考声纹相似度;根据所述目标音频分别与多个参考音频中每一参考音频的参考声纹相似度构建相似度分布模型,并确定所述用户声纹相似度在所述相似度分布模型中的分布位置;根据所述分布位置判断所述用户音频与所述目标音频是否声纹匹配。本申请能够以动态标准判断声纹是否匹配,提高了声纹识别的准确率。

    媒体播放控制方法、装置及系统和计算机可读存储介质

    公开(公告)号:CN112148917B

    公开(公告)日:2024-05-10

    申请号:CN201910574819.1

    申请日:2019-06-28

    摘要: 本发明实施例涉及媒体播放控制方法、装置及系统和计算机可读存储介质。其中,所述方法例如包括:检测是否有设备接入事件,并当检测到有设备接入事件时读取触发设备接入事件的接入设备的文件目录以获取目标格式文件的文件名和文件路径,且将获取的目标格式文件的文件名和文件路径写入第一数据库表中;检测第一数据库表是否被修改,并当检测到第一数据库表被修改时将第一数据库表中的目标文件名及其对应的文件路径写入第二数据库表;以及检测第二数据库表是否被修改,并当检测到第二数据库表被修改时根据第二数据库表中的数据执行文件播放控制操作。本发明实施例可以解决嵌入式设备媒体信息来源单一、视频播放难以控制的问题。

    图像排序方法、电子设备、程序产品及介质

    公开(公告)号:CN115437601B

    公开(公告)日:2024-04-19

    申请号:CN202211364538.1

    申请日:2022-11-02

    发明人: 陈敬濠 曹鹏蕊

    IPC分类号: G06F7/08 G06F16/63 G06F16/68

    摘要: 本申请提供一种图像排序方法、电子设备、程序产品及介质,该方法包括:获取第一图像集合,该第一图像集合包括多个待排序图像,该待排序图像为根据查询图像检索得到的图像;根据每个待排序图像和该查询图像之间匹配的第一特征点,计算对应待排序图像和查询图像的共视比例;根据该共视比例对所述多个待排序图像进行排序。本申请可以通过反映特征点分布的共视比例对检索结果中的相似图像按照相似度进一步排序,得到更准确的排序结果,解决图像检索结果中相似图像排序混乱的问题。

    一种车机倒车语言的切换方法和切换装置

    公开(公告)号:CN117755222A

    公开(公告)日:2024-03-26

    申请号:CN202311816646.2

    申请日:2023-12-26

    发明人: 邵明昊

    摘要: 本申请提供了一种车机倒车语言的切换方法和切换装置,所述车机包括第一处理器和第二处理器,所述切换方法包括:所述第一处理器响应于接收到切换倒车语言的指令,解析出待切换的倒车语言;所述第一处理器基于解析出的待切换的倒车语言,向所述第二处理器发送切换倒车语言的通知;所述第二处理器响应于接收到切换倒车语言的通知,将原倒车语言切换成所述待切换的倒车语言。所述切换方法和切换装置,能够提高倒车语言切换的处理速度。

    音乐文件分享方法、装置和系统
    7.
    发明公开

    公开(公告)号:CN117749787A

    公开(公告)日:2024-03-22

    申请号:CN202311768609.9

    申请日:2023-12-21

    摘要: 本申请公开提供了一种音乐文件分享方法、装置和系统,涉及音乐文件分享技术,该方法用于实现从分享侧的第一用户终端向接收侧的第二用户终端分享音乐,接收第一用户终端上传的音乐分享请求信息,音乐分享请求信息包括第二用户终端ID信息和音乐分享信息;根据音乐分享信息获取目标音乐信息,目标音乐信息包括音乐匹配信息和音乐匹配文件;根据第二用户终端ID信息,向第二用户终端发送音乐分享推送信息,音乐分享推送信息包括第二用户终端ID信息和目标音乐信息,解决了现有技术中人工进行音乐文件分享工作量大、出错率高的问题。

    设备调试方法、装置、电子设备及可读存储介质

    公开(公告)号:CN116795319A

    公开(公告)日:2023-09-22

    申请号:CN202310906015.3

    申请日:2023-07-21

    发明人: 杨培

    IPC分类号: G06F3/16 G06F16/63

    摘要: 本申请涉及一种设备调试方法、装置、电子设备及可读存储介质,所述方法包括步骤:触发调试指令,将所述调试指令转换为第一音频信号;通过上位机扬声器对所述第一音频信号进行播放,以使目标调试设备通过设备麦克风接收到所述第一音频信号;通过上位机麦克风接收所述目标调试设备基于所述调试指令发送的第二音频信号,其中,所述第二音频信号通过所述目标调试设备的设备扬声器播放;根据所述第二音频信号确定所述调试指令对应的调试结果。通过目标调试设备自身设置的设备麦克风与设备扬声器实现调试指令与调试结果的传输,避免了对目标调试设备进行破坏的同时,保证了相关数据的传输,降低了设备的研发成本。

    音乐检索方法、音乐检索装置、电子设备及存储介质

    公开(公告)号:CN116595216A

    公开(公告)日:2023-08-15

    申请号:CN202310568357.9

    申请日:2023-05-19

    摘要: 本申请实施例提供了一种音乐检索方法、音乐检索装置、电子设备及存储介质,属于人工智能技术领域。该方法包括:获取目标描述文本和候选音乐,其中,目标描述文本包括目标对象对音乐的描述内容;对目标描述文本进行词语识别,得到流派描述词语;对候选音乐进行频谱变换,得到候选音乐频谱序列;基于候选音乐频谱序列,获取候选音乐对应的候选音乐流派表征向量;基于候选音乐流派表征向量对候选音乐进行流派识别,得到候选音乐的流派标签数据;基于流派描述词语和流派标签数据对候选音乐进行筛选,得到目标音乐;将目标音乐反馈给目标对象。本申请实施例能够提高音乐检索的准确性。