专利检索 ap:("腾讯科技(深圳)有限公司" OR "中国科学院自动化研究所") AND inv:"周明" 第 1 页

1.

发明公开
视频文本匹配模型训练、视频文本匹配方法和装置审中-实审

公开(公告)号：CN115204301A

公开(公告)日：2022-10-18

申请号：CN202210868349.1

申请日：2022-07-22

申请人： 腾讯科技(深圳)有限公司 , 中国科学院自动化研究所

发明人： 刘烁 , 全卫泽 , 陈思宏 , 陈宸 , 周明 , 严冬明

IPC分类号： G06K9/62 , G06N3/08

摘要： 本申请涉及一种视频文本匹配模型训练、视频文本匹配方法、装置、计算机设备、存储介质和计算机程序产品。本申请涉及人工智能技术。所述方法包括：将训练样本对集合中训练视频对应的视频特征、参考特征和训练文本对应的训练文本特征输入初始视频文本匹配模型；参考特征包括音频特征和动作特征中的至少一种；基于同一训练视频对应的参考特征对相应的视频特征进行特征增强，得到训练视频对应的参考增强视频特征；将训练文本对应的训练文本特征，分别和训练视频对应的视频特征、参考增强视频特征进行相似度计算；基于各个训练样本对所对应的相似度集合训练初始视频文本匹配模型，得到目标视频文本匹配模型。采用本方法能够提高模型预测准确性。

2.

发明公开
基于超声影像的ICU-AW呼吸功能评估方法及装置审中-实审

公开(公告)号：CN118735855A

公开(公告)日：2024-10-01

申请号：CN202410687980.0

申请日：2024-05-30

申请人： 中国科学院自动化研究所 , 中国人民解放军总医院第一医学中心

发明人： 程龙 , 王一帆 , 韩立君 , 周明 , 黄丽萍 , 邹永向 , 耿雨涵

IPC分类号： G06T7/00 , A61B8/00 , G06T7/11 , G06T7/60 , G16H50/20 , G16H30/20

摘要： 本发明提供一种基于超声影像的ICU‑AW呼吸功能评估方法及装置，所述方法包括：采集膈肌超声影像；将所述膈肌超声影像输入至语义分割模型，获取所述语义分割模型输出的分割出膈肌区域的超声影像；采用骨架提取算法提取所述膈肌区域的骨架，并采用边界提取算法提取所述膈肌区域的边界；基于所述膈肌区域的骨架和所述膈肌区域的边界，确定ICU‑AW呼吸功能指标。本发明可以自动对膈肌影像进行处理，并计算膈肌功能指标，进而反映个体呼吸功能，有助于辅助医师对患者的呼吸功能评估，提高评估效率。另一方面，基于AI的评估结果更加客观，有助于避免因医师经验不足、判断主观引入的误差，提高了评估的可靠性。

3.

发明公开
有声读物的生成方法、装置、设备、存储介质及程序产品有权

公开(公告)号：CN114783403A

公开(公告)日：2022-07-22

申请号：CN202210149168.3

申请日：2022-02-18

申请人： 腾讯科技(深圳)有限公司

发明人： 程龙 , 王砚峰 , 刘恺 , 王睿敏 , 周志平 , 方鹏 , 周明 , 林国雯 , 冷永才 , 蒋维明 , 史小静 , 陆亮 , 张晶晶 , 段文君 , 曾可璇 , 张心愿 , 马浩然 , 郎勇 , 段枫 , 谢昆 , 许亚东 , 姜鹏 , 朱浩 , 陆飞 , 王宁 , 姜伟 , 鹿畅 , 韩晓明 , 朱立人 , 赵亮 , 栾佳慧 , 宋启亮

IPC分类号： G10L13/02 , G10L13/10 , G10L25/30

摘要： 本申请公开了一种有声读物的生成方法、装置、设备、存储介质和程序产品，涉及人工智能技术领域。所述方法包括：显示目标读物对应的配音员设置界面，在配音员设置界面中显示目标读物中包含的多个角色以及多个候选的配音员；响应于针对角色的配音员设置操作，在配音员设置界面中显示为角色设置的配音员；响应于设置完成操作，显示配音结果展示界面，在配音结果展示界面中显示目标读物的至少一个语句，以及语句对应的角色；响应于针对目标读物的播放操作，播放以目标配音员生成的目标读物中目标语句的音频内容。本申请使得有声读物中的声音更具有多样性，提高了有声读物的配音质量。

4.

发明授权
有声读物的生成方法、装置、设备、存储介质及程序产品有权

公开(公告)号：CN114783403B

公开(公告)日：2024-08-13

申请号：CN202210149168.3

申请日：2022-02-18

申请人： 腾讯科技(深圳)有限公司

发明人： 程龙 , 王砚峰 , 刘恺 , 王睿敏 , 周志平 , 方鹏 , 周明 , 林国雯 , 冷永才 , 蒋维明 , 史小静 , 陆亮 , 张晶晶 , 段文君 , 曾可璇 , 张心愿 , 马浩然 , 郎勇 , 段枫 , 谢昆 , 许亚东 , 姜鹏 , 朱浩 , 陆飞 , 王宁 , 姜伟 , 鹿畅 , 韩晓明 , 朱立人 , 赵亮 , 栾佳慧 , 宋启亮

IPC分类号： G10L13/02 , G10L13/10 , G10L25/30

摘要： 本申请公开了一种有声读物的生成方法、装置、设备、存储介质和程序产品，涉及人工智能技术领域。所述方法包括：显示目标读物对应的配音员设置界面，在配音员设置界面中显示目标读物中包含的多个角色以及多个候选的配音员；响应于针对角色的配音员设置操作，在配音员设置界面中显示为角色设置的配音员；响应于设置完成操作，显示配音结果展示界面，在配音结果展示界面中显示目标读物的至少一个语句，以及语句对应的角色；响应于针对目标读物的播放操作，播放以目标配音员生成的目标读物中目标语句的音频内容。本申请使得有声读物中的声音更具有多样性，提高了有声读物的配音质量。

搜索结果

国家/区域

专利有效性

申请日

公布(公告)日

申请人

申请人所在国/区域

发明人

IPC

IPC部

IPC大类

IPC小类

IPC大组

IPC小组

外观分类