-
公开(公告)号:CN118486292A
公开(公告)日:2024-08-13
申请号:CN202410603270.5
申请日:2024-05-15
IPC分类号: G10L13/02 , G10L13/047 , G10L13/04 , G10L13/033 , G10L13/08 , A61B5/16 , G06N3/0464 , G06N3/08
摘要: 本发明公开了一种基于脑电情绪量度的粤语语音智能合成方法及系统,涉及智能语音合成技术领域。包括:S1.获取数据;S2.数据标注;S3.数据预处理;S4.脑电情绪量度模型训练;S5.情感语音合成模型训练;S6.语音合成。本发明提出了脑电情绪量度模型和情感语音合成模型,情感语音合成模型能够将剧本中的文本转化成语音,听众在佩戴非侵入式脑电设备的情况下,听取合成的语音,产生脑电图,脑电图经过脑电情绪量度模型生成情绪量度,有利于在情绪量度结果下优化语音生成,合成满足听众共情需求的情感丰富的语音。
-
公开(公告)号:CN113206949B
公开(公告)日:2023-04-28
申请号:CN202110354965.0
申请日:2021-04-01
申请人: 广州大学
IPC分类号: H04N23/73 , H04N23/741 , H04N23/60 , H04N23/95 , H04N25/57
摘要: 本发明公开了一种基于熵加权图像梯度的半直接单目视觉SLAM方法,包括以下步骤:S1、记录曝光时间,并读入下一帧图像;S2、将图像分成若干个图像块;S3、计算每个图像块的图像熵,根据图像熵分配权重;S4、计算每个图像块的图像梯度;S5、记录6次调整相机曝光时间后的图像熵加权图像梯度值,分别作为多项式拟合曲线的6个点的x坐标和y坐标,拟合曲线后用牛顿迭代法寻找曲线函数值最大值,其对应的x坐标即为最优曝光时间;S6、通过对应接口传入半直接法单目视觉SLAM的视觉里程计中;S7、判断相机获取的图片是否为最后一帧图像。本发明相比传统曝光算法下直接法的单目视觉SLAM方法,利用图像熵梯度寻找最佳曝光时间可以大大提高动态范围。
-
公开(公告)号:CN113206949A
公开(公告)日:2021-08-03
申请号:CN202110354965.0
申请日:2021-04-01
申请人: 广州大学
摘要: 本发明公开了一种基于熵加权图像梯度的半直接单目视觉SLAM方法,包括以下步骤:S1、记录曝光时间,并读入下一帧图像;S2、将图像分成若干个图像块;S3、计算每个图像块的图像熵,根据图像熵分配权重;S4、计算每个图像块的图像梯度;S5、记录6次调整相机曝光时间后的图像熵加权图像梯度值,分别作为多项式拟合曲线的6个点的x坐标和y坐标,拟合曲线后用牛顿迭代法寻找曲线函数值最大值,其对应的x坐标即为最优曝光时间;S6、通过对应接口传入半直接法单目视觉SLAM的视觉里程计中;S7、判断相机获取的图片是否为最后一帧图像。本发明相比传统曝光算法下直接法的单目视觉SLAM方法,利用图像熵梯度寻找最佳曝光时间可以大大提高动态范围。
-
-