-
公开(公告)号:CN110298236B
公开(公告)日:2021-11-30
申请号:CN201910419983.5
申请日:2019-05-20
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种基于深度学习的盲文图像自动识别方法和系统,包括:获取多张盲文点字图像作为训练集,并获取其对应的标注图像,标注图像中每个像素均已标注为对应的盲方类别;以训练集中的盲文点字图像为输入,并以对应的盲方标注图像为标准答案,使用卷积神经网络训练语义分割模型,直到语义分割模型输出的语义分割结果图中每个像素的盲方类别和标准答案之间的差异低于阈值,保持当前语义分割模型作为盲方语义分割模型;将待识别的盲文点字图像输入盲方语义分割模型,得到待识别盲文点字图像的语义分割结果图,作为识别结果,识别结果中每个像素均对应其所属的盲方类别。
-
公开(公告)号:CN107958261B
公开(公告)日:2020-12-04
申请号:CN201711071085.2
申请日:2017-11-03
Applicant: 中国科学院计算技术研究所
IPC: G06K9/62
Abstract: 本发明涉及一种盲文点检测方法及系统,包括:利用采集设备获取纸版盲文的数字化图像;对该数字化图像的盲文进行盲文点标注;根据标注好的盲文图像,截取以盲文点为中心的盲文点图像区域作为正样本,截取除该盲文点图像区域以外的背景图像区域作为负样本;提取该正样本和该负样本的多个特征,训练级联分类器;在待检测的盲文图像上,利用该级联分类器进行盲文点的检测和定位。由此本发明可实现对盲文数字化图像的盲文点自动标注。
-
公开(公告)号:CN106166071B
公开(公告)日:2018-11-30
申请号:CN201610519761.7
申请日:2016-07-04
Applicant: 中国科学院计算技术研究所
IPC: A61B5/11
Abstract: 本发明提供一种步态数据的采集方法,包括:1)获取左、右脚的声音信号曲线;2)根据峰值检测算法提取出该声音信号曲线中表征节点足触地声音的峰值位置和非节点足触地声音的峰值位置,然后计算每一步的步距Lsd=V声(t2‑t1);其中,V声为声音在空气中传播的速度,t1和t2分别是固定在不同脚的步态数据采集装置采集到同一次单脚触地所发出的声音的时刻,其中,t2为采集到非节点足触地声音的时间,t1为采集到节点足触地声音的时间。本发明还提供了相应的步态数据的采集设备。本发明可基于可穿戴的声传感器采集数据,不需要在特定环境中使用,特别适合于监测人的日常行走过程的步态。
-
公开(公告)号:CN104574365A
公开(公告)日:2015-04-29
申请号:CN201410795401.0
申请日:2014-12-18
Applicant: 中国科学院计算技术研究所
CPC classification number: G06K9/00805
Abstract: 本发明提供一种基于图样投影的障碍物检测装置。该装置包括图样发生器、图像传感器、障碍物检测部件。图样发生器用于将图样投射到路面上,图像传感器采集带有图样的路面图像信息,障碍物检测部件通过分析采集的图像中图样变化情况来判别路面上是否存在障碍物。该装置在检测障碍物时采用了投射图样的方式,极大地简化了障碍物分析检测的复杂度,降低了成本,改善了障碍物检测的鲁棒性,提高了检测速度和精度。
-
公开(公告)号:CN104538032A
公开(公告)日:2015-04-22
申请号:CN201410806233.0
申请日:2014-12-19
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了融合用户反馈的汉语语音识别方法及系统,涉及语音识别领域,包括步骤1,获取输入语音,根据所述输入语音,生成词网格,并将所述词网格转换为字的候选列表;步骤2,获取用户对所述候选列表中的所述用户反馈,所述用户反馈包括:所述用户选择所述候选列表中与所述输入语音相对应的正确字,或输入与所述输入语音相对应的所述正确字;步骤3,将所述正确字以及所述正确字对应的候选列之前的各候选列的第一个候选字作为已确定文字,并以所述已确定文字为约束和指导,调整未确定文字对应的所述候选列表,生成新的候选列表;步骤4,重复所述步骤2、3,直到正确识别所述输入语音或所述用户输入新输入语音,以完成语音识别。
-
公开(公告)号:CN101986653B
公开(公告)日:2014-11-05
申请号:CN201010517817.8
申请日:2010-10-15
Applicant: 中国科学院计算技术研究所
Inventor: 钱跃良
IPC: H04L29/08
Abstract: 本发明有关于一种物-物智能交互装置及其方法、交互系统,该交互装置,包括:控制部,用于实现对该交互装置的实时处理和控制;存储部,连接所述控制部,用于存储属性编码数据;通信部,连接所述控制部,用于通过预设的交互协议、属性编码数据实现该交互装置与其他交互装置之间的通信,完成交互数据的发送和接收。本发明实现了物与物的智能交互系统及交互方法,有效地实现了物体与物体之间的自动发现与智能交互,对于物联网的发展具有重要的意义。
-
公开(公告)号:CN102547466B
公开(公告)日:2014-08-13
申请号:CN201210048441.X
申请日:2012-02-27
Applicant: 中国科学院计算技术研究所
IPC: H04N21/472 , H04N21/422
Abstract: 本发明公开一种智能电视的交互方法与系统,包括如下步骤:步骤100,主控程序模块负责智能电视的交互控制,将智能电视的画面划分成主显示区、提示区、候选区,划分的区域根据应用需要来更换相应位置,等待步骤200的执行;步骤200,信号接收与解析模块负责接收按键信息,并进行相应的处理;步骤300,注册表存放节目表以及应用程序的列表,根据步骤200的请求执行相应的电视节目以及应用程序的列表;步骤400,注册表管理模块负责增加节目表或应用程序列表,动态调整使用频度,同时管理注册表指针;步骤500,显示模块负责按照注册表指针所指定的位置显示相应的内容。
-
公开(公告)号:CN102324233B
公开(公告)日:2014-05-07
申请号:CN201110220842.4
申请日:2011-08-03
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种汉语语音识别中重复出现词识别错误的自动修正方法,包括:(1)对每句话经识别后得到的字混淆网络与词组库中的词组及中间识别结果进行相似性匹配,以查找重复出现词组;其中,字混淆网络是所有可能识别结果的集合,字混淆网络包括最优识别结果即原有最优识别结果和最优识别结果中的每个字对应的中间识别结果;词组库包括词组及其对应的中间识别结果;(2)根据查找得到的词组信息,重新计算相似概率值和字识别概率值;(3)根据新的概率值,对字混淆网络按照概率值大小排序;和(4)使用排序结果替换字混淆网络的最优识别结果以及中间识别结果。优点在于:利用之前已修正的识别结果中的经验知识,自动修正当前识别语句中重复出现词的识别错误,从而提高识别错误的修正效率,加快识别错误修正速度。
-
公开(公告)号:CN100469109C
公开(公告)日:2009-03-11
申请号:CN200610087132.8
申请日:2006-06-13
Applicant: 中国科学院计算技术研究所
IPC: H04N5/278
Abstract: 本发明公开了一种数字视频字幕自动翻译方法,用于将字幕内容翻译成另一种语言,包括:提取用源语言表示的字幕内容,并转换为文本格式;进行语种判别;选择从源语言到目标语言的翻译短语表;根据目标语言的语种类别,提取目标语言的语言模型;将字幕中的语句划分成短语,查找短语在目标语言中的含义;将翻译后的短语按顺序连接,并计算翻译结果的分数;选择分数最高的翻译结果作为字幕中的语句在目标语言中的含义;将翻译后的字幕内容重新转换为传输流接受的格式并输出。本发明对每个短语保留所有可能的翻译结果,用翻译概率来表示谁的可能性更大,提高了翻译的准确率;对语句作短语切分时考虑所有可能的匹配上的短语切分,使得翻译结果更为全面。
-
公开(公告)号:CN100426376C
公开(公告)日:2008-10-15
申请号:CN200510011285.X
申请日:2005-01-28
Applicant: 中国科学院计算技术研究所
IPC: G10L15/00
Abstract: 本发明公开一种电话连续语音识别系统性能的评测方法及系统,该系统包括录音模块、被测的电话连续语音识别系统、语法库、语法展开模块、语料筛选模块、槽解析模块以及自动评测模块。先对电话查询的若干领域,按其语法定义若干槽;在各个领域按其语法展开,从生成的句子中选择出作为评测语料的句子并录制测试语音;将测试语音输入要评测的电话连续语音识别系统,将每个句子的语音识别结果解析为所包含的槽后输出;将系统输出的识别结果与标准答案对照,计算槽识别正确率,得到系统性能的评判指标。本发明方法比目前常用的听写机式的评测方法更符合电话连续语音识别系统的特点,能够更准确地评价电话连续语音识别系统性能。
-
-
-
-
-
-
-
-
-