一种广告检测识别方法及系统

    公开(公告)号:CN101221622A

    公开(公告)日:2008-07-16

    申请号:CN200810057162.3

    申请日:2008-01-30

    Abstract: 本发明提供一种广告检测识别方法,包括:对待检测的广播电视节目数据进行预处理,得到所述数据音频流的短时能量包络;根据音频的短时能量特征,将所得到的短时能量包络切分为能量包络单元,得到待检测的广播电视节目数据的能量包络单元图;利用跳单元的策略和基于能量包络单元的相似性度量方法,对所述待检测的广播电视节目数据的能量包络单元图与已知广告的能量包络单元图进行比较,根据比较结果实现对广告的检测识别。本发明以音频特征取代视频特征、音视频特征结合等进行广告检测,具有计算复杂度低,检测效率高的优点;通过将待测数据与已知广告的音频特征进行比较,可以实现对特定广告的识别;本发明还具有应用范围广的优点。

    一种盲文计算机点字输入系统和装置以及方法

    公开(公告)号:CN101135940A

    公开(公告)日:2008-03-05

    申请号:CN200710121525.0

    申请日:2007-09-07

    Abstract: 本发明公开了一种盲文计算机点字输入系统和装置以及方法。该系统包括电脑手写板,计算机,还包括盲文点字输入导板,点字笔,以及盲文点字处理模块;所述盲文点字输入导板与所述电脑手写板的书写区域的尺寸相一致,安装在手写板的书写表面;所述电脑手写板通过接口与所述计算机相连接;所述盲文点字处理模块,用于当使用者利用所述点字笔和所述盲文点字输入导板在所述电脑手写板上进行点字时,对来自手写板的点字输入信号进行处理,并转换成文字。其通用性强,成本低,使用方便。

    一种农业诊断系统的开发平台

    公开(公告)号:CN1862567A

    公开(公告)日:2006-11-15

    申请号:CN200510069516.2

    申请日:2005-05-12

    Abstract: 本发明公开了一种农业诊断系统的开发平台,包括逻辑功能构件层,面向用户构件层和平台定制构件层,通过下一层构件向上一层构件提供服务的方式将三层构件连接成一个整体平台,其中:逻辑功能构件层用于与界面无关的基础的数据处理过程;面向用户构件层包含有界面,通过胶合逻辑功能构件实现数据处理的功能;平台定制构件层用于形成可以生成不同农业诊断领域系统的平台。本发明通过采用构件技术、面向对象技术,框架元模型对农业诊断平台进行开发,将大大提高开发的效率与平台的扩展性能,具有良好的通用性和可扩展性,并能填补国内在农业诊断领域发明的空白。

    一种基于深度学习的手写盲文识别方法及系统

    公开(公告)号:CN115171109A

    公开(公告)日:2022-10-11

    申请号:CN202210653603.6

    申请日:2022-06-09

    Abstract: 本发明提出一种基于深度学习的手写盲文识别方法和系统,包括采用已标注盲符区域的盲文图像训练语义分割模型进行像素级分割,得到预训练模型;获取训练用手写盲文图像和待识别手写盲文图像,并将训练用手写盲文图像输入预训练模型,得到初步盲符识别结果并进行标注,基于标注数据对预训练模型进行迁移学习,得到新模型;待识别手写盲文图像通过新模型进行识别,对识别结果进行盲方识别,得到方框级的盲符识别结果,将盲符识别结果通过盲文电子化操作转化为电子盲文;根据通用盲文规则,将电子盲文映射为拼音与标点符号,并利用通用盲文的标调规则和简写规则对拼音进行标调,得到待识别手写盲文图像的手写盲文识别结果和转拼音结果。

    一种方言语音数据切分及标注方法、系统

    公开(公告)号:CN113781999A

    公开(公告)日:2021-12-10

    申请号:CN202111066861.6

    申请日:2021-09-13

    Abstract: 本发明提出一种方言语音数据切分及标注方法和系统,使用普通话语音识别模型对第一方言语音进行语音数据切分及标注,得到第一方言语音的汉字识别结果,并基于第一方言语音及其对应汉字文本和汉字识别结果,构建方言词汇库;获取待切分和标注的语音数据作为第二方言语音,基于方言词汇库和第二方言语音对应的汉字文本,得到第二方言语音对应的音素序列,并采用音素对齐算法和普通话语音识别模型,得到第二方言语音的语音切分标注结果;基于经人工校对的语音切分标注结果及其对应的语音数据训练得到方言语音声学模型,将方言语音数据输入至方言语音声学模型,得到方言语音数据的切分和标注结果。

    一种汉语盲文语音合成方法及系统

    公开(公告)号:CN113571037A

    公开(公告)日:2021-10-29

    申请号:CN202110749716.1

    申请日:2021-07-02

    Abstract: 本发明提出一种汉语盲文语音合成方法和系统,包括:通过将待语音合成的通用盲文文本中标点符号和音节分别转换为中文标点和拼音,得到拼音序列;通过汉字预测模型将该拼音序列转换为汉字,得到带有分词信息的汉字序列,并将该汉字序列输入至韵律预测模型,得到该汉字序列的韵律标签;结合该韵律标签和拼音序列,得到含有韵律标签的拼音序列,并将其输入至语音合成模块,得到该通用盲文文本的语音合成结果。本发明可应用于盲用终端上的电子书阅读器文本编辑器等软件,可以实现通用盲文的实时语音转换,帮助盲人在阅读盲文时可以实时听到其触摸的文字,更好地理解他们所阅读的内容。

    基于音频的拖地声检测方法

    公开(公告)号:CN107170466B

    公开(公告)日:2020-12-29

    申请号:CN201710242995.6

    申请日:2017-04-14

    Abstract: 本发明提供一种基于音频的脚步拖地声的检测方法。该方法包括:对采集到的左右脚双声道音频数据进行分帧处理,以获得相应的音频帧;以从所述音频帧提取的特征向量作为输入,利用分类器获得音频帧属于拖地声的概率和属于正常脚步声的概率,其中,所述分类器通过训练获得的,训练样本包括用于识别正常脚步声的正样本、用于识别拖地声的拖地样本和用于识别非脚步的其它声音的负样本;根据获得的各个音频帧属于拖地声的概率和属于正常脚步声的概率,得出拖地声对应的时间区间。根据本发明的方法能够准确的检测出行走过程中的拖地声,有助于步态检测、跌倒预警等。

    一种融合非确定性反馈的语音识别错误修正方法及系统

    公开(公告)号:CN105206267B

    公开(公告)日:2019-04-02

    申请号:CN201510569945.X

    申请日:2015-09-09

    Abstract: 本发明提供一种融合非确定性反馈的语音识别错误修正方法及系统,其中,方法包括:接收用户的非确定性反馈,获得所述非确定性反馈对应的所有字;计算所述非确定性反馈对应的所有字在用户已确认文字的约束下出现的概率;以及,根据计算的概率,将所述非确定性反馈对应的所有字的全部或部分按顺序显示给用户。本发明提高了修正效率并节省了人力;此外,还统一了反馈界面,用户体验更好。

Patent Agency Ranking