Patent search ap:("中国科学院计算技术研究所") AND inv:"王向东" Page 1

1.

发明公开
数据调度方法、装置、相关设备、存储介质及计算机程序产品审中-实审

公开(公告)号：CN118796795A

公开(公告)日：2024-10-18

申请号：CN202410480768.7

申请日：2024-04-19

Applicant: 中国移动通信有限公司研究院 , 中国科学院计算技术研究所 , 中国移动通信集团有限公司

Inventor： 王向东 , 刘宏 , 王玮 , 姜宇 , 李爱华

IPC: G06F16/21 , G06F16/27 , G06F16/28 , H04L67/1004

Abstract: 本申请公开了一种数据调度方法、装置、第一节点、第一平台、存储介质及计算机程序产品。其中，方法包括：第一节点接入待调度数据库；利用容器技术，对所述待调度数据库的相关数据和/或相关信息进行封装，得到第一数据；基于所述第一数据，确定第一信息，所述第一信息用于申请调度所述第一数据；向第一平台发送所述第一信息，以供所述第一平台将所述第一数据由所述第一节点调度到第二节点。

2.

发明公开
一种基于深度学习的手写盲文识别方法及系统审中-实审

公开(公告)号：CN115171109A

公开(公告)日：2022-10-11

申请号：CN202210653603.6

申请日：2022-06-09

Applicant: 中国科学院计算技术研究所

Inventor： 刘宏 , 雷欣 , 王向东 , 钱跃良

IPC: G06V30/10 , G06V30/148 , G06V30/19

Abstract: 本发明提出一种基于深度学习的手写盲文识别方法和系统，包括采用已标注盲符区域的盲文图像训练语义分割模型进行像素级分割，得到预训练模型；获取训练用手写盲文图像和待识别手写盲文图像，并将训练用手写盲文图像输入预训练模型，得到初步盲符识别结果并进行标注，基于标注数据对预训练模型进行迁移学习，得到新模型；待识别手写盲文图像通过新模型进行识别，对识别结果进行盲方识别，得到方框级的盲符识别结果，将盲符识别结果通过盲文电子化操作转化为电子盲文；根据通用盲文规则，将电子盲文映射为拼音与标点符号，并利用通用盲文的标调规则和简写规则对拼音进行标调，得到待识别手写盲文图像的手写盲文识别结果和转拼音结果。

3.

发明公开
一种方言语音数据切分及标注方法、系统有权

公开(公告)号：CN113781999A

公开(公告)日：2021-12-10

申请号：CN202111066861.6

申请日：2021-09-13

Applicant: 中国科学院计算技术研究所

Inventor： 谢萦 , 钱跃良 , 王向东

IPC: G10L15/00 , G10L15/04 , G10L15/14 , G10L15/26 , G10L15/16 , G10L15/02

Abstract: 本发明提出一种方言语音数据切分及标注方法和系统，使用普通话语音识别模型对第一方言语音进行语音数据切分及标注，得到第一方言语音的汉字识别结果，并基于第一方言语音及其对应汉字文本和汉字识别结果，构建方言词汇库；获取待切分和标注的语音数据作为第二方言语音，基于方言词汇库和第二方言语音对应的汉字文本，得到第二方言语音对应的音素序列，并采用音素对齐算法和普通话语音识别模型，得到第二方言语音的语音切分标注结果；基于经人工校对的语音切分标注结果及其对应的语音数据训练得到方言语音声学模型，将方言语音数据输入至方言语音声学模型，得到方言语音数据的切分和标注结果。

4.

发明公开
一种汉语盲文语音合成方法及系统有权

公开(公告)号：CN113571037A

公开(公告)日：2021-10-29

申请号：CN202110749716.1

申请日：2021-07-02

Applicant: 中国科学院计算技术研究所

Inventor： 王向东 , 朱靖雯 , 毛建国 , 刘宏 , 钱跃良

IPC: G10L13/02 , G10L19/16 , G10L25/30 , G10L25/24

Abstract: 本发明提出一种汉语盲文语音合成方法和系统，包括：通过将待语音合成的通用盲文文本中标点符号和音节分别转换为中文标点和拼音，得到拼音序列；通过汉字预测模型将该拼音序列转换为汉字，得到带有分词信息的汉字序列，并将该汉字序列输入至韵律预测模型，得到该汉字序列的韵律标签；结合该韵律标签和拼音序列，得到含有韵律标签的拼音序列，并将其输入至语音合成模块，得到该通用盲文文本的语音合成结果。本发明可应用于盲用终端上的电子书阅读器文本编辑器等软件，可以实现通用盲文的实时语音转换，帮助盲人在阅读盲文时可以实时听到其触摸的文字，更好地理解他们所阅读的内容。

5.

发明授权
基于音频的拖地声检测方法有权许可

公开(公告)号：CN107170466B

公开(公告)日：2020-12-29

申请号：CN201710242995.6

申请日：2017-04-14

Applicant: 中国科学院计算技术研究所

Inventor： 王成 , 龙舟 , 钱跃良 , 王向东 , 袁静 , 李锦涛

IPC: G10L25/66 , G10L25/51 , G10L25/45 , G10L25/03 , A61B5/11

Abstract: 本发明提供一种基于音频的脚步拖地声的检测方法。该方法包括：对采集到的左右脚双声道音频数据进行分帧处理，以获得相应的音频帧；以从所述音频帧提取的特征向量作为输入，利用分类器获得音频帧属于拖地声的概率和属于正常脚步声的概率，其中，所述分类器通过训练获得的，训练样本包括用于识别正常脚步声的正样本、用于识别拖地声的拖地样本和用于识别非脚步的其它声音的负样本；根据获得的各个音频帧属于拖地声的概率和属于正常脚步声的概率，得出拖地声对应的时间区间。根据本发明的方法能够准确的检测出行走过程中的拖地声，有助于步态检测、跌倒预警等。

6.

发明授权
一种融合非确定性反馈的语音识别错误修正方法及系统有权

公开(公告)号：CN105206267B

公开(公告)日：2019-04-02

申请号：CN201510569945.X

申请日：2015-09-09

Applicant: 中国科学院计算技术研究所

Inventor： 王向东 , 蔡佳 , 钱跃良 , 刘宏

IPC: G10L15/22 , G10L15/06

Abstract: 本发明提供一种融合非确定性反馈的语音识别错误修正方法及系统，其中，方法包括：接收用户的非确定性反馈，获得所述非确定性反馈对应的所有字；计算所述非确定性反馈对应的所有字在用户已确认文字的约束下出现的概率；以及，根据计算的概率，将所述非确定性反馈对应的所有字的全部或部分按顺序显示给用户。本发明提高了修正效率并节省了人力；此外，还统一了反馈界面，用户体验更好。

7.

发明公开
一种汉盲对照双语语料库的构建方法和系统有权

公开(公告)号：CN109344389A

公开(公告)日：2019-02-15

申请号：CN201810929248.4

申请日：2018-08-15

Applicant: 中国科学院计算技术研究所

Inventor： 王向东 , 蔡佳 , 钱跃良 , 刘宏

IPC: G06F17/27

Abstract: 本发明涉及一种汉盲对照双语语料库的构建方法和系统，包括：获取内容相同的汉语文本和盲文文本；分别将盲文文本和汉语文本进行切分处理，得到第一盲文句子集合和汉语句子集合；在第一盲文句子集合和汉语句子集合之间进行汉语盲文匹配处理，以在第一盲文句子集合中找到与汉语句子集合中汉语句子相匹配的盲文句子，保留匹配成功的汉语句子和盲文句子；将所有匹配成功的汉语句子和盲文句子按照篇章、句子、词语多级对照的要求生成汉盲双语语料库。本发明可由计算机自动从内容相同但不精确对应的汉语和盲文文件中自动对齐和抽取语料，生成篇章、句子、词语多级对照的汉盲双语语料库。相对于人工语料库构建方法，提高了效率、降低了成本。

8.

发明授权
障碍物检测装置及方法有权

公开(公告)号：CN104574365B

公开(公告)日：2018-09-07

申请号：CN201410795401.0

申请日：2014-12-18

Applicant: 中国科学院计算技术研究所

Inventor： 钱跃良 , 王向东 , 刘宏

IPC: G06T7/00 , G06K9/00

Abstract: 本发明提供一种基于图样投影的障碍物检测装置。该装置包括图样发生器、图像传感器、障碍物检测部件。图样发生器用于将图样投射到路面上，图像传感器采集带有图样的路面图像信息，障碍物检测部件通过分析采集的图像中图样变化情况来判别路面上是否存在障碍物。该装置在检测障碍物时采用了投射图样的方式，极大地简化了障碍物分析检测的复杂度，降低了成本，改善了障碍物检测的鲁棒性，提高了检测速度和精度。

9.

发明公开
一种盲文方自适应定位方法及系统有权

公开(公告)号：CN108062548A

公开(公告)日：2018-05-22

申请号：CN201711071082.9

申请日：2017-11-03

Applicant: 中国科学院计算技术研究所

Inventor： 刘宏 , 黎仁强 , 王向东 , 钱跃良

IPC: G06K9/32 , G09B21/00

Abstract: 本发明涉及一种盲文方自适应定位方法及系统，包括：获取盲文图像的盲文点位置信息；对盲文点位置信息进行纵坐标的聚类，以得到多条预选盲文方水平行线的位置；根据各预选盲文方水平行线的纵坐标，从上往下判断是否存在符合标准的水平行线，若存在，则从三条水平行线开始，根据统计得到的盲文方点距、行距等信息分别向上、向下拓展，且拓展的过程中生成以最新拓展的一组三条水平行线为基准，同时剔除位置错误的水平行线，直到达到盲文图像上下两端，得到包含多组以三条水平行线为一组的盲文方水平线；同理得到盲文方竖直线；以盲文方竖直线和盲文方竖直线的相交点，构成盲文方网格。

10.

发明公开
一种聋人提示系统、方法及智能手机无效

公开(公告)号：CN106713633A

公开(公告)日：2017-05-24

申请号：CN201611179001.2

申请日：2016-12-19

Applicant: 中国科学院计算技术研究所

Inventor： 钱跃良 , 王向东

IPC: H04M1/725

Abstract: 本发明涉及一种聋人提示系统、方法及智能手机，该系统包括用户交互模块，用于聋人与系统之间的交互；场景感知模块，用于感知并确定聋人的运用场景；数据采集及预处理模块，用于采集并生成广播语音数据；语音识别模块，用于接收识别该广播语音数据，加载对应该运用场景的语音识别模型，并根据该语音识别模型将该广播语音数据转换成文字信息；关键词匹配模块，用于将该文字信息与关键词进行匹配，如果该文字信息包含该关键词，则向用户交互模块发送一个匹配成功的标记；总控模块用于控制整个系统按流程运行。本发明通过确定运用场景，进行针对性的广播语音增强，提升了广播语音识别的准确性及聋哑人生活的便捷性。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification