基于定位遥控器的智能电视人机交互方法、装置和系统

    公开(公告)号:CN103051964A

    公开(公告)日:2013-04-17

    申请号:CN201110312134.3

    申请日:2011-10-14

    Abstract: 本发明提供一种基于定位遥控器的智能电视人机交互装置,包括:遥控器模块,适于接收用户操作,产生相应的控制信号;服务器模块,适于接收并解析所述控制信号以获取指令;定位感兴趣区域模块,适于根据所述定位指令,截取当前电视画面并在其上定位感兴趣的区域中心点及默认的感兴趣区域,并将该点和区域数据反馈给服务器模块;调整感兴趣区域模块,适于根据所述调整区域指令,对选定的感兴趣区进行位置、形状和大小中的至少一项的调整,并将调整结果反馈给服务器模块;和输出模块,适于输出所述潜在区域图像和选定的感兴趣区域图像。本发明还提供基于上述装置的系统和方法,使用户利用遥控器即可对电视画面中感兴趣的目标进行方便的点选。

    一种网页分割方法
    32.
    发明授权

    公开(公告)号:CN102073710B

    公开(公告)日:2012-11-21

    申请号:CN201010617741.6

    申请日:2010-12-31

    Abstract: 本发明提供一种网页分割方法,其特征在于,包括:步骤1)获取待分割网页的DOM树;步骤2)遍历所述DOM树,将其中每个只包含1个基本多行结点的结点作为一个基本分块,将每两个只包含1个基本多行结点的结点之间的零散叶结点分别合成一个基本分块;其中,当一个基本多行结点的父结点被作为一个基本分块时,该基本多行结点不再作为一个基本分块;步骤3)在所述基本分块中找出主题块,将主题块与其后面邻接的若干个非主题块合并。本发明能够在分块的同时很好地保持原有的网页结构,避免打散属于同一主题或分类的链接,避免主题或分类标签与其对应的链接分离。本发明的执行效率高,容易实现。

    一种交互式语音识别系统和方法

    公开(公告)号:CN101923854B

    公开(公告)日:2012-03-28

    申请号:CN201010269306.9

    申请日:2010-08-31

    Abstract: 本发明公开了一种交互式语音识别系统,包括:声学模型和语言模型选择模块,用于根据待识别对象信息,为其选择与之发音特点最相似的声学模型和为整个识别过程选择与之领域最相似的语言模型;语音语句提取模块,用于将整段语音信号切分成若干个语音语句并提取出来,送至语音识别模块;语音识别模块,用于对语音语句提取模块提取后得到的语音语句进行识别,并输出中间识别结果;字候选生成和错误修正模块,用于对所述识别中间结果进行处理生成候选集,再根据选择的候选或输入的正确数据来纠正识别错误得到最终识别结果;交互模块,用于将用户输入的数据发送给声学模型和语言模型选择模块,以及向用户反馈所述字候选生成和错误修正模块的识别结果。

    一种路灯杆的数字化管理与智能交互装置、方法及其系统

    公开(公告)号:CN102158986A

    公开(公告)日:2011-08-17

    申请号:CN201010589387.0

    申请日:2010-12-15

    Abstract: 本发明关于一种路灯杆的数字化管理与智能交互装置、方法及其系统,其中该装置包括:控制部,用于实现对该交互装置的实时处理和控制;存储部,连接所述控制部,用于存储属性编码数据;通信部,连接所述控制部,用于通过预设的交互协议、属性编码数据实现该交互装置与其它交互装置之间的通信,完成交互数据的发送和接收。本发明有效地实现了对路灯杆及其路灯杆上面安装的各类设备进行数字化管理,以及通过路灯杆上的设备为路上的移动物体提供服务以及对管理。

    一种目标场所优化调度方法及系统

    公开(公告)号:CN100595121C

    公开(公告)日:2010-03-24

    申请号:CN200710179079.9

    申请日:2007-12-10

    Abstract: 本发明公开了一种目标场所优化调度方法及系统。该方法包括下列步骤:采集目标场所相应目标对应的正例样本集合和反例样本集合;在正例样本集合和反例样本集合中,提取图像特征并进行训练,得到用于目标场所目标检测的分类器;从获取的目标场所的实时视频图像中,利用分类器检测出目标,对目标场所进行优化调度。将从目标场所获取的实时视频图像检测出的目标所在区域作为正例样本,重复训练,进一步提高分类器的分类精确度。其对目标场所进行优化调度,提高目标场所的工作效率。

    基于光传感器的盲文计算机点字输入系统和方法

    公开(公告)号:CN101324810A

    公开(公告)日:2008-12-17

    申请号:CN200810116754.8

    申请日:2008-07-16

    Abstract: 本发明涉及基于光传感器的盲文计算机点字输入系统和方法。该方法包括:步骤91,使用者将点字笔插入当前盲符点位对应的点字孔并遮挡住X轴方向和Y轴方向的光线;步骤92,依据X轴方向的光接收器和Y轴方向的光接收器接收的光线获取当前盲符点的坐标并计算出当前盲符点位的盲符点位信息;在一方输入结束时,将属于同一方的所有盲符点位信息转换为盲符编码,并将该盲符编码发送至计算机;步骤93,计算机将盲符编码转换为文字。本发明实现了盲文的计算机点字输入功能,具有通用性强、成本低、使用方便等优点,完全符合盲人平时书写盲文的使用习惯。

    三维人体运动仿真结果与录像同屏对比方法

    公开(公告)号:CN1479252A

    公开(公告)日:2004-03-03

    申请号:CN03147556.6

    申请日:2003-07-22

    Abstract: 一种三维人体运动仿真结果与录像同屏对比方法,包括步骤:提取体育视频首帧对应摄像机的外参数,并据此对仿真分析系统中的虚拟摄像机进行视点调整;提取体育视频首帧的后续帧的摄像机定量全局运动,并据此控制仿真分析系统中的虚拟摄像机的运动。本发明针对人体运动的录像,自动地提取摄像机所在的位置与方向,在同一屏幕上按相同的位置与方向显示其对应的三维人体运动仿真结果。实现同屏对比,则可以快速、准确地比较运动员的完成动作与标准动作(或仿真结果)之间的差异,为运动员与教练员提出具体的改进意见和建议。

    一种通用盲文到汉字的转换方法及系统

    公开(公告)号:CN114970453B

    公开(公告)日:2025-04-08

    申请号:CN202210569910.6

    申请日:2022-05-24

    Abstract: 本发明提出一种通用盲文到汉字的转换方法和系统,其特征在于,包括:构建深度学习模型,由通用盲文文本生成拼音音节序列和分词标记序列,经由深度学习模型的嵌入层向量化后拼接得到融合盲文分词信息的拼音嵌入向量,分别输入深度学习模型的局部语义特征提取层和全局语义特征提取层;得到局部语义信息和上下文语义信息,将两者拼接后输入全连接层得到通用盲文文本对应的汉字文本。本发明通过拼音音节嵌入与分词信息嵌入拼接为一个总体的嵌入向量,以及局部语义特征提取层和全局语义特征提取层共享嵌入层结合的特征提取模块,实现了高准确率的通用盲文‑汉字转换。

    一种基于深度学习的盲文读物校对方法及系统

    公开(公告)号:CN114519860A

    公开(公告)日:2022-05-20

    申请号:CN202210066282.X

    申请日:2022-01-20

    Abstract: 本发明提出一种基于深度学习的盲文读物校对方法,包括:对已知盲文图像进行盲符标注,生成标注图,构建已知数据集;以该已知数据集对深度学习模型进行训练,获得初始识别模型;以盲文读物对应的盲文图像为目标盲文图像,将该目标盲文图像划分为迁移学习图像和校对图像,以该迁移学习图像对该初始识别模型进行迁移学习训练,得到目标识别模型;以该目标识别模型对该校对图像进行识别,获得该校对图像的校对电子盲文;通过该电子盲文和该校对图像对应的原始电子盲文进行对比,以完成对该盲文读物的质检校对。还提出一种基于深度学习的盲文读物校对系统,以及一种实施盲文读物校对的数据处理装置。

    一种基于影像数据和深度学习的肿瘤良恶性识别方法和系统

    公开(公告)号:CN113743463A

    公开(公告)日:2021-12-03

    申请号:CN202110879294.X

    申请日:2021-08-02

    Abstract: 本发明提出一种面向医学影像序列的基于深度学习的患者级肿瘤良恶性自动判别方法及系统。首先进行患者影像数据的采集和整理及标注,然后使用肿瘤区域检测模型、序列分类模型、年龄信息这三个信息模块获得不同级别下患者肿瘤良恶性的概率,最后通过多模型加权融合进行患者级肿瘤良恶性综合判别。该技术将有助于在患者早期,基于影像检测数据对肿瘤良恶性进行预判,从而制定相应的治疗方案及提升预后效果,同时也能辅助提高医生早期利用影像数据进行肿瘤良恶性诊断的准确率。

Patent Agency Ranking