-
公开(公告)号:CN110135412A
公开(公告)日:2019-08-16
申请号:CN201910364062.3
申请日:2019-04-30
Applicant: 北京邮电大学
IPC: G06K9/20
Abstract: 本申请提出一种名片识别方法和装置,其中,方法包括:通过获取待识别图像中的候选名片区域,根据预设的图像识别算法识别候选名片区域中的多个候选轮廓关键点,根据凸包算法对多个候选轮廓关键点计算获取多条候选边,在多条候选边中选择符合预设条件的多组候选边,并构建与每组候选边分别对应的候选四边形,根据预设算法计算每个候选四边形的置信度,根据置信度确定目标候选四边形,并根据目标候选四边形确定候选名片区域的轮廓关键点,根据轮廓关键点在候选名片区域中确定目标名片区域,并识别目标名片区域中的名片信息。该方法解决了现有技术中对于复杂背景的名片图像进行识别时,识别准确率较低的技术问题,提高了名片识别的精度和准确度。
-
公开(公告)号:CN110135411A
公开(公告)日:2019-08-16
申请号:CN201910360584.6
申请日:2019-04-30
Applicant: 北京邮电大学
Abstract: 本发明提出一种名片识别方法和装置,其中,方法包括:获取待识别的名片图像;将名片图像输入至文字检测模型,以得到各文本行区域;其中,文字检测模型,已学习得到图像特征与各文本行区域之间的对应关系;将各文本行区域输入至文字识别模型,以得到各文本行区域对应的名片信息。该方法能够实现基于深度学习的文字检测模型来识别名片图像中的各文本行区域,鲁棒性较强,可以降低因为低质量和噪声数据对文本提取的影响,从而提升该方法的通用性和应用空间。并且,基于深度学习的文字识别模型来对各文本行区域进行端到端的识别,无需进行单字分割,具有更高的准确率,同时也对各种复杂的变化具有更强的识别能力,提升该方法的通用性和识别效果。
-
公开(公告)号:CN110135307A
公开(公告)日:2019-08-16
申请号:CN201910365006.1
申请日:2019-04-30
Applicant: 北京邮电大学
IPC: G06K9/00
Abstract: 本申请提出一种基于注意力机制的交通标志检测方法和装置,其中,方法包括:通过获取待检测图像,根据贪心策略算法对待检测图像进行切片,得到符合预设条件的获取至少一个目标检测区域,其中,目标检测区域中包含所有交通标志区域;将至少一个目标检测区域输入预先训练的检测模型,获取与每个目标检测区域对应的候选预测结果,根据非极大抑制算法对所有目标检测区域对应的候选预测结果进行去噪,获取目标预测结果,其中,目标预测结果中包含所述待检测图像中的交通标志类别信息和位置信息。由此,通过预先训练的检测模型对待检测图像进行交通标志检测,提高了交通标志检测的精度值和效率。
-
公开(公告)号:CN109978006A
公开(公告)日:2019-07-05
申请号:CN201910139095.8
申请日:2019-02-25
Applicant: 北京邮电大学
IPC: G06K9/62
Abstract: 本发明提出一种聚类方法和装置,其中,方法包括:对待聚类对象进行特征提取,得到特征向量;根据待聚类对象的数量,确定随机图聚类算法对应的重复聚类次数RT和迭代次数列表{Ri},其中,迭代次数列表{Ri}是由每次聚类的迭代次数组成的;根据特征向量,确定阈值列表{Ti},其中,阈值列表{Ti}是由每次聚类时构建加权图的阈值组成的;根据随机图聚类算法对应的重复聚类次数RT、迭代次数列表{Ri}以及阈值列表{Ti},对特征向量进行聚类。该方法能够实现根据待聚类对象的规模和重复聚类次数,确定每次聚类的迭代次数,针对待聚类对象规模较小和聚类结果相对稳定的后几次聚类,可以使用较小的迭代次数,从而提高聚类效率。
-
公开(公告)号:CN114581915B
公开(公告)日:2025-03-14
申请号:CN202210141377.3
申请日:2022-02-16
Applicant: 北京邮电大学
IPC: G06V30/148 , G06V10/26 , G06V10/22
Abstract: 本发明提出一种噪声鲁棒的多类别表盘指针读数识别方法和装置,其中,方法包括:获取待检测仪表的图像信息,并根据图像信息确定待检测仪表的目标位置信息和类别信息;根据目标位置信息对图像信息进行分割,从图像信息中提取表盘中的关键区域信息;根据类别信息确定与类别信息对应的预设规则,根据预设规则和关键区域信息获取表盘指针读数结果。该方法可以提升在多种环境和多种不同形态规格表盘读数识别的有效性,解决现有技术中识别算法不具有普适性和读数识别受环境影响的技术问题。
-
公开(公告)号:CN118196575B
公开(公告)日:2024-12-31
申请号:CN202410294327.8
申请日:2024-03-14
Applicant: 北京邮电大学
IPC: G06V10/80 , G06V10/25 , G06V10/766 , G06V10/764 , G06V10/22 , G06V10/40 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/08
Abstract: 本申请提出了一种基于多视角特征融合与元特征编码的小样本目标检测方法,包括:对待检测图像数据进行多视角嵌入融合,得到融合后的图像数据;使用特征提取网络对融合后的图像数据进行图像特征提取,并结合区域建议网络确定图像数据的候选区域,并将候选区域进行RoI池化,得到RoI特征;将RoI特征分别输入全连接网络和元特征编码器中,获取分类特征、回归特征及元特征,并将元特征和分类特征进行融合,得到最终分类特征;通过分类器和回归器根据回归特征与最终分类特征确定图像数据中目标的定位与分类。采用上述方案的本发明在进行小样本目标检测时能够保证新类泛化性,并实现对基类知识的有效保留,缓解灾难性知识遗忘问题。
-
公开(公告)号:CN119166853A
公开(公告)日:2024-12-20
申请号:CN202411097270.9
申请日:2024-08-12
Applicant: 国网河北省电力有限公司信息通信分公司 , 北京邮电大学 , 国家电网有限公司
Inventor: 彭姣 , 辛锐 , 吴军英 , 欧中洪 , 王玉贞 , 宋美娜 , 贺月 , 朱一凡 , 陈曦 , 吕帅 , 常永娟 , 郑朴原 , 卢艳艳 , 尹晓宇 , 李涛 , 马子淇 , 张鹏飞 , 李士林
IPC: G06F16/783 , G06N3/0499
Abstract: 本发明提供一种视频文本跨模态检索方法及装置,属于数据处理领域。该方法包括:获取目标数据集中的原始数据;其中,原始数据中包括视频数据及其对应的文本数据;对原始数据进行预处理,得到多模态特征嵌入向量;对多模态特征嵌入向量进行特征提取,得到视频特征和文本特征;其中,视频特征包括视频全局特征和视频局部特征;分别对视频全局特征、视频局部特征和文本特征进行嵌入学习,得到视频嵌入空间、视频局部关系嵌入空间和文本嵌入空间;基于视频嵌入空间、视频局部关系嵌入空间和文本嵌入空间进行视频文本跨模态检索。本发明通过联合视觉、文本以及局部关系进行空间嵌入学习,能更加精确高效地实现跨模态检索。
-
公开(公告)号:CN114817557B
公开(公告)日:2024-12-20
申请号:CN202210302732.0
申请日:2022-03-24
Applicant: 北京邮电大学
IPC: G06F16/36 , G06F18/214 , G06Q40/03
Abstract: 本发明公开了基于企业征信大数据知识图谱的企业风险检测方法和装置,其中,该方法包括:通过分散数据子域数据构建企业征信大数据统一信息模型;基于企业征信大数据统一信息模型,利用自顶向下方式构建第一企业征信大数据领域本体;以及通过自底向上的构建方式对企业征信大数据领域中的数据进行实体抽取和关系抽取,选取优质新词扩充第一企业征信大数据领域本体规模,以构建第二企业征信大数据领域本体;基于构建好的本体,利用企业征信大数据构建企业征信大数据知识图谱,通过知识图谱进行特征获取,将获取的特征数据输入训练好的风控模型输出分类结果,并用于分类企业。本发明提升了企业征信领域知识图谱本体的精确性,提升了风控模型的性能。
-
公开(公告)号:CN114817241B
公开(公告)日:2024-12-20
申请号:CN202210306938.0
申请日:2022-03-25
Applicant: 北京邮电大学
IPC: G06F16/22 , G06F16/2458 , G06F16/953 , G06Q40/03
Abstract: 本申请提出了一种基于Flink引擎计算节点动态扩展的任务评价方法,包括:接收客户端发送的任务;接收客户端在出现数据热点时发送的节点扩展指令,根据节点扩展指令修改任务的执行图的拓扑结构,并通知目标算子任务的上游算子任务增加结果分区和变更虚拟哈希映射表和虚拟路由表,其中,目标算子任务为出现数据热点的算子任务;通过任务管理器启动新增计算节点,初始化新增计算节点的输入网关和结果分区;通知目标算子任务的下游算子任务增加输入通道;通过任务管理器根据修改后的任务的执行图的拓扑结构,对用户数据进行处理,得到任务评价结果。本申请解决了Flink引擎处理数据时的数据倾斜的问题,提高了系统的数据计算速度,满足任务实时场景需求。
-
公开(公告)号:CN114528387B
公开(公告)日:2024-11-19
申请号:CN202210074402.0
申请日:2022-01-21
Applicant: 北京邮电大学
IPC: G06F16/332 , G06F18/2415 , G06N3/04 , G06N3/08 , G06F40/35
Abstract: 本发明提出一种基于对话流自举的深度学习对话策略模型构建方法和系统,其中,方法包括:通过对话流自举方式构建语料训练集,对话流自举方式包括:基于用户的多对话轮次对话数据获得对话流状态机,使用宽度优先搜索获取对话流状态机中起始状态到任意状态的所有路径,进而获得多对话轮次的对话序列标注数据,多对话轮次的对话序列标注数据构成语料训练集;构建深度学习对话策略模型,将语料训练集输入至深度学习对话策略模型,输出目标对话动作,其中,深度学习对话策略模型包括对话动作预测模型和置信度比较模型。根据本发明的方法解决现有技术中模型训练数据不足导致模型冷启动的问题。
-
-
-
-
-
-
-
-
-