-
公开(公告)号:CN115496906A
公开(公告)日:2022-12-20
申请号:CN202211201860.2
申请日:2022-09-29
申请人: 杭州电子科技大学
摘要: 本发明公开了一种基于CNN图像处理的三消游戏辅助方法,首先获取棋盘图像,利用预训练模型对棋盘内的棋子进行分割,得到棋子的分类和位置;再根据图像处理结果模拟棋盘;最后基于三消游戏的逻辑,设计三消游戏算法,确定最优操作;本发明采用了Mask‑RCNN网络处理棋盘图像,改变辅助方法只能针对单一游戏的现状,可以适用于辅助绝大多数三消游戏。
-
公开(公告)号:CN116758629A
公开(公告)日:2023-09-15
申请号:CN202310650341.2
申请日:2023-06-03
申请人: 杭州电子科技大学
IPC分类号: G06V40/20 , G06V10/82 , G06V10/774 , G06N3/0895
摘要: 本发明公开了一种基于半监督随机神经网络的行人轨迹分类方法。该方法包括构建行人轨迹数据;对行人轨迹数据预处理;根据行人轨迹数据建立不同的轨迹模式;最后采用可量化最小误差熵准则和半监督随机神经网络算法的组合算法对行人行为进行分类。本发明采用可量化最小误差熵准则替代传统的均方误差准则,并与半监督随机神经网络算法相结合,能够进一步提高现有半监督学习模型的分类能力,同时也提高了对行人轨迹分类的准确性。
-
公开(公告)号:CN116363146A
公开(公告)日:2023-06-30
申请号:CN202310376860.4
申请日:2023-04-10
申请人: 杭州电子科技大学
IPC分类号: G06T7/10 , G06T7/00 , G06V10/764 , G06V10/774 , G06N3/0464 , G06N3/08
摘要: 本发明公开了一种基于半监督学习的眼眶肿瘤图像分割方法,首先获取图像数据集,然后进行图像预处理;构建基于半监督学习的眼眶肿瘤图像分割模型(MSCINet);再将预处理后的数据集输入MSCINet模型,进行模型训练;最后通过训练好的MSCINet模型实现眼眶肿瘤图像分割。本发明通过引入多尺度一致性约束,可以学习不同尺度下的鲁棒特征,更好的应对眼眶肿瘤尺度变换较大的挑战;通过自训练策略,充分利用大量未标注数据,缓解一般深度模型对于大规模标注数据的需求,降低深度模型应用限制。
-
公开(公告)号:CN116363145A
公开(公告)日:2023-06-30
申请号:CN202310374298.1
申请日:2023-04-10
申请人: 杭州电子科技大学
IPC分类号: G06T7/10 , G06V10/764 , G06V10/774 , G06T7/00 , G06V10/80 , G06N3/0464 , G06N3/048 , G06N3/08
摘要: 本发明公开了一种基于双重边缘表示的眼底OCT图像视网膜分层方法,首先进行数据集获取及预处理,然后构建基于双重边缘表示的眼底OCT图像视网膜分层模型MTDBA‑Net;使用灰度归一化训练图像和人工标注结果及双重边缘表示训练提出的MTDBA‑Net;最后通过训练好的模型实现眼底OCT图像视网膜分层。本发明所提出的双重边缘表示可以包含更加丰富的边缘形状信息,多任务间施加一致性约束可以充分利用多任务间的相关性,提高图像分割的精度获得更精准的边缘。
-
公开(公告)号:CN115497083A
公开(公告)日:2022-12-20
申请号:CN202211201815.7
申请日:2022-09-29
申请人: 杭州电子科技大学
IPC分类号: G06V20/62 , G06V30/18 , G06V30/418 , G06N20/00 , G06N3/08 , G06N3/04 , G06F40/258
摘要: 本发明公开了一种基于机器学习的即插即用的风格化图片字幕生成方法,首先准备数据集,构建可控图像文本生成网络,包含两个子网络:image‑caption网络和风格控制器;通过image‑caption网络对输入的图像数据进行处理,得到对应的输出文本;通过风格控制器对输出文本进行风格控制;最后训练可控图像文本生成网络。本发明提出一种可控文本生成的方式,不需要对生成模型进行参数调整等额外操作,通过一个具有即插即用功能的风格控制器,即可在生成模型基础上生成带有所需要属性的字幕,拓展了原生成模型的功能与泛用性;本发明采用Transformer替代传统的LSTM作为生成模型,增加了生成字幕的准确性。
-
-
-
-