-
公开(公告)号:CN112860945A
公开(公告)日:2021-05-28
申请号:CN202110017595.1
申请日:2021-01-07
申请人: 国网浙江省电力有限公司 , 国网浙江省电力有限公司营销服务中心 , 浙江大学 , 杭州一知智能科技有限公司
IPC分类号: G06F16/783 , G06K9/62 , G06N3/08
摘要: 本发明属于视频问答领域,具体涉及利用帧‑字幕自监督进行多模态视频问答的方法。包括以下步骤:提取视频帧特征、问答特征、字幕特征、字幕建议特征;得到带注意力帧特征、带注意力字幕特征,得到融合特征;基于融合特征计算得到时间注意力得分;利用时间注意力得分计算得到问题的时间边界;利用融合特征与时间注意力得分计算得到问题答案;利用问题的时间边界和问题答案训练神经网络;优化神经网络的网络参数,利用最优神经网络进行视频问答并划定时间边界。本发明没有使用标注代价昂贵的时间标注,而是根据自行设计的时间注意分数生成问题相关的时间边界。另外本发明通过挖掘字幕与对应视频内容之间的联系,得到更为精准的答案。
-
公开(公告)号:CN112767921A
公开(公告)日:2021-05-07
申请号:CN202110018749.9
申请日:2021-01-07
申请人: 国网浙江省电力有限公司 , 国网浙江省电力有限公司营销服务中心 , 浙江大学 , 杭州一知智能科技有限公司
摘要: 本发明属于语音识别领域,具体涉及一种基于缓存语言模型的语音识别自适应方法和系统,包括:针对一段连续的长语音分割得到多条短语音,并按照时间顺序构成任务队列;通过动态语言模型获得识别文本;根据每一条短语音的识别文本,实时判断是否需要进行概率修正,若是,则根据预设关联词表进行关键词搜索,得到关键词组,计算局部词汇概率分布,构建局部语言模型;将局部语言模型与动态语言模型进行插值合并,得到更新后的动态语言模型。本发明根据预设关联词表进行关键词搜索,得到关键词组,计算局部词汇概率分布,构建局部语言模型,将局部语言模型与动态语言模型进行插值合并,得到更新后的动态语言模型,进而提高识别准确率。
-
公开(公告)号:CN112860945B
公开(公告)日:2022-07-08
申请号:CN202110017595.1
申请日:2021-01-07
申请人: 国网浙江省电力有限公司 , 国网浙江省电力有限公司营销服务中心 , 浙江大学 , 杭州一知智能科技有限公司
IPC分类号: G06F16/783 , G06V10/80 , G06V10/82 , G06V10/771 , G06K9/62 , G06N3/08
摘要: 本发明属于视频问答领域,具体涉及利用帧‑字幕自监督进行多模态视频问答的方法。包括以下步骤:提取视频帧特征、问答特征、字幕特征、字幕建议特征;得到带注意力帧特征、带注意力字幕特征,得到融合特征;基于融合特征计算得到时间注意力得分;利用时间注意力得分计算得到问题的时间边界;利用融合特征与时间注意力得分计算得到问题答案;利用问题的时间边界和问题答案训练神经网络;优化神经网络的网络参数,利用最优神经网络进行视频问答并划定时间边界。本发明没有使用标注代价昂贵的时间标注,而是根据自行设计的时间注意分数生成问题相关的时间边界。另外本发明通过挖掘字幕与对应视频内容之间的联系,得到更为精准的答案。
-
公开(公告)号:CN113079264A
公开(公告)日:2021-07-06
申请号:CN202110296280.5
申请日:2021-03-19
申请人: 国网浙江省电力有限公司 , 国网浙江省电力有限公司营销服务中心 , 浙江大学 , 杭州一知智能科技有限公司
摘要: 本发明属于电力领域,具体涉及一种应用于供电系统的电费催缴联动方法,包括以下步骤:S1:在第一设定时间段,对所有已出账单的用户发送包含电费信息的短信;S2:在第二设定时间段,获取仍未缴费的用户信息,根据用户信息进行外呼机器人电话外呼催费,通话结束后经过对用户发送指定内容的短信;S3:在第三设定时间段,对经过短信催费和电话催费之后仍未缴费的用户进行上门递送电费账单催缴电费。本发明采用的技术方案,具有如下有益效果:通过短信‑电话‑人工电费催缴的联动策略,解决传统的电费催缴业务模块分离,触达率低的问题,从而节省人力消耗,节约资金成本。
-
公开(公告)号:CN112150694A
公开(公告)日:2020-12-29
申请号:CN202010806179.5
申请日:2020-08-12
申请人: 国网浙江省电力有限公司营销服务中心 , 国网浙江省电力有限公司 , 浙江大学 , 杭州一知智能科技有限公司
摘要: 本发明涉及智能语音领域,尤其涉及一种智能语音电费催缴系统及方法,包括:话术结点配置模块,用于结合电费催缴场景,通过配置结点内的话术与客户意向分类,连接结点之间的连线组成完整的话术;知识库构建模块,用于构建知识库存储问答知识;实时语音识别模块,用于识别客户的发声语音,并将其转换成文字;自然语言理解模块,用于理解语音识别之后文字的语义;文本转语音模块,用于根据对语义的理解选择话术结点配置模块内的话术或知识库构建模块中的答案,并合成语音播放给客户。通过使用本发明,可以实现以下效果:实现智能语音催缴电费,以节省人力资源,提升催缴效率。
-
公开(公告)号:CN116434216A
公开(公告)日:2023-07-14
申请号:CN202310320095.4
申请日:2023-03-29
申请人: 浙江大学 , 国网浙江省电力有限公司营销服务中心
IPC分类号: G06V20/62 , G06V30/19 , G06V10/82 , G06N3/0442 , G06N3/045 , G06N3/0464 , G06N3/08
摘要: 本发明公开了一种用于去中心化场景的模型自适应文本识别方法和系统。本发明的方法包括步骤:利用多个文本识别源模型对一组目标域中的文本图像进行预测,得到经全部模型预测的字符序列标签;基于置信度和不确定性进行筛选,将符合条件的字符序列标签组成字符序列,和与其对应的文本图像作为伪标签对;基于多样性度量判断伪标签对是否可用于模型的自适应性训练,若否,则剔除,剩余的伪标签对组成训练集;采用训练集对模型进行自适应训练;训练之后的模型识别待测文本图像,并使用集成选择策略确定最终的文本识别结果。本发明在去中心化场景下设计新的伪标签筛选策略,仅利用多个模型和无标注的目标域文本图像,实现了模型自适应文本识别的效果。
-
公开(公告)号:CN115293400A
公开(公告)日:2022-11-04
申请号:CN202210718685.8
申请日:2022-06-23
申请人: 国网浙江省电力有限公司营销服务中心 , 浙江大学
摘要: 本发明公开了一种电力系统负荷预测方法和系统。本发明预测方法包括:以用电企业为单位,对企业用电数据集以给定的采样时间窗口进行滑动采样;将滑动采样后的数据集划分为训练集和测试集,构成GA‑CNN‑LSTM模型的输入;构建GA‑CNN‑LSTM模型;构建基于GA遗传算法的调参策略;将训练集输入GA‑CNN‑LSTM模型,在GPU上进行模型调参,获得最优参数;将训练集输入GA‑CNN‑LSTM模型,使用最优参数,在GPU上进行模型训练;将训练集输入GA‑CNN‑LSTM模型,在测试集上进行预测,获得最终预测结果;使用均方误差MSE、平均绝对误差RMSE、决定系数R2_Score和均方根误差MAE指标评估模型的效果。本发明能得到更可靠的数据集划分方式及能稳定、精确地挖掘电力负荷序列长期依赖关系,有效解决电力负荷预测技术难题。
-
公开(公告)号:CN116797656A
公开(公告)日:2023-09-22
申请号:CN202310177625.4
申请日:2023-02-28
申请人: 浙江大学 , 杭州一知智能科技有限公司
IPC分类号: G06T7/73 , G06F16/35 , G06F40/20 , G06N3/0455 , G06N3/0499 , G06N3/08
摘要: 本发明提出了一种具有相对位置感知能力的3D视觉定位方法和系统,属于3D视觉定位领域,从3D点云中采样种子点,提取种子点特征;以及,提取语言描述语句的文本特征;从种子点中采样与语言描述语句相关的目标物体的关键点;利用包含文本‑视觉双解码器的3D相对位置感知网络分别解码输出目标物体的预测边界框和参考置信度分数,选择具有最高参考置信度分数的关键点来回归目标边界框,将边界框内的物体作为定位结果。还设计了一种软标签策略来辅助训练并进一步提高视觉定位性能,大范围的实验证明了本发明的高效性和有效性。
-
公开(公告)号:CN116503771A
公开(公告)日:2023-07-28
申请号:CN202310052079.1
申请日:2023-02-02
申请人: 浙江大学 , 杭州一知智能科技有限公司
IPC分类号: G06V20/40 , G06V20/50 , G06V10/82 , G06N3/0455 , G06N3/0895
摘要: 本发明公开了一种基于高效关系逼近算法的群体视频描述方法及系统,属于视频理解领域。包括:针对包含目标视频和参考视频的视频组,根据基于高效关系逼近的跨视频共享内容聚合模块,生成目标视频组共享特征和参考视频组共享特征;根据上下文精炼模块,输出参考视频中对于目标视频的补充信息,得到上下文特征。利用解码网络对共享特征和上下文特征的拼接结果进行解码,输出针对于目标视频组的描述文本。本发明能够生成针对群体视频共享内容的描述文本,采用一种新颖的高效关系逼近算法优化模型的时间复杂度到线性级别,并利用对比学习策略精炼上下文特征,有效地改善了模型性能。
-
公开(公告)号:CN116484885A
公开(公告)日:2023-07-25
申请号:CN202310461929.3
申请日:2023-04-26
申请人: 浙江大学 , 杭州一知智能科技有限公司
IPC分类号: G06F40/58 , G06N3/0895 , G06N3/0499 , G06N3/0455 , G06N3/0464
摘要: 本发明公开了一种基于对比学习和词粒度权重的视觉语言翻译方法和系统,属于时序对齐的视觉语言翻译领域。提取源域的唇语或指语视频嵌入特征和文本嵌入特征;先对视频嵌入特征进行编码,再通过多头注意力机制与文本嵌入特征交互,解码生成字词概率分布,基于任务的交叉熵损失函数项初步训练;根据解码的注意力向量,计算字词的词粒度多样性权重;将源域随机划分为元训练集和元测试集,采用对比限制的元学习训练策略,通过多样性感知权重控制模型的学习方向,训练具有泛化能力的编码器和解码器。利用训练好的视觉编码器和跨模态解码器完成对未见表达者的视觉语言翻译任务。本发明提高了对域外表达者的泛化能力,有效地改善了视觉语言翻译效果。
-
-
-
-
-
-
-
-
-