-
公开(公告)号:CN118298845B
公开(公告)日:2024-11-01
申请号:CN202410530115.5
申请日:2024-04-29
申请人: 北京开普云信息科技有限公司
IPC分类号: G10L25/24 , G10L25/30 , G10L25/90 , G10L19/008
摘要: 本申请公开了一种复调音频的音高识别模型的训练方法、装置、介质及设备,属于数据处理技术领域。将训练集中的复调音频的每帧音频数据转换成梅尔频谱图;搭建音高识别模型;利用模型中的Mamba‑UNet对每帧梅尔频谱图进行特征提取,得到第一中间特征;利用模型中的Transformer‑encoder对连续帧的第一中间特征进行分析,得到第二中间特征;利用全连接层对第二中间特征进行处理,得到人声的音高识别结果;根据训练集中的真实音高信息和音高识别结果对音高识别模型进行训练。本申请能在不牺牲全局感受野的情况下实现线性复杂度计算,降低计算成本;还能避免梯度问题,在处理大规模数据时显示出更高的效率和更好的性能。
-
公开(公告)号:CN117216208B
公开(公告)日:2024-08-20
申请号:CN202311125882.X
申请日:2023-09-01
申请人: 北京开普云信息科技有限公司
IPC分类号: G06F16/332 , G06F16/33 , G06F40/211 , G06F40/289 , G06N20/00
摘要: 本申请公开了一种基于长文档的问答方法、装置、存储介质及设备,属于机器学习技术领域。所述方法包括:按照不同切分长度分别对长文档进行切分,将每个切分长度对应的多个切块组成一个切块向量数据库;获取用户输入的提问文本;从多个切块向量数据库中查找与提问文本的长度相匹配的一个切块向量数据库;根据提问文本和切块向量数据库生成提示词;将提示词输入训练后的大语言模型,将大语言模型的输出结果确定为提问文本的回答。本申请可以在与提问文本的长度更相近的某一个切块向量数据库里查找切块,解决了提问文本的长短不确定,可能导致语义检索的定位不准确的问题,使得问答结果更准确。
-
公开(公告)号:CN118447110A
公开(公告)日:2024-08-06
申请号:CN202410422573.7
申请日:2024-04-09
申请人: 北京开普云信息科技有限公司
IPC分类号: G06T11/00 , G06V40/10 , G06T11/60 , G06V10/774 , G06V10/82
摘要: 本申请公开了一种可控的特定人物人像生成方法、装置、存储介质及设备,属于计算机技术领域。获取衣饰图像、身姿图像、文本描述词和随机噪声;利用IPAdapter模型、Stable‑DiffusionXL模型和Lora模型对衣饰图像和随机噪声进行处理,得到第一特征向量;利用ControlNet模型、Stable‑DiffusionXL模型和Lora模型对身姿图像、文本描述词和随机噪声进行处理,得到第二特征向量;利用Stable‑DiffusionXL模型和Lora模型对两个特征向量进行处理,得到具有特定衣饰和特定身姿的特定人物图像。本申请能控制人物的身姿、衣饰,具有高还原度、可控性好和易操作的效果。
-
公开(公告)号:CN114092743B
公开(公告)日:2022-07-26
申请号:CN202111405840.2
申请日:2021-11-24
申请人: 开普云信息科技股份有限公司 , 北京开普云信息科技有限公司
IPC分类号: G06V10/764 , G06V10/74 , G06V10/766 , G06V10/82 , G06V10/25 , G06V40/16 , G06N3/04 , G06N3/08 , G06K9/62
摘要: 本申请公开了一种敏感图片的合规性检测方法、装置、存储介质及设备,属于图片处理技术领域。所述方法用于合规性检测网络中,所述合规性检测网络中包括目标检测网络和至少一个检测分支,每个检测分支对应于一种合规性检测策略;包括:获取待检测的敏感图片;利用所述目标检测网络,从所述敏感图片中识别出敏感区域和敏感类别,所述敏感区域中包含敏感目标,所述敏感类别是所述敏感目标所属的类别;从所述至少一个检测分支中选择与所述敏感类别对应的目标检测分支;利用所述目标检测分支的合规性检测策略检测所述敏感图片是否合规。本申请可以实现对敏感图片的合规性检测,且可以提高检测的准确性。
-
公开(公告)号:CN114757168A
公开(公告)日:2022-07-15
申请号:CN202210079245.2
申请日:2022-01-24
申请人: 开普云信息科技股份有限公司 , 北京开普云信息科技有限公司
IPC分类号: G06F40/232 , G06N3/04 , G06N3/08
摘要: 本发明提供了一种文本纠错模型的训练方法、设备、介质及产品,所述方法包括如下步骤:通过获取样本文本列表,对样本文本列表中任一样本文本进行切分处理,得到样本片段;将任一样本片段输入至预设的文本纠错模型中,获取第一损失函数值和第二损失函数值并基于一损失函数值和第二损失函数值,获取总损失函数值;能够以总损失函数值对文本纠错模型进行调整,直到文本纠错模型进行收敛,进而提高了文本纠错模型对文本纠错准确性,在保证对文本进行正确纠错的同时,减少所述纠错模型对文本的错误纠错和增强对正确文本的复制,从而减少文本纠错时的误报。
-
公开(公告)号:CN112257419B
公开(公告)日:2021-05-28
申请号:CN202011227890.1
申请日:2020-11-06
申请人: 开普云信息科技股份有限公司 , 北京开普云信息科技有限公司
IPC分类号: G06F40/216 , G06F40/30 , G06F40/242 , G06F40/289 , G06K9/62 , G06F16/33
摘要: 本发明提供一种基于词频和语义计算专利文献相似度的智能检索方法、装置、电子设备及其存储介质,对专利数据库中的所有文献进行词袋统计和词向量计算,得到对应的词袋数据和词距离数据;建立模型,输入内容或考题号,在题库数据中获取待审专利的标题、摘要、权利要求书、说明书进行多种组合,并分别根据词袋算法和语义算法进行粗选和细选,针对选择后数据进行文本相似度分析,将分析结果融合排序得到综合相似度,经查重筛选,给出待查专利的可疑答案集合。本发明提升了检索速度,采用两轮筛选,第一轮粗选旨在快速缩小对比范围,第二轮细选旨在兼顾提高准确率;可以有效节省人力和时间,帮助专利审查员缩减相关专利审查范围,提高审查效率。
-
公开(公告)号:CN111723287B
公开(公告)日:2021-03-05
申请号:CN202010502980.0
申请日:2020-06-03
申请人: 开普云信息科技股份有限公司 , 北京开普云信息科技有限公司
IPC分类号: G06F16/9535 , G06N3/04 , G06N3/08
摘要: 本发明提供一种基于大规模机器学习的内容和服务推荐方法及其系统,所述方法包括:系统采用半监督学习的方式实现智能推荐,首先,粗粒度定义用户和资源的特征标签,通过计算标签权重对标签进行关联;其次,细粒度挖掘用户和资源的关系,采用BP神经网络学习规则对数据进行机器训练并构建模型,通过计算推荐度对待推荐资源进行打分和排序,从而实现搜索结果、资源内容的关联展示和个性化服务推荐,本发明将BP神经网络技术与推荐技术相结合,充分利用积累的网站大数据,通过大规模机器训练实现智能化推荐,具有很强的非线性映射能力和柔性的网络结构,有效提升了资源发布效率,实现快速、高效且准确的内容和服务推荐,获得更高的用户满意度。
-
公开(公告)号:CN111723287A
公开(公告)日:2020-09-29
申请号:CN202010502980.0
申请日:2020-06-03
申请人: 开普云信息科技股份有限公司 , 北京开普云信息科技有限公司
IPC分类号: G06F16/9535 , G06N3/04 , G06N3/08
摘要: 本发明提供一种基于大规模机器学习的内容和服务推荐方法及其系统,所述方法包括:系统采用半监督学习的方式实现智能推荐,首先,粗粒度定义用户和资源的特征标签,通过计算标签权重对标签进行关联;其次,细粒度挖掘用户和资源的关系,采用BP神经网络学习规则对数据进行机器训练并构建模型,通过计算推荐度对待推荐资源进行打分和排序,从而实现搜索结果、资源内容的关联展示和个性化服务推荐,本发明将BP神经网络技术与推荐技术相结合,充分利用积累的网站大数据,通过大规模机器训练实现智能化推荐,具有很强的非线性映射能力和柔性的网络结构,有效提升了资源发布效率,实现快速、高效且准确的内容和服务推荐,获得更高的用户满意度。
-
公开(公告)号:CN109379363B
公开(公告)日:2019-07-12
申请号:CN201811247457.7
申请日:2018-10-25
申请人: 北京开普云信息科技有限公司 , 开普云信息科技股份有限公司
IPC分类号: H04L29/06
摘要: 本发明提供了一种基于集约化治理平台的单点登录集成方法及系统,本发明系统具体包括以下模块:单点登录模块:通过协议完成登录校验,实现到处漫游的功能;日志模块:记录各应用系统的登录日志,以及校验主平台的访问控制权限;主平台模块:对用户或机构进行统一认证管理并同步到各集成应用系统中。本发明的技术方案解决了单点登录时共性应用系统无法对用户和机构以及访问控制权限等数据进行统一认证管理和同步的问题。本发明的有益效果是在集约化治理平台中对用户、机构、访问权限等信息做出改变后,会及时同步到该用户、机构具有权限的共性应用系统中,实现了用户、机构等重要数据的一致性管理。
-
公开(公告)号:CN109062876B
公开(公告)日:2019-07-12
申请号:CN201810801006.7
申请日:2018-07-20
申请人: 北京开普云信息科技有限公司 , 开普云信息科技股份有限公司
IPC分类号: G06F17/22
摘要: 本发明提供了一种基于DOM网页剪枝的相似网页查找方法及系统,其包括步骤:输入数据格式化:获取网页的数字化标识;相似网页查找:在存储网页数字化标识的数据库中查找相似网页。其中,所述获取网页的数据化标识具体包括以下步骤:网页数据格式化:获取输入网页的HTML源代码;网页净化:去除网页中的冗余信息;生成网页的DOM树:对网页进行DOM解析,生成DOM树;精炼的DOM树:遍历DOM树,寻找最小格式节点,删除最小格式节点的子孙节点,形成一个新的DOM树;文本序列转换:对新的DOM树进行深度优先遍历,得到一个HTML标签拼接的文本序列;数字标识生成:利用simhash算法计算所述文本序列,得到该网页的数字化标识。本发明方法能够提高海量网页中相似网页的查找效率。
-
-
-
-
-
-
-
-
-