-
公开(公告)号:CN115713270B
公开(公告)日:2023-07-21
申请号:CN202211505028.1
申请日:2022-11-28
Applicant: 之江实验室
IPC: G06Q10/0639 , G06F16/22 , G06F16/2455 , G06F18/2433 , G06F18/2321 , G06F18/2135
Abstract: 本发明公开了一种同行互评异常评分检测及修正方法和装置,该方法包括以下步骤:首先将收集到的评分数据转化为二维矩阵并进行数据预处理;其次利用单向异常检测法、一致性检验法及双向异常检测法对处理后的结构化数据进行异常判断,并将检测出的异常数据归入异常数据集中;然后利用信息熵修正法对异常数据集进行异常数据修复;最后结合异常数据集生成能力评价报告,并结合能力评价报告中评审人的评分权重对修正后的评分数据进行加权平均得到最终评分结果,并生成异常评分修正报告。本发明能够有效检测企业人员绩效考核中同行互评分数异常现象,并通过能力评估报告对评审人进行约束,保证同行互评结果的公平、公正及客观性。
-
公开(公告)号:CN116306657A
公开(公告)日:2023-06-23
申请号:CN202310565366.2
申请日:2023-05-19
Applicant: 之江实验室
IPC: G06F40/295 , G06F16/33 , G06N20/00 , G06F16/35
Abstract: 本发明公开一种基于方阵标注和双仿射层注意力的实体抽取方法及系统。本发明由文本数据库模块、文本预处理模块、文本建模模块、输出模块四个部分组成。该系统是首次将图像语义分割的思想融入文本实体抽取的任务中,将传统的序列标注任务转变成方阵标注任务,并使用双仿射层注意力机制将序列表示的语义向量转化为长宽均为文本序列长度的方阵,缓解了中文文本实体识别任务中实体边缘检测难,检测精度低的问题。
-
公开(公告)号:CN115049489A
公开(公告)日:2022-09-13
申请号:CN202210671194.2
申请日:2022-06-14
Applicant: 之江实验室 , 建信金融科技有限责任公司 , 浙江邦盛科技股份有限公司
Inventor: 陈杨 , 张洪彬 , 王艺涵 , 许浩 , 方宁 , 姚翌 , 叶振栋 , 洪世能 , 胡宗鹏 , 金雨青 , 王笑 , 刘敏 , 孙力骏 , 李晓晨 , 钟鑫 , 刘智 , 朱凌峰 , 柴方林
IPC: G06Q40/04
Abstract: 本发明公开了一种基于变量选择法的配对交易的交易对选择方法,该方法获取期货合约的日度平均成交价格;将价格转化为指数价格;运用套索回归、弹性网回归等变量选择法,处理期货的指数价格序列;以回归方程被解释变量和解释变量中回归系数不为零的期货作为交易对,以回归系数作为套利对冲系数;对解释变量指数价格,与被解释变量指数价格的系数乘积和,运用E‑G两步法进行协整性检验;对通过协整性检验的交易对,计算价差的方差,选取方差较大的交易对进行套利交易;根据价差的分布制定套利交易策略。本发明方法计算得到的多产品对及套利对冲系数更加稳健可靠,使得交易对的盈利能力大大提升。
-
公开(公告)号:CN115049472A
公开(公告)日:2022-09-13
申请号:CN202210519445.5
申请日:2022-05-12
Applicant: 之江实验室 , 建信金融科技有限责任公司 , 浙江邦盛科技股份有限公司
Abstract: 本发明公开了一种基于多维特征张量的无监督信用卡异常检测方法,首次将多维度多尺度特征张量特征构建、多维注意力卷积网络、重编码生成对抗网络进行有机结合,由多维注意力卷积网络产生优质的生成结果,并对多维度多尺度特征张量编码、解码、再编码。将异常交易样本的特点最大程度的表达出来,得到优质的重构表征;在重构特征上进行基于时间、空间、类别的3σ异常打分,并基于不同尺度进行异常投票,异常尺度占多数的为异常,避免噪声影响,增加鲁棒性;采用流式指标计算引擎协同工作,具有实时性和高准确率。本发明减少了特征工程对专家经验的依赖程度,在信用卡交易实时异常检测问题方面有较高的准确率。
-
公开(公告)号:CN118072119B
公开(公告)日:2025-04-08
申请号:CN202410055534.8
申请日:2024-01-15
Applicant: 之江实验室
IPC: G06V10/774 , G06V10/82 , G06V10/77 , G06V10/762 , G06V10/75 , G06V10/764 , G06N3/0464 , G06N3/045 , G06N3/084 , G06N3/088
Abstract: 本发明公开了一种面向数据隐私保护的多源异质数据蒸馏方法和装置,该方法包括:首先获得待蒸馏的多源异质图像数据集并进行相应的数据预处理;其次利用卷积神经网络获得图像表征后利用无监督聚类方法对表征数据进行聚类;然后构建同时满足分布匹配和参数匹配的双层网络模型,匹配每个聚类簇中的质心点所对应的原始数据点作为合成数据集,通过异步更新机制,迭代更新合成数据集和网络参数直至模型收敛;最后获得蒸馏后的图像数据集。本发明能精准的识别多源异质图像数据集的隐含模式,并从每个隐含模式中合成一张最具代表性的图像数据集,最终达到数据隐私保护和数据压缩的目的。
-
公开(公告)号:CN119066185A
公开(公告)日:2024-12-03
申请号:CN202411574862.5
申请日:2024-11-06
Applicant: 之江实验室
IPC: G06F16/332 , G06F16/36 , G06F16/953 , G06F18/214 , G06Q40/03
Abstract: 本发明公开了一种基于大模型的潜在绿色企业挖掘方法和装置,包括:对大语言模型基座进行领域预训练以及进行绿色企业与绿色产业识别任务的微调;获取每个企业的经营范围、业务范围以及生态环境行政处罚相关文本信息,并与企业申请绿色信贷时填写的信贷业务相关文本信息进行文本处理;将经过处理的文本数据和问题输入微调后的大语言模型,输出是否为绿色企业以及绿色企业所属的绿色产业类别,同时由人工对输出结果进行二次确认得到确认结果,将确认结果作为标签对大语言模型进行训练;利用训练好的大语言模型进行绿色企业挖掘。本发明通过一整套智能的流程设计,极大削减了人力成本,简化了潜在绿色企业的挖掘流程,缩短潜在绿色企业的挖掘周期。
-
公开(公告)号:CN116523619A
公开(公告)日:2023-08-01
申请号:CN202310277065.X
申请日:2023-03-21
Applicant: 之江实验室
IPC: G06Q40/03 , G06Q10/0635
Abstract: 本发明公开了一种绿色金融环境和社会风险的预警方法,包括以下步骤:采集与企业相关的工商信息,司法信息以及周边新闻,组成原始环境数据;基于预警类型对原始环境数据进行分类,基于分类结果构建包括环境行政处罚企业,环境违法失信黑名单企业以及安全生产违法违规企业的预警数据库;创建中文自定义词典对所述预警数据库进行筛选,生成预警任务列表;根据企业整改情况对所述预警任务列表进行核对和分类,生成所有企业的环境社会风险预警结果。本发明还提供了一种预警装置和预警系统。本发明提供的方法提高绿色金融领域环境和社会风险管理的自动化程度,减少人工管理成本。
-
公开(公告)号:CN115906835A
公开(公告)日:2023-04-04
申请号:CN202211480390.8
申请日:2022-11-23
Applicant: 之江实验室
IPC: G06F40/289 , G06F40/30 , G06F40/216 , G06F18/23 , G06F18/22
Abstract: 本发明公开一种基于聚类和对比学习的中文问句文本表示学习的方法,该方法先对中文问句语料进行清洗,然后进行聚类,将字面相似的样本划分在相同的子集中;按顺序选定子集并按批次抽取问句,将不同批次问句按顺序输入SimCLR对比学习框架中,并生成与每个问句对应的语义相似问句表示,之后使用对比损失函数拉近问句与语义相似问句之间的距离,并扩大该问句与同批次其他问句之间的距离,得到训练好的SimCLR对比学习模型;最后将新的中文问句语料也进行相同的清洗和聚类,并将聚类后的子集按批次输入训练好的SimCLR对比学习模型,得到分类后的中文问句语料,实现中文问句语料的自动打标。本发明有效提升了模型对问句文本之间差异的辨析性能。
-
公开(公告)号:CN115906835B
公开(公告)日:2024-02-20
申请号:CN202211480390.8
申请日:2022-11-23
Applicant: 之江实验室
IPC: G06F40/289 , G06F40/30 , G06F40/216 , G06F18/23 , G06F18/22
Abstract: 本发明公开一种基于聚类和对比学习的中文问句文本表示学习的方法,该方法先对中文问句语料进行清洗,然后进行聚类,将字面相似的样本划分在相同的子集中;按顺序选定子集并按批次抽取问句,将不同批次问句按顺序输入SimCLR对比学习框架中,并生成与每个问句对应的语义相似问句表示,之后使用对比损失函数拉近问句与语义相似问句之间的距离,并扩大该问句与同批次其他问句之间的距离,得到训练好的SimCLR对比学习模型;最后将新的中文问句语料也进行相同的清洗和聚类,并将聚类后的子集按批次输入训练好的SimCLR对比学习模型,得到分类后的中文问句语料,实现中文问句语料的自动打标。本发明有效提升了模型对问句文本之间差异的辨析性能。
-
公开(公告)号:CN116401362A
公开(公告)日:2023-07-07
申请号:CN202310110726.X
申请日:2023-01-16
Applicant: 之江实验室
IPC: G06F16/35 , G06F40/216 , G06F40/284 , G06F40/289 , G06F18/241 , G06F18/23 , G06F18/10
Abstract: 本发明公开了一种基于动态聚类的面向不平衡数据集的绿色金融产业分类方法和装置,包括:清洗并将不平衡的绿色信贷数据转换为词向量;统计每类数据的词向量数量,并计算词向量数量的平均值作为采样基线,对于大于等于采样基线的类别数据,采用动态聚类欠采样方式减少该类别数据的词向量,对于低于采样基线的类别数据,采用动态聚类过采样方式增加该类别数据的词向量,以实现数据平衡;利用数据平衡后的词向量对文本分类模型进行训练;利用训练后的文本分类模型进行绿色金融产业分类,该方法和装置通过对不平衡数据集均衡采样来提升绿色金融产业分类的准确性。
-
-
-
-
-
-
-
-
-