-
公开(公告)号:CN118607511B
公开(公告)日:2024-11-26
申请号:CN202411081248.5
申请日:2024-08-08
Applicant: 之江实验室
IPC: G06F40/205 , G06N3/0442 , G06N3/0455 , G06N3/084
Abstract: 本发明公开了一种基于蒸馏提升BERT的财经新闻情感分析方法和装置,方法包括以下步骤:利用大语言模型构建情感感知摘要数据集;对BERT模型进行领域自适应预训练;构建包括预训练后的BERT模型、双向GRU网络和基于注意力机制的指针网络的情绪语句摘要任务模型,对情感语句摘要任务模型进行微调;利用大语言模型对预训练后的BERT模型进行知识蒸馏;利用微调后的情感语句摘要任务模型和知识蒸馏后的BERT模型进行情感类别分析。本发明能够将大语言模型的情感分析能力迁移到训练硬件需求更小、更易部署、计算效率更高的BERT模型上,提高财经新闻情感分析的效率和准确性,为用户提供更有价值的情感分析结果。
-
公开(公告)号:CN115713270B
公开(公告)日:2023-07-21
申请号:CN202211505028.1
申请日:2022-11-28
Applicant: 之江实验室
IPC: G06Q10/0639 , G06F16/22 , G06F16/2455 , G06F18/2433 , G06F18/2321 , G06F18/2135
Abstract: 本发明公开了一种同行互评异常评分检测及修正方法和装置,该方法包括以下步骤:首先将收集到的评分数据转化为二维矩阵并进行数据预处理;其次利用单向异常检测法、一致性检验法及双向异常检测法对处理后的结构化数据进行异常判断,并将检测出的异常数据归入异常数据集中;然后利用信息熵修正法对异常数据集进行异常数据修复;最后结合异常数据集生成能力评价报告,并结合能力评价报告中评审人的评分权重对修正后的评分数据进行加权平均得到最终评分结果,并生成异常评分修正报告。本发明能够有效检测企业人员绩效考核中同行互评分数异常现象,并通过能力评估报告对评审人进行约束,保证同行互评结果的公平、公正及客观性。
-
公开(公告)号:CN116308738A
公开(公告)日:2023-06-23
申请号:CN202310140918.5
申请日:2023-02-10
Applicant: 之江实验室
IPC: G06Q40/03 , G06Q10/0631
Abstract: 本说明书公开了一种模型训练的方法、业务风控的方法及装置。首先,确定预先构建的业务关系图。其次,获取各用户的目标属性数据以及各用户之间所产生的业务行为的目标业务信息。而后,将业务关系图、各用户的目标属性数据以及各用户之间所产生的业务行为的目标业务信息输入到待训练的风控模型中,预测各用户所属的用户群体以及各用户所属用户群体的风险标签。最后,以最小化各用户所属的用户群体与各用户所属的实际用户群体之间的偏差,以及最小化各用户所属用户群体的风险标签与各用户所属用户群体的实际风险标签之间的偏差为优化目标,对风控模型进行训练。本方法可以提高风控模型确定出的风控结果的准确性。
-
公开(公告)号:CN115049489A
公开(公告)日:2022-09-13
申请号:CN202210671194.2
申请日:2022-06-14
Applicant: 之江实验室 , 建信金融科技有限责任公司 , 浙江邦盛科技股份有限公司
Inventor: 陈杨 , 张洪彬 , 王艺涵 , 许浩 , 方宁 , 姚翌 , 叶振栋 , 洪世能 , 胡宗鹏 , 金雨青 , 王笑 , 刘敏 , 孙力骏 , 李晓晨 , 钟鑫 , 刘智 , 朱凌峰 , 柴方林
IPC: G06Q40/04
Abstract: 本发明公开了一种基于变量选择法的配对交易的交易对选择方法,该方法获取期货合约的日度平均成交价格;将价格转化为指数价格;运用套索回归、弹性网回归等变量选择法,处理期货的指数价格序列;以回归方程被解释变量和解释变量中回归系数不为零的期货作为交易对,以回归系数作为套利对冲系数;对解释变量指数价格,与被解释变量指数价格的系数乘积和,运用E‑G两步法进行协整性检验;对通过协整性检验的交易对,计算价差的方差,选取方差较大的交易对进行套利交易;根据价差的分布制定套利交易策略。本发明方法计算得到的多产品对及套利对冲系数更加稳健可靠,使得交易对的盈利能力大大提升。
-
公开(公告)号:CN115049472A
公开(公告)日:2022-09-13
申请号:CN202210519445.5
申请日:2022-05-12
Applicant: 之江实验室 , 建信金融科技有限责任公司 , 浙江邦盛科技股份有限公司
Abstract: 本发明公开了一种基于多维特征张量的无监督信用卡异常检测方法,首次将多维度多尺度特征张量特征构建、多维注意力卷积网络、重编码生成对抗网络进行有机结合,由多维注意力卷积网络产生优质的生成结果,并对多维度多尺度特征张量编码、解码、再编码。将异常交易样本的特点最大程度的表达出来,得到优质的重构表征;在重构特征上进行基于时间、空间、类别的3σ异常打分,并基于不同尺度进行异常投票,异常尺度占多数的为异常,避免噪声影响,增加鲁棒性;采用流式指标计算引擎协同工作,具有实时性和高准确率。本发明减少了特征工程对专家经验的依赖程度,在信用卡交易实时异常检测问题方面有较高的准确率。
-
公开(公告)号:CN112380572A
公开(公告)日:2021-02-19
申请号:CN202110051389.2
申请日:2021-01-14
Applicant: 之江实验室
Abstract: 本发明公开了一种多方数据协同场景下的隐私保护量化评估方法和系统,该方法为数据资源提供方根据算法和保护机制,将所述数据资源输入模型中进行训练,输出满足模型指标和阈值的模型,同时,数据资源提供方利用攻击手段,攻击上述模型,记录并量化模型的隐私泄露情况,输出隐私指标;数据资源使用方和数据资源提供方分别根据模型指标和隐私指标是否满足自身需要,做出是否进行数据合作的决策。本发明提升了在数据共享过程中对隐私风险和数据价值的有效评估和信息披露,有效解决数据资源提供方和数据使用需求方之间的信息不对称问题,有助于构建更加健康和可持续发展的数据共享、交互和交易体系。
-
公开(公告)号:CN113722495B
公开(公告)日:2025-03-14
申请号:CN202111240263.6
申请日:2021-10-25
Applicant: 之江实验室
IPC: G06N5/025 , G06N3/0455 , G06N3/0442 , G06N3/047 , G06N3/0985 , G06F16/353 , G06F16/903 , G06F18/2415
Abstract: 本发明公开了一种融合正则表达式的金融文本关系抽取与分类方法。该方法对金融文本编码后识别出文本中包含的关系实体对并进行标记;将金融文本依次和各项正则表达式进行匹配,将匹配结果转换为正则表达式标签,最后将该标签与标记结果融合,通过深度神经网络对实体对之间包含的关系进行抽取与分类。本发明实现了融合了正则表达式信息的金融文本端到端关系抽取与分类,逻辑结构清晰,层次分明,无需人工标注,节约了人力成本,提升了工作效率,准确率高,实用性强。
-
-
公开(公告)号:CN115906835B
公开(公告)日:2024-02-20
申请号:CN202211480390.8
申请日:2022-11-23
Applicant: 之江实验室
IPC: G06F40/289 , G06F40/30 , G06F40/216 , G06F18/23 , G06F18/22
Abstract: 本发明公开一种基于聚类和对比学习的中文问句文本表示学习的方法,该方法先对中文问句语料进行清洗,然后进行聚类,将字面相似的样本划分在相同的子集中;按顺序选定子集并按批次抽取问句,将不同批次问句按顺序输入SimCLR对比学习框架中,并生成与每个问句对应的语义相似问句表示,之后使用对比损失函数拉近问句与语义相似问句之间的距离,并扩大该问句与同批次其他问句之间的距离,得到训练好的SimCLR对比学习模型;最后将新的中文问句语料也进行相同的清洗和聚类,并将聚类后的子集按批次输入训练好的SimCLR对比学习模型,得到分类后的中文问句语料,实现中文问句语料的自动打标。本发明有效提升了模型对问句文本之间差异的辨析性能。
-
公开(公告)号:CN113722495A
公开(公告)日:2021-11-30
申请号:CN202111240263.6
申请日:2021-10-25
Applicant: 之江实验室
IPC: G06F16/35 , G06F16/903 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种融合正则表达式的金融文本关系抽取与分类方法。该方法对金融文本编码后识别出文本中包含的关系实体对并进行标记;将金融文本依次和各项正则表达式进行匹配,将匹配结果转换为正则表达式标签,最后将该标签与标记结果融合,通过深度神经网络对实体对之间包含的关系进行抽取与分类。本发明实现了融合了正则表达式信息的金融文本端到端关系抽取与分类,逻辑结构清晰,层次分明,无需人工标注,节约了人力成本,提升了工作效率,准确率高,实用性强。
-
-
-
-
-
-
-
-
-