一种同行互评异常评分检测及修正方法和装置

    公开(公告)号:CN115713270B

    公开(公告)日:2023-07-21

    申请号:CN202211505028.1

    申请日:2022-11-28

    Abstract: 本发明公开了一种同行互评异常评分检测及修正方法和装置,该方法包括以下步骤:首先将收集到的评分数据转化为二维矩阵并进行数据预处理;其次利用单向异常检测法、一致性检验法及双向异常检测法对处理后的结构化数据进行异常判断,并将检测出的异常数据归入异常数据集中;然后利用信息熵修正法对异常数据集进行异常数据修复;最后结合异常数据集生成能力评价报告,并结合能力评价报告中评审人的评分权重对修正后的评分数据进行加权平均得到最终评分结果,并生成异常评分修正报告。本发明能够有效检测企业人员绩效考核中同行互评分数异常现象,并通过能力评估报告对评审人进行约束,保证同行互评结果的公平、公正及客观性。

    一种基于大模型的潜在绿色企业挖掘方法和装置

    公开(公告)号:CN119066185A

    公开(公告)日:2024-12-03

    申请号:CN202411574862.5

    申请日:2024-11-06

    Abstract: 本发明公开了一种基于大模型的潜在绿色企业挖掘方法和装置,包括:对大语言模型基座进行领域预训练以及进行绿色企业与绿色产业识别任务的微调;获取每个企业的经营范围、业务范围以及生态环境行政处罚相关文本信息,并与企业申请绿色信贷时填写的信贷业务相关文本信息进行文本处理;将经过处理的文本数据和问题输入微调后的大语言模型,输出是否为绿色企业以及绿色企业所属的绿色产业类别,同时由人工对输出结果进行二次确认得到确认结果,将确认结果作为标签对大语言模型进行训练;利用训练好的大语言模型进行绿色企业挖掘。本发明通过一整套智能的流程设计,极大削减了人力成本,简化了潜在绿色企业的挖掘流程,缩短潜在绿色企业的挖掘周期。

    一种绿色金融环境和社会风险的预警方法、装置及系统

    公开(公告)号:CN116523619A

    公开(公告)日:2023-08-01

    申请号:CN202310277065.X

    申请日:2023-03-21

    Abstract: 本发明公开了一种绿色金融环境和社会风险的预警方法,包括以下步骤:采集与企业相关的工商信息,司法信息以及周边新闻,组成原始环境数据;基于预警类型对原始环境数据进行分类,基于分类结果构建包括环境行政处罚企业,环境违法失信黑名单企业以及安全生产违法违规企业的预警数据库;创建中文自定义词典对所述预警数据库进行筛选,生成预警任务列表;根据企业整改情况对所述预警任务列表进行核对和分类,生成所有企业的环境社会风险预警结果。本发明还提供了一种预警装置和预警系统。本发明提供的方法提高绿色金融领域环境和社会风险管理的自动化程度,减少人工管理成本。

    一种基于聚类和对比学习的中文问句文本表示学习的方法

    公开(公告)号:CN115906835A

    公开(公告)日:2023-04-04

    申请号:CN202211480390.8

    申请日:2022-11-23

    Inventor: 王艺涵 李栓 许浩

    Abstract: 本发明公开一种基于聚类和对比学习的中文问句文本表示学习的方法,该方法先对中文问句语料进行清洗,然后进行聚类,将字面相似的样本划分在相同的子集中;按顺序选定子集并按批次抽取问句,将不同批次问句按顺序输入SimCLR对比学习框架中,并生成与每个问句对应的语义相似问句表示,之后使用对比损失函数拉近问句与语义相似问句之间的距离,并扩大该问句与同批次其他问句之间的距离,得到训练好的SimCLR对比学习模型;最后将新的中文问句语料也进行相同的清洗和聚类,并将聚类后的子集按批次输入训练好的SimCLR对比学习模型,得到分类后的中文问句语料,实现中文问句语料的自动打标。本发明有效提升了模型对问句文本之间差异的辨析性能。

    一种基于聚类和对比学习的中文问句文本表示学习的方法

    公开(公告)号:CN115906835B

    公开(公告)日:2024-02-20

    申请号:CN202211480390.8

    申请日:2022-11-23

    Inventor: 王艺涵 李栓 许浩

    Abstract: 本发明公开一种基于聚类和对比学习的中文问句文本表示学习的方法,该方法先对中文问句语料进行清洗,然后进行聚类,将字面相似的样本划分在相同的子集中;按顺序选定子集并按批次抽取问句,将不同批次问句按顺序输入SimCLR对比学习框架中,并生成与每个问句对应的语义相似问句表示,之后使用对比损失函数拉近问句与语义相似问句之间的距离,并扩大该问句与同批次其他问句之间的距离,得到训练好的SimCLR对比学习模型;最后将新的中文问句语料也进行相同的清洗和聚类,并将聚类后的子集按批次输入训练好的SimCLR对比学习模型,得到分类后的中文问句语料,实现中文问句语料的自动打标。本发明有效提升了模型对问句文本之间差异的辨析性能。

    基于动态聚类的面向不平衡数据集的绿色金融产业分类方法和装置

    公开(公告)号:CN116401362A

    公开(公告)日:2023-07-07

    申请号:CN202310110726.X

    申请日:2023-01-16

    Abstract: 本发明公开了一种基于动态聚类的面向不平衡数据集的绿色金融产业分类方法和装置,包括:清洗并将不平衡的绿色信贷数据转换为词向量;统计每类数据的词向量数量,并计算词向量数量的平均值作为采样基线,对于大于等于采样基线的类别数据,采用动态聚类欠采样方式减少该类别数据的词向量,对于低于采样基线的类别数据,采用动态聚类过采样方式增加该类别数据的词向量,以实现数据平衡;利用数据平衡后的词向量对文本分类模型进行训练;利用训练后的文本分类模型进行绿色金融产业分类,该方法和装置通过对不平衡数据集均衡采样来提升绿色金融产业分类的准确性。

Patent Agency Ranking