不均衡数据集的文本分类方法、文本分类器及存储介质

    公开(公告)号:CN108628971A

    公开(公告)日:2018-10-09

    申请号:CN201810378347.8

    申请日:2018-04-24

    发明人: 刘志煌 吴三平

    IPC分类号: G06F17/30 G06K9/62

    摘要: 本发明公开了一种不均衡数据集的文本分类方法、文本分类器及存储介质,所述方法包括:获取用于训练分类模型的数据集;根据文本数据标注的类别信息,确定每一文本数据为多数类样本或少数类样本;计算多数类样本数量和少数类样本数量之间的比值,得到不均衡倍率;对文本数据进行预处理,得到对应的样本点以映射成向量空间;基于预设插值策略、不均衡倍率以及各个样本点,得到插值样本后,更新数据集;以更新的数据集为训练样本集,训练分类模型;获取待测文本数据,并将待测文本数据导入至训练完成的分类模型中进行分类,以得出待测文本数据属于何种类别,作为分类结果。本发明不仅能够扩大少数类样本及其边界区域,还有效提高模型的分类效果。

    报表邮件的推送方法、装置、终端以及存储介质

    公开(公告)号:CN116319651B

    公开(公告)日:2024-09-03

    申请号:CN202310144923.3

    申请日:2023-02-06

    IPC分类号: H04L51/42 H04L51/214

    摘要: 本发明公开了一种报表邮件的推送方法、装置、终端以及存储介质,所述报表邮件的推送方法包括以下步骤:在预设的邮件配置列表中筛选出待发送的报表邮件信息,并确认所述报表邮件信息指向的报表数据的就绪状态是否为已就绪完成状态,其中,所述报表邮件信息指向的报表数据为一个或者多个;若确认所述就绪状态为已就绪完成状态,则将所述报表数据刷新至预设的报表框架以获取最新的报表,并下载所述最新的报表;根据所述最新的报表制作待发送的报表邮件,并在所述报表邮件制作完成时实时发送所述报表邮件。从而,本发明能够实现推送报表邮件时不再受到固定发送时间点的限制,从而,提升发送报表邮件的灵活性。

    风险识别方法、装置、设备及存储介质

    公开(公告)号:CN113706040B

    公开(公告)日:2024-05-28

    申请号:CN202111021915.7

    申请日:2021-09-01

    摘要: 本申请公开了一种风险识别方法、装置、设备及存储介质,所述风险识别方法包括:统计待预测用户在预期观察时间内使用各所述交互对手方对应的使用时长,以计算各所述交互对手方对应的相对使用指标,基于各所述交互对手方对应的相对使用指标,通过目标向量模型对各所述交互对手方进行向量化处理,获得各所述交互对手方对应的交互数据向量,其中,所述目标向量模型是基于预设统计各所述交互对手方对应的训练使用时长和训练相对使用指标进行迭代训练优化得到的,基于各所述交互对手方对应的交互数据向量,通过预设风险预测模型对所述待预测用户进行风险预测,获得风险识别结果。本申请解决了模型风险预测的准确性低的技术问题。

    策略确定方法、设备及计算机可读存储介质

    公开(公告)号:CN112669084B

    公开(公告)日:2024-05-14

    申请号:CN202011645153.3

    申请日:2020-12-31

    IPC分类号: G06Q30/0201 G06N20/00

    摘要: 本发明涉及金融科技(Fintech)技术领域。本发明公开了一种策略确定方法、设备及计算机可读存储介质,本发明通过先构建目标客户群的营销响应预测模型来对存在一种或是多种营销方式的场景下的客户行为进行预测,从而考虑到每个用户差异化的营销偏好;通过在营销响应预测结果的基础上构建决策矩阵,再利用决策矩阵建立运筹学模型,使得所建立的运筹学模型能够适用于同时存在多种营销方式的应用场景;最后通过运筹学模型得到目标客户群在一种或多种不同营销方式下的最优营销发放策略,尤其是在同时存在多种营销方式场景下,能够通过数学手段快速给出目标客户群的具有针对性的最优营销手段,可进一步提升获客率或者降低营销成本。

    信用评分卡模型训练方法、装置、系统及计算机存储介质

    公开(公告)号:CN112862593B

    公开(公告)日:2024-05-03

    申请号:CN202110122286.0

    申请日:2021-01-28

    IPC分类号: G06Q40/03

    摘要: 本发明公开了一种信用评分卡模型训练方法、装置、系统及计算机存储介质,方法包括:确定目标客户,获取目标客户在预设时点范围内的第一切片数据,其中,预设时点范围包含多个历史时点;对第一切片数据进行预处理,得到目标客户的征信数据;对征信数据进行衍生处理,得到征信数据对应的衍生变量;将衍生变量输入待训练的信用评分卡模型进行训练,以更新信用评分卡模型。本发明通过获取包含多个历史时点信息的切片数据来对信用评分卡模型进行训练,以提高信用评分卡模型对客户进行信用评分时的准确率。

    信贷风险建模方法、装置、设备及计算机可读存储介质

    公开(公告)号:CN112785418B

    公开(公告)日:2024-02-06

    申请号:CN202110091086.3

    申请日:2021-01-22

    IPC分类号: G06Q40/03

    摘要: 本发明公开了一种信贷风险建模方法、装置、设备及计算机可读存储介质,所述方法包括:接收用户设置信息,其中,所述用户设置信息包括建模特征属性、拟合目标、模型评估指标、各建模类型和各所述建模类型对应的参数组合范围;分别按照各所述建模类型和自身对应的所述参数组合范围对客户信贷数据集进行拟合,得到各待选信贷风险评估模型,其中,所述客户信贷数据集为与所述建模特征属性和所述拟合目标对应的数据集;计算并输出各所述待选信贷风险评估模型与所述模型评估指标对应的指标值。本发明实现了用户能够根据指标值从繁多的建模方法中快速选择符合要求的建模方法,从而在建模过程中减少了用户的手动操作,提高了客户信贷风险建模的效率。

    信用评分卡模型构建方法、装置、设备及可读存储介质

    公开(公告)号:CN112734568B

    公开(公告)日:2024-01-12

    申请号:CN202110139379.4

    申请日:2021-01-29

    IPC分类号: G06Q40/03 G06N20/00

    摘要: 本发明公开了一种信用评分卡模型构建方法、装置、设备及可读存储介质,该方法包括:基于借款人的信用行为数据,确定训练样本和验证样本;将训练样本输入至机器学习模型,并基于参数组合对机器学习模型进行训练,得到第一评价指标;将验证样本输入至训练完成的机器学习模型,确定第二评价指标;基于第一评价指标和第二评价指标,确定参数组合中的最佳参数组合,以基于最佳参数组合确定机器学习模型对应的信用评分卡模型。本发明通过指标评价体系自动对模型评价指标进行评价,避免了人工筛选模型评价指标,解决了人工筛选模型评价指标的方

    数据动态存储方法、装置、电子设备及存储介质

    公开(公告)号:CN116126245A

    公开(公告)日:2023-05-16

    申请号:CN202310090910.2

    申请日:2023-01-30

    IPC分类号: G06F3/06

    摘要: 本申请公开了一种数据动态存储方法、装置、电子设备及存储介质,所述的数据动态存储方法包括以下步骤:获取待评分数据表的操作信息,其中,所述待评分数据表存储于归档节点或计算节点;根据所述操作信息对所述待评分数据表进行使用率评分,得到使用率评分结果;根据所述使用率评分结果对所述待评分数据表的存储位置进行调整。本申请解决了常规技术难以平衡大数据管理的成本和效率的技术问题。