基于互信息的用于文档分类的并行特征选择方法

    公开(公告)号:CN105183813A

    公开(公告)日:2015-12-23

    申请号:CN201510532920.2

    申请日:2015-08-26

    IPC分类号: G06F17/30 G06K9/62

    摘要: 本发明的基于互信息的用于文档分类的并行特征选择方法,包括a).选取样本并分类;b).求解词的TF-IDF值;c).生成初始化数据集合D={x1,x2,…,xN};d).分布式计算,将所有子数据集平均分布到m个计算节点上;e).建立集合,S=Φ,V={X1,X2,…,XM};f).计算联合、条件概率分布;g).计算互信息;h).选取特征变量;i).判断数量是否已够;j).文本分类。本发明的文档分类的并行特征选择方法,基于瑞利熵的互信息被用来度量特征变量与类变量之间的相关性,使得最终选取的特征变量更能代表文档分类的特征,分类效果更准确,分类结果要好于目前常用特征选择方法得到的结果,有益效果显著,适于推广应用。

    一种基于区块链的可信交易和服务信誉评价方法

    公开(公告)号:CN113240427A

    公开(公告)日:2021-08-10

    申请号:CN202110540666.6

    申请日:2021-05-18

    IPC分类号: G06Q20/40 G06F21/44 G06F16/27

    摘要: 本发明公开了一种基于区块链的可信交易和服务信誉评价方法,首先通过认证系统进行实名认证。然后通过数据发布系统对交易信息进行发布。在发布交易信息中,需要对交易信息进行二次认证。双方达成初步意愿后,通过信息采集平台对进行二次认证,并通过担保平台和支付平台进行支付。在交易过程中,交易流程模块构建流程状态图,实施追踪交易进展情况。完成交易后,通过综合反馈模块对发布信息人和需求信息人进行二次评价分数统计。与现有技术相比本发明的有益效果是:通过多级评价方案对相关信息进行综合评分,以保证信息的可靠性和真实性,在费用支付上采用多级担保的方式,提高双方交易的可信赖度,促进交易的成功转换。

    一种基于大数据的科技服务智能匹配、推荐的方法

    公开(公告)号:CN113221001A

    公开(公告)日:2021-08-06

    申请号:CN202110541178.7

    申请日:2021-05-18

    摘要: 本发明公开了一种基于大数据的科技服务智能匹配、推荐的方法,其特征在于,包括如下步骤:企业通过服务平台进行实名认证和资质上传,并对企业的经营内容进行关键词的整理和分类,形成若干个领域模块的企业名录;企业通过搜索引擎模块进行检索;同时数据采集模块自动采集搜索引擎模块中录入的关键信息并进行存储;检索后的相关信息通过公示模块进行展示;数据采集模块通过整理检索信息关键词的频率和企业经营内容,通过推荐匹配模块单独在搜索引擎模块的一侧进行显示。与现有技术相比本发明的有益效果是:特点是使用操作简单,推荐准确性高,安全可靠。

    一种基于业务审核及检索的数据标签管理方法

    公开(公告)号:CN113704229A

    公开(公告)日:2021-11-26

    申请号:CN202111026786.0

    申请日:2021-09-02

    IPC分类号: G06F16/21 G06F16/2455

    摘要: 本发明涉及计算机信息技术领域,具体地涉及一种基于业务审核及检索的数据标签管理方法,包括待审核业务数据收集,所述业务数据包括业务参数及审核业务参数的审核规则;根据业务参数确定业务数据对应的业务节点;开展标签需求数据源的收集和分析;对数据源进行整合生成标签;构建数据标签库以供业务审核及检索应用,根据数据源情况,构建所需标签数据库;根据标签数据库创建标签规则和检索规则,所述标签规则包括标签管理信息规则和标签值信息管理规则。本发明对数据标签进行有效管理,构建标签数据库,便于业务应用,为业务审核和检索提供了支撑,实现了高效的数据标签管理。

    一种基于扩展熵的无监督特征的选择方法及系统

    公开(公告)号:CN107368587A

    公开(公告)日:2017-11-21

    申请号:CN201710606624.1

    申请日:2017-07-24

    IPC分类号: G06F17/30 G06N3/08

    摘要: 本发明公开一种基于扩展熵的无监督特征的选择方法及系统,所述选择方法包括根据原始备选特征集中的任意备选特征变量与剩余备选特征变量之间的相关度选择第一个特征变量添加到已选特征集中,从原始备选特征集中剔除第一个特征变量;根据当前备选特征集中的任意备选特征变量与剩余备选特征变量之间的相关度,与已选特征集之间的冗余信息程度,确定当前特征变量以及相关度变化参数;将当前备选特征变量添加到已选特征集中;判断相关度变化参数是否小于设定阈值,如果是则选择结束;否则,将从当前备选特征集中剔除当前特征变量,继续选择下一个特征变量。本发明可处理连续的特征变量,以提高选择的特征变量组合的信息量。