一种基于元数据自动建立表方法及系统

    公开(公告)号:CN105653732A

    公开(公告)日:2016-06-08

    申请号:CN201610074780.3

    申请日:2016-02-02

    发明人: 易君 鄢坤 黄俊

    IPC分类号: G06F17/30

    CPC分类号: G06F16/9017

    摘要: 本发明公开了一种基于元数据自动建立表方法及系统,方法包括:从网站中提取得到信息数据;根据所述信息数据建立定义的业务表结构,并按照业务表结构得到业务表;根据所述的业务表生成元数据信息;将所述元数据信息生成结构模型,根据所述结构模型对所述信息数据进行整理得到业务分类;按照所述业务分类进行元数据标识,得到所述元数据标识后储存至数据库。系统包括:获取装置,处理装置,分类装置,储存装置。采用本发明的方法能够对非结构化和结构化的数据表模型进行统一创建、修改、维护管理,从数据库读取元信息存储到数据库并且从元信息自动建表生成物理表结构,从而降底由于结构和元信息不一致的情况。

    一种基于金融资讯的数据分类处理方法

    公开(公告)号:CN105786961A

    公开(公告)日:2016-07-20

    申请号:CN201610029411.2

    申请日:2016-01-15

    发明人: 黄俊 鄢坤 易君

    IPC分类号: G06F17/30 G06Q40/00

    CPC分类号: G06F16/35 G06Q40/00

    摘要: 本发明公开了一种基于金融资讯的数据分类处理方法,包括:抓取得到金融资讯中的正文,并对正文进行解析得到分词;根据解析结果获取分词的出现频率,并按照设定的频率获取出现频率高的分词,将所述出现频率高的分词作为关键词进行检索,得到的检索结果按照分类编码进行匹配,使关键词按照分类编码对应分类。本发明通过对正文进行解析得到分词,实现各维度分类词频管理。其次,由于将所述出现频率高的分词作为关键词进行检索,得到的检索结果按照分类编码进行匹配,使得分词与支撑数据的关联关系建立,从而达到较好的资讯精准应用。采用本发明的基于金融资讯的数据分类处理方法可实现自动关联、自动入库及相关处理,提高了对金融资讯的处理效率。

    一种整合重复记录的方法及系统

    公开(公告)号:CN105956070A

    公开(公告)日:2016-09-21

    申请号:CN201610277820.4

    申请日:2016-04-28

    发明人: 鄢坤 易君 黄俊

    IPC分类号: G06F17/30

    CPC分类号: G06F16/3344 G06F16/3335

    摘要: 本发明提供了一种整合重复记录的方法及系统,所述方法包括以下步骤:S1:抓取目标网络的网页内容,并将从所述网页内容中提取的标题和正文存储于数据库中,同时将当前提取的标题和正文作为当前的目标标题和目标正文;S2:基于所述数据库中的数据对所述目标标题进行重复度查询,根据该查询结果选择执行步骤S3;S3:基于所述数据库对所述目标正文进行重复度查询,并基于该查询结果选择整合所述网页内容在所述数据库中的存储。本发明能够快速实现对抓取信息进行查重,并可以消除重复记录。