SQL脚本的结构化元数据生成方法及数据地图生成方法

    公开(公告)号:CN102339295A

    公开(公告)日:2012-02-01

    申请号:CN201010238389.5

    申请日:2010-07-23

    Abstract: 本发明公开了一种SQL脚本的结构化元数据生成方法以及数据地图生成方法,其中,该方法包括:根据SQL脚本数据流语义结构生成一组SQL脚本元模型;根据元模型对SQL脚本的数据处理逻辑进行结构化描述;根据数据处理逻辑的结构化描述,生成SQL脚本元数据。本发明可以将SQL脚本的数据转换处理逻辑进行结构化描述,在此基础上提供相应的辅助分析功能和分层数据地图图形展现,从而提供数据链路辅助分析和血统分析、数据地图展现和细节数据处理逻辑图形化展现,解决现有技术中SQL脚本所包含的数据流信息无法在元数据中体现出来,导致元数据的数据加工链路不连贯,无法进行有效的分析的缺陷。

    SQL脚本解析方法、装置及系统

    公开(公告)号:CN102375826B

    公开(公告)日:2014-12-31

    申请号:CN201010253875.4

    申请日:2010-08-13

    Abstract: 本发明公开了一种SQL脚本解析方法、装置及系统。其中SQL脚本解析方法,包括:A、按照运行日志中的SQL脚本执行顺序,从运行日志中提取SQL脚本;B、对每条SQL脚本依次进行词法、语法和语义进行分析,生成SQL脚本的语义结果集;C、根据所述语义结果集分析所述SQL脚本的上下文类型,生成所述运行日志中各个SQL脚本之间的上下文相关信息,根据所述语义结果集和所述上下文相关信息获得所述运行日志的数据流信息。本发明的SQL脚本解析方法、装置及系统,通过对SQL脚本进行词法、语法、语义以及上下文相关性分析,避免在生成SQL脚本的元数据时,数据流语义信息的丢失,从而提高获取SQL脚本的元数据的完整性和准确性,保证SQL脚本元数据的获取质量。

    SQL脚本解析方法、装置及系统

    公开(公告)号:CN102375826A

    公开(公告)日:2012-03-14

    申请号:CN201010253875.4

    申请日:2010-08-13

    Abstract: 本发明公开了一种SQL脚本解析方法、装置及系统。其中SQL脚本解析方法,包括:A、按照运行日志中的SQL脚本执行顺序,从运行日志中提取SQL脚本;B、对每条SQL脚本依次进行词法、语法和语义进行分析,生成SQL脚本的语义结果集;C、根据所述语义结果集分析所述SQL脚本的上下文类型,生成所述运行日志中各个SQL脚本之间的上下文相关信息,根据所述语义结果集和所述上下文相关信息获得所述运行日志的数据流信息。本发明的SQL脚本解析方法、装置及系统,通过对SQL脚本进行词法、语法、语义以及上下文相关性分析,避免在生成SQL脚本的元数据时,数据流语义信息的丢失,从而提高获取SQL脚本的元数据的完整性和准确性,保证SQL脚本元数据的获取质量。

    SQL脚本的结构化元数据生成方法及数据地图生成方法

    公开(公告)号:CN102339295B

    公开(公告)日:2014-01-29

    申请号:CN201010238389.5

    申请日:2010-07-23

    Abstract: 本发明公开了一种SQL脚本的结构化元数据生成方法以及数据地图生成方法,其中,该方法包括:根据SQL脚本数据流语义结构生成一组SQL脚本元模型;根据元模型对SQL脚本的数据处理逻辑进行结构化描述;根据数据处理逻辑的结构化描述,生成SQL脚本元数据。本发明可以将SQL脚本的数据转换处理逻辑进行结构化描述,在此基础上提供相应的辅助分析功能和分层数据地图图形展现,从而提供数据链路辅助分析和血统分析、数据地图展现和细节数据处理逻辑图形化展现,解决现有技术中SQL脚本所包含的数据流信息无法在元数据中体现出来,导致元数据的数据加工链路不连贯,无法进行有效的分析的缺陷。

    一种上网偏好用户群体的确定方法和设备

    公开(公告)号:CN104750752B

    公开(公告)日:2018-06-15

    申请号:CN201310752439.5

    申请日:2013-12-31

    Abstract: 本发明实施例公开了一种上网偏好用户群体的确定方法和设备,通过应用本发明实施例所提出的技术方案,在需要确定上网偏好用户群体时,根据上网偏好用户群体所对应的关键词确定相应的目标URL,并结合该目标URL所对应的倒排索引信息,确定对该目标URL的访问次数符合用户筛选条件的各用户标识所对应的用户组成该上网偏好用户群体,从而,充分利用倒排索引信息高性能、高灵活度的特征,实现上网偏好用户群体的快速获取,避免了大量数据记录和匹配所带来的系统资源的消耗,提高了上网偏好用户群体确定过程的处理效率和筛选准确度。

    一种上网偏好用户群体的确定方法和设备

    公开(公告)号:CN104750752A

    公开(公告)日:2015-07-01

    申请号:CN201310752439.5

    申请日:2013-12-31

    Abstract: 本发明实施例公开了一种上网偏好用户群体的确定方法和设备,通过应用本发明实施例所提出的技术方案,在需要确定上网偏好用户群体时,根据上网偏好用户群体所对应的关键词确定相应的目标URL,并结合该目标URL所对应的倒排索引信息,确定对该目标URL的访问次数符合用户筛选条件的各用户标识所对应的用户组成该上网偏好用户群体,从而,充分利用倒排索引信息高性能、高灵活度的特征,实现上网偏好用户群体的快速获取,避免了大量数据记录和匹配所带来的系统资源的消耗,提高了上网偏好用户群体确定过程的处理效率和筛选准确度。

    一种数据挖掘系统中数据聚类的方法、系统及装置

    公开(公告)号:CN102141988A

    公开(公告)日:2011-08-03

    申请号:CN201010102976.1

    申请日:2010-01-28

    Abstract: 本发明公开了一种数据挖掘系统中数据聚类的方法、系统及装置,主要包括:A、主控节点将分块数据对象分发给至少两个计算节点;B、以串行方式或并行方式控制每个计算节点计算利用保存的数据对象中的非中心点对象分别替换设定个中心点对象后对应的替换代价;C、获取每个计算节点的执行结果,并是否存在小于零的替换代价;若是,确定替换同一中心点对象的多个非中心点对象中最小替换代价的非中心点对象,替换中心点对象,并返回步骤B;若否,则将当前各中心点对象及对应簇确定为最终聚类结果。根据该技术方案,提高了计算效率,并且应用于海量数据的处理需求。

Patent Agency Ranking