一种面向协议数据流的数据抽取方法

    公开(公告)号:CN104778258A

    公开(公告)日:2015-07-15

    申请号:CN201510187447.9

    申请日:2015-04-21

    发明人: 王非 潘鑫侨

    IPC分类号: G06F17/30

    摘要: 本发明公开了一种面向协议数据流的数据抽取方法,属于数据仓库领域。本发明根据工业领域中数据帧的结构特点,给出了一种通用的面向协议数据流的数据抽取机制,具体包括三个步骤:(1)提取描述性信息,获取抽取数据项所需要的解析参数;(2)利用解析参数,确定数据帧中数据域的模式信息,主要包括数据域的结构、格式和类型;(3)根据解析参数和数据域的模式信息,实现对数据项的抽取,并转换成结构化的数据保存。本发明可以对各种类型的协议数据帧的数据实现有效而准确地抽取,更能保证数据抽取的扩展性、通用性以及灵活性,即在通信协议改变的情况下本发明也能适用。

    一种面向协议数据流的数据抽取方法

    公开(公告)号:CN104778258B

    公开(公告)日:2018-04-24

    申请号:CN201510187447.9

    申请日:2015-04-21

    发明人: 王非 潘鑫侨

    IPC分类号: G06F17/30

    摘要: 本发明公开了一种面向协议数据流的数据抽取方法,属于数据仓库领域。本发明根据工业领域中数据帧的结构特点,给出了一种通用的面向协议数据流的数据抽取机制,具体包括三个步骤:(1)提取描述性信息,获取抽取数据项所需要的解析参数;(2)利用解析参数,确定数据帧中数据域的模式信息,主要包括数据域的结构、格式和类型;(3)根据解析参数和数据域的模式信息,实现对数据项的抽取,并转换成结构化的数据保存。本发明可以对各种类型的协议数据帧的数据实现有效而准确地抽取,更能保证数据抽取的扩展性、通用性以及灵活性,即在通信协议改变的情况下本发明也能适用。