-
公开(公告)号:CN112486989B
公开(公告)日:2021-08-27
申请号:CN202011361683.5
申请日:2020-11-28
IPC分类号: G06F16/22 , G06F16/28 , G06F16/215
摘要: 本发明公开了一种多源数据颗粒化融合及指标分类分层处理方法,通过将表格中大量多样冗余的指标进行分类,并建立存储库,再通过将多种形式的表格统一为标准表格、识别标题区域和数值区域、分别提取数值的相关属性信息,从而形成颗粒化、标准化的数据;然后通过构建指标索引结构,依据用户的个性化选择,以电子表格形式呈现数值项、以及与数值相对应的指标及层级、指标分类描述及层级、指标与指标分类描述的应用场景和其它隐含属性,实现对二维表格数据的准确表达。本发明能够将多源数据进行归一化处理、存储,从而使指标名称唯一性、层级关系多源性、指标分类描述多源性以及应用场景多源性,为多源数据的灵活、多样、快速呈现提供了基础。
-
公开(公告)号:CN112328589B
公开(公告)日:2021-08-17
申请号:CN202011365226.3
申请日:2020-11-28
IPC分类号: G06F16/215 , G06F16/28 , G06F40/18
摘要: 本发明公开了一种电子表格数据颗粒化及指标标准化处理方法,包括以下步骤:利用电子表格格式规整器将表格统一为标准表格待处理文档PD;利用区域自动识别器读取待处理文档PD,形成表格矩阵M,并识别指标区域和数值区域;利用指标结构解析器,递归遍历指标区域,识别并提取指标单元存入I库;识别并提取指标分类描述单元存入C库;识别并标引指标单元和指标分类描述单元之间的应用场景存入R库;利用数值项自动提取器,通过遍历数值区域提取数值项,同时将其对应的横纵坐标、指标单元键值、指标分类描述单元键值存入D库。本发明一次性解决了二维电子表格数据的颗粒化、标准化、隐性属性显性化等问题,为进行多源、大规模数据运算提供了基础。
-
公开(公告)号:CN112487107B
公开(公告)日:2021-11-23
申请号:CN202011365236.7
申请日:2020-11-28
摘要: 本发明公开了一种在电子表格中呈现数据指标层级与分类的处理方法,通过构建指标索引结构S,依据用户的个性化选择,以电子表格形式呈现指标及层级、指标分类描述及层级、指标与指标分类描述的应用场景以及其它隐含属性,从而使指标表述更简洁、可读性更强,能够实现对二维表格数据的准确表达,呈现的表格更易于理解;并基于此,还能够对指标和指标分类描述灵活多样组合展示,使呈现的结果更加多样化、灵活化、个性化。
-
公开(公告)号:CN112487107A
公开(公告)日:2021-03-12
申请号:CN202011365236.7
申请日:2020-11-28
摘要: 本发明公开了一种在电子表格中呈现数据指标层级与分类的处理方法,通过构建指标索引结构S,依据用户的个性化选择,以电子表格形式呈现指标及层级、指标分类描述及层级、指标与指标分类描述的应用场景以及其它隐含属性,从而使指标表述更简洁、可读性更强,能够实现对二维表格数据的准确表达,呈现的表格更易于理解;并基于此,还能够对指标和指标分类描述灵活多样组合展示,使呈现的结果更加多样化、灵活化、个性化。
-
公开(公告)号:CN112486989A
公开(公告)日:2021-03-12
申请号:CN202011361683.5
申请日:2020-11-28
IPC分类号: G06F16/22 , G06F16/28 , G06F16/215
摘要: 本发明公开了一种多源数据颗粒化融合及指标分类分层处理方法,通过将表格中大量多样冗余的指标进行分类,并建立存储库,再通过将多种形式的表格统一为标准表格、识别标题区域和数值区域、分别提取数值的相关属性信息,从而形成颗粒化、标准化的数据;然后通过构建指标索引结构,依据用户的个性化选择,以电子表格形式呈现数值项、以及与数值相对应的指标及层级、指标分类描述及层级、指标与指标分类描述的应用场景和其它隐含属性,实现对二维表格数据的准确表达。本发明能够将多源数据进行归一化处理、存储,从而使指标名称唯一性、层级关系多源性、指标分类描述多源性以及应用场景多源性,为多源数据的灵活、多样、快速呈现提供了基础。
-
公开(公告)号:CN112328589A
公开(公告)日:2021-02-05
申请号:CN202011365226.3
申请日:2020-11-28
IPC分类号: G06F16/215 , G06F16/28 , G06F40/18
摘要: 本发明公开了一种电子表格数据颗粒化及指标标准化处理方法,包括以下步骤:利用电子表格格式规整器将表格统一为标准表格待处理文档PD;利用区域自动识别器读取待处理文档PD,形成表格矩阵M,并识别指标区域和数值区域;利用指标结构解析器,递归遍历指标区域,识别并提取指标单元存入I库;识别并提取指标分类描述单元存入C库;识别并标引指标单元和指标分类描述单元之间的应用场景存入R库;利用数值项自动提取器,通过遍历数值区域提取数值项,同时将其对应的横纵坐标、指标单元键值、指标分类描述单元键值存入D库。本发明一次性解决了二维电子表格数据的颗粒化、标准化、隐性属性显性化等问题,为进行多源、大规模数据运算提供了基础。
-
-
-
-
-