-
公开(公告)号:CN114880330A
公开(公告)日:2022-08-09
申请号:CN202210592829.X
申请日:2022-05-27
IPC分类号: G06F16/22 , G06F16/28 , G06F40/18 , G06F40/186 , G06F40/295
摘要: 本发明公开了一种单源多期指标体系模块化构建及实体自动识别处理方法,包括:将电子表格数据规整为标准化格式,分别提取主实体M(M)和附属实体S(M)的题录项以及数值项等信息;依据样表文档等信息,形成标准指标体系结构EIS;提取主实体M(M)、附属实体S(M)、标准指标体系结构EIS、源库表等的应用场景信息;形成颗粒化、标准化的数据。本发明应用于大数据处理技术领域中,提出了将数据中的各种实体按照彼此间的依存关系,划分主实体和附属实体;解决了数据隐性关系的提取、运算、溯源等问题,为进行多源、大规模数据关联计算提供了可行性的解决方案。
-
公开(公告)号:CN114860734A
公开(公告)日:2022-08-05
申请号:CN202210592804.X
申请日:2022-05-27
摘要: 本发明公开了一种多源指标结构融合及场景还原的数据呈现的处理方法,首先构建用户交互界面,并根据用户的个性化选择项,呈现原数据结构、资源分类、指标体系结构、数据及溯源信息,同时实时展示选定信息项的应用场景。本发明通过原始数据结构与资源目录呈现、指标体系结构融合构建、数据自动提取、应用场景追溯还原等技术方法,系统性解决了数据多形式展示,指标融合呈现、场景追溯还原等问题,能做到指标体系融合呈现、实体应用场景还原、数据分类呈现以及自动抽取,为大规模多源数据抽取、数据关系精准表达提供了可行性的应用方案。
-
公开(公告)号:CN114780654A
公开(公告)日:2022-07-22
申请号:CN202210592832.1
申请日:2022-05-27
摘要: 本发明公开了一种多源主附实体结构模块化构建的处理方法,利用主实体形成主实体静态库指标结构;通过自动触发机制,构建实体动态库;依据异源附属实体,自动补充完善实体动态库,促进实体动态库自成长;记录实体的应用场景等信息。本发明通过主实体静态库自动化识别构建、实体动态库自动识别构建、附属实体自动判别、实体动态库指标体系自动完善与应用场景记录等技术方法,能够区分相对不变的数据和经常变动的数据,做到多源数据的静态库和动态库分层存储,记录了数据归集的过程和应用场景,实现了多源数据的主附实体结构模块化构建,以及数据的关联存储与自增长;为数据溯源、数据关联分析提供了可行性的数据存储解决方案。
-
公开(公告)号:CN112486989B
公开(公告)日:2021-08-27
申请号:CN202011361683.5
申请日:2020-11-28
IPC分类号: G06F16/22 , G06F16/28 , G06F16/215
摘要: 本发明公开了一种多源数据颗粒化融合及指标分类分层处理方法,通过将表格中大量多样冗余的指标进行分类,并建立存储库,再通过将多种形式的表格统一为标准表格、识别标题区域和数值区域、分别提取数值的相关属性信息,从而形成颗粒化、标准化的数据;然后通过构建指标索引结构,依据用户的个性化选择,以电子表格形式呈现数值项、以及与数值相对应的指标及层级、指标分类描述及层级、指标与指标分类描述的应用场景和其它隐含属性,实现对二维表格数据的准确表达。本发明能够将多源数据进行归一化处理、存储,从而使指标名称唯一性、层级关系多源性、指标分类描述多源性以及应用场景多源性,为多源数据的灵活、多样、快速呈现提供了基础。
-
公开(公告)号:CN114969041B
公开(公告)日:2023-06-30
申请号:CN202210592302.7
申请日:2022-05-27
摘要: 本发明公开了一种多源主附实体同一性甄别及数据自补的处理方法,应用于大数据处理领域中,提出按主附实体剥离多源数据实体,按照同场景、实体属性分类和权值等进行同一实体甄别,并针对甄别概率进行分别处理和存储。本发明通过主实体与附属实体同一性概率计算、同一实体的指标补充与数据合并、实体名录项提取与存储、实体子名录项分离等技术方法,系统性解决了主附实体按同一性概率分别处理与归集、跨源实体合并与数据补充、实体关系统一存储、实体按需分离等问题,为进行多源、大规模数据关联运算提供了可行性的解决方案。
-
公开(公告)号:CN112487107B
公开(公告)日:2021-11-23
申请号:CN202011365236.7
申请日:2020-11-28
摘要: 本发明公开了一种在电子表格中呈现数据指标层级与分类的处理方法,通过构建指标索引结构S,依据用户的个性化选择,以电子表格形式呈现指标及层级、指标分类描述及层级、指标与指标分类描述的应用场景以及其它隐含属性,从而使指标表述更简洁、可读性更强,能够实现对二维表格数据的准确表达,呈现的表格更易于理解;并基于此,还能够对指标和指标分类描述灵活多样组合展示,使呈现的结果更加多样化、灵活化、个性化。
-
公开(公告)号:CN112487107A
公开(公告)日:2021-03-12
申请号:CN202011365236.7
申请日:2020-11-28
摘要: 本发明公开了一种在电子表格中呈现数据指标层级与分类的处理方法,通过构建指标索引结构S,依据用户的个性化选择,以电子表格形式呈现指标及层级、指标分类描述及层级、指标与指标分类描述的应用场景以及其它隐含属性,从而使指标表述更简洁、可读性更强,能够实现对二维表格数据的准确表达,呈现的表格更易于理解;并基于此,还能够对指标和指标分类描述灵活多样组合展示,使呈现的结果更加多样化、灵活化、个性化。
-
公开(公告)号:CN112486989A
公开(公告)日:2021-03-12
申请号:CN202011361683.5
申请日:2020-11-28
IPC分类号: G06F16/22 , G06F16/28 , G06F16/215
摘要: 本发明公开了一种多源数据颗粒化融合及指标分类分层处理方法,通过将表格中大量多样冗余的指标进行分类,并建立存储库,再通过将多种形式的表格统一为标准表格、识别标题区域和数值区域、分别提取数值的相关属性信息,从而形成颗粒化、标准化的数据;然后通过构建指标索引结构,依据用户的个性化选择,以电子表格形式呈现数值项、以及与数值相对应的指标及层级、指标分类描述及层级、指标与指标分类描述的应用场景和其它隐含属性,实现对二维表格数据的准确表达。本发明能够将多源数据进行归一化处理、存储,从而使指标名称唯一性、层级关系多源性、指标分类描述多源性以及应用场景多源性,为多源数据的灵活、多样、快速呈现提供了基础。
-
公开(公告)号:CN112328589A
公开(公告)日:2021-02-05
申请号:CN202011365226.3
申请日:2020-11-28
IPC分类号: G06F16/215 , G06F16/28 , G06F40/18
摘要: 本发明公开了一种电子表格数据颗粒化及指标标准化处理方法,包括以下步骤:利用电子表格格式规整器将表格统一为标准表格待处理文档PD;利用区域自动识别器读取待处理文档PD,形成表格矩阵M,并识别指标区域和数值区域;利用指标结构解析器,递归遍历指标区域,识别并提取指标单元存入I库;识别并提取指标分类描述单元存入C库;识别并标引指标单元和指标分类描述单元之间的应用场景存入R库;利用数值项自动提取器,通过遍历数值区域提取数值项,同时将其对应的横纵坐标、指标单元键值、指标分类描述单元键值存入D库。本发明一次性解决了二维电子表格数据的颗粒化、标准化、隐性属性显性化等问题,为进行多源、大规模数据运算提供了基础。
-
公开(公告)号:CN114860734B
公开(公告)日:2022-11-15
申请号:CN202210592804.X
申请日:2022-05-27
摘要: 本发明公开了一种多源指标结构融合及场景还原的数据呈现的处理方法,首先构建用户交互界面,并根据用户的个性化选择项,呈现原数据结构、资源分类、指标体系结构、数据及溯源信息,同时实时展示选定信息项的应用场景。本发明通过原始数据结构与资源目录呈现、指标体系结构融合构建、数据自动提取、应用场景追溯还原等技术方法,系统性解决了数据多形式展示,指标融合呈现、场景追溯还原等问题,能做到指标体系融合呈现、实体应用场景还原、数据分类呈现以及自动抽取,为大规模多源数据抽取、数据关系精准表达提供了可行性的应用方案。
-
-
-
-
-
-
-
-
-