-
公开(公告)号:CN116776854B
公开(公告)日:2023-11-03
申请号:CN202311079930.6
申请日:2023-08-25
申请人: 湖南汇智兴创科技有限公司
IPC分类号: G06F40/197 , G06F40/126 , G06F40/14 , G06F40/194 , G06F16/35 , G06F16/901 , G06F16/906 , G06F18/22 , G06F18/2321
摘要: 本申请涉及一种在线多版本文献内容关联方法、装置、设备和介质。所述方法包括:将多版本文献的版式格式模型中的版式格式结构转换为树结构,对待关联的文档集合中所有版本的树结构进行相似性计算并聚类,利用k中心聚类方法求出类簇的中心点并计算距离中心点距离最小的版式结构作为初始本体版式,对初始本体版式集合进行差异比较和相似性度量,对得到的本体版式进行编码,直至编码到最细粒度,根据本体版式中各个元素和编码后的本体版式的各个元素建立数据库,将待关联的文档转换为树结构后与本体版式进行相似性计算,根据计算结果和预先设置的阈值则进行关联。采用本方法能够解决同一文献多个文档版本中元素的关联问题。
-
公开(公告)号:CN115994232B
公开(公告)日:2023-06-09
申请号:CN202310276612.2
申请日:2023-03-21
申请人: 湖南汇智兴创科技有限公司
IPC分类号: G06F16/38 , G06F40/284 , G06F40/30 , G06F16/33
摘要: 本申请涉及一种在线多版本文献同一性鉴别方法、系统及计算机设备。所述方法包括:基于在线文献的生成时间,生成时间标记以及时间标记对应时间检验逻辑;对预先构建的在线多版本文献数据库进行学习,得到包括多个维度的在线文献的内容标记;内容标记至少包含语义提取信息以及版本差异信息;根据时间标记、时间检验逻辑以及内容标记,确定在线多版本文献是否为同一文献。采用本方法能够在保证鉴别精度的前提下,大大的提升鉴别的效率,可以应用于实时性高的鉴别系统。
-
公开(公告)号:CN115994232A
公开(公告)日:2023-04-21
申请号:CN202310276612.2
申请日:2023-03-21
申请人: 湖南汇智兴创科技有限公司
IPC分类号: G06F16/38 , G06F40/284 , G06F40/30 , G06F16/33
摘要: 本申请涉及一种在线多版本文献同一性鉴别方法、系统及计算机设备。所述方法包括:基于在线文献的生成时间,生成时间标记以及时间标记对应时间检验逻辑;对预先构建的在线多版本文献数据库进行学习,得到包括多个维度的在线文献的内容标记;内容标记至少包含语义提取信息以及版本差异信息;根据时间标记、时间检验逻辑以及内容标记,确定在线多版本文献是否为同一文献。采用本方法能够在保证鉴别精度的前提下,大大的提升鉴别的效率,可以应用于实时性高的鉴别系统。
-
公开(公告)号:CN115438633B
公开(公告)日:2023-03-17
申请号:CN202211210639.3
申请日:2022-09-30
申请人: 湖南汇智兴创科技有限公司
IPC分类号: G06F40/166 , G06F16/23 , G06F16/27
摘要: 本申请涉及一种跨文档在线研讨处理方法、互动方法、装置和设备。包括:通过话题内容锚定模型中的内容锚定标记的位置信息,将话题模型中的话题与在线研讨模型中的话题信息进行关联,得到在线文档模型中的关联信息;根据多个在线文档模型构建在线文档模型集合,确定在线文档模型集合中的联合研讨话题,根据联合研讨话题和关联信息建立联合研讨模型,联合研讨模型包括:联合话题标识、联合研讨话题以及联合话题内容锚定信息,当处理联合研讨模型中的联合研讨话题时,能够通过对应的关联信息和联合话题锚定信息定位到有关的在线文档信息和话题,以此将处理信息同步至对应的在线文档模型中。本发明使得用户灵活选择文档或话题中进行处理并同步更新。
-
公开(公告)号:CN117389954B
公开(公告)日:2024-03-29
申请号:CN202311711792.9
申请日:2023-12-13
申请人: 湖南汇智兴创科技有限公司
摘要: 本申请涉及一种在线多版本文献内容定位方法、装置、设备及介质。所述方法包括:构建文档位置模型,根据文档位置模型构建文档元素索引结构模型,获取待检索的文档元素在多版本文献中的内容,根据文档元素查询其在排序数组索引空间的位置,并且通过指针得到元素位置链,遍历元素位置链以及文档位置模型,得到待检索的文档元素在多版本文献中的位置。采用本方法能够建立了元素与文档内部的关联,不仅提升了检索精度,同时可以应用于大规模的元素索引,为了索引结果提供了可解释性。
-
公开(公告)号:CN117389954A
公开(公告)日:2024-01-12
申请号:CN202311711792.9
申请日:2023-12-13
申请人: 湖南汇智兴创科技有限公司
摘要: 本申请涉及一种在线多版本文献内容定位方法、装置、设备及介质。所述方法包括:构建文档位置模型,根据文档位置模型构建文档元素索引结构模型,获取待检索的文档元素在多版本文献中的内容,根据文档元素查询其在排序数组索引空间的位置,并且通过指针得到元素位置链,遍历元素位置链以及文档位置模型,得到待检索的文档元素在多版本文献中的位置。采用本方法能够建立了元素与文档内部的关联,不仅提升了检索精度,同时可以应用于大规模的元素索引,为了索引结果提供了可解释性。
-
公开(公告)号:CN116776854A
公开(公告)日:2023-09-19
申请号:CN202311079930.6
申请日:2023-08-25
申请人: 湖南汇智兴创科技有限公司
IPC分类号: G06F40/197 , G06F40/126 , G06F40/14 , G06F40/194 , G06F16/35 , G06F16/901 , G06F16/906 , G06F18/22 , G06F18/2321
摘要: 本申请涉及一种在线多版本文献内容关联方法、装置、设备和介质。所述方法包括:将多版本文献的版式格式模型中的版式格式结构转换为树结构,对待关联的文档集合中所有版本的树结构进行相似性计算并聚类,利用k中心聚类方法求出类簇的中心点并计算距离中心点距离最小的版式结构作为初始本体版式,对初始本体版式集合进行差异比较和相似性度量,对得到的本体版式进行编码,直至编码到最细粒度,根据本体版式中各个元素和编码后的本体版式的各个元素建立数据库,将待关联的文档转换为树结构后与本体版式进行相似性计算,根据计算结果和预先设置的阈值则进行关联。采用本方法能够解决同一文献多个文档版本中元素的关联问题。
-
公开(公告)号:CN115438633A
公开(公告)日:2022-12-06
申请号:CN202211210639.3
申请日:2022-09-30
申请人: 湖南汇智兴创科技有限公司
IPC分类号: G06F40/166 , G06F16/23 , G06F16/27
摘要: 本申请涉及一种跨文档在线研讨处理方法、互动方法、装置和设备。包括:通过话题内容锚定模型中的内容锚定标记的位置信息,将话题模型中的话题与在线研讨模型中的话题信息进行关联,得到在线文档模型中的关联信息;根据多个在线文档模型构建在线文档模型集合,确定在线文档模型集合中的联合研讨话题,根据联合研讨话题和关联信息建立联合研讨模型,联合研讨模型包括:联合话题标识、联合研讨话题以及联合话题内容锚定信息,当处理联合研讨模型中的联合研讨话题时,能够通过对应的关联信息和联合话题锚定信息定位到有关的在线文档信息和话题,以此将处理信息同步至对应的在线文档模型中。本发明使得用户灵活选择文档或话题中进行处理并同步更新。
-
-
-
-
-
-
-