结构化文档管理装置、方法及程序

    公开(公告)号:CN103827861A

    公开(公告)日:2014-05-28

    申请号:CN201280002750.1

    申请日:2012-09-07

    IPC分类号: G06F17/30

    摘要: 结构化文档管理装置(1)包括:检索接口部(26),用于受理检索具有层次化后的逻辑结构的结构化文档的查询数据的输入;结构条件分割部(27),将查询数据分割为包含多个结构条件的要素单位;结构条件改写部(28),在分割出的上述结构条件的种类是根据结构化文档的上位层次指定下位层次的子孙结构条件以外时,上将述结构条件改写为按各自的上述结构条件的每个种类预先确定的包含子孙结构条件和结合运算处理的改写查询,以避免对结构条件的前后的上述要素带来影响;以及查询执行部(29),以上述结构条件及包含改写查询的查询数据作为输入,输出检索结果。

    结构化文档管理装置、结构化文档检索方法

    公开(公告)号:CN103415850A

    公开(公告)日:2013-11-27

    申请号:CN201280002969.1

    申请日:2012-07-20

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30477 G06F17/30938

    摘要: 实施方式的结构化文档管理装置包括文档存储部、标题提取部、关联度计算部、文档检索部、标题选择部和标题表示部。文档存储部存储多个结构化文档。标题提取部提取结构化文档的标题,并制作含有所提取的标题的标题列表。关联度计算部分别计算结构化文档中的词汇与对应于结构化文档的标题之间的概念上的关联度。文档检索部检索含有与检索用关键字一致的词汇的结构化文档。标题选择部将相对于与检索用关键字一致的词汇的关联度较大的标题比关联度较小的标题更加优先地加以选择。显示控制部使由标题选择部选出的标题作为显示标题,显示在显示部上。

    用于查找数据库的方法和数据库

    公开(公告)号:CN100533433C

    公开(公告)日:2009-08-26

    申请号:CN200410102294.5

    申请日:2004-12-16

    IPC分类号: G06F17/30

    摘要: 本发明涉及一种用于在分层结构数据库(10)的元素内进行查找的方法,其中每个元素都具有用于限定所述元素的属性的一个或多个分层结构节点,且其中所查找的元素的一个或多个节点必须实现一个或多个查找条件(c0,ci,...),该方法包括以下步骤:a.选择多个节点并向每个所选节点分配唯一的标识符(EID);b.创建参考索引(20),它允许为所选节点的每个唯一的标识符(EID)派生数据库(10)的相应元素;c.对于一个或多个查找条件(c0,ci,...)中的每一个:为实现各查找条件(c0,ci,...)的节点检索起源节点的唯一标识符(EID)的组(L,Ei);d.使这些组(L,Ei)相交,以获得唯一标识符(EID)的最终组(L);以及e.根据唯一标识符(EID)的最终组(L)和参考索引(20)检索数据库(10)的所查找的元素。

    数据库与OPC联接系统及其控制方法

    公开(公告)号:CN107766391A

    公开(公告)日:2018-03-06

    申请号:CN201610705684.4

    申请日:2016-08-22

    发明人: 孟华卫

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30914 G06F17/30938

    摘要: 本发明公开了一种数据库与OPC联接系统,包括信息标记文本模块,用于导入设置信息;数据库与OPC联接系统程序,用于解析设置信息并发送到OPC客户端模块和查询指令模块;OPC客户端模块,用于执行设备指令;查询指令模块,用于执行数据库指令;OPC服务器模块,用于获取或设置设备的参数;人机界面,用于系统的控制和日志的显示及导出。可实现高兼容性,简易性,由于OPC是工厂通用数据接口,可以连接所有带有OPC数据接口的设备,同时扩展标记语言简单,易学易用,使用扩展标记语言导入设置信息会最大程度的降低使用者的素质要求,提高工作效率。

    评估XML全文搜索
    6.
    发明公开

    公开(公告)号:CN104781811A

    公开(公告)日:2015-07-15

    申请号:CN201380058915.1

    申请日:2013-09-26

    发明人: 刘振华 吕颖 张辉

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30938

    摘要: 提供了用于存储XML文档中的记号的倒排列表并且使用倒排列表处理查询的过程、机器和存储的指令。对于记号在XML文档中的每次出现,文档处理器向针对该记号的列表添加条目。针对该记号的条目把该记号映射到可以找到该记号的文档或文档内的节点。文档处理器还可以检测XML文档中的标志并且,对于标志的每次出现,向针对该标志的列表添加条目。针对标志的条目指定由该标志覆盖的位置范围。然后,查询处理器可以接收用于对照XML文档进行评估的全文查询,并且查询处理器可以使用针对记号的列表和/或针对标志的列表来确定查询的结果集。

    一种从维基百科半结构化数据自动构建分类树的方法

    公开(公告)号:CN103778238A

    公开(公告)日:2014-05-07

    申请号:CN201410040234.9

    申请日:2014-01-27

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30938

    摘要: 本发明公开了一种从维基百科半结构化数据自动构建分类树的方法,包括(1)半结构化数据的抽取,通过分析获取到页面的HTML,识别出含有半结构化数据的页面。(2)半结构化数据中上下位关系的抽取,依据维基目录页面的布局特点,获取其中包含的上下位关系;解析HTML元素,依据导航表的结构,获取表格中包含的上下位关系。(3)源于不同半结构化数据的上下位关系融合,依据抽取到的上下位关系集构建向无权简单图,然后基于图的深度优先遍历算法生成分类树。本发明能够自动抽取维基页面中的上下位关系,并构建分类树,减少领域专家构建的成本,充分重用了志愿者手工构建的上下位关系。

    一种关键字检索方法、装置及系统

    公开(公告)号:CN103544281A

    公开(公告)日:2014-01-29

    申请号:CN201310503091.6

    申请日:2013-10-23

    发明人: 徐光剑

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30926 G06F17/30938

    摘要: 本发明适用于计算机检索技术领域,提供了一种关键字检索方法、装置及系统,所述方法包括:接收输入的关键字检索请求,请求中包括目标文件的ID和关键字检索语句;根据目标文件的ID读取文件信息;对目标文件进行分块;在各分块上运行Mapper程序,以由Mapper程序根据关键字检索语句以及文件信息查询得到各分块对应的SCKS、SLCA节点,并生成子树SCKS’;发送SLCA节点与SCKS’至Reduce设备,以由Reduce设备根据SLCA节点与SCKS’计算得到检索结果。本发明,通过MapReduce对海量XML文件进行分布式并行运算,从而可以支持大数据量的关键字检索。

    用于检索结构化文件的系统和方法

    公开(公告)号:CN1766875A

    公开(公告)日:2006-05-03

    申请号:CN200510064601.X

    申请日:2005-04-15

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30938

    摘要: 一种结构化文件检索系统(10),包括:通过包含有分层化的多个节点的树结构对结构化文件进行管理的结构化文件数据库(11);和接收来自用户机(20)的遍历请求的单元(12),所述遍历请求包括:将所述结构化文件数据库(11)内的多个节点中的一个指定为作为检索基点的基节点的基节点指定信息,及指定相对于所述基节点的遍历目标节点的相对位置关系的相对位置信息;以及遍历处理单元(14),从由所述接收的遍历请求中包含的基节点指定信息指定作为基节点的所述结构化文件数据库(11)内的多个节点中的一个,根据所述接收的遍历请求中包含的所述相对位置信息,执行追溯所述结构化文件数据库(11)内的多个节点中的其他节点的遍历处理,从所述结构化文件数据库(11)获取与所述遍历目标节点对应的数据。