-
公开(公告)号:CN106777109A
公开(公告)日:2017-05-31
申请号:CN201611160017.9
申请日:2016-12-15
申请人: 东北师范大学 , 东北师大理想软件股份有限公司
IPC分类号: G06F17/30
CPC分类号: G06F16/316 , G06F16/35
摘要: 本发明公开了一种基于融合点的教育资源分类组织方法,该方法创建了一种网状结构的有向图用于存储教育资源,其中,该网状结构的构建包括以下步骤:新建图结构的根节点Ci,用于表示资源类别,包括教学指导、课件、素材、试题、课例等;新建学科类别节点Sj,并将Sj节点添加到根节点Ci下,建立学科与资源类别的对应关系;根据融合点诊断的结果,新建相应的融合点节点Np,并根据该融合点所对应的学科,生成学科与融合点之间的指针,一个融合点可能属于一个学科也可能跨学科;在每个融合点节点下,添加所需的资源对象节点Rq,Rq节点所表示的类型包括MS office文件、WPS office文件、PDF文件、音视频文件、Flash动画文件、网页文件等。
-
公开(公告)号:CN106528647A
公开(公告)日:2017-03-22
申请号:CN201610897558.3
申请日:2016-10-15
申请人: 北京语联炉火信息技术有限公司
发明人: 冯泽康
CPC分类号: G06F16/316 , G06F17/289
摘要: 一种基于cedar双数组字典树算法进行术语匹配的方法,其特征是包括建索引的步骤,及用索引进行术语查询匹配的步骤;其中,所述建索引的步骤是遍历数据库,获取术语集合,调用cedar双数组字典树插入术语,用以形成术语集合的索引;所述cedar双数组字典树包括一个以基准值和校验值为成员的结构体数组,一个与结构体数组体量相同的循环队列;将cedar双数组算法应用于术语匹配引擎的建索引和根据索引来查询术语,极大地提升了术语匹配引擎的效率,同时该算法也避免了经典的双数组算法libdatrie对大量术语建索引时速度非常慢而不利于快速重建数据的缺点;二叉树作为一种辅助结构,可以用来快速地还原整个双数组字典树。
-
公开(公告)号:CN104182527A
公开(公告)日:2014-12-03
申请号:CN201410427491.8
申请日:2014-08-27
申请人: 广西教育学院
发明人: 黄名选
IPC分类号: G06F17/30
CPC分类号: G06F16/316 , G06F16/334 , G06F16/353 , G06F17/2715
摘要: 一种基于偏序项集的中英文本词间关联规则挖掘方法及其系统,利用文本信息预处理模块进行预处理,构建文本信息数据库和特征词项目库;利用特征词频繁偏序项集实现模块挖掘特征词候选项集,求出候选项集的偏序项集,采用新的项集剪枝方法对候选偏序项集剪枝,计算候选偏序项集权值,采用新的计算方法计算候选偏序项集支持度,由此得出频繁偏序项集;利用完全加权词间关联规则挖掘实现模块挖掘有效的特征词关联规则模式;利用关联规则模式结果显示模块将关联规则模式输出给用户。本发明具有良好的挖掘效率,得到更接近实际的文本特征词关联规则模式,这些模式运用于中文或者英文文本挖掘、信息检索等领域,运用于搜索引擎,可以提高查询性能。
-
公开(公告)号:CN106446247A
公开(公告)日:2017-02-22
申请号:CN201610891782.1
申请日:2016-10-12
申请人: 南方电网科学研究院有限责任公司 , 广州奥凯信息咨询有限公司
IPC分类号: G06F17/30
CPC分类号: G06F16/33 , G06F16/316 , G06F16/3331
摘要: 本发明涉及一种专利数据调用系统,包括调用终端、主服务器和多个存储服务器;其中各个存储服务器中存储有专利数据;所述主服务器存储有各个存储服务器所存储专利数据的索引信息;所述调用终端用于接收用户下发的调用指令,并将其传送至主服务器;所述调用指令内包含有待调用的专利数据的索引信息;所述主服务器接收调用指令,并提取调用指令中的专利数据的索引信息在其所存储的索引信息中进行遍历,从而确定待调用的专利数据所在的存储服务器,然后从确定的存储服务器中调用出专利数据,并将其发送至调用终端。
-
公开(公告)号:CN105677904A
公开(公告)日:2016-06-15
申请号:CN201610082148.3
申请日:2016-02-04
申请人: 杭州数梦工场科技有限公司
发明人: 张亚惠
IPC分类号: G06F17/30
CPC分类号: G06F16/316 , G06F16/182
摘要: 本申请提供一种基于分布式文件系统的小文件存储方法及装置,所述方法包括:为存在关联性的待存储小文件分配唯一对应的数据分表;所述数据分表为预设的逻辑二维表,包括由预设大小的逻辑存储单元构成的若干逻辑行和逻辑列;所述待存储文件包括文件类型和大小均不相同的批量小文件;将所述待存储小文件中存在关联性的小文件分别存储至所述数据分表中的同一逻辑行或者同一逻辑列;针对所述存在关联性的小文件分别生成唯一对应的文件索引,并将该文件索引保存至对应的逻辑行或者逻辑列中。本申请可以显著降低分布式文件系统的文件存储压力。
-
公开(公告)号:CN105404664A
公开(公告)日:2016-03-16
申请号:CN201510759972.3
申请日:2015-11-10
申请人: 上海尚毅测控技术有限公司
IPC分类号: G06F17/30
CPC分类号: G06F16/316 , G06F16/13
摘要: 本发明涉及一种针对海量数据可配置的多重索引及回放方法及其系统,所述方法包括数据索引步骤和数据回放步骤,通过数据索引步骤形成多级索引数据,通过数据回放步骤实现对所需部分原始数据进行呈现,该方法可以有效地提取海量数据中的特征值,通过特征值反映数据的整体走势,当用户对局部数据感兴趣时可以通过局部放大的方式对局部数据进行还原与放大,从而方便用户进行海量数据回放。
-
公开(公告)号:CN101963965B
公开(公告)日:2013-03-20
申请号:CN200910151487.2
申请日:2009-07-23
申请人: 阿里巴巴集团控股有限公司
IPC分类号: G06F17/30
CPC分类号: G06F16/24554 , G06F16/2228 , G06F16/2379 , G06F16/31 , G06F16/316 , G06F16/3337 , G06F16/93
摘要: 本申请实施例公开了基于搜索引擎的文档索引方法、数据查询方法及服务器,所述文档索引方法包括:获取待索引的文档,并对所述文档进行分词操作得到一元分词;判断每个一元分词是否为过滤字,若所述一元分词是过滤字,将所述一元分词和与所述一元分词顺序相邻的至少一个一元分词组成多元分词,对所述多元分词建立索引;若所述一元分词不是过滤字,则直接对所述一元分词建立索引。本申请实施例中在进行索引或查询时,将作为高频字的一元分词与其相邻的至少一个一元分词组成多元分词,以保证不会因为对高频字进行索引而导致查询时浪费搜索引擎的资源,并且也不会因为跳过对高频字的索引而导致查询结果不准确。
-
公开(公告)号:CN108280072A
公开(公告)日:2018-07-13
申请号:CN201710006391.1
申请日:2017-01-05
申请人: 长沙湘佩网络技术有限公司
发明人: 不公告发明人
IPC分类号: G06F17/30
CPC分类号: G06F16/316 , G06F16/335
摘要: 本发明公布了一种基于移动智能平台的邮件检索系统设计,本系统针对大多数手机邮箱忽略个人邮件的检索功能,在移动智能平台上设计的邮件检索系统;该系统实现了对收/发件人、主题、正文等进行检索外,还增加了针对邮件附件内容的检索功能;系统通过增加邮件解析模块,对附件内容格式的解析,针对不同类型的文档,判断其类型并进行解析;解析、提取完成之后,继续建立索引、检索等一系列操作,实现邮件信息检索的功能。
-
公开(公告)号:CN107679091A
公开(公告)日:2018-02-09
申请号:CN201710799147.5
申请日:2017-09-07
申请人: 北京海融兴通信息安全技术有限公司
发明人: 白云飞
IPC分类号: G06F17/30
CPC分类号: G06F16/2453 , G06F16/22 , G06F16/316 , G06F16/33 , G06F16/951
摘要: 本发明涉及一种基于大数据的搜索系统及方法,包括:系统管理模块、大数据服务器、安全认证模块、搜索模块、数据索引存储模块、数据采集模块、数据索引模块和数据存储模块;本发明所述的基于大数据的搜索系统,建立了专门的索引存储,并将历史搜索结果进行缓存利用,避免了重复搜索的工作量,提高了搜索的精准度和速度,可以从大量的数据中搜索到有价值的信息,很容易地解决了大数据时代对数据搜索的问题。
-
公开(公告)号:CN107145603A
公开(公告)日:2017-09-08
申请号:CN201710419745.5
申请日:2017-06-08
申请人: 上海德衡数据科技有限公司
IPC分类号: G06F17/30 , G06F12/0893 , H04L29/08 , G06F9/50
CPC分类号: G06F16/334 , G06F9/5083 , G06F12/0893 , G06F16/316 , G06F16/951 , G06F16/955 , G06F2212/154 , G06F2212/163 , H04L67/1002 , H04L67/2842
摘要: 本发明公开一种针对关键词的网络文档搜索引擎框架,构建一套分布式内存对象缓存系统,作为代理服务器,用于在动态系统中减少数据库负载;通过METAFILE的链路,实现对URL和关键词的提取及索引并建立URL与关键词映射;构建高可用的负载均衡服务器集群,存储已索引的URL和关键词;利用关键词,对指向网络文档地址的URL,进行基于语义的精准检索。
-
-
-
-
-
-
-
-
-