-
公开(公告)号:CN108710607A
公开(公告)日:2018-10-26
申请号:CN201810345021.5
申请日:2018-04-17
申请人: 达而观信息科技(上海)有限公司
CPC分类号: G06F17/2775 , G06F17/218 , G06F17/272 , G06F17/2785 , G06F17/2795
摘要: 本申请公开了一种文本改写方法及装置。该文本改写方法包括:根据待改写文本确定文本的输入词集合;在所述输入词集合中提取输入词的词特征向量;根据所述词特征向量确定关键词集;根据所述关键词集对所述输入词集合筛选,得到文本改写对照表;根据所述文本改写对照表改写所述待改写文本。本申请解决了文本改写自动化程度低、文本风格特点难以把握和文本原意容易造成偏移的技术问题。
-
公开(公告)号:CN104866512B
公开(公告)日:2018-09-07
申请号:CN201410067190.9
申请日:2014-02-26
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06F17/30
CPC分类号: G06F17/272 , G06F17/30011 , G06F17/3089
摘要: 本发明涉及一种提取网页内容的方法、装置及系统,其方法包括:响应移动客户端在浏览器上触发的网页浏览指令,获取对应的网页;解析网页,获取网页脚本中标签的DOM节点;从DOM节点中获取插件标签节点;当插件标签节点对应的插件标签为预定类型标签时,提取插件标签对应的插件资源。本发明可在网页尚未真正渲染时完成符合特定协议规范的内容的提取,由此提高了网页预定内容的提取速度,同时也提高了网页的展示速度,此外,由于本方案可以不依赖后台服务器而是在浏览器终端侧实现插件资源的提取,在技术上易于实现,可降低开发成本。
-
公开(公告)号:CN104951504B
公开(公告)日:2018-08-14
申请号:CN201510258568.8
申请日:2015-05-20
申请人: 深圳创维-RGB电子有限公司
IPC分类号: G06F17/30 , G06F3/0484 , G06F17/22
CPC分类号: G06F17/218 , G06F3/165 , G06F17/212 , G06F17/2247 , G06F17/272 , G06F17/30 , G06F17/30053 , G06F17/30887 , G06F17/30896
摘要: 本发明公开一种网页处理方法及系统,方法包括步骤:当手持设备访问HTML文本文件时,解析HTML文本文件,根据当前标签将HTML文本文件中的多媒体内容的地址剥离;将剥离出的多媒体内容的地址组成相应的播放列表,并分发至匹配的播放设备中,并对剥离后的HTML文本文件进行重组;手持设备打开重组后的HTML文件显示相应的文本网页,播放设备播放相应的多媒体内容。本发明充分利用各家庭设备所具有的播放功能优势,进行多媒体内容的播放,而手持设备则只显示文本信息,播放设备则根据其所适合处理的数据类型播放相应的多媒体内容。
-
公开(公告)号:CN102859511B
公开(公告)日:2016-05-11
申请号:CN201180020125.5
申请日:2011-04-14
申请人: 费斯布克公司
IPC分类号: G06F15/16
CPC分类号: G06F17/30896 , G06F3/0484 , G06F9/542 , G06F17/2247 , G06F17/272 , G06F17/30377 , G06F17/30598 , G06F17/30861 , G06F17/30867 , G06Q50/01 , H04L51/32 , H04L67/02 , H04L67/146 , H04L67/22 , H04L67/306
摘要: 社交网络系统包括用于将节点并入到社交图中的机制,其中节点与网页相关联。每个网页包括一个或多个标签,标签包含用于定义社交网络系统中的节点的元信息,诸如节点的类型。社交网络系统从标记语言文档获取标签,并且存储与用于针对网页与的节点相结合地存储其有关的信息。网页可以在社交网络系统的域之外,并且可以由社交网络运营商以外的实体来运营;由此,第三方可以定义、创建和维护继而将由社交网络系统使用的节点。用户继而可以与社交网络系统之外的站点上的节点进行交互,并且这些交互被跟踪,并且被反映回社交网络系统内。
-
公开(公告)号:CN105531672A
公开(公告)日:2016-04-27
申请号:CN201480050603.0
申请日:2014-06-30
申请人: 起元科技有限公司
CPC分类号: G06F17/2705 , G06F8/37 , G06F17/2258 , G06F17/272
摘要: 生成用于解析数据对象的输入流(504)的数据解析器(418)包括:接收表示限定以层级组织的多个对象的分层数据格式(105,205)的信息(502),所述对象包括表示数据对象的一个或多个模式对象、以及每个与一个或多个模式对象相关联的一个或多个容器对象;以及处理所接收到的信息以形成所述数据解析器。所述处理包括:确定所述输入流中连续数据对象之间的容许转换;将一个或多个数据操作与每个所确定的容许转换相关联;以及存储用于配置处理器以执行所述数据解析器的规范。
-
公开(公告)号:CN104246762A
公开(公告)日:2014-12-24
申请号:CN201380017573.9
申请日:2013-02-20
申请人: 高通股份有限公司
IPC分类号: G06F17/30
CPC分类号: G06F17/2247 , G06F17/218 , G06F17/272 , G06F17/30896 , G06F17/30899
摘要: 各个方面提供了用于标识HTML文档的独立部分以使得所标识部分可被并行处理的方法、服务器和系统。可以将这些独立部分与具有无缝和沙盒属性两者的iframe标签相关联。在运行时,浏览器可以检测到两个属性的存在,并且并行地处理iframe的内容。
-
公开(公告)号:CN102054024A
公开(公告)日:2011-05-11
申请号:CN201010540061.9
申请日:2010-11-02
申请人: 索尼公司
发明人: 礒津政明
IPC分类号: G06F17/30
CPC分类号: G06F17/272 , G06F17/2247
摘要: 本发明公开了一种信息处理设备、信息提取方法、程序和信息处理系统,该信息处理设备包括:数据存储单元,存储用于从使用标记语言写成的文档中提取的信息的至少两个规则;选择单元,根据使用标记语言写成的输入文档的至少一个部分中特定字符串的出现频率,来从数据存储单元中所存储的至少两个规则中选择要应用于所述部分的规则;以及提取单元,使用由选择单元所选择的规则来从所述部分中提取信息。
-
公开(公告)号:CN1954314B
公开(公告)日:2010-05-26
申请号:CN200480042890.7
申请日:2004-07-23
申请人: 微软公司
发明人: D·F·埃默森 , D·奥恩斯坦 , G·谢克特 , J·迪尼埃兹 , J·金 , S·苏布拉马尼亚安 , O·H·弗尔 , W·朱 , M·J·希尔伯格 , D·C·布朗 , M·V·雷诺 , J·D·泰纳斯基
IPC分类号: G06F17/21
CPC分类号: G06F17/30908 , G06F17/218 , G06F17/2229 , G06F17/2247 , G06F17/2288 , G06F17/272 , Y10S707/99945 , Y10S707/99948
摘要: 描述了模块化内容框架和文档格式方法与系统。所描述的框架和格式定义了一组用于排版、打包、分发和呈现以文档为中心的内容的构件块。这些构件块为文档格式定义了使软件和硬件系统能够可靠且一致地生成、交换和显示文档的平台无关框架。该框架和格式是用灵活且可扩展的方式来设计的。除该通用框架和格式之外,使用该通用框架定义了一种称为影响范围包(reach package)格式的特定格式。影响范围包格式是一种用于储存分页文档的格式。影响范围包的内容可在各种各样环境中且跨各种各样情形的设备和应用程序之中用完全的保真度来显示或打印。
-
公开(公告)号:CN1526104B
公开(公告)日:2010-04-28
申请号:CN02807089.5
申请日:2002-01-30
申请人: 诺基亚有限公司
发明人: T·维科梅基
IPC分类号: G06F17/27
CPC分类号: G06F17/271 , G06F17/272
摘要: 本发明公开了一种用于分析结构化数据的方法,具有以下步骤:以第一计算机语言接收输入数据;根据输入数据生成多个令牌;使用包括规则集的文法语法编制上下文,所述上下文包括多个上下文分段,其形式为至少一个或多个上下文分段链,所述编制上下文的步骤包括以下子步骤:根据文法语法检测一个令牌在上下文中是否是容许的;如果所述令牌是容许的,则建立对应于该令牌的一个新上下文分段;以及为了恢复不容许令牌,还包括以下其他的步骤:为所述不容许令牌识别合适上下文,在该合适上下文中该令牌是容许的;和将此令牌应用于已识别的合适上下文中。
-
公开(公告)号:CN100495401C
公开(公告)日:2009-06-03
申请号:CN200610164702.9
申请日:2006-11-14
申请人: 国际商业机器公司
IPC分类号: G06F17/30
CPC分类号: G06F17/2247 , G06F17/272
摘要: 本发明的目标是提供一种能够使用诸如XML解析器之类的解析器来快速解析数字化的结构化文档的句法解析装置和方法。与实例文档和概要信息有关的统计信息被用于合并允许对结构化文档分段的多个状态转变,由此生成优化的自动机。在合并状态转变中,以ID列表的形式保存连续匹配状态转变,所述ID列表然后用于对连续状态转变数进行计数。此外,统计地获得包括嵌套元素的重复元素出现次数的模式。通过使用统计方法来解决XML中空白的变化。概要信息用于预先建立自动机,由此降低所述句法解析装置的初始开销。
-
-
-
-
-
-
-
-
-