-
公开(公告)号:CN109716330A
公开(公告)日:2019-05-03
申请号:CN201780056798.3
申请日:2017-09-15
申请人: 甲骨文国际公司
发明人: S·巴斯拉
IPC分类号: G06F16/93 , G06F17/21 , G06F17/24 , G06F17/27 , G06F3/0482
CPC分类号: G06F17/212 , G06F3/0485 , G06F16/9038 , G06F17/245 , G06F17/248 , G06F17/2745
摘要: 公开了用于管理电子文档中的内容的显示的技术。具体而言,该技术可以使得能够选择性地移动与内容相关的头部。例如,可以在图形界面中显示数据表中的头部或电子文档中的内容的数据表头部,使得对于头部的选择性移动,图形界面以动画显示,以显示可见的内容。头部的选择性移动可以使得能够管理电子文档中的内容以供显示,使得当与头部相关的内容在图形界面中可见时,头部可以是可见的。通过选择性地移动诸如文档中的头部之类的内容,文档可以以动画或移动的方式进行渲染,以与相关内容一起渲染。
-
公开(公告)号:CN108228555A
公开(公告)日:2018-06-29
申请号:CN201611153482.X
申请日:2016-12-14
申请人: 北京国双科技有限公司
发明人: 曹志明
CPC分类号: G06F17/277 , G06F17/2745 , G06F17/30873 , G06K9/723
摘要: 本发明公开了一种基于栏目主题的文章处理方法和装置。其中,该方法包括:对待判断文章进行分词,得到分词结果;从分词结果中筛选出属于预构建的栏目主题词库的分词词汇,并计算属于预构建的栏目主题词库的分词词汇在待判断文章中的词频以及在所有分词词汇中的占比;判断属于预构建的栏目主题词库的分词词汇在待判断文章中的词频以及在所有分词词汇中的占比是否满足预设条件,得到判断结果;根据判断结果确定待判断文章是否与所述栏目主题相符。本发明解决了现有技术中在处理栏目中的文章与栏目主题不相关的问题时,产生的被动性和滞后性的技术问题。
-
公开(公告)号:CN104516942B
公开(公告)日:2018-04-17
申请号:CN201410483039.3
申请日:2014-09-19
申请人: 国际商业机器公司
CPC分类号: G06F17/30598 , G06F17/241 , G06F17/2745 , G06F17/3053 , G06F17/30722
摘要: 本发明的各实施例涉及概念驱动的自动分节标识。提供了用于生成用于电子文档的分节元数据的机制。这些机制接收文档并且分析文档以标识在文档的文本内容内存在的概念。机制使在文本内容内的概念相互相关以基于定义有关概念或者概念模式的一个或者多个规则的应用来标识概念组。机制基于在文本内容内的概念的相关性来确定在文本内容内的文本分节。基于该确定的结果,机制生成用于文档的分节元数据并且与文档关联地存储分节元数据以用于由文档处理系统使用。
-
公开(公告)号:CN107832299A
公开(公告)日:2018-03-23
申请号:CN201711147815.2
申请日:2017-11-17
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F17/27
CPC分类号: G06F17/2745 , G06F17/2785
摘要: 本发明提供一种基于人工智能的标题的改写处理方法、装置及可读介质。其方法包括:获取文章中各句子的特征表达,该句子的特征表达包括句子的信息特征以及句子与文章的原始标题的相似性特征;根据各句子的特征表达和预先训练的支撑句提取模型,从文章的各句子中提取文章的支撑句;根据文章的支撑句和预先训练的标题生成模型,生成文章的支撑句对应的候选标题;根据文章的原始标题、候选标题和预先训练的点击率预估模型,确定是否利用候选标题对文章的原始标题进行改写处理。采用本发明的技术方案,可以保证在文章的标题只要被改写,就可以提高改写后的标题的质量,提高改写标题后的文章的召回率,从而满足真正的标题改写需求。
-
公开(公告)号:CN107229731A
公开(公告)日:2017-10-03
申请号:CN201710427453.6
申请日:2017-06-08
申请人: 百度在线网络技术(北京)有限公司
发明人: 戴明洋
CPC分类号: G06F17/30705 , G06F17/2745 , G06F17/277 , G06F17/30699
摘要: 本申请公开了用于分类数据的方法和装置。方法的一具体实施方式包括:采用各预定类别的初始过滤词集合,过滤原始数据,得到各预定类别的原始样本集合;对原始样本集合进行分类处理,得到验证的准确率满足阈值的更新后的样本集合;其中,分类处理包括:对原始样本集合进行过滤处理,得到更新后的样本集合,对更新后的样本集合进行验证,得到验证的准确率,响应于验证的准确率不满足阈值,对原始样本集合进行分类处理直至准确率满足阈值。该实施方式自动的学习计算出准确率满足阈值的更新后的样本集合,提高了更新后的样本集合的准确率,增强了对于未知样本的分类能力。
-
公开(公告)号:CN106933808A
公开(公告)日:2017-07-07
申请号:CN201710166238.5
申请日:2017-03-20
申请人: 百度在线网络技术(北京)有限公司
IPC分类号: G06F17/27
CPC分类号: G06F17/2745 , G06F17/277
摘要: 本发明实施例公开了基于人工智能的文章标题生成方法、装置、设备及存储介质。其中方法包括:根据待生成标题的文章与标题模板确定至少一个候选标题;根据标题质量筛选参数对各所述候选标题进行筛选,确定目标标题;将所述目标标题与所述待生成标题文章组合;其中,所述标题模板和/或标题质量筛选参数根据历史标题数据的用户反馈信息确定。本发明实施例解决了普通机器文章标题质量差、吸引力低的问题,实现了自动生成高质量的文章标题。
-
公开(公告)号:CN106502991A
公开(公告)日:2017-03-15
申请号:CN201610972309.6
申请日:2016-10-28
申请人: 人民卫生电子音像出版社有限公司
CPC分类号: G06F17/2705 , G06F16/284 , G06F16/285 , G06F17/2745
摘要: 本发明公开了一种出版物处理方法和装置。该方法包括:获取数字化的出版物;根据出版物的版面信息从出版物中提取出信息,其中,信息分为多个类别,不同的类别用于表示出版物的内容结构;根据信息对出版物进行加工。通过本发明,解决了相关技术中出版物数字化加工方法局限性高的问题,进而达到了提高出版物数字化加工方法的灵活性的效果。
-
公开(公告)号:CN105512107A
公开(公告)日:2016-04-20
申请号:CN201510918241.9
申请日:2015-12-10
申请人: 天津海量信息技术有限公司
IPC分类号: G06F17/27
CPC分类号: G06F17/2745
摘要: 一种基于视觉的互联网正文页标题识别方法,输入为经过Chrome内核下载和渲染后的DOM树对象,由于DOM树包含有网页元素的渲染后的style信息,便于分析,通过对每一个HTML元素,进行必要权判断和比例权计算,以得出正文页中的标题并输出为最可能的正文标题的Element对象,本发明在运行中模拟人类的识别方式,能够高效、准确地识别和区分互联网正文页中标题元素。
-
公开(公告)号:CN104516942A
公开(公告)日:2015-04-15
申请号:CN201410483039.3
申请日:2014-09-19
申请人: 国际商业机器公司
CPC分类号: G06F17/30598 , G06F17/241 , G06F17/2745 , G06F17/3053 , G06F17/30722 , G06F17/30861
摘要: 本发明的各实施例涉及概念驱动的自动分节标识。提供了用于生成用于电子文档的分节元数据的机制。这些机制接收文档并且分析文档以标识在文档的文本内容内存在的概念。机制使在文本内容内的概念相互相关以基于定义有关概念或者概念模式的一个或者多个规则的应用来标识概念组。机制基于在文本内容内的概念的相关性来确定在文本内容内的文本分节。基于该确定的结果,机制生成用于文档的分节元数据并且与文档关联地存储分节元数据以用于由文档处理系统使用。
-
公开(公告)号:CN103678451A
公开(公告)日:2014-03-26
申请号:CN201310410042.8
申请日:2013-09-10
申请人: 国际商业机器公司
IPC分类号: G06F17/30
CPC分类号: G06F17/2745 , G06F17/246 , G06F17/30339 , G06F17/30557
摘要: 本发明涉及一种用于电子表格模式提取的方法和系统。本发明的各方面提供了一种用于从电子表格提取模式的工具。在一个实施例中,检索以未编目表格格式(例如电子表格)存储的一组数据。检查所检索的一组数据的结构以便确定其数据集模式。然后,分析所述数据集模式中的数据元素以便获得有关所述数据元素的信息。根据数据集模式和元素信息,可以构造允许远程访问所述一组数据的接口。
-
-
-
-
-
-
-
-
-