文本分块方法,装置,存储介质及电子设备

    公开(公告)号:CN109684610A

    公开(公告)日:2019-04-26

    申请号:CN201811459532.6

    申请日:2018-11-30

    发明人: 韩志刚

    IPC分类号: G06F17/22

    CPC分类号: G06F17/2229 G06F17/2211

    摘要: 本公开涉及一种文本分块方法,装置,存储介质及电子设备。该方法包括:对第一文本和第二文本进行预分块,得到所述第一文本的文字块组以及所述第二文本的文字块组;确定所述第一文本的文字块组与所述第二文本的文字块组中各个文字块之间的匹配率;将匹配率大于预设阈值的文字块对作为共通文字块对,并基于所述共通文字块对,对所述第一文本和所述第二文本重新进行分块,得到所述第一文本的新的文字块组和所述第二文本的新的文字块组;重新执行确定匹配率,以及基于共通文字块对所述第一文本和所述第二文本重新进行分块的步骤,直到满足预设的停止分块条件为止,得到所述第一文本和所述第二文本最终的分块结果。

    用标记语言编写文档的方法

    公开(公告)号:CN108351768A

    公开(公告)日:2018-07-31

    申请号:CN201580084390.8

    申请日:2015-09-30

    摘要: 本技术解决方案总体上涉及用户界面,并且具体涉及旨在用于处理计算机信息系统的数据的用户界面。一种用于以标记语言编写文档同时实现用于处理信息系统的数据的用户界面的方法,使得:形成用于至少一个实体类、实体类属性、数据集和至少包括数据集字段与数据集聚合函数的数据集元素的元数据;形成用于呈现实体类的实例的模板,该模板包括以至少一种标记语言编写的至少一个文档;形成并存储模板和实体类之间的链接;显示模板,形成并存储模板和实体类属性、数据集、它们的字段和聚合函数之间的链接,此外:选择模板元素并显示关于可用于链接形成的实体类属性、数据集字段和数据集聚合函数的信息;选择实体类属性或数据集或数据集字段或数据集聚合函数;形成并存储链接,该链接包括早先选择的模板元素的标识符和先前选择的实体类属性或数据集或数据集字段或数据集聚合函数的标识符。本技术的实施例的技术效果允许优化以标记语言编写文档的过程,同时实施用于处理信息系统的数据的用户界面,优化准备文档的时间并简化它们的进一步维护。技术效果基于消除将附加信息插入以标记语言编写的文档中的需要,附加信息旨在管理显示文档中包括的信息系统的数据。进一步的效果是:以标记语言编写文档的升级便利性,以用于实施用于处理信息系统的数据的用户界面和放松形成此些文档的用户的特殊知识的要求。

    向报告提供帮助的方法、装置和系统

    公开(公告)号:CN104350494B

    公开(公告)日:2017-05-17

    申请号:CN201380028255.2

    申请日:2013-05-27

    IPC分类号: G06F17/24 G06F17/22

    摘要: 本文公开一种用于维护在结构化文档中和在报告中的相对应的信息的系统。所述结构化文档包括结构化数据元素并且所述报告包括自然语言的文本。关联单元(1)被布置用于将所述结构化文档的结构化数据元素与所述报告的相关联部分进行关联,其中由所述结构化数据元素表示的信息与由所述报告的所述相关联部分表示的信息相对应。确定单元(2)被布置用于确定对所述结构化数据元素和所述报告的所述相关联部分中的一个的改变,以获得确定的改变。对应改变单元(3)被布置成用于基于所述确定的改变,对所述结构化数据元素和所述报告的所述相关联部分中的另一个进行相对应的改变。

    一种日志文件拆分方法及装置

    公开(公告)号:CN106126487A

    公开(公告)日:2016-11-16

    申请号:CN201610509430.5

    申请日:2016-06-30

    发明人: 张新亮

    IPC分类号: G06F17/22 G06F17/30

    摘要: 本发明公开了一种日志文件拆分方法及装置,属于计算机领域,用于解决服务器日志文件过大的问题。所述日志文件拆分方法包括:在操作系统中,安装日志拆分应用程序;在所述日志拆分应用程序的配置文件目录中,创建目标日志文件的配置文件;编辑所述配置文件;所述配置文件中包括目标日志文件的路径及拆分属性。本发明提供的方案能够使系统按照所述配置文件对目标日志文件进行拆分保存,提高对日志文件的有效管理。

    用于重用HTML内容的方法和系统

    公开(公告)号:CN103139260B

    公开(公告)日:2015-09-30

    申请号:CN201110391155.9

    申请日:2011-11-30

    IPC分类号: H04L29/08

    摘要: 本公开提供了一种用于重用HTML内容的方法,包括:接收HTTP请求;确定接收的HTTP请求存在指定请求部分HTML内容的特定参数;根据该特定参数获取部分HTML内容;输出获取的部分HTML内容。本公开还提供了一种用于重用HTML内容的系统,包括:接收单元,配置为接收HTTP请求;确定单元,配置为确定接收的HTTP请求存在指定请求部分HTML内容的特定参数;获取单元,配置为根据该特定参数获取部分HTML内容;输出单元,配置为输出获取的部分HTML内容。利用本公开的方法和系统能够在资源的提供方不提供公用的API的情况下对这些资源的重用成为可能。同时,由于不需要提供公用的API,资源的提供方也能够节省成本。

    文件切边方法、终端及服务器

    公开(公告)号:CN103150291B

    公开(公告)日:2015-09-09

    申请号:CN201310039296.3

    申请日:2013-01-31

    发明人: 仇睿恒

    IPC分类号: G06F17/21 G06F17/30

    摘要: 本发明公开了一种文件切边方法、终端及服务器,属于计算机技术领域,尤其涉及电子文件显示领域。所述方法包括:发送对应文件的文件标识,所述文件包括至少一个页面;接收根据所述文件标识反馈的切边数据包,所述切边数据包包括所述文件中至少一个页面的切边数据;根据所述切边数据包对所述文件进行切边。所述终端包括:第一发送模块、第一接收模块和切边模块。所述服务器包括:第三接收模块、第一检测模块和反馈模块。本发明解决了需要根据算法实时检测文件中每一个页面的切边区域,使得对文件的切边操作占用了大量的资源的问题,达到了提高文件的切边效率的效果。