提供翻译文的方法、装置以及程序

    公开(公告)号:CN107870900A

    公开(公告)日:2018-04-03

    申请号:CN201710669428.9

    申请日:2017-08-08

    IPC分类号: G06F17/28

    摘要: 本公开涉及提供翻译文的方法、装置以及程序。所述方法包括:经由用户终端,取得作为翻译对象的用第1语言记述的第1文;判定包括多个成对的用第1语言记述的文和用第2语言记述的对译文的数据库中是否包含有第1文;在判定为数据库中没有包含第1文的情况下,生成将构成第1文的一个以上的单词基于预定规则进行替换而得到的多个第2文;分别算出多个第2文与数据库所包含的用第1语言记述的多个文之间的句法的一致度;提取所算出的一致度在阈值以上的、包含于数据库的用第1语言记述的一个以上的第3文;使一个以上的第4文作为第1文的对译参照显示于用户终端,一个以上的第4文是一个以上的第3文在数据库中的用第2语言记述的对译文。

    一种对输入数据的控制方法和装置

    公开(公告)号:CN104504005A

    公开(公告)日:2015-04-08

    申请号:CN201410751711.2

    申请日:2012-03-31

    IPC分类号: G06F17/30 G06F17/28

    摘要: 本申请提供了一种对输入数据的控制方法和装置。所述方法包括:拦截键盘消息,所述键盘消息包含有第一语种消息;获取当前窗口中的焦点元素;依据预置的目标元素属性映射表,获得在焦点元素中进行输入的第二语种;依据预置的语种编码映射表,将所述键盘消息转换为按第二语种编码对应的键盘信息;输出所述按第二语种编码的键盘信息到所述焦点元素中。现有技术无法满足浏览器兼容的条件下实现对输入法的屏蔽,而本发明通过拦截键盘消息,并转换键盘输入从而有效解决了现有技术问题。

    用于多语言信息检索的系统、方法、软件和界面

    公开(公告)号:CN101099153A

    公开(公告)日:2008-01-02

    申请号:CN200680001792.8

    申请日:2006-01-04

    IPC分类号: G06F17/30

    摘要: 本发明人已经设计出了一种或多种新颖的方法、系统和界面用于帮助实现多语言搜索。一种示范方法需要为文档总集创建多个语言专有索引,每个索引包括来自文档的项的词干化和未词干化的版本。用户提交与一组一个或多个目标语言相关联的查询。查询处理需要使用产生一组可能的等价查询项的一种或多种技术将查询中的每个项的初始版本和词干化版本翻译成各个目标语言。然后使用传统的单语言搜索技术,例如布尔或自然语言查询,针对相应的语言专有索引处理每组可能的等价查询项以从该总集中识别出文档。得到的文档被按语言分组或按计算出的相关性呈现给用户。

    多语言信息检索与广告
    5.
    发明公开

    公开(公告)号:CN105378775A

    公开(公告)日:2016-03-02

    申请号:CN201480015243.0

    申请日:2014-03-14

    IPC分类号: G06Q30/02 G06F17/28

    CPC分类号: G06F16/3337

    摘要: 提供用于以与用于接收查询的语言不同的语言来获得和呈现搜索结果的系统、方法和计算机可读存储媒体。一旦以第一语言接收到搜索查询,则确定搜索查询所涉及的至少一种第二语言(或方言)并检索一个或多个搜索结果,这些搜索结果基于搜索查询并与至少一种第二语言(或方言)相关联。进一步,本发明的实施例涉及生成广告,其中广告包括至已被翻译成与目标市场相关联的一种或多种语言(或方言)的登录页面的嵌入链接。以这种方式,广告商能够更成功地向其主要语言或方言不同于网站和/或广告商的(主要)语言或方言的个人做广告。

    基于搜索引擎的文档索引方法、数据查询方法及服务器

    公开(公告)号:CN101963965B

    公开(公告)日:2013-03-20

    申请号:CN200910151487.2

    申请日:2009-07-23

    发明人: 魏磊 沈加翔

    IPC分类号: G06F17/30

    摘要: 本申请实施例公开了基于搜索引擎的文档索引方法、数据查询方法及服务器,所述文档索引方法包括:获取待索引的文档,并对所述文档进行分词操作得到一元分词;判断每个一元分词是否为过滤字,若所述一元分词是过滤字,将所述一元分词和与所述一元分词顺序相邻的至少一个一元分词组成多元分词,对所述多元分词建立索引;若所述一元分词不是过滤字,则直接对所述一元分词建立索引。本申请实施例中在进行索引或查询时,将作为高频字的一元分词与其相邻的至少一个一元分词组成多元分词,以保证不会因为对高频字进行索引而导致查询时浪费搜索引擎的资源,并且也不会因为跳过对高频字的索引而导致查询结果不准确。

    不同语言在大数据中实现实时搜索方法及系统

    公开(公告)号:CN106326350A

    公开(公告)日:2017-01-11

    申请号:CN201610643819.9

    申请日:2016-08-06

    申请人: 马岩

    发明人: 马岩

    IPC分类号: G06F17/30

    CPC分类号: G06F16/338 G06F16/3337

    摘要: 本发明提供了一种不同语言在大数据中实现实时搜索方法及系统,所述方法包括如下步骤:接收用户输入的关键词;依据该关键词查询出该关键词的翻译内容;依据关键词的翻译内容实现搜索得到搜索结果。本发明提供的技术方案具有用户体验度高的优点。

    用于多语言信息检索的系统、方法、软件和界面

    公开(公告)号:CN100492364C

    公开(公告)日:2009-05-27

    申请号:CN200680001792.8

    申请日:2006-01-04

    IPC分类号: G06F17/30

    摘要: 本发明人已经设计出了一种或多种新颖的方法、系统和界面用于帮助实现多语言搜索。一种示范方法需要为文档总集创建多个语言专有索引,每个索引包括来自文档的项的词干化和未词干化的版本。用户提交与一组一个或多个目标语言相关联的查询。查询处理需要使用产生一组可能的等价查询项的一种或多种技术将查询中的每个项的初始版本和词干化版本翻译成各个目标语言。然后使用传统的单语言搜索技术,例如布尔或自然语言查询,针对相应的语言专有索引处理每组可能的等价查询项以从该总集中识别出文档。得到的文档被按语言分组或按计算出的相关性呈现给用户。

    不同语言在大数据中实现实时搜索方法及系统

    公开(公告)号:CN106294643A

    公开(公告)日:2017-01-04

    申请号:CN201610628862.8

    申请日:2016-08-03

    申请人: 王晓光

    发明人: 王晓光

    IPC分类号: G06F17/30

    CPC分类号: G06F16/338 G06F16/3337

    摘要: 本发明提供了一种不同语言在大数据中实现实时搜索方法及系统,所述方法包括如下步骤:接收用户输入的关键词;依据该关键词查询出该关键词的翻译内容;依据关键词的翻译内容实现搜索得到搜索结果。本发明提供的技术方案具有用户体验度高的优点。

    网络文本处理方法及装置
    10.
    发明公开

    公开(公告)号:CN104346443A

    公开(公告)日:2015-02-11

    申请号:CN201410559608.8

    申请日:2014-10-20

    IPC分类号: G06F17/30 G06F17/27

    摘要: 本发明公开了一种网络文本处理方法及装置。该网络文本处理方法包括:获取网络发布的第一网络文本和第二网络文本;计算第一网络文本与第二网络文本的相似度;判断相似度是否大于预设阈值;如果相似度大于预设阈值,则确定第一网络文本与第二网络文本存在转载关系;以及如果相似度不大于预设阈值,则确定第一网络文本与第二网络文本不存在转载关系。通过本发明解决了相关技术中无法确定未标识转载来源的网络文本的转载关系的问题,进而达到了提高网络文本传播路径分析的准确性的效果。