一种文本处理方法、系统和一种用于文本处理的装置

    公开(公告)号:CN109284510A

    公开(公告)日:2019-01-29

    申请号:CN201710602815.0

    申请日:2017-07-21

    IPC分类号: G06F17/28

    CPC分类号: G06F17/289 G06F17/2809

    摘要: 本发明实施例提供了一种文本处理方法、系统和一种用于文本处理的装置,该方法包括:接收源文本,所述源文本具有多个源词;调用编码器将所述多个源词编码为多个向量;当解码第t个目标词时,根据编码状态、在解码所述第t个目标词时的解码状态、在解码所述第t个目标词之前的中心点中一个或多个信息确定局部注意力窗口的中心点;基于所述局部注意力窗口的中心点确定局部注意力窗口;调用解码器依据位于所述局部注意力窗口中源词,将所述向量解码出所述第t个目标词。通过综合考虑多种信息,提高了注意力的中心定位的准确率,从而提高了诸如翻译等业务处理的质量。

    建立语句编辑模型的方法、语句自动编辑方法及对应装置

    公开(公告)号:CN105975558B

    公开(公告)日:2018-08-10

    申请号:CN201610285425.0

    申请日:2016-04-29

    IPC分类号: G06F17/30

    摘要: 本发明提供了一种建立语句编辑模型的方法、语句自动编辑方法及对应装置,具体包括:从搜索日志中获取搜索关键词query以及query对应的被点击搜索结果的标题,构成query‑title对;将各query‑title对中的title作为待编辑语句,query作为对应的编辑后语句,构成训练语料;利用所述训练语料训练翻译模型和第一语言模型,得到包含所述翻译模型和第一语言模型的语句编辑模型。获取到待编辑语句后,将所述待编辑语句输入语句编辑模型,得到各候选编辑语句的编辑得分;选取编辑得分满足预设要求的候选编辑语句作为编辑后的语句。本发明能够实现语句的自动编辑,提高可读性,降低人力成本。

    通信控制方法、装置、计算机装置及计算机可读存储介质

    公开(公告)号:CN107783966A

    公开(公告)日:2018-03-09

    申请号:CN201711048031.4

    申请日:2017-10-31

    发明人: 胡交

    IPC分类号: G06F17/28

    摘要: 本发明提供一种通信控制方法,所述通信控制方法包括:采集终端在通话过程中通话联系人的第一语音数据,判断所述第一语音数据是否与所述终端用户的第二语音数据相匹配,若判断结果为否,则开启预设翻译应用,将采集到的所述第一语音数据通过所述预设翻译应用进行翻译,并获取与所述第一语音数据相应的文字,在所述终端的当前显示界面上显示所述文字。本发明还提供一种通信控制装置、计算机装置及计算机可读存储介质。本发明能够方便于语言不同的人在通话时的沟通。

    一种自动化管理词条的方法

    公开(公告)号:CN107748746A

    公开(公告)日:2018-03-02

    申请号:CN201711080344.8

    申请日:2017-11-06

    发明人: 罗晓燕

    IPC分类号: G06F17/28

    CPC分类号: G06F17/2809 G06F17/2872

    摘要: 本发明涉及软件开发领域,公开了一种自动化管理词条的方法,解决当前整理词条效率低和出错率高的问题。本发明每次编译生成apk时,连接词条服务器,遍历当前工程中的词条,如果该词条不存在于词条库中,则将该词条加入等待翻译,如果已经存在,将已翻译好的语种,写入到工程中。定期整理词条库,将需要翻译的词条整理成excel,发给翻译公司翻译。翻译公司返回已经翻译好的词条excel上传到词条服务器,词条管理系统自动写入词条库中,此后应用只需要重新编译下apk,最新的词条将自动更新到工程中。本发明适用于android系统开发。

    数据处理方法和存储介质

    公开(公告)号:CN107301172A

    公开(公告)日:2017-10-27

    申请号:CN201710481573.4

    申请日:2017-06-22

    申请人: 秦一男

    发明人: 秦一男

    IPC分类号: G06F17/28

    CPC分类号: G06F17/289 G06F17/2809

    摘要: 公开了一种数据处理方法和存储介质,通过获取与自然语言语句对应的字符序列或其标识,根据字符序列或其标识获取对应的至少两种转换信息,最后在人机交互界面上展示转换信息,由此,可以有效地展示自然语言对应的信息,提高展示效果,帮助使用者提高使用效率。

    一种确定双语语句对互译关系方法及系统

    公开(公告)号:CN106598959A

    公开(公告)日:2017-04-26

    申请号:CN201611207663.6

    申请日:2016-12-23

    发明人: 武英波

    IPC分类号: G06F17/28

    CPC分类号: G06F17/2809 G06F17/289

    摘要: 本发明公开一种确定双语语句对互译关系方法及系统,包括确定双语语句对的匹配特征值的步骤,再根据预先建立的训练分类模型,利用匹配特征值在互译关系中的权重对双语语句进行过滤分类,确定出该双语语句对是否为符合互译关系要求的双语语句对。这样本发明实施例所述确定双语语句对互译关系方法能够快速方便的处理数据量庞大的双语语料库。本发明利用训练分类模型的分类的思想将确定双语语句对互译关系问题转换为二元分类问题,使得双语语料库匹配特征的权值能够更加科学合理的确定,比现有经验的方法更具普适性,准确率和召回率也得到相应的提高。

    音译处理装置、程序、记录媒体及方法

    公开(公告)号:CN103140849A

    公开(公告)日:2013-06-05

    申请号:CN201280003171.9

    申请日:2012-02-28

    发明人: 萩原正人

    IPC分类号: G06F17/28

    CPC分类号: G06F17/2809 G06F17/2223

    摘要: 本发明的音译处理装置(100)包括生成部(105),所述生成部(105)生成包含多个为音译而由原片段经覆写为音译片段的覆写概率且与彼此不同的K个语言相对应的覆写表、及与K个语言相对应的音译表。而且,音译处理装置(100)包括更新部(107),所述更新部(107)在将以与所使用的覆写表相对应的语言为起源的原拼写字符串音译为目标拼写字符串的音译概率保存在与该语言相对应的音译表后,以使算出K个音译表的似然度的似然函数的期待值最大化的方式,更新K个覆写表。

    语言分析
    10.
    发明授权

    公开(公告)号:CN101595474B

    公开(公告)日:2012-07-11

    申请号:CN200780049161.8

    申请日:2007-12-21

    发明人: 约翰·鲍尔

    IPC分类号: G06F17/27 G06F17/28

    摘要: 本发明涉及语言分析。具体地,本发明包括操作计算机以执行语言分析的方法。在另一方面,本发明为执行该方法的计算机系统,并且在进一步方面,本发明为用于对计算机编程以执行该方法的软件。该方法包括以下步骤:将输入文本划分为词和句子。对于每个句子,将在句子中的短语与存储在数据库中的已知短语进行比较,如下:对于句子中的每个词,将词的涵义和跟随词的词的涵义与存储短语的词的涵义进行比较,以该词开始的最长存储短语开始,并且从最长至最短运行。如果找到对于两个或者多个连续词匹配,并且考虑在短语周围的词,则通过描述匹配短语的语法结构的代短语来标记匹配短语。在已经比较了倒数第二词之后,通过由其各代短语代替匹配短语来改写句子。然后,通过改写句子重复比较过程直到不存在进一步改写。