文本校对方法、装置、设备、介质及程序产品

    公开(公告)号:CN115204166A

    公开(公告)日:2022-10-18

    申请号:CN202210311657.4

    申请日:2022-03-28

    Abstract: 本申请公开了一种文本校对方法、装置、设备、介质及程序产品。该方法包括:对目标文本进行断句分词处理,获得至少一个目标单句、以及与该目标单句对应的初始分词序列;针对目标文本对应的每一个初始分词序列,至少根据两种预设词表校正规则进行校正处理,获得与每一初始分词序列对应的多个候选校正序列;至少根据两种概率模型,计算与各候选校正序列对应的置信值,根据置信值对候选校正序列进行筛选;根据置信值对多个筛选得到的候选校正序列进行融合处理,获得与初始分词序列对应的最优校正序列;根据目标单句在目标文本中的位置,组合各最优校正序列,获得校正文本。根据本申请实施例,本申请对文本进行校对的准确率高。

    一种地震新闻信息抽取方法及其系统

    公开(公告)号:CN113033201A

    公开(公告)日:2021-06-25

    申请号:CN202011231567.1

    申请日:2020-11-06

    Abstract: 本发明提供一种地震新闻信息抽取方法及其系统,方法包括:将实体库中的第一实体链接到新闻文本上,对链接有第一实体的新闻文本识别得到第二实体,并对识别后的新闻文本进行分句,以得到包括新闻原句的第二处理文本;对第二处理文本识别和分词后得到第二数字类社会属性新闻数组,转化得到第二数字类社会属性新闻数组中的阿拉伯数字,将元素、阿拉伯数字和新闻原句输出;根据第二处理文本的时间要素对新闻原句设置时刻信息,对新闻原句识别得到新闻原句中的第三实体和关系动词列表,根据优先级顺序获取关系动词列表中的关系动词,并将第三实体、关系动词、时刻信息和新闻原句输出。本发明的有益效果:实现了基于时间线形成全面的新闻事件脉络。

    基于注意力机制的事件抽取方法及系统

    公开(公告)号:CN112307761A

    公开(公告)日:2021-02-02

    申请号:CN202011301062.8

    申请日:2020-11-19

    Abstract: 本发明公开一种基于注意力机制的事件抽取方法及系统,其中抽取方法包括以下步骤:获取待处理文本及其事件类型,提取所述待处理文本中各字的向量,获得文本向量数据,提取所述事件类型中各字的向量,生成事件类型向量数据;将所述文本向量数据和所述事件类型向量数据输入预先构建的抽取词预测模型,获得所述待处理文本中每个字所对应的标签所形成的标签序列;基于所述标签序列对所述待处理文本进行事件抽取,获得相应的事件触发词和事件论元。本发明中通过引入事件类型,结合事件类型对应的特征数据对事件触发词和事件论元进行联合抽取,有效提升事件抽取的准召率。

    一种媒体画像生成方法和系统

    公开(公告)号:CN112199599A

    公开(公告)日:2021-01-08

    申请号:CN202011171680.5

    申请日:2020-10-28

    Abstract: 本发明公开了一种媒体画像生成方法和系统,所述方法包括如下步骤:监测目标媒体账号,获取目标媒体的推送数据;根据推送数据可选择地获取目标媒体的公共画像数据;可选择地建立至少一个目标媒体偏好画像分析模型,根据推送数据分析获取目标媒体偏好画像数据;根据公共画像数据、偏好画像数据建立可视化的媒体画像;本发明采用人工智能技术,根据媒体属性建立多个分析模型,根据分析模型生成媒体画像,通过大数据和人工智能可以给每个媒体提供多样化的标签,从而可以自动地在细分属性中体现媒体的画像内容,提高画像内容的解析深度,提高媒体画像的准确性和多样性。

    一种面向语音识别的抗噪音频传输的装置

    公开(公告)号:CN110931001A

    公开(公告)日:2020-03-27

    申请号:CN201910838418.2

    申请日:2019-09-05

    Abstract: 本发明公开了一种面向语音识别的抗噪音频传输的装置,将音源设备发生的扬声器信号Ss转变成能够被移动设备的TRRS接口识别的麦克风信号Sm。移动设备TRRS端接收驻极体麦克风产生的Sm信号需要使用其内置的放大电路对驻极体咪头进行驱动,因音讯盒子模块进行的工作是模拟麦克风信号,为了消除接收端的驱动电流对Ss的干扰,模块中使用2组有极电容C2、C1过滤掉来自驱动端的驱动电流。移动设备TRRS端会对接入的设备进行检测,以判断设备为TRS型或TRRS型,并且部分移动设备会对接入设备进行阻抗匹配。其实现方式结构简单、使用方便灵活,使原本只能通过手机放置在音箱旁边录音的方式具备抗噪传输的功能。

    基于用户生成内容的新闻认证预警方法及系统

    公开(公告)号:CN104636408B

    公开(公告)日:2017-08-08

    申请号:CN201410414956.6

    申请日:2014-08-21

    Abstract: 本发明公开了一种基于用户生成内容的新闻认证预警方法及系统,其中该方法包括,通过对新闻线索进行语义扩展,获得参考数据,将该参考数据进行定向采集,获取该新闻线索相关的信息内容、传输模式、用户群体、用户群体的行为信息和属性信息等,对信息内容进行语义知识提取,将该语义知识进行进行聚类和相似度计算,识别与历史新闻线索数据库不匹配的新闻线索,并从语义知识对比、用户群体、传播模式和信息内容等方面对其进行可信度评估。最终形成UGC新闻真实性的分级度量和预警,为该新闻是否为真实信息提供决策支持。

    一种基于微博平台的事件舆情信息提取方法及系统

    公开(公告)号:CN104615627A

    公开(公告)日:2015-05-13

    申请号:CN201410490602.X

    申请日:2014-09-23

    CPC classification number: G06F17/2765

    Abstract: 本发明涉及舆情事件提取技术,本发明公开了一种基于微博平台的事件舆情信息提取方法及系统,该方法包括:获取所述事件的关键词、起始时间、截止时间,并根据所述微博平台搜索服务的链接格式,构造待采样页面的页面链接;根据所述页面链接进行微博采样,生成样本微博,根据所述样本微博,计算所述事件的事件热度,并根据所述事件热度计算微博抓取周期;根据所述微博抓取周期,结合所述页面链接,获取与所述事件相关的微博页面。提取所述微博页面的微博信息,以完成提取所述事件的所述舆情信息。本发明获取事件舆情信息更全面而高效,能采集到实时的舆情信息。

Patent Agency Ranking