一种基于品牌分析系统的NLP中文分词歧义识别方法

    公开(公告)号:CN108664618A

    公开(公告)日:2018-10-16

    申请号:CN201810454166.9

    申请日:2018-05-14

    IPC分类号: G06F17/30 G06F17/27

    CPC分类号: G06F17/277

    摘要: 本发明公开了一种基于品牌分析系统的NLP中文分词歧义识别方法,包含以下步骤:步骤一:输入汉语语句,通过最大匹配算法检测中文语句中存在的交叉歧义,并放入交叉型歧义集合,若集合为空,表示输入语句中无交叉型歧义,不进行任何处理,直接返回,否则,遍历集合中的所有歧义,进入步骤二处理;步骤二:采用基于深度优先搜索的递归方法,对歧义进行路径全切分,得到所有路径的集合,遍历路径集合,对每条路径做步骤三处理;步骤三:根据给定的选择可能性计算数学模型,对歧义切分路径进行建模,进行歧义消解。本发明提高了品牌分析系统中伪歧义识别率与准确率,使得系统更加智能的识别理解文本,降低人工干预,提高分析系统工作效率。

    一种基于舆情平台的抽样分布式聚类方法

    公开(公告)号:CN106874367A

    公开(公告)日:2017-06-20

    申请号:CN201611260883.5

    申请日:2016-12-30

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30705

    摘要: 本发明提供了一种基于舆情平台的抽样分布式聚类方法,并包括如下步骤:一、获取待聚类数据,并对待聚类数据进行分片处理,得到多个分片;二、利用MapReduce中的Map函数对每一分片进行数据抽样;三、将得到的抽样数据汇总,并在MapReduce框架的Reduce过程中对汇总的抽样数据进行聚类;四、依次重复步骤二和步骤三合计进行r轮数据抽样,将每一轮的抽样数据的聚类结果记作基聚类,并得到Π={π1,π2,…,πr}的向量,其中,r为大于等于2的正整数,πi为第i轮的基聚类,1≤i≤r,且为正整数;五、再次使用MapReduce框架将基聚类集成为最终的聚类结果。所述基于舆情平台的抽样分布式聚类方法能够有效提高海量数据的聚类效率问题和在缩减数据规模的同时提高数据多样性。

    基于Spark集群的多数据源位置信息融合方法及系统

    公开(公告)号:CN106844546A

    公开(公告)日:2017-06-13

    申请号:CN201611260892.4

    申请日:2016-12-30

    IPC分类号: G06F17/30

    摘要: 本发明提供了一种基于Spark集群的多数据源位置信息融合方法,并包括如下步骤:通过接口接收海量位置信息数据,所述位置信息数据来源于省级运营商的信令采集系统以及互联网用户行为大数据平台;通过预处理程序将采集到的文本文件进行加密、清洗,剔除无效数据,处理后的数据实时放入Kafka中;通过Spark Streaming对实时的数据进行处理,包括对实时位置的计算、融合、统计、轨迹生成操作获得全量位置信息,并将处理后的所述全量位置信息存入到Redis数据库中;在所述Redis数据库中,按设定的周期对所述全量位置信息进行切片导出,将导出的数据存入到HDFS中,通过Spark SQL接口提供给上层应用调用查询历史数据。本发明还提供一种基于Spark集群的多数据源位置信息融合方法的系统。

    一种基于语义分析的导航系统及方法

    公开(公告)号:CN103644906A

    公开(公告)日:2014-03-19

    申请号:CN201310717125.1

    申请日:2013-12-23

    IPC分类号: G01C21/00

    CPC分类号: G01C21/36

    摘要: 本发明涉及一种基于语义分析的导航系统及方法。该系统包括移动通信终端、无线网络平台、地理位置数据库和导航系统;其中:所述的无线网络平台用于移动通信终端通过所述的导航系统对移动通信终端当前位置端进行自我定位,获取当前位置信息;所述的地理位置数据库用于存储地理位置数据;所述的导航系统用于实现通过通过获取移动通信终端中短信息的文字内容,同时对其进行语义分析,当分析出的数据域地理数据库中的数据匹配,自动提示用户是否发起位置导航的系统。,使用时,当移动通信终端收到的短信中涵盖类似于地理位置的文字时,软件就会主动分析出这个地理位置,从而提示用户是否需要启动导航。

    一种基于逻辑运算文件块的加解密方法及设备

    公开(公告)号:CN118573388A

    公开(公告)日:2024-08-30

    申请号:CN202410227119.6

    申请日:2024-02-29

    发明人: 张剑峰

    IPC分类号: H04L9/40 H04L9/08

    摘要: 本发明涉及一种基于逻辑运算文件块的加解密方法及设备,该方法包括加密过程和解密过程,所述的加密过程包括以下步骤:步骤S11,获取待加密的原文件,并从密钥管理模块获取第一密钥;步骤S12,根据文件保护等级需求确定第二密钥长度,并采用随机数算法生成第二密钥;步骤S13,利用第一密钥和第二密钥生成第二密钥的密文,并生成加密文件头;步骤S14,分批对原文件的数据块进行加密,得到加密文件;步骤S15,处理完原文件的所有数据块后,拼装加密文件头和加密文件,得到完整的加密文件。与现有技术相比,本发明具有快速加解密、密钥长度灵活,加解密既安全又快速、实现解密后原文件的准确性校验等优点。

    一种基于关键信息处理模型的智能应答系统和方法

    公开(公告)号:CN118283183A

    公开(公告)日:2024-07-02

    申请号:CN202410293809.1

    申请日:2024-03-14

    摘要: 本发明涉及一种基于关键信息处理模型的智能应答系统和方法,该系统包括第一语音网关、ASR模块、TTS模块、第二语音网关、业务平台、NLP引擎模块和口语化处理模块;所述第一语音网关、ASR模块、NLP引擎模块、口语化处理模块、TTS模块、第一语音网关和业务平台依次连接;所述NLP引擎模块包括大规模语言模型,所述NLP引擎模块用于提供基于大规模语言模型的应用,接收ASR模块识别出来的主叫用户的文本,并产生应答文本;所述口语化处理模块包括关键信息处理模型,接收NLP引擎模块的输出文本,经关键信息处理模型处理后输出口语化的应答文本。与现有技术相比,本发明具有提取关键信息的完整性、逻辑性和正确性,以及实现打电话场景的口语化应答等优点。

    基于通话的适老服务的方法、装置、电子设备及存储介质

    公开(公告)号:CN117880768A

    公开(公告)日:2024-04-12

    申请号:CN202311729738.7

    申请日:2023-12-15

    IPC分类号: H04W4/20 H04L67/12

    摘要: 本发明涉及一种基于通话的适老服务的方法、装置、电子设备及存储介质。基于通话的适老服务方法包括步骤:S1、为主叫电话建立分类标签,形成码号标签表;S2、将运营商签约使用适老服务的被叫电话,进行用户信息登记,并按照该用户所需的具体适老服务内容完成需求配置;S3、进行志愿者信息登记,形成人工服务池;S4、当主叫号码呼叫签约了适老服务的被叫号码时,使用经改进的Jaccard相似度算法生成众包分发路由,利用适老服务AS将经码号标签库识别的主叫电话转接到众包分发路由,通过众包分发路由读取用户信息表及需求配置、匹配人工服务池中的志愿者信息,进而从人工服务池中选择合适的志愿者队列,选择的志愿者电话,进行通话转接。

    语音自动化测试的方法、装置、电子设备及存储介质

    公开(公告)号:CN117877510A

    公开(公告)日:2024-04-12

    申请号:CN202311714221.0

    申请日:2023-12-14

    摘要: 本发明涉及一种语音自动化测试的方法、装置、电子设备及存储介质。语音自动化测试方法包括步骤:S1、语音信号采集与预处理,获取用户通话时的用户通话录音,对通话录音进行降噪处理,得到降噪后的语音信号;S2、音色识别,依次通过语音数据预处理、MFCC特征提取、音色模型训练,生成音色模型,从而实现音色识别;S3、场景识别,所述场景识别为场景进行分类,依次通过语音识别、语义识别、场景模型训练,生成场景模型,从而实现场景识别;S4、语音自动化测试调度,进行音色识别,利用场景识别进行场景分类,对输入的语音信号进行分类,根据分类结果触发相应的语音自动化测试用例及语音自动化测试脚本,语音自动化测试完成后生成测试结果。