-
公开(公告)号:CN115640420A
公开(公告)日:2023-01-24
申请号:CN202211248534.7
申请日:2022-10-12
申请人: 广州广电运通信息科技有限公司 , 广州广电运通金融电子股份有限公司
IPC分类号: G06F16/683 , G06F16/61 , G10L15/16 , G10L15/18 , G10L15/26
摘要: 本申请公开了一种基于ES的音频信息索引库建立方法,包括:获取目标音频信息;根据所述目标音频信息以及预设的语音识别模型,确定与所述目标音频信息对应的响应文本信息,所述预设的语音识别模型用于将音频信息识别转换为文本信息;响应于保存操作,将所述目标音频信息以及所述响应文本信息进行保存,以建立所述音频信息索引库。本申请可以实现将目标音频信息识别转换为文本,并将目标音频信息以符合索引库格式要求的文件形态与文本共同存入索引库,在对多个目标音频信息重复进行上述步骤后得到一个音频信息索引库,以便于根据关键字文本信息直接检索出目标音频与文本,同时能够实现实际检索时文本和语音一并输出,为检索提供便利。
-
公开(公告)号:CN114168534A
公开(公告)日:2022-03-11
申请号:CN202111298880.1
申请日:2021-11-04
申请人: 广州广电运通信息科技有限公司 , 广州广电运通金融电子股份有限公司
摘要: 本发明公开了一种加快ES文件进行本地全文检索的方法、系统、装置及介质,其中方法包括以下步骤:采用fsutil工具的文件记录读取功能对磁盘中文件夹的文件信息进行采集;将文件信息保存至预设的程序内存中,并命名为original;根据original获取磁盘中文件的全路径,对全路径进行处理,获得文件列表;根据文件列表将磁盘中的文件内容上传至Elasticsearch数据库中;输入需要检索的关键字,根据关键字和Elasticsearch数据库获得检索结果。本发明利用fsutil查看usn相关信息并初始化为内存文件路径映射Map,将本地文件路径全部找出并加以内容提取存入Elasticsearch数据库中,在Elasticsearch相关API进行全文检索时可直接检索;极大地提高数据上传的效率,可广泛应用于数据检索技术领域。
-
公开(公告)号:CN111160024B
公开(公告)日:2023-08-15
申请号:CN201911392455.1
申请日:2019-12-30
申请人: 广州广电运通信息科技有限公司 , 广州广电运通金融电子股份有限公司
IPC分类号: G06F40/284
摘要: 本发明公开了一种基于统计的中文分词方法、系统、装置和存储介质,其中方法包括:获取目标文本;根据预置语料库对目标文本进行分词处理,识别出第一概率和第二概率;结合第一概率与第二概率对目标文本所含的词进行逆向匹配,输出若干个分词路径,各所述路径含若干个分词节点;结合维特比算法和预置比例因子对各所述分词路径上各分词节点的词进行逆向递归处理,获取最优分词序列;根据最优分词序列生成分词结果,从而提高中文分词处理的分词准确率,并通过预置比例因此降低计算量,降低成本。
-
公开(公告)号:CN111104488B
公开(公告)日:2023-10-24
申请号:CN201911392463.6
申请日:2019-12-30
申请人: 广州广电运通信息科技有限公司 , 广州广电运通金融电子股份有限公司
IPC分类号: G06F16/33
摘要: 本发明公开了检索和相似度分析一体化的方法、装置和存储介质,方法包括以下步骤:获取输入文本,并根据输入文本确定检索词;根据检索词,确定若干个匹配文档;根据匹配文档和输入文本,确定输入文本与每一匹配文档的相似度;根据匹配文档返回每一匹配文档的摘要文本。通过本发明根据输入文本确定检索词,利用检索词确定匹配文档,并返回匹配文档的摘要文本,即使输入文本包含大量的内容,也能够正常进行检索找到匹配文档,并返回摘要文本,不会出现崩溃的情况;同时能够根据匹配文档和输入文本,确定输入文本与匹配文档的相似度,在检索正常的情况下又支持相似度分析,便捷且用户体验好。本发明可广泛应用于数据处理领域。
-
公开(公告)号:CN111160024A
公开(公告)日:2020-05-15
申请号:CN201911392455.1
申请日:2019-12-30
申请人: 广州广电运通信息科技有限公司 , 广州广电运通金融电子股份有限公司
IPC分类号: G06F40/284
摘要: 本发明公开了一种基于统计的中文分词方法、系统、装置和存储介质,其中方法包括:获取目标文本;根据预置语料库对目标文本进行分词处理,识别出第一概率和第二概率;结合第一概率与第二概率对目标文本所含的词进行逆向匹配,输出若干个分词路径,各所述路径含若干个分词节点;结合维特比算法和预置比例因子对各所述分词路径上各分词节点的词进行逆向递归处理,获取最优分词序列;根据最优分词序列生成分词结果,从而提高中文分词处理的分词准确率,并通过预置比例因此降低计算量,降低成本。
-
公开(公告)号:CN115599886A
公开(公告)日:2023-01-13
申请号:CN202211302049.3
申请日:2022-10-24
IPC分类号: G06F16/33 , G06F40/289 , G06F40/30
摘要: 本申请公开了一种用于Lucene的检索逻辑算子的生成方法,包括:获取多个关键词文本;响应于逻辑编辑操作,根据所述多个关键词文本的语义关系以及逻辑关系,确定所述检索逻辑算子中各逻辑节点的内容以及排布情况,所述检索逻辑算子中的逻辑节点包括根节点、分支节点以及叶子节点;响应于输入操作,将各逻辑节点的内容输入所述检索逻辑算子中对应的逻辑节点;响应于生成操作,根据所述检索逻辑算子中各逻辑节点的排布情况,生成所述检索逻辑算子。根据用户输入的关键词文本间存在的语义关系与逻辑关系即可生成一个树状逻辑网络,其中每个逻辑节点都包含有相应的内容,不同的逻辑节点间也具有相应的逻辑关系,能够满足用户更复杂的逻辑检索需求。
-
公开(公告)号:CN114168613A
公开(公告)日:2022-03-11
申请号:CN202111299934.6
申请日:2021-11-04
申请人: 广州广电运通信息科技有限公司 , 广州广电运通金融电子股份有限公司
IPC分类号: G06F16/242 , G06F16/248 , G06Q40/00
摘要: 本发明公开了一种基于算子组合运算的审计分析方法、系统、装置及介,其中方法包括:获取审计数据库,对审计数据库中的历程资源进行可视化配置,获得历程资源算子;将历程资源算子移动至前端的画布界面,将预设封装好的历程运算算子移动至画布界面;采用有向线条将历程资源算子与历程运算算子进行连接,生成有向任务流程图;前端采用JSON协议将有向任务流程图封装成协议数据包;运算后台对协议数据包进行解析,采用执行引擎对解析后的协议数据包进行运算,将运算结果推送至前端界面。本发明将审计挖掘的SQL语句按照最小执行单元的原子封装成运算组件,简化SQL编写难度,提高复用性,可广泛应用于数据审计领域。
-
公开(公告)号:CN111104488A
公开(公告)日:2020-05-05
申请号:CN201911392463.6
申请日:2019-12-30
申请人: 广州广电运通信息科技有限公司 , 广州广电运通金融电子股份有限公司
IPC分类号: G06F16/33
摘要: 本发明公开了检索和相似度分析一体化的方法、装置和存储介质,方法包括以下步骤:获取输入文本,并根据输入文本确定检索词;根据检索词,确定若干个匹配文档;根据匹配文档和输入文本,确定输入文本与每一匹配文档的相似度;根据匹配文档返回每一匹配文档的摘要文本。通过本发明根据输入文本确定检索词,利用检索词确定匹配文档,并返回匹配文档的摘要文本,即使输入文本包含大量的内容,也能够正常进行检索找到匹配文档,并返回摘要文本,不会出现崩溃的情况;同时能够根据匹配文档和输入文本,确定输入文本与匹配文档的相似度,在检索正常的情况下又支持相似度分析,便捷且用户体验好。本发明可广泛应用于数据处理领域。
-
公开(公告)号:CN117493570A
公开(公告)日:2024-02-02
申请号:CN202311500108.2
申请日:2023-11-10
申请人: 广州广电运通信息科技有限公司
IPC分类号: G06F16/35 , G06F18/2411 , G06F40/216 , G06F40/289
摘要: 本申请公开了一种新闻情感预测方法、装置、电子设备及存储介质,属于人工智能领域。方法包括:获取待处理的新闻文本;基于新闻文本,确定新闻文本中特征词的词结构权重和词频次特征;基于特征词的词结构权重和词频次特征,生成新闻文本的文本向量;基于文本向量,确定新闻文本的情感类型。新闻情感预测方法通过新闻文本自身的结构因素作为变量构建词结构权重,能够更加贴合和突出新闻文本特有的结构特征,不需要进行截取而损失部分内容特征,也不需要依赖外部词典的质量,能够支撑长篇幅的新闻的情感预测,有效地提高了新闻情感的预测精度。
-
公开(公告)号:CN117395051A
公开(公告)日:2024-01-12
申请号:CN202311397375.1
申请日:2023-10-25
申请人: 广州广电运通信息科技有限公司
IPC分类号: H04L9/40
摘要: 本申请公开了一种数据处理方法,用于第一服务器,包括:在与客户端应用标识对应的凭证数据存在的情况下,根据请求报文、凭证数据、预设普通请求盐值以及第一随机数序列,确定响应加密报文;根据请求报文以及第一随机数序列,确定第一散列计算值;根据响应加密报文、第一散列计算值以及客户端应用标识,确定第一加密报文;向第二服务器发送加密报文,以实现向第二服务器发起业务处理请求。本申请通过对称加盐加密的方式降低了两侧服务器的计算量,提高了服务器间通信计算的整体效率,同时通过加入随机数序列的方式来弥补对称加密过程中密文相同明文即相同的弱点,保证了加密数据的安全性。
-
-
-
-
-
-
-
-
-