加快ES文件进行本地全文检索的方法、系统、装置及介质

    公开(公告)号:CN114168534A

    公开(公告)日:2022-03-11

    申请号:CN202111298880.1

    申请日:2021-11-04

    IPC分类号: G06F16/13 G06F16/16

    摘要: 本发明公开了一种加快ES文件进行本地全文检索的方法、系统、装置及介质,其中方法包括以下步骤:采用fsutil工具的文件记录读取功能对磁盘中文件夹的文件信息进行采集;将文件信息保存至预设的程序内存中,并命名为original;根据original获取磁盘中文件的全路径,对全路径进行处理,获得文件列表;根据文件列表将磁盘中的文件内容上传至Elasticsearch数据库中;输入需要检索的关键字,根据关键字和Elasticsearch数据库获得检索结果。本发明利用fsutil查看usn相关信息并初始化为内存文件路径映射Map,将本地文件路径全部找出并加以内容提取存入Elasticsearch数据库中,在Elasticsearch相关API进行全文检索时可直接检索;极大地提高数据上传的效率,可广泛应用于数据检索技术领域。

    检索和相似度分析一体化的方法、装置和存储介质

    公开(公告)号:CN111104488B

    公开(公告)日:2023-10-24

    申请号:CN201911392463.6

    申请日:2019-12-30

    IPC分类号: G06F16/33

    摘要: 本发明公开了检索和相似度分析一体化的方法、装置和存储介质,方法包括以下步骤:获取输入文本,并根据输入文本确定检索词;根据检索词,确定若干个匹配文档;根据匹配文档和输入文本,确定输入文本与每一匹配文档的相似度;根据匹配文档返回每一匹配文档的摘要文本。通过本发明根据输入文本确定检索词,利用检索词确定匹配文档,并返回匹配文档的摘要文本,即使输入文本包含大量的内容,也能够正常进行检索找到匹配文档,并返回摘要文本,不会出现崩溃的情况;同时能够根据匹配文档和输入文本,确定输入文本与匹配文档的相似度,在检索正常的情况下又支持相似度分析,便捷且用户体验好。本发明可广泛应用于数据处理领域。

    用于Lucene的检索逻辑算子的生成方法、设备及存储介质

    公开(公告)号:CN115599886A

    公开(公告)日:2023-01-13

    申请号:CN202211302049.3

    申请日:2022-10-24

    摘要: 本申请公开了一种用于Lucene的检索逻辑算子的生成方法,包括:获取多个关键词文本;响应于逻辑编辑操作,根据所述多个关键词文本的语义关系以及逻辑关系,确定所述检索逻辑算子中各逻辑节点的内容以及排布情况,所述检索逻辑算子中的逻辑节点包括根节点、分支节点以及叶子节点;响应于输入操作,将各逻辑节点的内容输入所述检索逻辑算子中对应的逻辑节点;响应于生成操作,根据所述检索逻辑算子中各逻辑节点的排布情况,生成所述检索逻辑算子。根据用户输入的关键词文本间存在的语义关系与逻辑关系即可生成一个树状逻辑网络,其中每个逻辑节点都包含有相应的内容,不同的逻辑节点间也具有相应的逻辑关系,能够满足用户更复杂的逻辑检索需求。

    基于算子组合运算的审计分析方法、系统、装置及介质

    公开(公告)号:CN114168613A

    公开(公告)日:2022-03-11

    申请号:CN202111299934.6

    申请日:2021-11-04

    摘要: 本发明公开了一种基于算子组合运算的审计分析方法、系统、装置及介,其中方法包括:获取审计数据库,对审计数据库中的历程资源进行可视化配置,获得历程资源算子;将历程资源算子移动至前端的画布界面,将预设封装好的历程运算算子移动至画布界面;采用有向线条将历程资源算子与历程运算算子进行连接,生成有向任务流程图;前端采用JSON协议将有向任务流程图封装成协议数据包;运算后台对协议数据包进行解析,采用执行引擎对解析后的协议数据包进行运算,将运算结果推送至前端界面。本发明将审计挖掘的SQL语句按照最小执行单元的原子封装成运算组件,简化SQL编写难度,提高复用性,可广泛应用于数据审计领域。

    检索和相似度分析一体化的方法、装置和存储介质

    公开(公告)号:CN111104488A

    公开(公告)日:2020-05-05

    申请号:CN201911392463.6

    申请日:2019-12-30

    IPC分类号: G06F16/33

    摘要: 本发明公开了检索和相似度分析一体化的方法、装置和存储介质,方法包括以下步骤:获取输入文本,并根据输入文本确定检索词;根据检索词,确定若干个匹配文档;根据匹配文档和输入文本,确定输入文本与每一匹配文档的相似度;根据匹配文档返回每一匹配文档的摘要文本。通过本发明根据输入文本确定检索词,利用检索词确定匹配文档,并返回匹配文档的摘要文本,即使输入文本包含大量的内容,也能够正常进行检索找到匹配文档,并返回摘要文本,不会出现崩溃的情况;同时能够根据匹配文档和输入文本,确定输入文本与匹配文档的相似度,在检索正常的情况下又支持相似度分析,便捷且用户体验好。本发明可广泛应用于数据处理领域。

    新闻情感预测方法、装置、电子设备及存储介质

    公开(公告)号:CN117493570A

    公开(公告)日:2024-02-02

    申请号:CN202311500108.2

    申请日:2023-11-10

    摘要: 本申请公开了一种新闻情感预测方法、装置、电子设备及存储介质,属于人工智能领域。方法包括:获取待处理的新闻文本;基于新闻文本,确定新闻文本中特征词的词结构权重和词频次特征;基于特征词的词结构权重和词频次特征,生成新闻文本的文本向量;基于文本向量,确定新闻文本的情感类型。新闻情感预测方法通过新闻文本自身的结构因素作为变量构建词结构权重,能够更加贴合和突出新闻文本特有的结构特征,不需要进行截取而损失部分内容特征,也不需要依赖外部词典的质量,能够支撑长篇幅的新闻的情感预测,有效地提高了新闻情感的预测精度。

    数据处理方法、计算机设备及存储介质

    公开(公告)号:CN117395051A

    公开(公告)日:2024-01-12

    申请号:CN202311397375.1

    申请日:2023-10-25

    IPC分类号: H04L9/40

    摘要: 本申请公开了一种数据处理方法,用于第一服务器,包括:在与客户端应用标识对应的凭证数据存在的情况下,根据请求报文、凭证数据、预设普通请求盐值以及第一随机数序列,确定响应加密报文;根据请求报文以及第一随机数序列,确定第一散列计算值;根据响应加密报文、第一散列计算值以及客户端应用标识,确定第一加密报文;向第二服务器发送加密报文,以实现向第二服务器发起业务处理请求。本申请通过对称加盐加密的方式降低了两侧服务器的计算量,提高了服务器间通信计算的整体效率,同时通过加入随机数序列的方式来弥补对称加密过程中密文相同明文即相同的弱点,保证了加密数据的安全性。