-
公开(公告)号:CN118690021A
公开(公告)日:2024-09-24
申请号:CN202410997259.1
申请日:2024-07-24
申请人: 北京睿企信息科技有限公司 , 上海清月人工智能科技有限公司 , 日照睿安信息科技有限公司 , 南通睿企科技有限公司
摘要: 本发明涉及电数字数据处理技术领域,特别是涉及一种基于文本标签的文本清洗方法。所述方法包括:获取待清洗的文本集cle;获取cle中第ra个待清洗的文本clera对应的提示词prora,prora包括思维链示例文本modra和待推理文本ansra;将prora输入经训练的大语言模型,以由经训练的大语言模型判断labra是否为clera的标签;根据经训练的大语言模型对labra是否为clera的标签的判断结果判断是否将clera清洗掉。本发明实现了对文本对应的标签是否正确的自动判断,进而完成了对文本集的清洗任务。
-
公开(公告)号:CN118689956A
公开(公告)日:2024-09-24
申请号:CN202410997382.3
申请日:2024-07-24
申请人: 北京睿企信息科技有限公司 , 上海清月人工智能科技有限公司 , 日照睿安信息科技有限公司 , 南通睿企科技有限公司
摘要: 本发明涉及电数字数据处理技术领域,特别是涉及一种基于大语言模型的文本清洗方法、设备及存储介质。所述方法包括:获取待清洗的文本集cle;将第ra个待清洗的文本clera输入到经训练的第一模型,获取clera的一级标签lab1ra;根据lab1ra在预设的思维链示例文本库bas中进行匹配,获取与lab1ra匹配的num个思维链示例文本modra;根据modra、clera和clera的二级标签lab2ra构建clera对应的提示词prora;将prora输入经训练的大语言模型,并根据经训练的大语言模型的输出判断是否将clera清洗掉。本发明能够提高大语言模型判断文本的标签是否存在错误的准确性。
-
公开(公告)号:CN112765250B
公开(公告)日:2024-05-28
申请号:CN202110063490.X
申请日:2021-01-18
申请人: 北京睿企信息科技有限公司 , 日照睿安信息科技有限公司
IPC分类号: G06F16/25 , G06F16/23 , G06F40/151
摘要: 本发明公开了一种支持json数据转化为关系型数据库数据的方法和装置,方法步骤包括:录入需要的数据和数据库信息,验证数据库信息正确性,对录入数据进行分页,数据校验,将数据转化为数据库标识对应的对象,插入数据,失败数据日志收集,装置包括数据库连接器模块、数据分页装置模块、数据库表结构读取装置模块以及数据库表结构转换对象装置模块。本发明实现了对json数据进行解析,并和目前表结构的字段对比,并录入的功能。
-
公开(公告)号:CN112749222B
公开(公告)日:2024-03-19
申请号:CN202110065021.1
申请日:2021-01-18
申请人: 北京睿企信息科技有限公司 , 日照睿安信息科技有限公司
IPC分类号: G06F16/25 , G06F16/2455 , G06F16/248
摘要: 本发明公开了一种支持动态参数的关系型数据库查询方法和装置,包括对新增的数据源进行注册,配置对应的相关信息;进行动态查询传入用户想要的动态参数;程序将配置好的数据源参数与查询语句参数进行结果查询;记录查询时间并将结果落入数据库;用户查询数据会保存到一个固定数据地址供可视化预览。本发明通过对动态参数对配置查询条件进行动态目标数据库查询,将服务功能模块化、参数化以及流程可视化,进而达到在工作和生产过程中使用该功能,能够极大的提升工作效率,且整体流程可视化、标准化以及易于版本管理,降低了用户使用的门槛和处理数据的复杂程度,提供了在任何环境和任何数据库下都能完成动态的数据查询。
-
公开(公告)号:CN117579692B
公开(公告)日:2024-03-15
申请号:CN202410057416.0
申请日:2024-01-16
申请人: 北京睿企信息科技有限公司 , 上海清月人工智能科技有限公司 , 日照睿安信息科技有限公司
IPC分类号: H04L67/55
摘要: 本申请涉及数据监控与处理技术领域,特别是涉及一种用于信息推送的数据处理系统,所述系统包括:存储有初始终端标识集的第一存储介质、处理器和存储有计算机程序的存储器,计算机程序被处理器执行时,实现以下步骤:当接收到关键信息推送请求时,获取每一初始终端的初始活跃度和未处理信息文本数量,并确定出第一目标终端,在第一目标终端存在第一信息文本时,获取所有第一信息文本权重和关键信息文本权重,并将对应第一信息文本权重大于关键信息权重的第一信息文本推送至第一目标终端。可知,本发明通过对比未被响应的信息文本和新信息文本权重,实现了权重高的未响应信息文本的重复推送,避免信息被用户忽略。
-
公开(公告)号:CN117539869B
公开(公告)日:2024-03-15
申请号:CN202410022480.5
申请日:2024-01-08
申请人: 北京睿企信息科技有限公司 , 日照睿安信息科技有限公司
IPC分类号: G06F16/22 , G06F16/2453 , G06F16/2458
摘要: 本申请涉及数据表分析技术领域,特别是涉及一种获取数据表的数据处理系统,所述系统包括:存储有初始事件数据表列表集和初始事件数据表集对应的初始事件数据表名称列表集的第一存储介质、处理器和存储有计算机程序的存储器,当所述计算机程序被处理器执行时,实现以下步骤:从初始事件数据表集中确定出主事件数据表集和每一主事件数据表对应的副事件数据表集,将初始事件数据表中目标字段名对应的任一初始字段值和与该初始字段值对应的初始事件数据表进行关联。本发明使得用户在点击该初始字段值时能够快速查询到与其对应的副事件数据表,进而获取到副事件数据表中的各种数据,便于用户对副事件数据表中的数据分析。
-
公开(公告)号:CN117332768B
公开(公告)日:2024-03-08
申请号:CN202311308051.6
申请日:2023-10-10
申请人: 北京睿企信息科技有限公司 , 日照睿安信息科技有限公司
IPC分类号: G06F40/186 , G06F40/284 , G06F16/33 , G06F16/338
-
公开(公告)号:CN117312624B
公开(公告)日:2024-02-20
申请号:CN202311617663.3
申请日:2023-11-30
申请人: 北京睿企信息科技有限公司 , 日照睿安信息科技有限公司
IPC分类号: G06F16/903 , G06F16/901
摘要: 本发明涉及数据处理技术领域,提供了一种获取目标数据列表的数据处理系统,包括:初始字符串列表、处理器和存储有计算机程序的存储器,当计算机程序被处理器执行时,实现如下步骤:根据初始字符串列表,获取第一字符串集;按照第一处理方法,同时对第一字符串集中所有的第一字符串列表中的第一字符进行处理,获取目标数据列表;可知本发明能够根据初始字符串列表,获取第一字符串列表,同时对第一字符串列表中的第一字符进行处理,获取目标数据,能够实现对字符串进行并行处理并且无需训练字符串解析模型,无论什么格式的字符串,都能够获取到目标数据,因此,本发明有利于提高获取目标数据的精准度,且能够避免资源浪费,提高系统的运行效率。
-
公开(公告)号:CN117113092B
公开(公告)日:2024-01-23
申请号:CN202311381995.6
申请日:2023-10-24
申请人: 北京睿企信息科技有限公司 , 日照睿安信息科技有限公司
IPC分类号: G06F18/214 , G06F18/22 , G06F16/332 , G06F16/35
摘要: 本发明提供了一种基于问答任务模型进行问题扩充的方法及存储介质,涉及问答任务领域,所述方法包括如下步骤:获取样本问题库和每一样本问题对应的目标原则列表,基于任一样本问题进行扩充,获取第一问题,若第一问题和样本问题的相似度≥预设相似度阈值,将该样本问题对应的目标原则列表作为第一问题对应的目标原则列表;若第一问题和该样本问题的相似度<预设相似度阈值,计算第一问题和样本问题库中所有样本问题的相似度,将最大的相似度对应的样本问题对应的目标原则列表作为第一问题对应的目标原则列表,使得问答任务模型在扩充时能够输出相对高质量的扩充问题。
-
公开(公告)号:CN117371435A
公开(公告)日:2024-01-09
申请号:CN202311300631.0
申请日:2023-10-09
申请人: 北京睿企信息科技有限公司 , 日照睿安信息科技有限公司
IPC分类号: G06F40/284 , G06F40/216
摘要: 本发明提供了一种获取热度发生波动的热词的数据处理系统,包括:目标文本对应的关键特征词列表、预设热度波动特征词列表、处理器和存储有计算机程序的存储器,当计算机程序被处理器执行时,实现如下步骤:获取第一特征相似度,当第一特征相似度不大于第一相似度阈值时,获取预设周期列表,根据目标关键词和预设周期列表获取第一关键词列表,将第一关键词作为第一字符串并删除第一字符串中的空格字符,以获取第二字符串,对第二字符串的长度进行对比,确定热度发生波动的热词,可知,本发明能够获取热度发生微小波动的热词,能够满足用户的需求,有利于提高在此需求下获取热词的精准度,使用户能够更深入的了解到事件的细节。
-
-
-
-
-
-
-
-
-