-
公开(公告)号:CN208477524U
公开(公告)日:2019-02-05
申请号:CN201721901091.1
申请日:2017-12-29
申请人: 杭州世平信息科技有限公司
摘要: 一种图形化的案件梳理系统,包括能够将纸质版卷宗文字转换为可编辑电子版文字的输入模块;输入模块将案件信息输入图形化模块,图形化模块包括案件要素提取模块与图形化处理模块;图形化模块连接能够将图形化的案件要素信息进行显示的显示模块。所述的输入模块采用带有OCR识别功能的扫描仪或者扫描仪与OCR识别模块的组合装置。本实用新型通过图形化技术,将案件要素之间的关系可视化的展现出来,基于图形进行逻辑推理以及论证,辅助检察官、法官进行案件梳理、了解案情脉络,进而节约办案时间,提高办案效率,该系统适用于检察院、法院,具有非常广阔的应用前景。
-
公开(公告)号:CN118607579A
公开(公告)日:2024-09-06
申请号:CN202410761687.4
申请日:2024-06-13
申请人: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司
摘要: 本发明公开了一种基于大语言模型的机器学习算法改进方法及系统,其中方法包括:将分析提示与技术文档输入大语言模型,生成现有机器学习算法的分析结果;基于分析结果,利用大语言模型挖掘潜在的创新点;利用大语言模型通过使用元学习策略,生成新的机器学习算法;结合大语言模型与模型解释工具所述机器学习算法的特征贡献度;利用大语言模型生成模型融合策略,组合多个新生成的机器学习算法的预测结果;利用大语言模型自动生成特征工程策略,将生成的特征工程策略输入自动化特征工具进行特征提取;利用训练与验证数据集对最终的机器学习算法进行训练与评估。本发明通过利用大语言模型分析现有机器学习算法,提高机器学习算法的性能和准确度。
-
公开(公告)号:CN118606431A
公开(公告)日:2024-09-06
申请号:CN202410737853.7
申请日:2024-06-07
申请人: 广西电网有限责任公司
IPC分类号: G06F16/33 , G06F16/34 , G06F40/216 , G06F40/289 , G06F40/30 , G06N3/0442 , G06N3/084
摘要: 本发明公开了一种融合主题信息的电力数据推荐方法。该方法包括:利用LDA模型对电力文本以及检索文本进行学习,得到文档的主题分布,每个主题包含一组相关的词汇,将主题分布表示为固定长度的向量,每个维度对应一个主题;将LDA模型得到的主题向量嵌入BERT预训练语言模型,得到融合主题信息的增强文本表示;通过LSTM模型对输入的文本时序数据进行特征提取并预测下一个与主题相关的文本,返回与该主题文本相关的电力数据作为推荐数据;本发明融合了主题信息的电力数据推荐方法,相比于在社交媒体环境下的基于内容或协同过滤的传统推荐方法,不仅在应用场景下更贴近实际工作环境中面向主题的数据检索,而且对大规模数据的使用效率更高。
-
公开(公告)号:CN118586506A
公开(公告)日:2024-09-03
申请号:CN202410046485.1
申请日:2024-01-12
申请人: 浙江阿里巴巴机器人有限公司
IPC分类号: G06N5/045 , G06N5/04 , G06F40/295 , G06F40/205 , G06F40/30 , G06F16/35 , G06F16/34 , G06F40/58
摘要: 本说明书实施例提供文本处理方法、对话处理方法,其中所述文本处理方法包括:获取待分析文本;针对所述待分析文本创建解析指令文本;将所述待分析文本和所述解析指令文本输入文本分析模型,获得所述文本分析模型输出的文本分析结果,其中,所述文本分析结果为文本分析模型基于待分析文本中各文本语句对应的语句解释文本和所述解析指令文本生成,各文本语句对应的语句解释文本基于所述待分析文本生成。通过本说明书提供的方法,为各文本语句进行语句解释,获得语句解释信息,根据各文本语句的语句解释信息获得待分析文本的文本分析结果,提升了文本分析模型的处理精度和准确度。
-
公开(公告)号:CN112306820B
公开(公告)日:2024-09-03
申请号:CN202011345726.0
申请日:2020-11-26
申请人: 南京欣华软件技术有限公司
摘要: 本发明公开了一种日志运维根因分析方法、装置、电子设备及存储介质,属于日志运维技术领域。该方法通过对采集日志数据进行裁剪和过滤,去除部分干扰信息,再对错误的第二日志数据进行聚类,泛化第二日志数据;将经泛化的第二日志数据按照预定顺序构造回溯型树数据模型,遍历回溯型树的数据结构,计算每条链路的关联性熵,获取熵值最小的链路作为根因链熵;再利用知识库的方式生成根因结果的自然语言描述图谱;由于知识库本身就已经覆盖了90%以上已知的错误类型与错误链,因此在分析时的数据拟合更准确,同时分析结果可发现新的根因链,反哺了根因知识库,再根据回溯报告生成自然语言的预警进行数据反馈,极大提升了根因报告中的准确性。
-
公开(公告)号:CN118568256A
公开(公告)日:2024-08-30
申请号:CN202410578939.X
申请日:2024-05-10
申请人: 北京度友信息技术有限公司
IPC分类号: G06F16/35 , G06F18/214 , G06F40/295 , G06F16/34 , G06F16/332
摘要: 本公开提供一种大语言模型的文本分类性能的评测方法、装置,涉及大语言模型、自然语言处理、深度学习等人工智能技术领域。大语言模型的文本分类性能的评测方法包括:获取对应源评测任务的评测数据集、对应至少一个子评测任务的评测数据集;根据评测文本以及评测文本所对应的评测任务类型得到评测输入数据,将评测输入数据输入待评测大语言模型,将待评测大语言模型的输出结果作为评测文本对应不同评测任务类型的预测答案;根据评测文本对应相同评测任务类型的标注答案与预测答案,得到对应源评测任务的源评测结果、以及对应至少一个子评测任务的至少一个子评测结果;根据源评测结果与至少一个子评测结果,得到待评测大语言模型的文本分类性能。
-
公开(公告)号:CN118568252A
公开(公告)日:2024-08-30
申请号:CN202410446359.5
申请日:2024-04-15
申请人: 富途网络科技(深圳)有限公司
IPC分类号: G06F16/34 , G06F40/258 , G06F16/583 , G06N3/045
摘要: 本申请公开了一种摘要生成方法、装置、设备及介质,其中,方法包括:基于待分析公告文件的公告文件类型确定目标处理流程,其中,不同的公告文件类型对应不同的处理流程;基于目标处理流程对待分析公告文件进行文本提取,得到待分析公告文件对应的目标文本信息;判断目标文本信息的长度是否大于预设长度阈值;若是,根据目标文本信息获取待分析公告文件对应的初始摘要,调用第一预设摘要生成模型对初始摘要进行摘要生成,得到待分析公告文件对应的目标摘要;若否,调用第一预设摘要生成模型对目标文本信息进行摘要生成,得到待分析公告文件对应的目标摘要。本申请各实施例提供的技术方案,可起到提高用户获取公告文件信息的效率和体验的作用。
-
公开(公告)号:CN118551736A
公开(公告)日:2024-08-27
申请号:CN202410523337.4
申请日:2024-04-28
申请人: 远光软件股份有限公司
IPC分类号: G06F40/166 , G06N20/00 , G06F16/36 , G06F16/34
摘要: 本发明提供一种基于大语言模型和本地知识库的经营分析报告生成方法、计算机装置、介质及程序产品,其中,该方法包括以下步骤:获取数据资料的调用设置,调用设置包括从本地知识库获取和从外部的代理实体获取;获取报告分析要求和提纲生成指令;调用预设大语言模型,根据报告分析要求生成报告提纲;报告提纲包括多个章节概述;调用预设大语言模型,根据章节概述分步生成报告内容;基于报告内容输出报告文件。本发明不仅优化了内容生成过程,还提高了经营分析报告的生成效率和质量,从而为企业提供更高效、更准确、更专业的决策支持,以及降低人力成本,提高企业运营效率。
-
公开(公告)号:CN113761214B
公开(公告)日:2024-08-27
申请号:CN202010503615.1
申请日:2020-06-05
申请人: 智慧芽信息科技(苏州)有限公司
发明人: S·德斯潘德 , 庞卡·库玛 , 希夫尚卡尔·乌玛尚卡尔 , 马库斯·汉斯
IPC分类号: G06F16/36 , G06F16/34 , G06F40/211 , G06F40/279 , G06Q50/18
摘要: 本说明书实施例公开了一种信息流提取方法、装置及设备,所述方法包括获取目标实体信息;从数据源中提取所述目标实体信息对应的至少一个关联实体信息以及所述目标实体信息与关联实体信息之间的关联关系信息,所述关联关系信息包括对实体信息之间的关联方向以及关联类型进行描述的信息;利用所述关联关系信息对所述目标实体信息以及关联实体信息进行关联,获得所述目标实体信息所对应的信息流。利用本说明书各个实施例,可以大幅提高信息提取的准确性以及全面性。
-
公开(公告)号:CN118535722A
公开(公告)日:2024-08-23
申请号:CN202410490889.X
申请日:2024-04-23
申请人: 同方知网数字出版技术股份有限公司
摘要: 本申请公开了基于LDA主题模型的数据挖掘方法、装置、设备及介质,涉及数据分析技术领域,其中方法包括:通过对采集的文本信息进行时间切片处理,得到基于时序标签的文本集;利用训练得到的自适应LDA主题模型,确定所述文本集的主题—关键词分布矩阵;根据所述主题—关键词分布矩阵,利用主题归约算法生成针对每个主题的主题连通图;根据所述每个主题的主题连通图,确定所述每个主题的主题关键词。本申请适用于对前沿主题技术信息的准确挖掘。
-
-
-
-
-
-
-
-
-