-
公开(公告)号:CN118170916A
公开(公告)日:2024-06-11
申请号:CN202410360179.5
申请日:2024-03-27
申请人: 河南工程学院
IPC分类号: G06F16/35 , G06F40/211 , G06F40/242 , G06F40/253 , G06F40/268 , G06F40/284 , G06F40/30
摘要: 本发明涉及文本分类技术领域,具体涉及基于深度学习的新闻文本分类方法,该方法包括:获取各篇新闻文本中各词的词向量及词性标签,获取新闻文本各句子中各词的结构优先指数及语义核心度,结合结构优先指数及语义核心度得到各句子中各词的分类依仗性权重,获取各句子中各词的依存核心指数及文本语境匹配指数,获取各篇新闻文本的核心词典,获取核心词典中各词的综合文本语境匹配指数,根据综合文本语境匹配指数得到各篇新闻文本的全文语法特征向量,结合深度学习文本分类模型完成新闻文本分类。本发明旨在提高新闻文本分类的准确率与可靠性,实现基于深度学习的新闻文本的精确分类。
-
公开(公告)号:CN117993385A
公开(公告)日:2024-05-07
申请号:CN202410240214.X
申请日:2024-03-04
申请人: 国网江苏省电力有限公司淮安供电分公司 , 国网江苏省电力有限公司
IPC分类号: G06F40/289 , G06F40/216 , G06F40/268 , G06F40/242 , G06Q10/20 , G06Q50/06 , G06N20/00
摘要: 本发明公开了一种电力二次工作安全措施票文本向量化方法及相关装置,方法包括:获取目标二次工作安全措施票;利用预训练好的分词模型将目标二次工作安全措施票中的文本进行分词,得到分词结果;其中所述分词模型采用ELECTRA模型构建而成;基于所述分词结果,统计所有文本中出现的词汇的词频,并基于词频构建词汇表;其中所述词汇表表示为词汇的索引系统,每个词汇对应一个唯一的索引;利用预训练的词嵌入模型为词汇表中的每个词汇生成相应的词嵌入向量;其中所有词嵌入向量均为一个固定长度;基于构建的词汇表,将目标二次工作安全措施票中目标文本的每个词汇转换为对应的索引,并根据索引替换为相应的词嵌入向量,得到目标文本的向量序列。
-
公开(公告)号:CN117540747B
公开(公告)日:2024-04-16
申请号:CN202410028055.7
申请日:2024-01-09
申请人: 《全国新书目》杂志有限责任公司
IPC分类号: G06F40/295 , G06F40/268 , G06N3/0442 , G06N3/0455 , G06N3/084 , G06F40/30
摘要: 本发明涉及文本处理技术领域,具体涉及一种基于人工智能的图书出版智慧选题系统,所述系统包括:数据采集模块:获取各月的热点评论数据作为各月的文档集合;数据处理模块:选取文档集合中的实体词;根据文档集合中的实体词筛选得到候选词;根据候选词自身特征得到图书出版选题自身重要性;采用PageRank算法对各候选词进行迭代得到图书出版选题重要性;根据各候选词的选题重要性变化序列得到图书出版选题指数;选题推荐模块:根据候选词以及用户输入选题要求中的各实体词之间的相关性关系得到候选词的语义匹配选题指数序列,将序列中前r个候选词作为给用户选题推荐的关键词。本发明提高了用户选题需求的关键词推荐精准性。
-
公开(公告)号:CN113515939B
公开(公告)日:2024-04-16
申请号:CN202110459258.8
申请日:2021-04-27
申请人: 西安理工大学
IPC分类号: G06F40/289 , G06F40/216 , G06F40/242 , G06F40/268
摘要: 本发明公开了一种勘察报告文本关键信息提取系统,包括依次电信号连接的文本输入模块、文本预处理模块、TF‑IDF计算模块、文本信息改进模块、关键词输出模块以及查找定位关键信息模块。本发明的一种勘察报告文本关键信息提取系统,对现有TF‑IDF算法进行优化使其准确度大大提高,实现了勘察报告规范文本的关键信息自动输出。本发明还公开了一种勘察报告文本关键信息提取方法。
-
公开(公告)号:CN117852545A
公开(公告)日:2024-04-09
申请号:CN202410035833.5
申请日:2024-01-10
申请人: 南京邮电大学
IPC分类号: G06F40/295 , G06F40/268
摘要: 本发明公开了一种基于预训练语言模型的本体修正方法与系统,属于语义网中本体修正技术领域。首先将待修正本体与可靠本体中的公理翻译成自然语言句子,基于预训练模型计算句子的向量,根据向量和打分函数为待修正本体R‑MIPS中的公理进行打分,通过分批处理不可满足概念计算出一个修正方案。本发明根据本体修正的特征定义了四个基于预训练语言模型的打分函数,提出了一个基于预训练语言模型分批处理不可满足概念的本体修正方法,用户可以对本体修正方法中的参数进行个性化配置,有助于满足用户多样化的需求。
-
公开(公告)号:CN116205601B
公开(公告)日:2024-04-05
申请号:CN202310175513.5
申请日:2023-02-27
申请人: 开元数智工程咨询集团有限公司
IPC分类号: G06Q10/10 , G06Q50/08 , G06F16/2458 , G06F16/248 , G06F16/215 , G06F16/25 , G06F16/35 , G06F40/284 , G06F40/268 , G06V30/41 , G06V30/19 , G06V10/82
摘要: 本发明公开了一种基于互联网的工程清单复核及数据统计方法与系统,其中方法包括以下步骤:S1.数据获取:获取需要进行复核和统计的工程清单数据,并对工程清单数据进行初步清洗和预处理;S2.数据识别:基于自然语言处理和/或图像识别对工程清单中的文本和图片进行自动识别和提取;S3.数据匹配:基于数据匹配算法来比对工程清单中的文本或图片是否与实际情况一致,若不一致,则自动标记错误;S4.数据统计:对数据匹配的结果进行统计,统计出符合要求的数据并生成报表或图表展示。本发明通过AI算法对工程清单进行自动识别,并将识别结果与实际情况进行比对,从而实现自动复核和统计,本发明可提高工程清单复核和统计的效率和准确性。
-
公开(公告)号:CN117744621A
公开(公告)日:2024-03-22
申请号:CN202311862568.X
申请日:2023-12-29
申请人: 广州方硅信息技术有限公司
发明人: 彭伟湘
IPC分类号: G06F40/186 , G06F40/211 , G06F40/226 , G06F40/268 , G06F40/284 , G06F40/30 , G06F16/25 , G06F16/28 , G06F16/31
摘要: 本申请公开一种直播内容文案生成方法及其装置、设备、介质,包括:筛选出直播文案数据库中的优质直播内容文案,生成文案生成提示框架;将文案生成提示框架输入至文案生成评估模型中,驱动文案生成评估模型基于各所述优质直播内容文案,生成一个或多个新直播内容文案,并对新直播内容文案进行文案抽取,生成文案结构化数据存储至结构化数据库;从结构化数据库获取一个或多个直播类型的关键词模板与句式模板进行填充拼接,生成拼接直播内容文案;将各新直播内容文案与拼接直播内容文案输入至文案生成评估模型进行文案评估,通过文案评估的直播内容文案作为待投放直播内容文案。本申请为网络直播平台自动生成直播内容文案,提升平台的文案生成效率。
-
公开(公告)号:CN116795886B
公开(公告)日:2024-03-08
申请号:CN202310857319.5
申请日:2023-07-13
申请人: 杭州逍邦网络科技有限公司
IPC分类号: G06F16/2455 , G06F16/25 , G06F16/22 , G06F40/268 , G06F40/30
-
公开(公告)号:CN117592436A
公开(公告)日:2024-02-23
申请号:CN202311573040.0
申请日:2023-11-23
申请人: 知学云(北京)科技股份有限公司
IPC分类号: G06F40/166 , G06F40/126 , G06F40/151 , G06F40/186 , G06F40/284 , G06F40/289 , G06F40/268 , G06F40/295 , G06F40/30 , G06F40/211 , G06F16/35 , G06F16/31 , G06N3/044 , G06N3/047 , G06N3/084
摘要: 本发明涉及智能办公技术领域,具体为一种基于人工智能技术的自动化公文生成系统,包括:编号模块、自然语言处理模块、神经网络算法模块和公文输出模块;所述编号模块,构建不同类型的公文模板,对公文模板进行编号;在对公文模板进行编号时,采用首个大写字母对不同的类型的公文模板进行大类分类,并且采用字母后缀数字对同类型公文的进行小类分类,建立所有公文模板的编号,统一所有公文模板编号格式与编号字符长度;所述自然语言处理模块,存储有自然语言处理算法,对用户输出为自然语言进行处理,并转换成数字序列。本发明相较于传统人工对公文的处理,极大地提高了公文处理的工作效率,且公文中的错误率也有大幅降低。
-
公开(公告)号:CN116756272B
公开(公告)日:2024-02-23
申请号:CN202310741156.4
申请日:2023-06-20
申请人: 广州大学
IPC分类号: G06F16/33 , G06F40/211 , G06F40/253 , G06F40/268 , G06F40/289 , G06F40/30 , G06F40/242 , H04L9/40
摘要: 焦核心威胁信息。本说明书实施例提供了一种面向中文威胁报告的ATT&CK模型映射方法及装置,其中,该方法包括获取威胁报告文本,通过中文开源自然语言处理工具对威胁报告文本分析,并进行中文断句、中文分词、词性标注、依存句法分析以及语义角色标注;基于预设的语义角色标签与攻击向量维度的映射关系表,抽取威胁报告文本中符合攻击向量所对应的语义角色标签类型的文本片段,将文本片段拼接成一个新的文本代表攻击向量;将攻击向量输入至ATT&CK映射模型,获得对应的(56)对比文件罗叶妮.基于本体的网络安全资源库的构建技术研究《.中国优秀硕士学位论文全文数据库信息科技辑》.2022,(第1期),第I138-3715页.Clemente Izurieta等.LeveragingSecDevOps to Tackle the Technical DebtAssociated with Cybersecurity AttackTactics《.2019 IEEE/ACM InternationalConference on Technical Debt (TechDebt)》.2019,第33-37页.
-
-
-
-
-
-
-
-
-