基于深度学习的新闻文本分类方法

    公开(公告)号:CN118170916A

    公开(公告)日:2024-06-11

    申请号:CN202410360179.5

    申请日:2024-03-27

    摘要: 本发明涉及文本分类技术领域,具体涉及基于深度学习的新闻文本分类方法,该方法包括:获取各篇新闻文本中各词的词向量及词性标签,获取新闻文本各句子中各词的结构优先指数及语义核心度,结合结构优先指数及语义核心度得到各句子中各词的分类依仗性权重,获取各句子中各词的依存核心指数及文本语境匹配指数,获取各篇新闻文本的核心词典,获取核心词典中各词的综合文本语境匹配指数,根据综合文本语境匹配指数得到各篇新闻文本的全文语法特征向量,结合深度学习文本分类模型完成新闻文本分类。本发明旨在提高新闻文本分类的准确率与可靠性,实现基于深度学习的新闻文本的精确分类。

    一种基于人工智能的图书出版智慧选题系统

    公开(公告)号:CN117540747B

    公开(公告)日:2024-04-16

    申请号:CN202410028055.7

    申请日:2024-01-09

    摘要: 本发明涉及文本处理技术领域,具体涉及一种基于人工智能的图书出版智慧选题系统,所述系统包括:数据采集模块:获取各月的热点评论数据作为各月的文档集合;数据处理模块:选取文档集合中的实体词;根据文档集合中的实体词筛选得到候选词;根据候选词自身特征得到图书出版选题自身重要性;采用PageRank算法对各候选词进行迭代得到图书出版选题重要性;根据各候选词的选题重要性变化序列得到图书出版选题指数;选题推荐模块:根据候选词以及用户输入选题要求中的各实体词之间的相关性关系得到候选词的语义匹配选题指数序列,将序列中前r个候选词作为给用户选题推荐的关键词。本发明提高了用户选题需求的关键词推荐精准性。

    一种基于预训练语言模型的本体修正方法与系统

    公开(公告)号:CN117852545A

    公开(公告)日:2024-04-09

    申请号:CN202410035833.5

    申请日:2024-01-10

    发明人: 季秋 黄思颖

    IPC分类号: G06F40/295 G06F40/268

    摘要: 本发明公开了一种基于预训练语言模型的本体修正方法与系统,属于语义网中本体修正技术领域。首先将待修正本体与可靠本体中的公理翻译成自然语言句子,基于预训练模型计算句子的向量,根据向量和打分函数为待修正本体R‑MIPS中的公理进行打分,通过分批处理不可满足概念计算出一个修正方案。本发明根据本体修正的特征定义了四个基于预训练语言模型的打分函数,提出了一个基于预训练语言模型分批处理不可满足概念的本体修正方法,用户可以对本体修正方法中的参数进行个性化配置,有助于满足用户多样化的需求。

    基于互联网的工程清单复核及数据统计方法与系统

    公开(公告)号:CN116205601B

    公开(公告)日:2024-04-05

    申请号:CN202310175513.5

    申请日:2023-02-27

    发明人: 潘敏 杨溪 徐润

    摘要: 本发明公开了一种基于互联网的工程清单复核及数据统计方法与系统,其中方法包括以下步骤:S1.数据获取:获取需要进行复核和统计的工程清单数据,并对工程清单数据进行初步清洗和预处理;S2.数据识别:基于自然语言处理和/或图像识别对工程清单中的文本和图片进行自动识别和提取;S3.数据匹配:基于数据匹配算法来比对工程清单中的文本或图片是否与实际情况一致,若不一致,则自动标记错误;S4.数据统计:对数据匹配的结果进行统计,统计出符合要求的数据并生成报表或图表展示。本发明通过AI算法对工程清单进行自动识别,并将识别结果与实际情况进行比对,从而实现自动复核和统计,本发明可提高工程清单复核和统计的效率和准确性。

    直播内容文案生成方法及其装置、设备、介质

    公开(公告)号:CN117744621A

    公开(公告)日:2024-03-22

    申请号:CN202311862568.X

    申请日:2023-12-29

    发明人: 彭伟湘

    摘要: 本申请公开一种直播内容文案生成方法及其装置、设备、介质,包括:筛选出直播文案数据库中的优质直播内容文案,生成文案生成提示框架;将文案生成提示框架输入至文案生成评估模型中,驱动文案生成评估模型基于各所述优质直播内容文案,生成一个或多个新直播内容文案,并对新直播内容文案进行文案抽取,生成文案结构化数据存储至结构化数据库;从结构化数据库获取一个或多个直播类型的关键词模板与句式模板进行填充拼接,生成拼接直播内容文案;将各新直播内容文案与拼接直播内容文案输入至文案生成评估模型进行文案评估,通过文案评估的直播内容文案作为待投放直播内容文案。本申请为网络直播平台自动生成直播内容文案,提升平台的文案生成效率。

    面向中文威胁报告的ATT&CK模型映射方法及装置

    公开(公告)号:CN116756272B

    公开(公告)日:2024-02-23

    申请号:CN202310741156.4

    申请日:2023-06-20

    申请人: 广州大学

    摘要: 焦核心威胁信息。本说明书实施例提供了一种面向中文威胁报告的ATT&CK模型映射方法及装置,其中,该方法包括获取威胁报告文本,通过中文开源自然语言处理工具对威胁报告文本分析,并进行中文断句、中文分词、词性标注、依存句法分析以及语义角色标注;基于预设的语义角色标签与攻击向量维度的映射关系表,抽取威胁报告文本中符合攻击向量所对应的语义角色标签类型的文本片段,将文本片段拼接成一个新的文本代表攻击向量;将攻击向量输入至ATT&CK映射模型,获得对应的(56)对比文件罗叶妮.基于本体的网络安全资源库的构建技术研究《.中国优秀硕士学位论文全文数据库信息科技辑》.2022,(第1期),第I138-3715页.Clemente Izurieta等.LeveragingSecDevOps to Tackle the Technical DebtAssociated with Cybersecurity AttackTactics《.2019 IEEE/ACM InternationalConference on Technical Debt (TechDebt)》.2019,第33-37页.