基于CLIP编码器的轻量级多模态图像描述生成方法

    公开(公告)号:CN118069877A

    公开(公告)日:2024-05-24

    申请号:CN202410299938.1

    申请日:2024-03-15

    发明人: 黄文明 陈冀楚

    IPC分类号: G06F16/58 G06N20/00

    摘要: 本发明公开了一种基于CLIP编码器的轻量级多模态图像描述生成方法,首先对图像数据进行预处理,生成图像特征向量;其次利用语言生成模型;最后生成所需的图像描述模型。该方法通过对已有描述进行扩充和合成,以生成更加准确和多样的描述。该方法采用了一种混合多模态模型,在图像特征生成阶段,引入了先进的CLIP编码器,该编码器能够将图像和文本嵌入空间进行对比学习,产生更具语义丰富性的特征表示。本发明提供了一种简单、轻便且高效的多模态文本生成技术,为解决多模态任务中的挑战提供了有力的解决方案。本发明方法有望推动多模态文本生成领域的发展,为实际应用提供更先进的解决方案。

    基于ConvNext-yolov7的建筑工地环境检测方法

    公开(公告)号:CN116342553A

    公开(公告)日:2023-06-27

    申请号:CN202310330005.X

    申请日:2023-03-30

    摘要: 本发明公开了一种基于ConvNext‑yolov7的建筑工地环境检测方法,包括如下步骤:1)采集建筑工地环境数据集:2)在YOLOv7网络中嵌入ConvNext结构,得到ConvNext‑yolov7网络模型,经过该网络模型将建筑工地中,不同特征的物体每一种的相对得分高的特征图和对应的权重打包成权重文件;3)通过权重对图像进行特征图分割,采用模糊均值聚类算法对X个特征对象生成图像特征初始聚类中心,再将初始聚类中心点传入K‑means算法,最后生成预测框;4)输出建筑工地环境检测结果。本发明方法可以识别多种不同的建筑工地内环境特征并且加以标注,修改过的网络模型提高了检测精度,相比于同类型的检测技术,其检测速度、精度均有进步,检测错误率大幅降低。

    一种契合用户兴趣变化的协同处理方法及系统

    公开(公告)号:CN107368519A

    公开(公告)日:2017-11-21

    申请号:CN201710414491.8

    申请日:2017-06-05

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30867

    摘要: 本发明涉及一种契合用户兴趣变化的协同处理方法及系统,其中方法包括:采集用户数据,并构建项目显式主题向量,得到目标项目的近邻列表,对构建用户兴趣主题向量,根据用户对项目的行为时间信息更新用户对项目评分,得到目标用户的近邻列表,由目标用户的近邻列表和目标项目的近邻列表,得到目标用户及其近邻用户对目标项目的项目列表,对目标用户及其近邻用户对目标项目的项目列表进行平均值计算,得到目标用户对目标项目的预测评分,将所述预测评分作为推荐结果;本发明考虑了用户行为的时序性对其兴趣的影响,解决了现有技术中存在的概念漂移问题,基于更新后的用户兴趣向量和用户画像,对项目进行评分预测,对数据具有更好的抗稀疏性。

    一种文本情感分析处理方法和系统

    公开(公告)号:CN107247702A

    公开(公告)日:2017-10-13

    申请号:CN201710313628.0

    申请日:2017-05-05

    IPC分类号: G06F17/27 G06N3/04

    摘要: 本发明涉及一种文本情感分析处理方法和系统,方法包括:将文本进行分词处理;将文本分词进行词向量训练,得到二进制文件;从二进制文件中提取情感特征词组,并从中获取句法特征信息、情感特征信息;将句法特征信息和情感特征信息进行特征融合,得到含有句法及情感信息的文本特征;将二进制文件中的词向量与情感特征信息进行融合,得到含有情感信息的词向量;对词向量进行提取,得到含有情感信息的语义特征;将含有句法及情感信息的文本特征与含有情感信息的语义特征进行融合,从而得到文本的语法信息、语义信息、句法信息和情感信息。本发明解决了现有技术中提取的特征无法同时包含语义信息、句法信息和情感信息的问题,得到的结果准确性较高。

    一种基于深度学习的文本自动生成方法

    公开(公告)号:CN108197294B

    公开(公告)日:2021-10-22

    申请号:CN201810058680.0

    申请日:2018-01-22

    摘要: 本发明公开了一种基于深度学习的文本自动生成方法,包括获得文本生成模型和调用文本生成模型两个阶段。第一阶段包括数据预处理;深度学习算法模型构建;训练深度学习模型;获得文本生成模型。第二阶段包括:接受用户输入的文本;提取用户输入文本的特征信息;调用文本生成模型;生成与用户输入文本的特征信息相匹配的文本。第一阶段采用深度学习算法模型,使得训练过程更加自动化,免去了过多的人工干预,训练过程采用一系列训练策略,使得文本生成模型生成的文本可读性更强。第二阶段,对用户输入信息进行分类,识别用户意图,跟据用户的意图生成出用户想要的文本。本发明方法实现相对简单,应用性强,尤其在文章生成方面将会有很大的应用。

    基于CHI和分类别关联规则算法的短文本分类方法

    公开(公告)号:CN106202518B

    公开(公告)日:2019-07-30

    申请号:CN201610583443.7

    申请日:2016-07-22

    IPC分类号: G06F16/35

    摘要: 本发明一种基于CHI和分类别关联规则算法的短文本分类方法,将不同类别文本的频繁词集出现频繁度进行了度量,引入了类别频繁因子(LFF),通过LFF合理分配了各文本类别的最小支持度阈值,克服了传统的FP‑Growth算法挖掘出的频繁词集类别出现偏斜的情况,同时在对频繁词集进行类别倾向判断上,采取了CHI检验算法去衡量特征词与类别之间的关联程度,而非采取简单的词语频率统计去衡量,避免了人工设参和实验确定最佳参数的步骤,增强了分类系统的可控制性。同时还提出了基于Hadoop/MapReduce大数据计算平台的并行特征扩展短文本分类算法,对类别频繁因子的计算和特征扩展方法进行了MapReduce并行化设计,提升了短文本分类准确率以及分类效率,提高了系统的可控性。

    一种基于项集熵的数据挖掘方法

    公开(公告)号:CN106802936A

    公开(公告)日:2017-06-06

    申请号:CN201611247714.8

    申请日:2016-12-29

    IPC分类号: G06F17/30

    CPC分类号: G06F16/2465 G06F2216/03

    摘要: 本发明涉及一种基于项集熵的数据挖掘方法,包括以下步骤:对采集的数据进行预处理,转化为同纬度的事务数据集存放到数据库;检索数据库,获取单项集和多项集的支持度;根据项集熵计算单项集的权值,根据单项集的权值计算单项集的加权支持度;去除加权支持度不满足支持度阈值的单项集,得到加权频繁1项集;根据单项集权值计算多项集的权值,根据多项集的权值计算多项集的加权支持度;去除加权支持度不满足支持度阈值的多项集,得到加权频繁多项集;根据满足置信度阈值的加权频繁项集的加权支持度和置信度得到改进关联规则。本发明引入了项集熵的概念对关联规则进行改进,提升了关联规则进行数据挖掘时的精度。

    基于CHI和分类别关联规则算法的短文本分类方法

    公开(公告)号:CN106202518A

    公开(公告)日:2016-12-07

    申请号:CN201610583443.7

    申请日:2016-07-22

    IPC分类号: G06F17/30

    CPC分类号: G06F16/35

    摘要: 本发明一种基于CHI和分类别关联规则算法的短文本分类方法,将不同类别文本的频繁词集出现频繁度进行了度量,引入了类别频繁因子LFF),通过LFF合理分配了各文本类别的最小支持度阈值,克服了传统的FP-Growth算法挖掘出的频繁词集类别出现偏斜的情况,同时在对频繁词集进行类别倾向判断上,采取了CHI检验算法去衡量特征词与类别之间的关联程度,而非采取简单的词语频率统计去衡量,避免了人工设参和实验确定最佳参数的步骤,增强了分类系统的可控制性。同时还提出了基于Hadoop/MapReduce大数据计算平台的并行特征扩展短文本分类算法,对类别频繁因子的计算和特征扩展方法进行了MapReduce并行化设计,提升了短文本分类准确率以及分类效率,提高了系统的可控性。

    基于对比注意力机制的中文摘要生成方法

    公开(公告)号:CN116402047A

    公开(公告)日:2023-07-07

    申请号:CN202310330003.0

    申请日:2023-03-30

    摘要: 本发明公开了基于对比注意力机制的中文摘要生成方法,包括了训练生成模型和使用生成模型两个阶段。第一个阶段包括数据的预处理,生成模型的构建,训练生成模型,获得生成模型。第二个阶段包括接收用户的数据,调用摘要生成模型生成摘要。第一阶段采用对比注意力机制训练模型,提高了模型的泛化能力和可解释性,提升了生成摘要的质量,可以用于生成多样化的摘要。第二阶段,接收用户的数据,再调用训练好的生成模型,生成可读性高的摘要。本发明可以提高摘要生成的性能,使得生成的摘要更加符合人类语言习惯,更具有可用性和实用性。

    基于对比学习的中文文本摘要生成方法

    公开(公告)号:CN115795026A

    公开(公告)日:2023-03-14

    申请号:CN202211585154.2

    申请日:2022-12-09

    发明人: 黄文明 周耀威

    IPC分类号: G06F16/34 G06F18/214

    摘要: 本发明公开了一种基于对比学习的中文文本摘要生成方法,包括获得摘要生成和评估模型,以及调用模型生成摘要两个阶段。第一阶段包括数据预处理;构建摘要生成模型;构建摘要评估模型;训练摘要生成模型;训练摘要评估模型。第二阶段包括:接受用户输入的文本;调用摘要生成模型生成候选摘要;调用摘要评估模型生成最终摘要。第一阶段分别基于最大似然估计来训练摘要生成模型以及基于对比学习来训练摘要评估模型。第二阶段,对于用户输入的文本,首先经过摘要生成模型生成候选摘要,再通过摘要评估模型生成最终摘要。本发明方法实现相对简单,应用性强,尤其在自动报告生成等方面将会有很大的应用。