基于LDA主题模型的文献分类方法和系统

    公开(公告)号:CN109492092B

    公开(公告)日:2020-07-17

    申请号:CN201811147398.6

    申请日:2018-09-29

    IPC分类号: G06F16/35

    摘要: 本发明公开了一种基于LDA主题模型的文献分类方法,包括以下步骤:步骤一、预编初始监督字典,初始监督字典里的词包括多个类,并且与LDA主题模型的主题一一对应;步骤二、获取待分类文献中的所有的词,并计算每个词属于每个主题的概率,获得聚类字典;步骤三、根据聚类字典组成新的监督字典;步骤四、查找每篇待分类文献所包含的新的监督字典中的词所对应的主题,将出现的词最多的主题作为该篇文献的主题,完成对待分类文献的分类。本发明还公开了一种基于LDA主题模型的文献分类系统。本发明的方法既保持了规则分类方法的准确性,又具有LDA的联想聚类能力,分类结果准确,工程量小。

    一种基于python深度学习算法的视觉识别方法

    公开(公告)号:CN112925507A

    公开(公告)日:2021-06-08

    申请号:CN202110196154.2

    申请日:2021-02-22

    摘要: 本发明公开一种基于python深度学习算法的视觉识别方法,后台使用python深度学习算法,构建神经网络,完成视觉识别任务;中间层使用c++加载python运行环境,通过dll打包的方式提供对于python的运行环境管理及调用接口;前台使用.net的界面框架,构建结果显示、配置管理界面,本发明首先是将图像识别与结果展示分离,可以针对业务变更灵活地调整识别程序或软件界面;同时,由于python神经网络进行图像识别,可以完成复杂的视觉识别任务,如瑕疵检测、喷码识别等;然后,由于使用c++的d l l动态链接库托管python代码,可以被.net内存式调用,避免了通信延时。最后,基于.net的界面框架,可以构建出美观易用的软件界面,大幅降低客户的学习和使用成本。

    基于知识图谱最短路径查询的搜索系统、方法及设备

    公开(公告)号:CN111611343A

    公开(公告)日:2020-09-01

    申请号:CN202010350391.5

    申请日:2020-04-28

    摘要: 本发明公开了一种基于知识图谱最短路径查询的搜索系统、方法及设备,该系统包括:应用层,接收用户的输入信息,并向用户展示搜索结果;加工层,根据实例同义词和概念同义词将输入信息划分为目标点和约束点,当目标点对应多个概念时,在概念图谱中分别求得约束点对应的概念节点到目标点对应的多个概念节点的最短路径,将最短路径最短的概念节点的概念作为目标节点的概念,在实例图谱中,根据目标节点的概念和实例名确定实例节点或根据最短路径从约束点对应的实例节点出发得到目标点对应的实例节点,将得到的实例节点作为搜索结果反馈给应用层;模型层,保存概念图谱、实例图谱、实例同义词、概念同义词;数据层,对原始数据进行管理。

    基于内容的大文本高阶语义张量化分类方法和系统

    公开(公告)号:CN107506415B

    公开(公告)日:2020-07-21

    申请号:CN201710687437.0

    申请日:2017-08-11

    摘要: 本发明公开了一种基于内容的大文本高阶语义张量化分类方法,包括:步骤一、构造类的DEC张量模型;步骤二、获取待分类的大文本中的部分文本,利用部分文本构建大文本的DEC张量,将其DEC张量和类的特征张量逻辑相乘,之后按照DEC的3个维度全部降维相加,得到大文本属于该类的强度,展示输出结果。本发明还公开了一种基于内容的大文本高阶语义张量化分类系统,包括:基础语料层,用于存储DEC张量模型要素和模型加工所需要的语料样本;DEC语义处理层,用于完成大文本的分词和DEC张量化,实现对张量模型的计算和调用;应用层,用于完成用户输入文本的接收和展示分类结果。本发明解决了计算资源不足和文本理解准确性之间矛盾。

    基于全文的大文本CRF和规则分类方法和系统

    公开(公告)号:CN107368610B

    公开(公告)日:2020-07-17

    申请号:CN201710685936.6

    申请日:2017-08-11

    IPC分类号: G06F16/35

    摘要: 本发明提供了一种基于全文的大文本CRF和规则分类方法和系统,是条件随机场和规则分类方法相结合,对大文本的全文进行分类。对输入大文本的标题部分采用基于语义的统计CRF分类方法;对大文本的正文部分采用基于规则的词袋分类方法;最后按照CRF分类结果为主规则分类结果为辅的方式对分类结果进行整合、去重、排序,输出语义层次和字符层次整合的最终分类结果。这种方法由于解决了标题的高度抽象性和正文的实体繁杂性之间的矛盾,实现了对文本不同视角的认识,满足了不同人群对大文本的个性化认识,具有全文分类整体准确度高的特点。

    一种利乐包流水线喷码信息采集设备

    公开(公告)号:CN111398173A

    公开(公告)日:2020-07-10

    申请号:CN202010374413.1

    申请日:2020-05-06

    IPC分类号: G01N21/01 G01N21/898

    摘要: 本发明提供了一种利乐包流水线喷码信息采集设备,包括:壳体、光电开关、相机和光源;所述壳体的下侧具有与利乐包流水线的形状相匹配的检测口,所述光电开关、相机和光源均连接在所述壳体中;所述光电开关位于所述利乐包流水线的侧方,所述相机和光源位于所述利乐包流水线的上方。本发明在利乐包流水线上设置了由光电开关、相机和光源组成的一套图像采集装置,光电开关用于检测利乐包流水线上是否有利乐包通过,相机用于在光电开关检测到利乐包流水线上有利乐包通过时给利乐包拍照,光源用于在相机拍照的时候进行光照,本装置能够实时反馈利乐包流水线上的利乐包喷码信息,且采集到的的信息为照片的形式,方便工人对生产进行实时监控。

    一种识别二维码的方法和装置

    公开(公告)号:CN112052702B

    公开(公告)日:2023-12-19

    申请号:CN202010793506.8

    申请日:2020-08-10

    IPC分类号: G06K7/14

    摘要: 本申请提出了一种识别二维码的方法和装置,该方法包括:获取包含待识别二维码的图像;从图像中检测出待识别二维码所在的区域;对待识别二维码所在的区域进行映射处理,获得中间二维码图像;对中间二维码图像进行重建,获得标准二维码图像;对标准二维码图像进行二维码识别,获得识别结果。本申请实施例通过从图像中检测出待识别二维码所在的区域,随后对待识别二维码所在的区域进行映射处理,获得中间二维码图像,随后对中间二维码图像进行重建,获得标准二维码图像,最后对重建得到的标准二维码图像进行信息读取即可,从而可以完成场景图像的复杂二维码的识别任务,分步骤可以保证中间产物的准确性,有利于把控总体识别准确率。