-
公开(公告)号:CN109543023B
公开(公告)日:2020-09-08
申请号:CN201811147380.6
申请日:2018-09-29
IPC分类号: G06F16/335 , G06F16/35 , G06F16/9032
摘要: 本发明公开了一种基于trie和LCS算法的文献分类方法,包括以下步骤:步骤一、预编初始分类字典和初始排除字典;步骤二、将初始分类字典中的每一个字符串扩展得到扩展字符串,根据初始排除字典对得到的扩展字符串过滤后构建字典树;步骤三、调用字典树查找待分类文献中的每一个句子中出现的所有的字符串,取其中含有的属于初始分类字典中的最长的字符串作为最长公共子序列,最长公共子序列及其对应的类作为该一个句子的最终字符串及最终类,将一篇文献中出现频率最多的最终类作为其所属的类。本发明还公开了一种基于trie和LCS算法的文献分类系统。本发明省略了分词过程,以稳定的字符串为特征,准确度高,降低了对上下文的依赖。
-
公开(公告)号:CN109543023A
公开(公告)日:2019-03-29
申请号:CN201811147380.6
申请日:2018-09-29
IPC分类号: G06F16/335 , G06F16/35 , G06F16/9032
摘要: 本发明公开了一种基于trie和LCS算法的文献分类方法,包括以下步骤:步骤一、预编初始分类字典和初始排除字典;步骤二、将初始分类字典中的每一个字符串扩展得到扩展字符串,根据初始排除字典对得到的扩展字符串过滤后构建字典树;步骤三、调用字典树查找待分类文献中的每一个句子中出现的所有的字符串,取其中含有的属于初始分类字典中的最长的字符串作为最长公共子序列,最长公共子序列及其对应的类作为该一个句子的最终字符串及最终类,将一篇文献中出现频率最多的最终类作为其所属的类。本发明还公开了一种基于trie和LCS算法的文献分类系统。本发明省略了分词过程,以稳定的字符串为特征,准确度高,降低了对上下文的依赖。
-
公开(公告)号:CN109492092B
公开(公告)日:2020-07-17
申请号:CN201811147398.6
申请日:2018-09-29
申请人: 北京智通云联科技有限公司
IPC分类号: G06F16/35
摘要: 本发明公开了一种基于LDA主题模型的文献分类方法,包括以下步骤:步骤一、预编初始监督字典,初始监督字典里的词包括多个类,并且与LDA主题模型的主题一一对应;步骤二、获取待分类文献中的所有的词,并计算每个词属于每个主题的概率,获得聚类字典;步骤三、根据聚类字典组成新的监督字典;步骤四、查找每篇待分类文献所包含的新的监督字典中的词所对应的主题,将出现的词最多的主题作为该篇文献的主题,完成对待分类文献的分类。本发明还公开了一种基于LDA主题模型的文献分类系统。本发明的方法既保持了规则分类方法的准确性,又具有LDA的联想聚类能力,分类结果准确,工程量小。
-
公开(公告)号:CN112925507A
公开(公告)日:2021-06-08
申请号:CN202110196154.2
申请日:2021-02-22
申请人: 北京智通云联科技有限公司
摘要: 本发明公开一种基于python深度学习算法的视觉识别方法,后台使用python深度学习算法,构建神经网络,完成视觉识别任务;中间层使用c++加载python运行环境,通过dll打包的方式提供对于python的运行环境管理及调用接口;前台使用.net的界面框架,构建结果显示、配置管理界面,本发明首先是将图像识别与结果展示分离,可以针对业务变更灵活地调整识别程序或软件界面;同时,由于python神经网络进行图像识别,可以完成复杂的视觉识别任务,如瑕疵检测、喷码识别等;然后,由于使用c++的d l l动态链接库托管python代码,可以被.net内存式调用,避免了通信延时。最后,基于.net的界面框架,可以构建出美观易用的软件界面,大幅降低客户的学习和使用成本。
-
公开(公告)号:CN113673223A
公开(公告)日:2021-11-19
申请号:CN202110981460.7
申请日:2021-08-25
申请人: 北京智通云联科技有限公司
IPC分类号: G06F40/211 , G06F40/289 , G06F16/33 , G06F40/30 , G06K9/62
摘要: 本发明公开了一种基于语义相似性的关键词抽取方法和系统,所述方法包括:将文本进行分句,根据领域分词字典对每个句子进行分词;将进行所述分词后的词语和词语所在句子进行向量化;计算向量化后的词语和词语所在句子的相似性,提取出候选关键词;利用聚类算法将所述候选关键词进行聚类,获取所述候选关键词主题模型;对每个主题模型中的候选关键词进行排序,获取最终关键词结果。采用本方法可以使分词更准确,使提取到的文章关键词能够更好的反应文章的主题。
-
公开(公告)号:CN111611343A
公开(公告)日:2020-09-01
申请号:CN202010350391.5
申请日:2020-04-28
申请人: 北京智通云联科技有限公司
IPC分类号: G06F16/33 , G06F16/338 , G06F16/36 , G06F40/247 , G06F40/30
摘要: 本发明公开了一种基于知识图谱最短路径查询的搜索系统、方法及设备,该系统包括:应用层,接收用户的输入信息,并向用户展示搜索结果;加工层,根据实例同义词和概念同义词将输入信息划分为目标点和约束点,当目标点对应多个概念时,在概念图谱中分别求得约束点对应的概念节点到目标点对应的多个概念节点的最短路径,将最短路径最短的概念节点的概念作为目标节点的概念,在实例图谱中,根据目标节点的概念和实例名确定实例节点或根据最短路径从约束点对应的实例节点出发得到目标点对应的实例节点,将得到的实例节点作为搜索结果反馈给应用层;模型层,保存概念图谱、实例图谱、实例同义词、概念同义词;数据层,对原始数据进行管理。
-
公开(公告)号:CN107506415B
公开(公告)日:2020-07-21
申请号:CN201710687437.0
申请日:2017-08-11
申请人: 北京智通云联科技有限公司
IPC分类号: G06F16/35 , G06F40/30 , G06F40/284
摘要: 本发明公开了一种基于内容的大文本高阶语义张量化分类方法,包括:步骤一、构造类的DEC张量模型;步骤二、获取待分类的大文本中的部分文本,利用部分文本构建大文本的DEC张量,将其DEC张量和类的特征张量逻辑相乘,之后按照DEC的3个维度全部降维相加,得到大文本属于该类的强度,展示输出结果。本发明还公开了一种基于内容的大文本高阶语义张量化分类系统,包括:基础语料层,用于存储DEC张量模型要素和模型加工所需要的语料样本;DEC语义处理层,用于完成大文本的分词和DEC张量化,实现对张量模型的计算和调用;应用层,用于完成用户输入文本的接收和展示分类结果。本发明解决了计算资源不足和文本理解准确性之间矛盾。
-
公开(公告)号:CN107368610B
公开(公告)日:2020-07-17
申请号:CN201710685936.6
申请日:2017-08-11
申请人: 北京智通云联科技有限公司
IPC分类号: G06F16/35
摘要: 本发明提供了一种基于全文的大文本CRF和规则分类方法和系统,是条件随机场和规则分类方法相结合,对大文本的全文进行分类。对输入大文本的标题部分采用基于语义的统计CRF分类方法;对大文本的正文部分采用基于规则的词袋分类方法;最后按照CRF分类结果为主规则分类结果为辅的方式对分类结果进行整合、去重、排序,输出语义层次和字符层次整合的最终分类结果。这种方法由于解决了标题的高度抽象性和正文的实体繁杂性之间的矛盾,实现了对文本不同视角的认识,满足了不同人群对大文本的个性化认识,具有全文分类整体准确度高的特点。
-
公开(公告)号:CN111398173A
公开(公告)日:2020-07-10
申请号:CN202010374413.1
申请日:2020-05-06
申请人: 北京智通云联科技有限公司
IPC分类号: G01N21/01 , G01N21/898
摘要: 本发明提供了一种利乐包流水线喷码信息采集设备,包括:壳体、光电开关、相机和光源;所述壳体的下侧具有与利乐包流水线的形状相匹配的检测口,所述光电开关、相机和光源均连接在所述壳体中;所述光电开关位于所述利乐包流水线的侧方,所述相机和光源位于所述利乐包流水线的上方。本发明在利乐包流水线上设置了由光电开关、相机和光源组成的一套图像采集装置,光电开关用于检测利乐包流水线上是否有利乐包通过,相机用于在光电开关检测到利乐包流水线上有利乐包通过时给利乐包拍照,光源用于在相机拍照的时候进行光照,本装置能够实时反馈利乐包流水线上的利乐包喷码信息,且采集到的的信息为照片的形式,方便工人对生产进行实时监控。
-
公开(公告)号:CN112052702B
公开(公告)日:2023-12-19
申请号:CN202010793506.8
申请日:2020-08-10
申请人: 北京智通云联科技有限公司
IPC分类号: G06K7/14
摘要: 本申请提出了一种识别二维码的方法和装置,该方法包括:获取包含待识别二维码的图像;从图像中检测出待识别二维码所在的区域;对待识别二维码所在的区域进行映射处理,获得中间二维码图像;对中间二维码图像进行重建,获得标准二维码图像;对标准二维码图像进行二维码识别,获得识别结果。本申请实施例通过从图像中检测出待识别二维码所在的区域,随后对待识别二维码所在的区域进行映射处理,获得中间二维码图像,随后对中间二维码图像进行重建,获得标准二维码图像,最后对重建得到的标准二维码图像进行信息读取即可,从而可以完成场景图像的复杂二维码的识别任务,分步骤可以保证中间产物的准确性,有利于把控总体识别准确率。
-
-
-
-
-
-
-
-
-