-
公开(公告)号:CN104834686B
公开(公告)日:2018-12-28
申请号:CN201510184876.0
申请日:2015-04-17
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
Abstract: 本发明涉及一种基于混合语义矩阵的视频推荐方法,其步骤包括:1)对视频描述信息进行分词,根据词频提取关键词作为视频描述标签;2)通过Word2vec工具对包含所述视频描述标签在内的各视频标签进行向量化;3)采用熵化法得到各视频标签的权重,并构建具有权重的混合语义矩阵,通过所述混合语义矩阵表示视频与其标签之间的对应关系;4)根据所述混合语义矩阵,将视频的相似性计算转化为向量的相似度计算,实现对用户的个性化视频推荐。本发明在继承内容过滤推荐算法简单、高效的特点的同时,实现了智能特征提取和标签量化、权重分配,避免了这个过程中的专家参与,提高了视频推荐的准确率。
-
公开(公告)号:CN108090115A
公开(公告)日:2018-05-29
申请号:CN201711070628.9
申请日:2017-11-03
Applicant: 中国科学院信息工程研究所
CPC classification number: G06F17/30097 , G06F17/30153 , H04L67/02 , H04L67/06
Abstract: 本发明提出一种针对Gzip压缩数据的过滤方法,根据Gzip压缩数据的特点,并结合KR多模式匹配算法,提升Gzip压缩数据的过滤速度,同时提高处理的实时性和安全性。本发明还提出一种针对Gzip压缩数据的过滤系统,用于执行该方法。
-
公开(公告)号:CN107818149A
公开(公告)日:2018-03-20
申请号:CN201710992552.9
申请日:2017-10-23
Applicant: 中国科学院信息工程研究所
CPC classification number: G06F17/30958 , G06F17/30994 , G06T11/203
Abstract: 本发明涉及一种基于力导引算法的图数据可视化布局优化方法。该方法在力导引算法的循环迭代过程中增加以下处理步骤,以优化图数据可视化布局:在结点粘连的情况下,通过随机函数给出结点弹开的位置和结点弹开的方向,从而将粘连结点彼此分开一定的距离,使得结点粘连情况下的吸引力和排斥力能够计算。进一步地,本发明在力导引算法的位移计算中对参数delta值采用梯度设置,使得图数据可视化布局过程减少震荡并快速收敛。本发明能够解决基础力导引布局算法中存在的上述问题,在优化算法布局效果的同时,提升算法的布局效率。
-
公开(公告)号:CN104935963B
公开(公告)日:2018-03-16
申请号:CN201510290170.2
申请日:2015-05-29
Applicant: 中国科学院信息工程研究所
IPC: H04N21/258 , H04N21/466
Abstract: 本发明涉及一种基于时序数据挖掘的视频推荐方法。该方法包括:1)通过第三方数据分析用户对视频的兴趣梯度变化,并得到用户兴趣梯度曲线,将用户兴趣梯度曲线的奇异点作为用户兴趣迁移的时间点;2)确定用户最近的兴趣迁移时间点,对用户最近的兴趣迁移时间点以后的用户‑项目评分进行采集,从而建立选定时间窗口内的符合用户当前兴趣的用户‑项目评分矩阵;3)基于所述用户‑项目评分矩阵,通过使用随机游走模型进行用户的个性化视频推荐。本发明考虑了个性化视频推荐中的兴趣迁移问题,并融合了时间窗口方法和基于Random Walker的信任度模型进行个性化视频推荐,提高了视频推荐的准确性和效率。
-
公开(公告)号:CN107301167A
公开(公告)日:2017-10-27
申请号:CN201710378496.X
申请日:2017-05-25
Applicant: 中国科学院信息工程研究所
Abstract: 本发明提供一种功性能描述信息识别方法及装置,该方法步骤包括:1)将测试文本按句子切分,过滤句子中包含的噪音;2)根据功性能描述性句子词典对从步骤1)得到的句子进行关键字匹配,过滤无关句子,得到功性能描述性句子候选集合;3)对上述功性能描述性句子候选集合中的功性能描述性句子进行分词,查询词向量表得到句子的向量表示,再输入神经网络模型进行分类,得到句子的分类标签;4)根据上述句子的分类标签,结合句子位置信息,得到文本识别结果。本发明方法及装置能够实现对未知文本尤其是包含大量噪音的网络文本中功性能描述片段的大规模自动识别,从而解决面向情报挖掘的功性能描述信息识别问题。
-
公开(公告)号:CN106980858A
公开(公告)日:2017-07-25
申请号:CN201710112377.X
申请日:2017-02-28
Applicant: 中国科学院信息工程研究所
CPC classification number: G06K9/344 , G06K9/629 , G06K2209/01 , G06N3/02
Abstract: 本发明提供一种语言文本检测与定位系统及应用该系统的语言文本检测与定位方法,该系统包括:一特征提取网络,用于从待检测图像中提取底层的CNN特征,得到若干不同的特征图;至少三个区域建议网络,用于分别对上述不同的特征图进行二分类以及边界框回归,然后根据包含文本的特征图产生文本候选区域;一过渡区域,用于连接多个上述文本候选区域,并根据上述包含文本的特征图及文本候选区域产生区域卷积特征图;一文本检测网络,用于根据上述区域卷积特征图产生文本区域边界框偏置信息,并对上述偏置信息进行非极大值抑制以及非合理区域过滤操作,产生图像坐标空间的预测文本区域边界框坐标信息。
-
公开(公告)号:CN106469218A
公开(公告)日:2017-03-01
申请号:CN201610811459.9
申请日:2016-09-08
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
Abstract: 本发明公开了一种基于位图的布尔表达式存储、匹配方法和系统。本发明存储阶段:针对多个布尔表达式的各个子项,对其相应的布尔表达式序号和所在位置进行存储,并按照子项值的大小升序排序,同时记录每个布尔表达式子项数目;对子项值建立索引。匹配阶段:开辟数组位向量bitmap存储每个布尔表达式的匹配情况,将每个能匹配的布尔表达式所对应的位置置为1,判断bitmap中1的个数是否与其子项数目一致,若一致,则输出对应序号,并将bitmap[k]置为-1以防止重复匹配该布尔表达式,否则继续匹配下一文本项。本系统包括系统预处理部件、存储子项部件、构建索引部件、访问信息部件和返回信息部件。本发明大大提高了查询效率。
-
公开(公告)号:CN102855473B
公开(公告)日:2016-03-02
申请号:CN201210299415.4
申请日:2012-08-21
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于相似性度量的图像多目标检测方法,该方法具体步骤:步骤一:提取目标样本库中每幅图像的特征点,计算出每幅图像的BOF词袋向量,从而构成所述目标样本库的BOF向量集合;步骤二:利用目标样本库的BOF向量集合构建所述目标样本库的M-Tree索引;步骤三:将待检测图像在M-tree索引中进行多目标检测,并将检测果返回给用户;该方法利用BOF向量进行目标检测,具有很好的鲁棒性,对目标形变,遮挡,光照变化不敏感;可以一次检测多个目标,不需要重复检测,可以实现高效的在线多目标检测;该方法可广泛用于网络信息安全、图像多目标检测,视频多目标跟踪等多个领域。
-
公开(公告)号:CN104935963A
公开(公告)日:2015-09-23
申请号:CN201510290170.2
申请日:2015-05-29
Applicant: 中国科学院信息工程研究所
IPC: H04N21/258 , H04N21/466
CPC classification number: H04N21/25891 , H04N21/4667 , H04N21/4668
Abstract: 本发明涉及一种基于时序数据挖掘的视频推荐方法。该方法包括:1)通过第三方数据分析用户对视频的兴趣梯度变化,并得到用户兴趣梯度曲线,将用户兴趣梯度曲线的奇异点作为用户兴趣迁移的时间点;2)确定用户最近的兴趣迁移时间点,对用户最近的兴趣迁移时间点以后的用户-项目评分进行采集,从而建立选定时间窗口内的符合用户当前兴趣的用户-项目评分矩阵;3)基于所述用户-项目评分矩阵,通过使用随机游走模型进行用户的个性化视频推荐。本发明考虑了个性化视频推荐中的兴趣迁移问题,并融合了时间窗口方法和基于Random Walker的信任度模型进行个性化视频推荐,提高了视频推荐的准确性和效率。
-
公开(公告)号:CN104881439A
公开(公告)日:2015-09-02
申请号:CN201510236364.4
申请日:2015-05-11
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
Abstract: 本发明涉及一种空间高效的多模式串匹配方法和系统。首先提出了一种新的存储模式串的数据结构HashTrie,利用位向量表将原模式串矩阵存储为一维表的形式,避开传统方法存储自动机的状态转移矩阵问题;利用递归的哈希函数方法求出这个特殊的位向量表,以达到节约存储空间的目的;在哈希函数计算过程中,利用位运算技巧,将其转化为简单高效的位与运算操作;另外在HashTrie构造和关键词查找过程中均使用Rank技术,提高了搜索的空间效率和时间效率。本发明极大地降低了内存开销和预处理时间,更能满足实时入侵检测系统对规则生效的时效性要求,更适合于模式串集合规模较大、模式串长度较短的多模式串实时匹配问题。
-
-
-
-
-
-
-
-
-