一种主题网络爬虫系统的构建方法

    公开(公告)号:CN102073730B

    公开(公告)日:2012-09-26

    申请号:CN201110007710.3

    申请日:2011-01-14

    IPC分类号: G06F17/30

    摘要: 本发明提供的是一种主题网络爬虫系统的构建方法。(1)定义主题初始描述向量,设定相关度初始阀值、初始化URL队列;(2)从初始URL队列中依次获取URL进行爬取;(3)对URL进行文本分析;(4)对URL进行链接分析;(5)计算URL与主题的相关度;(6)将相关度大于相关度阈值的URL加入有序的URL队列,URL依照与主题向量的相关度高低排序,依次爬取,直至队列为空,对于每个爬到的网页,提取其中的子URL,返回到步骤(3);(7)使用遗传算法进行遗传算法最优化;(8)Rocchio反馈模块对主题向量更新,并动态调整相关度阈值,继续爬取网页。本发明不需要事先准备大量的训练文本,速度快,适合处理海量的在线网页数据。

    一种主题网络爬虫系统的构建方法

    公开(公告)号:CN102073730A

    公开(公告)日:2011-05-25

    申请号:CN201110007710.3

    申请日:2011-01-14

    IPC分类号: G06F17/30

    摘要: 本发明提供的是一种主题网络爬虫系统的构建方法。(1)定义主题初始描述向量,设定相关度初始阀值、初始化URL队列;(2)从初始URL队列中依次获取URL进行爬取;(3)对URL进行文本分析;(4)对URL进行链接分析;(5)计算URL与主题的相关度;(6)将相关度大于相关度阈值的URL加入有序的URL队列,URL依照与主题向量的相关度高低排序,依次爬取,直至队列为空,对于每个爬到的网页,提取其中的子URL,返回到步骤(3);(7)使用遗传算法进行遗传算法最优化;(8)Rocchio反馈模块对主题向量更新,并动态调整相关度阈值,继续爬取网页。本发明不需要事先准备大量的训练文本,速度快,适合处理海量的在线网页数据。

    一种基于EM聚类的水下多目标轨迹关联方法

    公开(公告)号:CN110849372B

    公开(公告)日:2023-02-14

    申请号:CN201911188834.9

    申请日:2019-11-28

    IPC分类号: G01C21/20 G01V9/00

    摘要: 本发明提供的是一种基于EM聚类的水下多目标轨迹关联方法。对数据进行预处理;通过引入信息熵来构建构建轨迹质量分级模型,在轨迹关联的时候,把质量好的点当做中心优先进行轨迹关联匹配;通过轨迹间拓扑信息建立高斯混合模型同时将质量好的点当做质心,得到高斯概率密度函数;建立混合整数非线性规划模型,利用递归的思想降低关联偏差;通过EM聚类,对未知参数求极值,来设定关联判断门限,同时对结果进行唯一化处理,求解得到水下目标轨迹的对应关系,最后匹配出水下目标的轨迹。本发明在不同目标个数、不同传感器测角测距误差、以及不同传感器探测概率等情况下,本发明具有很好的正关联率,具备一定的优越性和鲁棒性。

    局部航迹分维度的选择性航迹状态估计融合方法

    公开(公告)号:CN110361006B

    公开(公告)日:2022-07-19

    申请号:CN201910575692.5

    申请日:2019-06-28

    IPC分类号: G01C21/20 G06K9/62

    摘要: 本发明是局部航迹分维度的选择性航迹状态估计融合方法。本发明对局部航迹进行读取和预处理,进行时间对准和空间对准;对局部航迹按纬度进行拆分,利用基于灰色接近关联度的航迹质量衡量算法进行单纬度下的航迹质量计算,并分维度排序;设置循环次数,根据航迹质量依据选择单纬度航迹数,将两条高质量的单纬度航迹和进行航迹状态估计融合,得到融合航迹,确定系统航迹;当融合航迹的航迹质量大于高质量的单纬度航迹的航迹质量,本发明实现了局部航迹的选择性融合,维度拆分后,再经过算法结构实现航迹选择,并采用局部航迹与局航迹的多传感器的简单凸组合融合方法后,融合生成的系统航迹精度有所提高。

    一种基于EM聚类的水下多目标轨迹关联方法

    公开(公告)号:CN110849372A

    公开(公告)日:2020-02-28

    申请号:CN201911188834.9

    申请日:2019-11-28

    IPC分类号: G01C21/20 G01V9/00 G06K9/62

    摘要: 本发明提供的是一种基于EM聚类的水下多目标轨迹关联方法。对数据进行预处理;通过引入信息熵来构建构建轨迹质量分级模型,在轨迹关联的时候,把质量好的点当做中心优先进行轨迹关联匹配;通过轨迹间拓扑信息建立高斯混合模型同时将质量好的点当做质心,得到高斯概率密度函数;建立混合整数非线性规划模型,利用递归的思想降低关联偏差;通过EM聚类,对未知参数求极值,来设定关联判断门限,同时对结果进行唯一化处理,求解得到水下目标轨迹的对应关系,最后匹配出水下目标的轨迹。本发明在不同目标个数、不同传感器测角测距误差、以及不同传感器探测概率等情况下,本发明具有很好的正关联率,具备一定的优越性和鲁棒性。

    局部航迹分维度的选择性航迹状态估计融合方法

    公开(公告)号:CN110361006A

    公开(公告)日:2019-10-22

    申请号:CN201910575692.5

    申请日:2019-06-28

    IPC分类号: G01C21/20 G06F17/50 G06K9/62

    摘要: 本发明是局部航迹分维度的选择性航迹状态估计融合方法。本发明对局部航迹进行读取和预处理,进行时间对准和空间对准;对局部航迹按纬度进行拆分,利用基于灰色接近关联度的航迹质量衡量算法进行单纬度下的航迹质量计算,并分维度排序;设置循环次数,根据航迹质量依据选择单纬度航迹数,将两条高质量的单纬度航迹和进行航迹状态估计融合,得到融合航迹,确定系统航迹;当融合航迹的航迹质量大于高质量的单纬度航迹的航迹质量,本发明实现了局部航迹的选择性融合,维度拆分后,再经过算法结构实现航迹选择,并采用局部航迹与局航迹的多传感器的简单凸组合融合方法后,融合生成的系统航迹精度有所提高。