用于使用自适应阈限计算的网页分割的系统和方法
摘要:
公开了一种用于自适应阈限网页分割的系统和方法。在一个实施例中,由具有一个或多个处理器的物理计算系统执行的、用于分割包括多个节点的网页的方法包括使用物理计算系统把网页中的内容解析为多个节点,使用物理计算系统获得每对节点之间的特征值,使用物理计算系统使用所获得的特征值来估计自适应阈限值,以及通过比较与每对节点相关联的特征值和所估计的自适应阈限值来对网页进行分割。
0/0