從網頁擷取標題及主體
    1.
    发明专利
    從網頁擷取標題及主體 审中-公开
    从网页截取标题及主体

    公开(公告)号:TW201514845A

    公开(公告)日:2015-04-16

    申请号:TW103126938

    申请日:2014-08-06

    IPC分类号: G06F3/14 G06F3/048 G06F17/00

    摘要: 一般提供用於擷取顯示於網頁上之文章之主體及標題之技術。網頁可顯示如除了網頁文章外之廣告、影像及連結之內容。使用者可在沒有額外內容的情況下,於閱讀器應用程式中選擇檢視文章,及閱讀器應用程式可從網頁擷取主體及標題。可藉由辨識與標題有關之元標籤及自元標籤移除網站名稱而選擇標題候選者。可藉由基於用於網頁之文件物件模型樹中之文字大小及深度辨識文字節點之群集而選擇主體候選者。可選擇最可能為主體之最佳群集及可選擇對應之標題候選者為最佳標題。

    简体摘要: 一般提供用于截取显示于网页上之文章之主体及标题之技术。网页可显示如除了网页文章外之广告、影像及链接之内容。用户可在没有额外内容的情况下,于阅读器应用进程中选择视图文章,及阅读器应用进程可从网页截取主体及标题。可借由辨识与标题有关之元标签及自元标签移除网站名称而选择标题候选者。可借由基于用于网页之文档对象模型树中之文本大小及深度辨识文本节点之群集而选择主体候选者。可选择最可能为主体之最佳群集及可选择对应之标题候选者为最佳标题。