封鎖機器人

說明

  • 防止搜尋引擎機器人擅自收集你的網站內容(archive)或網址(url index)。(封鎖機器人來暫存或收錄網站的內容)


原理

  • 在網頁的 <head></head> 標籤內,加上下面介紹的語法之ㄧ就可以了。
  • 當下次搜尋引擎機器人來的時候,辨識到你貼的禁止收錄、暫存標籤,就會自動移除掉相關的搜尋內容。
    PS:你可以透過各家的工具,請他們提早來逛你的網頁,處理掉你不想讓他們收錄或暫存的內容)


主要語法

禁止被搜尋引擎機器人收錄網址

<meta name="robots" content="noindex">
  • 簡單說明:noindex 代表禁止被索引、不願意被搜尋引擎機器人收錄網址,通常會用於免感或不想曝光的網頁加入此標籤。
    (一般搜尋引擎氣人看到此標籤,都會自動幫你移除。)


禁止被搜尋引擎機器人暫存網頁內容

<meta name="robots" content="noarchive">
  • 簡單說明:noarchive 代表禁止暫存、不願意被搜尋引擎機器人暫存任何網頁內容,通常會用於不想被任意收錄舊資料、比對或迴避舊消息的網頁(?)建議加入此標籤。
    (一般搜尋引擎氣人看到此標籤,都會自動幫你移除。)


以上兩種是通用型大部分機器人都會自動迴避,對於特殊隱私需求的網頁建議兩者並用,不衝突。


只針對 Google 搜尋引擎機器人

禁止暫存網頁內容

<meta name="googlebot" content="noindex">


綜合錯雜版


<META NAME="ROBOTS" CONTENT="NONE,NOINDEX, NOFOLLOW, NOARCHIVE">
<meta name="robots" content="none,noindex,nofollow,noarchive">
<META NAME="robots" CONTENT="none,noindex, nofollow,noarchive">
<meta http-equiv="pragma" content="no-cache">
<meta name="robots" content="noindex,nofollow">
<meta name="robots" content="none">
<meta name="robots" content="noarchive">


其他方法


參考資料


已下則是本Wiki空間的廣告,不要誤會XDDD

最終更新:2010年02月17日 20:06