避免您的網站和平台使用者產生的垃圾內容

垃圾內容發布者經常利用開放留言表單和其他使用者原創內容輸入欄位,在不知情的網站上產生垃圾資訊內容。代管平台也同樣可能成為濫用行為的受害者;垃圾內容發布者可能會建立大量違反 Google 垃圾內容政策的網站,這些網站對於網路環境而言貢獻甚微,甚至毫無價值。

防範平台或網站上的濫用行為通常不難。就算只是簡單的防範措施,像是要求使用者完成異常狀況測試才能與您的資源互動,或許就有嚇阻垃圾內容發布者的作用。

告訴使用者您的服務禁止垃圾內容

公布具體的濫用政策並告知使用者,例如在註冊過程即提供相關政策。此外,建議允許信任的使用者檢舉您資源上疑似垃圾資訊的內容。

識別垃圾帳戶

記錄您平台上註冊狀態和使用者互動情形,並嘗試找出常見的垃圾內容模式,例如:

  • 表單完成時間
  • 同一個 IP 位址範圍傳送的要求數量
  • 註冊過程中所用的使用者代理程式
  • 在註冊時所選擇的使用者名稱或其他表單提交值

這些信號可協助您建立使用者信譽系統,不僅有助於與使用者互動,也能找出垃圾內容發布者。許多垃圾評論發布者的目的是讓他們的內容出現在搜尋引擎中,因此,如果社群中有尚未累積任何信譽記錄的新使用者,您可以先在他們的文章中加入 noindex robots meta 標記,當這些使用者獲得信譽後,再允許搜尋引擎將他們的內容編入索引。這麼做能有效遏止垃圾內容發布者與平台互動。

由於垃圾內容發布者的目的通常是留下網站連結,建議您針對不受信任內容中的所有連結加入 nofollowugc rel 屬性。

透過人工核准的方式審核可疑使用者互動

藉由人工核准 (或管理) 特定使用者互動,即可防止垃圾內容發布者立即建立垃圾內容,大幅降低平台上的垃圾內容。管理作業會為您的日常工作流程增加負擔,但這也是打擊垃圾內容的絕佳方式。大多數 CMS 都內建有評論管理功能,正是因為效果卓越。

使用封鎖清單來避免垃圾內容重複出現

只要發現一個垃圾個人資料,您就可以直接將相同來源的個人資料全數移除。舉例來說,如果您發現多個垃圾個人資料來自相同的 IP 位址,即可將這個 IP 位址加入永久停權清單。對 CMS (例如 WordPress) 來說,Akismet 這類外掛程式可以派上用場,而將 IP 位址加入防火牆的拒絕清單也會非常有效。

封鎖自動建立帳戶的機制

建議您在註冊表單中使用 reCAPTCHA類似的驗證工具,只允許真人使用者進行註冊,並防止自動化指令碼在您的代管服務上產生大量網站。

監控服務是否遭到濫用

  • 監控您的資源是否出現垃圾內容信號,例如:重新導向、大量廣告區塊、特定垃圾關鍵字,以及大段落的 JavaScript 程式碼等。site: 搜尋運算子或 Google 快訊能協助您偵測是否存在這些問題。
  • 留意網路伺服器記錄檔中突然出現的流量高峰。
  • 監控您的資源,確認是否有網路詐騙網頁和受惡意軟體感染的網頁。舉例來說,您可以使用 Google Safe Browsing API 定期測試服務中的網址。
  • 制定幾項健全性檢查。舉例來說,如果您主要指定日本使用者,某晚突然出現數千次來自義大利 IP 的使用者互動,就很有可能是異常現象。目前有多種工具可偵測新建立網站的語言,例如語言偵測程式庫Google Translate API v2