CrUX 方法

本節說明 CrUX 收集及整理使用者體驗資料的方式。

使用資格

CrUX 資料集的核心是個別使用者,其中匯總為頁面層級和來源層級的分佈情形。本節說明使用者的資格,以及要納入資料集的網頁與來源相關規定。您必須符合所有資格條件,網頁層級資料才能納入 PageSpeed Insights 和 CrUX API 的網頁層級資料:使用者來源網頁。符合「使用者和來源」條件但不屬於「網頁」的體驗,就不會包含在所有 CrUX 資料來源提供的來源層級資料中。

如果頁面和來源的資格會隨著時間改變,系統會自動納入或從資料集中移除頁面和來源。目前,您無法手動提交收錄的網頁或來源。

開放搜尋

網頁必須可供公開探索,才有機會納入 CrUX 資料集。

系統會以與搜尋引擎相同的可索引性條件判定網頁可供公開搜尋。

如果符合下列「任一」條件,包括來源資料集的根頁面,頁面就無法滿足可偵測性要求:

  • 網頁提供 HTTP 狀態碼,而不是 200 (重新導向後)。
  • 頁面透過 HTTP X-Robots-Tag: noindex 標頭或同等項目提供。
  • 本文件包含 <meta name="robots" content="noindex"> 中繼標記或同等功能。

如需網站索引狀態的總覽資訊,請參閱 Google Search Console

相當熱門

系統會判定某個網頁的訪客人數下限,必須達到足夠的熱門程度。系統會判定某個來源在其所有網頁中都達到一定數量,才非常熱門。雖然我們沒有提供確切的數字,但選擇確保我們有足夠的樣本,能對包含頁面的統計分佈產生信心。網頁和來源的最低次數皆相同。

未達熱門程度門檻的網頁和來源就不會納入 CrUX 資料集。

來源

來源代表整個網站,可透過 https://www.example.com 等網址定址。來源必須符合以下兩項要求,才能納入 CrUX 資料集:

  1. 開放大眾搜尋
  2. 相當熱門

您可以執行 Lighthouse 稽核,並查看 SEO 類別結果,確認系統是否能夠找到來源。如果您的根網頁未通過網頁無法建立索引網頁未通過 HTTP 狀態碼稽核,系統就無法找到您的網站。

如果系統判定某個來源可供公開搜尋,則無論該來源的哪個網頁是否曝光,系統都會在該來源的所有網頁中,將符合資格的使用者體驗匯總為來源層級。這些體驗都會計入來源最受歡迎的程度要求。

請注意,在查詢目的中,CrUX 資料集中的所有來源皆為小寫。

頁面

包含在 CrUX 資料集內頁面的需求條件與來源相同:

  1. 開放大眾搜尋
  2. 相當熱門

您可以執行 Lighthouse 稽核,並查看 SEO 類別結果,確認網頁是否被找到。如果網頁未通過網頁無法建立索引網頁含有失敗的 HTTP 狀態碼稽核失敗,系統就不會搜尋該網頁。

如果部分使用者可以公開搜尋網頁,但在某些情況下,傳回未成功的 HTTP 狀態,那麼 CrUX 就不會納入這些體驗。

網頁的網址通常含有其他 ID,包括查詢字串參數 (例如 ?utm_medium=email) 和片段 (例如 #main)。系統會從 CrUX 資料集中的網址去除這些 ID,以便將網頁上的所有使用者體驗匯總在一起。如果同一個網頁有許多不連貫的網址變化形式,這個做法就相當實用。請注意,這種做法在極少數的情況下,可能會意外將不同網頁的體驗分組 (例如 ?productID=101?productID=102 參數代表不同的網頁)。

CrUX 網頁是根據頂層頁面評估。以 iframe 形式納入的網頁在 CrUX 中不會個別記錄,但會影響頂層網頁的指標。舉例來說,如果 https://www.example.com/page.html 在 iframe 中嵌入 https://www.example.com/frame.html,則 page.html 在 CrUX 中表示 (須符合其他資格條件),但 frame.html 不會顯示。如果 frame.htmlCLS 偏低,系統在評估 page.html 的 CLS 時就會納入 CLS。CrUX 是 Chrome 使用者體驗報告,但使用者甚至可能不知道這是 iframe。因此,系統會根據使用者看到的體驗,在頂層頁面評估體驗。

網站的架構可能會複雜的 CrUX 呈現資料的方式。例如,單頁應用程式 (SPA) 可能會使用以 JavaScript 為基礎的路徑轉換機制在網頁之間移動,而不是採用傳統的錨定式網頁導覽方式。這些轉場效果會顯示為使用者第一次瀏覽新網頁,但這次轉換在 Chrome 和基礎平台 API 上則歸功於最初的網頁瀏覽。這是建構 CrUX 的網頁平台 API 限制,詳情請參閱 SPA 架構對 web.dev 的影響

使用者

使用者必須符合下列條件,才能在 CrUX 資料集中匯總自身體驗:

  1. 啟用使用統計資料報表
  2. 同步處理對方的瀏覽器記錄
  3. 未設定同步通關密語
  4. 使用支援的平台。

目前支援的平台如下:

  • Chrome 電腦版,包括 Windows、macOS、ChromeOS 和 Linux 作業系統。
  • Android 版 Chrome,包括使用自訂分頁WebAPKs 的行動應用程式。

以下幾個例外情況不會將資料提供給 CrUX 資料集:

  • iOS 版 Chrome。
  • 使用 WebView 的 Android 應用程式。
  • 其他 Chromium 瀏覽器 (例如 Microsoft Edge)。

Chrome 不會發布符合這些條件的使用者比例資料。如要進一步瞭解我們蒐集的資料,請參閱《Chrome 隱私權白皮書》。

Accelerated Mobile Pages (AMP)

如同其他網頁,使用 AMP 建立的網頁會納入 CrUX 資料集。自 2020 年 6 月 CrUX 版本起,系統也會擷取使用 AMP 快取提供,以及 / 或透過 AMP 檢視器呈現的網頁,並歸因於發布者的網頁網址。

資料品質

CrUX 中的資料需經過少量處理,才能確保統計結果準確、結構良好且易於查詢。

篩選

CrUX 資料集會經過篩選,確保呈現的資料具有統計顯著性。避免整個網頁或來源出現在資料集內。

除了對來源和網頁套用的資格條件以外,系統還會進一步篩選資料中的區隔:

由於維度組合不合格的來源或網頁總流量超過 20%,系統完全排除在資料集中。

由於全域層級的資料集涵蓋所有國家/地區的使用者體驗,因此如果維度組合中未符合國家/地區的熱門程度條件,系統可能仍會納入全球層級 (前提是其熱門程度)。

模糊

資料集會套用少量的隨機性,以免對機密資料進行反向工程,例如總流量量。但不會影響匯總統計資料的準確性。

精確度

CrUX 資料集中大多數的指標值都會以值和特徵分塊大小的直方圖表示,其中直方圖值是所有包含區隔 (總和為 1) 的比例。特徵分塊大小為 1.0 至 0.0001 之間的浮點數。

直方圖會經過正規化,以簡化查詢和視覺化資料。這表示較大的特徵分塊可能會分割成較小的特徵分塊,這些特徵分塊等同於原始的密度,藉此維持一致的特徵分塊寬度。

授權

Google 的 CrUX 資料集是依據《創用 CC 姓名標示 4.0 國際授權》取得授權。