本節說明 CrUX 收集及整理使用者體驗資料的方式。
使用資格
CrUX 資料集的核心是個別使用者,其中匯總為頁面層級和來源層級的分佈情形。本節說明使用者的資格,以及要納入資料集的網頁與來源相關規定。您必須符合所有資格條件,網頁層級資料才能納入 PageSpeed Insights 和 CrUX API 的網頁層級資料:使用者、來源和網頁。符合「使用者和來源」條件但不屬於「網頁」的體驗,就不會包含在所有 CrUX 資料來源提供的來源層級資料中。
如果頁面和來源的資格會隨著時間改變,系統會自動納入或從資料集中移除頁面和來源。目前,您無法手動提交收錄的網頁或來源。
開放搜尋
網頁必須可供公開探索,才有機會納入 CrUX 資料集。
系統會以與搜尋引擎相同的可索引性條件判定網頁可供公開搜尋。
如果符合下列「任一」條件,包括來源資料集的根頁面,頁面就無法滿足可偵測性要求:
- 網頁提供 HTTP 狀態碼,而不是
200
(重新導向後)。 - 頁面透過 HTTP
X-Robots-Tag: noindex
標頭或同等項目提供。 - 本文件包含
<meta name="robots" content="noindex">
中繼標記或同等功能。
如需網站索引狀態的總覽資訊,請參閱 Google Search Console。
相當熱門
系統會判定某個網頁的訪客人數下限,必須達到足夠的熱門程度。系統會判定某個來源在其所有網頁中都達到一定數量,才非常熱門。雖然我們沒有提供確切的數字,但選擇確保我們有足夠的樣本,能對包含頁面的統計分佈產生信心。網頁和來源的最低次數皆相同。
未達熱門程度門檻的網頁和來源就不會納入 CrUX 資料集。
來源
來源代表整個網站,可透過 https://www.example.com
等網址定址。來源必須符合以下兩項要求,才能納入 CrUX 資料集:
您可以執行 Lighthouse 稽核,並查看 SEO 類別結果,確認系統是否能夠找到來源。如果您的根網頁未通過網頁無法建立索引或網頁未通過 HTTP 狀態碼稽核,系統就無法找到您的網站。
如果系統判定某個來源可供公開搜尋,則無論該來源的哪個網頁是否曝光,系統都會在該來源的所有網頁中,將符合資格的使用者體驗匯總為來源層級。這些體驗都會計入來源最受歡迎的程度要求。
請注意,在查詢目的中,CrUX 資料集中的所有來源皆為小寫。
頁面
包含在 CrUX 資料集內頁面的需求條件與來源相同:
您可以執行 Lighthouse 稽核,並查看 SEO 類別結果,確認網頁是否被找到。如果網頁未通過網頁無法建立索引或網頁含有失敗的 HTTP 狀態碼稽核失敗,系統就不會搜尋該網頁。
如果部分使用者可以公開搜尋網頁,但在某些情況下,傳回未成功的 HTTP 狀態,那麼 CrUX 就不會納入這些體驗。
網頁的網址通常含有其他 ID,包括查詢字串參數 (例如 ?utm_medium=email
) 和片段 (例如 #main
)。系統會從 CrUX 資料集中的網址去除這些 ID,以便將網頁上的所有使用者體驗匯總在一起。如果同一個網頁有許多不連貫的網址變化形式,這個做法就相當實用。請注意,這種做法在極少數的情況下,可能會意外將不同網頁的體驗分組 (例如 ?productID=101
和 ?productID=102
參數代表不同的網頁)。
CrUX 網頁是根據頂層頁面評估。以 iframe 形式納入的網頁在 CrUX 中不會個別記錄,但會影響頂層網頁的指標。舉例來說,如果 https://www.example.com/page.html
在 iframe 中嵌入 https://www.example.com/frame.html
,則 page.html
會在 CrUX 中表示 (須符合其他資格條件),但 frame.html
不會顯示。如果 frame.html
的 CLS 偏低,系統在評估 page.html
的 CLS 時就會納入 CLS。CrUX 是 Chrome 使用者體驗報告,但使用者甚至可能不知道這是 iframe。因此,系統會根據使用者看到的體驗,在頂層頁面評估體驗。
網站的架構可能會複雜的 CrUX 呈現資料的方式。例如,單頁應用程式 (SPA) 可能會使用以 JavaScript 為基礎的路徑轉換機制在網頁之間移動,而不是採用傳統的錨定式網頁導覽方式。這些轉場效果會顯示為使用者第一次瀏覽新網頁,但這次轉換在 Chrome 和基礎平台 API 上則歸功於最初的網頁瀏覽。這是建構 CrUX 的網頁平台 API 限制,詳情請參閱 SPA 架構對 web.dev 的影響。
使用者
使用者必須符合下列條件,才能在 CrUX 資料集中匯總自身體驗:
目前支援的平台如下:
以下幾個例外情況不會將資料提供給 CrUX 資料集:
- iOS 版 Chrome。
- 使用 WebView 的 Android 應用程式。
- 其他 Chromium 瀏覽器 (例如 Microsoft Edge)。
Chrome 不會發布符合這些條件的使用者比例資料。如要進一步瞭解我們蒐集的資料,請參閱《Chrome 隱私權白皮書》。
Accelerated Mobile Pages (AMP)
如同其他網頁,使用 AMP 建立的網頁會納入 CrUX 資料集。自 2020 年 6 月 CrUX 版本起,系統也會擷取使用 AMP 快取提供,以及 / 或透過 AMP 檢視器呈現的網頁,並歸因於發布者的網頁網址。
資料品質
CrUX 中的資料需經過少量處理,才能確保統計結果準確、結構良好且易於查詢。
篩選
CrUX 資料集會經過篩選,確保呈現的資料具有統計顯著性。避免整個網頁或來源出現在資料集內。
除了對來源和網頁套用的資格條件以外,系統還會進一步篩選資料中的區隔:
由於維度組合不合格的來源或網頁總流量超過 20%,系統完全排除在資料集中。
由於全域層級的資料集涵蓋所有國家/地區的使用者體驗,因此如果維度組合中未符合國家/地區的熱門程度條件,系統可能仍會納入全球層級 (前提是其熱門程度)。
模糊
資料集會套用少量的隨機性,以免對機密資料進行反向工程,例如總流量量。但不會影響匯總統計資料的準確性。
精確度
CrUX 資料集中大多數的指標值都會以值和特徵分塊大小的直方圖表示,其中直方圖值是所有包含區隔 (總和為 1) 的比例。特徵分塊大小為 1.0 至 0.0001 之間的浮點數。
直方圖會經過正規化,以簡化查詢和視覺化資料。這表示較大的特徵分塊可能會分割成較小的特徵分塊,這些特徵分塊等同於原始的密度,藉此維持一致的特徵分塊寬度。
授權
Google 的 CrUX 資料集是依據《創用 CC 姓名標示 4.0 國際授權》取得授權。