CPU プラットフォーム

Compute Engine を使用して仮想マシン（VM）またはベアメタルインスタンスを作成する場合は、インスタンスのマシンシリーズとマシンタイプを指定します。各マシンシリーズは 1 つ以上の CPU プラットフォームに関連付けられています。マシンタイプで使用可能な CPU プラットフォームが複数ある場合は、コンピューティングインスタンスに最小 CPU プラットフォームを選択できます。

CPU プラットフォームは複数の物理プロセッサを備えており、これらのプロセッサのそれぞれをコアと呼びます。Compute Engine で利用可能なすべてのプロセッサでは、同時マルチスレッド化（SMT）を通じて、1 つの CPU コアを複数のハードウェアマルチスレッドとして実行できます。これはインテルプロセッサではインテルハイパースレッディングテクノロジーとして知られています。Compute Engine では、各ハードウェアマルチスレッドは仮想 CPU（vCPU）と呼ばれます。vCPU が異なる仮想コアを占有しているとして VM に報告されると、Compute Engine はこれらの vCPU が同じ物理コアを共有しないようにします。

コンピューティングインスタンスのマシンタイプでは、vCPU の数が指定され、そのマシンシリーズのコアレーシオあたりのデフォルトの vCPU を使用する物理 CPU コアの数を推定できます。

Tau T2D、Tau T2A、H3 マシンシリーズの場合、VM には常にコアあたり 1 つの vCPU があります。
他のすべてのマシンシリーズでは、コンピューティングインスタンスにはデフォルトで 1 コアあたり 2 つの vCPU があります。

必要に応じて、コアあたりのスレッド数をデフォルト以外の値に設定できます。これにより、一部のワークロードにメリットがある場合があります。重要なこととして、この操作を行うと、コンピューティングインスタンスのマシンタイプに正しい数の vCPU が反映されません。代わりに、料金と物理 CPU コアの数は、コアあたりのデフォルトの 2 つの vCPU と同じままで、vCPU の数は、マシンタイプで示される値の半分です。

Arm プロセッサ

Arm プロセッサの場合、Compute Engine は 1 コアあたり 1 つのスレッドを使用します。各 vCPU は、SMT のない物理コアにマッピングされます。

次の表に、Compute Engine インスタンスで使用できる Arm プロセッサを示します。

CPU プロセッサ	プロセッサ SKU	サポートされているマシンシリーズとマシンタイプ	全コア持続周波数（GHz）
Ampere Altra	Q64-30	Tau T2A	3.0

x86 プロセッサ

ほとんどの x86 プロセッサでは、各 vCPU は単一のハードウェアスレッドとして実装されます。Tau T2D マシンシリーズは例外で、1 つの vCPU が 1 つの物理コアを表します。

Intel プロセッサ

インテル Xeon プロセッサでは、インテルハイパースレッディングテクノロジーにより、各コアで同時に実行される複数のスレッドがサポートされます。vCPU の数とメモリは、コンピューティングインスタンスのマシンタイプによって決まります。

CPU プロセッサ	プロセッサ SKU	サポートされているマシンシリーズとマシンタイプ	基本周波数（GHz）	全コアターボ周波数（GHz）	シングルコア最大ターボ周波数（GHz）
インテル Xeon スケーラブルプロセッサ（Emerald Rapids）第 5 世代
	インテル® Xeon® プラチナ 8581C プロセッサ	C4 （プレビュー）	2.3	3.1	4.0
	インテル® Xeon® プラチナ 8581C プロセッサ	N4	2.1	2.9	3.3
インテル Xeon スケーラブルプロセッサ（Sapphire Rapids）第 4 世代	インテル® Xeon® プラチナ 8490H プロセッサ	X4	1.9	2.9	3.5
	インテル® Xeon® プラチナ 8481C プロセッサ	C3 Z3 H3	2.2	3.0	3.0
	インテル® Xeon® プラチナ 8481C プロセッサ	A3	2.0	3.8	2.9
インテル Xeon スケーラブルプロセッサ（Ice Lake）第 3 世代	インテル® Xeon® プラチナ 8373C プロセッサ	N2^* M3	2.6	3.4	3.5
Intel Xeon スケーラブルプロセッサ（Cascade Lake）第 2 世代
	インテル® Xeon® ゴールド 6268CL プロセッサ	N2^*	2.8	3.4	3.9
	インテル® Xeon® ゴールド 6253CL プロセッサ	C2	3.1	3.8	3.9
	インテル® Xeon® プラチナ 8280L プロセッサ	M2	2.5	3.4	4.0
	インテル® Xeon® プラチナ 8273CL プロセッサ	A2 G2	2.2	2.9	3.7
Intel Xeon スケーラブルプロセッサ（Skylake）第 1 世代	インテル® Xeon® スケーラブルプラチナ 8173M プロセッサ	E2 `m1-megamem` メモリ最適化マシンタイプ N1	2.0	2.7	3.5
インテル Xeon E7（Broadwell E7）	インテル® Xeon® E7-8880V4 プロセッサ	`m1-ultramem` メモリ最適化マシンタイプ	2.2	2.6	3.3
インテル Xeon E5 v4（Broadwell E5）	インテル® Xeon® E5-2696V4 プロセッサ	E2 N1	2.2	2.8	3.7
インテル Xeon E5 v3（Haswell）	インテル® Xeon® E5-2696V3 プロセッサ	N1	2.3	2.8	3.8
インテル Xeon E5 v2（Ivy Bridge）	インテル® Xeon® E5-2696V2 プロセッサ	N1	2.5	3.1	3.5
インテル Xeon E5（Sandy Bridge）	インテル® Xeon® E5-2689 プロセッサ	N1	2.6	3.2	3.6

^*96 個以上の vCPU を備えた N2 マシンタイプには Intel Ice Lake CPU が必要です。

AMD プロセッサ

AMD プロセッサは、SMT を使用してパフォーマンスとスケーラビリティを最適化します。ほとんどの場合、Compute Engine はコアあたり 2 つのスレッドを使用し、各 vCPU は 1 スレッドです。Tau T2D は例外で、Compute Engine がコアごとに 1 つのスレッドを使用し、各 vCPU が物理コアにマッピングされます。vCPU の数とメモリは、コンピューティングインスタンスのマシンタイプによって決まります。

CPU プロセッサ	プロセッサ SKU	サポートされているマシンシリーズ	基本周波数（GHz）	有効周波数（GHz）	最大ブースト周波数（GHz）
AMD EPYC Genoa 第 4 世代	AMD EPYC™ 9B14	C3D	2.6	3.3	3.7
AMD EPYC Milan 第 3 世代	AMD EPYC™ 7B13	E2 Tau T2D N2D C2D	2.45	2.8	3.5
AMD EPYC Rome 第 2 世代	AMD EPYC™ 7B12	E2 N2D	2.25	2.7	3.3

周波数特性

上記の表では、Compute Engine で使用可能な CPU のハードウェア仕様について説明していますが、次の点に注意してください。

周波数: コンピュータの周波数（クロック速度）は、CPU が 1 秒間に実行するサイクル数を GHz（ギガヘルツ）で測定したものです。一般に、周波数が高いほどパフォーマンスが高いことを示します。ただし、CPU の設計によって命令の処理が異なるため、新しいアーキテクチャでは命令が効率的に処理され、クロック速度が高い古い CPU のほうが新しいクロック速度で処理できることがあります。

CPU クロックサイクルとパフォーマンスの詳細については、クロックレートとシステムパフォーマンスをご覧ください。
基本周波数: システムがアイドル状態または負荷が小さい場合に CPU が実行している周波数。基本周波数で実行すると、CPU では、電力消費は減少し、発熱が抑えられます。

コンピューティングインスタンスのゲスト環境では、CPU の実際の動作周波数に関係なく、基本周波数が反映されています。
全コアターボ周波数: ソケット内のすべてのコアが同時にアクティブである場合の、各 CPU の一般的な動作周波数。ワークロードが異なれば、システムの CPU に対する要求も異なります。Boost テクノロジーは、この違いに対応し、CPU の周波数を上げて、プロセスがワークロードの需要に適応できるようにします。
- ゲスト環境には基本周波数しかアドバタイズされない状態でも、ほとんどのコンピューティングインスタンスは全コアターボ時の周波数を取得します。
- Arm プロセッサの周波数は常に全コアターボ周波数であるため、Ampere Altra Arm プロセッサではパフォーマンスが予測しやすくなります。
最大ターボ周波数: ビデオゲームやデザインモデリングアプリケーションなど、要求の厳しいアプリケーションによって負荷がかけられる CPU のターゲット周波数。これは、オーバークロックなしで CPU が達成する最大シングルコア周波数です。
プロセッサの電力管理技術: インテルのプロセッサは、複数のテクノロジーをサポートして、電力消費を最適化します。これらのテクノロジーは 2 つのカテゴリまたは状態に分類されます。
- C-State は、CPU が選択された機能を削減または無効にしたときの状態です。
- P-State では、CPU の電力消費を低減するために、プロセッサが動作する周波数と電圧を調整する方法が提供されます。
特定の C2（30、60 vCPU）、C2D（56、112 vCPU）、M2（208、416 vCPU）マシンタイプでは、MWAIT 命令によりインスタンスが提供する C-State のヒントがサポートされます。

Compute Engine インスタンスには、お客様が P-State を制御するための機能はありません。

CPU 機能

半導体メーカーは、製造する CPU に計算、グラフィック、仮想化、メモリ管理のための高度なテクノロジーを追加します。Google Cloud では、これらの高度な機能のいくつかを Compute Engine で使用できます。

Advanced Matrix Extensions（AMX）

Intel AMX は、人工知能（AI）ワークロードと機械学習（ML）ワークロードを高速化するように設計された新しい命令セットアーキテクチャ（ISA）です。AMX では、AI と ML で最もよく使用される 2 つの行列乗算と畳み込み演算に使用できる新しい命令が導入されています。

AMX は、C4 汎用 VM シリーズで活用されている第 5 世代インテル Xeon プロセッサ（コード名: Emerald Rapids）、および A3 アクセラレータ最適化 VM と C3 汎用 VM で活用されている第 4 世代インテル Xeon プロセッサ（コード名: Sapphire Rapids）でサポートされています。すべての C4 VM マシンタイプと C3 VM マシンタイプは、AMX 命令セットをサポートしています。

AMX では、アクセラレータがオペレーションを実行できるように、タイルと呼ばれる 2 次元のレジスタが導入されています。AMX は拡張可能なアーキテクチャを前提としています。最初に実装されるアクセラレータは、タイルマトリックス乗算ユニット（TMUL）と呼ばれます。Sapphire Rapids プロセッサの各 CPU コアには、独立した AMX TMUL ユニットがあります。

インテル AMX に関する技術的な詳細については、5.16 のインテル AMX サポートをご覧ください。インテルでは、コードサンプル: Intel® Advanced Matrix Extensions（Intel® AMX）- Intrinsics Functions で AMX に関するチュートリアルを提供しています。

AMX を使用するための要件

インテル AMX 命令には、次のような最小ソフトウェア要件があります。

カスタムイメージの場合、AMX は Linux カーネルバージョン 5.16 以降でサポートされています。
Compute Engine では、次の公開イメージで AMX をサポートしています。
- CentOS Stream 8 以降
- Container-Optimized OS 109 LTS（またはそれ以降）
- RHEL 8（最新ビルド）以降
- Rocky Linux 8（最新ビルド）以降
- Ubuntu 22.04 以降
- Windows Server 2022 以降
Tensorflow 2.9.1 以降
PyTorch のインテル® 最適化用のインテル拡張機能

C4 VM と C3 VM を利用できるリージョンについては、使用可能なリージョンとゾーンを参照し、C4 または C3 マシンタイプのみが表示されるようにテーブルをフィルタします。

ベアメタルインスタンスで利用可能な CPU 機能

第 4 世代 Intel Xeon スケーラブルプロセッサで実行されるベアメタルインスタンスは、サーバーのすべての未加工コンピューティングリソースを提供できるだけでなく、機能固有の複数のオンボードアクセラレータとオフロードを使用できます。

Intel-QAT: Intel QuickAssist Technology（Intel QAT）は、圧縮、暗号化、復号を高速化します。
Intel-DLB: Intel Dynamic Load Balancer（Intel DLB）は、データキューの高速化に役立ちます。
Intel IAA: Intel In-Memory Analytics Accelerator（Intel IAA）は、クエリ処理のパフォーマンスを向上させます。
Intel DSA: Intel Data Streaming Accelerator（Intel DSA）は、データをより高速にコピーおよび移動するのに役立ちます。

Confidential Computing

使用中のデータを保護するため、Confidential Computing テクノロジーをサポートする CPU プラットフォームを使用して、Confidential VM インスタンスを作成できます。

Confidential VM インスタンスの作成要件の詳細については、サポートされている構成をご覧ください。

次のステップ

マシンファミリーの詳細を確認する。
仮想マシンインスタンスの詳細を確認する。
イメージの詳細を確認する。
最小 CPU プラットフォームの指定方法を確認する。

使ってみる

Google Cloud を初めて使用する場合は、アカウントを作成して、実際のシナリオで Compute Engine のパフォーマンスを評価してください。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。

Compute Engine の無料トライアル