このページは Cloud Translation API によって翻訳されました。

Web Audio API スタートガイド

Boris Smus

HTML5 の <audio> 要素が表示される前は、Flash または別のプラグインが必要でしたウェブの沈黙を打ち破ろうとしています。ウェブの音声は利用できなくなりましたが必要な場合、audio タグを使用すると、高度なゲームやインタラクティブアプリの実装。

Web Audio API は、音声処理と音声処理のための高レベルの JavaScript API です。ウェブアプリケーションで音声を合成しています。この API の目標は、最新のゲームオーディオエンジンに搭載されている機能や混合、処理、フィルタリングといったタスクはよく使用されます。さまざまな用途に活用できます。ここからは、データアナリストが使用できます。

AudioContext のスタートガイド

AudioContext は、すべてのサウンドの管理と再生に使用します。生成 Web Audio API を使用したサウンドの作成、1 つ以上の音源の作成 AudioContext で指定されたサウンドデスティネーションに接続します。構成されますこの接続は直接ではなく、処理として機能する任意の数の中間 AudioNodes オーディオ信号用のモジュールを使用します。このルーティングについては、ウェブオーディオの仕様をご覧ください。

AudioContext の 1 つのインスタンスで複数の音声入力をサポートできます複雑な音声グラフであるため、各グラフに 1 つだけで十分です。オーディオアプリケーションを作成します。

次のスニペットは AudioContext を作成します。

var context;
window.addEventListener('load', init, false);
function init() {
    try {
    context = new AudioContext();
    }
    catch(e) {
    alert('Web Audio API is not supported in this browser');
    }
}

古い WebKit ベースのブラウザの場合は、webkit webkitAudioContext。

Web Audio API の興味深い機能の多くには、 AudioNode と音声ファイルデータのデコードは AudioContext のメソッドです。

サウンドを読み込んでいます

Web Audio API は、短～中程度の長さのオーディオに AudioBuffer を使用できます。基本的なアプローチは、HTTP リクエストごとに XMLHttpRequest を取得しています。

この API では、 WAV、MP3、AAC、OGG、その他ブラウザによるさまざまな音声形式は異なります。

次のスニペットは、音声のサンプルを読み込む方法を示しています。

var dogBarkingBuffer = null;
var context = new AudioContext();

function loadDogSound(url) {
    var request = new XMLHttpRequest();
    request.open('GET', url, true);
    request.responseType = 'arraybuffer';

    // Decode asynchronously
    request.onload = function() {
    context.decodeAudioData(request.response, function(buffer) {
        dogBarkingBuffer = buffer;
    }, onError);
    }
    request.send();
}

音声ファイルのデータはテキストではなくバイナリであるため、responseType を設定します。 'arraybuffer' へのリクエストのレスポンスです。詳細については、このモジュールの ArrayBuffers については、XHR2 に関する記事をご覧ください。

受け取った音声ファイルの（デコードされていない）データは、保持しておくことができます。後でデコードできるようにしたり、 AudioContext decodeAudioData() メソッド。このメソッドは、音声ファイルデータの ArrayBuffer が request.response に保存されました。非同期にデコードする（メインの JavaScript の実行をブロックしない）あります）。

decodeAudioData() が終了すると、次のコールバック関数が呼び出されます。は、デコードされた PCM 音声データを AudioBuffer として提供します。

音を鳴らす

1 つ以上の AudioBuffers が読み込まれたら、プレイの準備が整いますできます。サウンドを含む AudioBuffer を読み込んだとしましょう。読み込みが完了しました。その後、このバッファを次のコードで置き換えます。

var context = new AudioContext();

function playSound(buffer) {
    var source = context.createBufferSource(); // creates a sound source
    source.buffer = buffer;                    // tell the source which sound to play
    source.connect(context.destination);       // connect the source to the context's destination (the speakers)
    source.noteOn(0);                          // play the source now
}

この playSound() 関数は、誰かがキーを押すたびに呼び出すか、マウスで何かをクリックしたりします

noteOn(time) 関数を使用すると、正確なサウンドのスケジュールを簡単に調整できますゲームなど時間制限のあるアプリでの再生に最適ですただし、このスケジュールが正しく機能するため、サウンドバッファができます。

Web Audio API の抽象化

もちろん、より一般的な読み込みシステムを作成する方がよいでしょう。ハードコードされていませんGoogle のさまざまな短編から中程度の長さの音を扱うためのたとえば、（ウェブ標準には含まれていない）BufferLoader を使用する 1 つの方法を紹介します。

BufferLoader クラスの使用例を次に示します。 2 つの AudioBuffers を作成しましょう。読み込みが完了するとすぐにそれらを同時に再生します

window.onload = init;
var context;
var bufferLoader;

function init() {
    context = new AudioContext();

    bufferLoader = new BufferLoader(
    context,
    [
        '../sounds/hyper-reality/br-jam-loop.wav',
        '../sounds/hyper-reality/laughter.wav',
    ],
    finishedLoading
    );

    bufferLoader.load();
}

function finishedLoading(bufferList) {
    // Create two sources and play them both together.
    var source1 = context.createBufferSource();
    var source2 = context.createBufferSource();
    source1.buffer = bufferList[0];
    source2.buffer = bufferList[1];

    source1.connect(context.destination);
    source2.connect(context.destination);
    source1.noteOn(0);
    source2.noteOn(0);
}

時間との闘い: リズムに合わせてサウンドを再生する

Web Audio API を使用すると、デベロッパーは再生のスケジュールを正確に設定できます。宛先簡単なリズムトラックを設定しましょうおそらく最も広く知られているドラムキットのパターンは、次のとおりです。

ハイハットは 8 分音符でキックとスネアは四半期ごとに交互に 4 分の 4 の動画で配信していました。

kick、snare、hihat の各バッファを読み込んだと仮定すると、そのためのコードは簡単です。

for (var bar = 0; bar < 2; bar++) {
    var time = startTime + bar * 8 * eighthNoteTime;
    // Play the bass (kick) drum on beats 1, 5
    playSound(kick, time);
    playSound(kick, time + 4 * eighthNoteTime);

    // Play the snare drum on beats 3, 7
    playSound(snare, time + 2 * eighthNoteTime);
    playSound(snare, time + 6 * eighthNoteTime);

    // Play the hi-hat every eighth note.
    for (var i = 0; i < 8; ++i) {
    playSound(hihat, time + i * eighthNoteTime);
    }
}

ここでは、先ほど見た無制限のループではなく、1 回だけ繰り返します。あります。関数 playSound は、特定の処理を実行するメソッドです。次のように指定して実行します。

function playSound(buffer, time) {
    var source = context.createBufferSource();
    source.buffer = buffer;
    source.connect(context.destination);
    source.noteOn(time);
}

音の音量の変更

サウンドに対して行う最も基本的な操作の 1 つは、音量を変更します。Web Audio API を使うと、ソースを AudioGainNodeを介してそのデスティネーションをボリューム:

この接続の設定手順は次のとおりです。

// Create a gain node.
var gainNode = context.createGainNode();
// Connect the source to the gain node.
source.connect(gainNode);
// Connect the gain node to the destination.
gainNode.connect(context.destination);

グラフを設定したら、プログラムでボリュームを増やすには、gainNode.gain.value を次のように操作します。

// Reduce the volume.
gainNode.gain.value = 0.5;

2 つの音間のクロスフェード

ここで、もう少し複雑なシナリオを考えてみましょう。複数のサウンドを再生しながら、それらの間でクロスフェードを行いたい場合に適しています。これはたとえば DJ のようなアプリで 2 つのターンテーブルとある音源から別の音源にパンできるようにします

そのためには、次の音声グラフを使用します。

ゲインノードで接続された 2 つのソースのオーディオグラフ — ゲインノードで接続された 2 つのソースを含む音声グラフ

この設定を行うには、2 つの AudioGainNodes を作成し、各ソースをノードから渡します。この関数は次のような関数を使用します。

function createSource(buffer) {
    var source = context.createBufferSource();
    // Create a gain node.
    var gainNode = context.createGainNode();
    source.buffer = buffer;
    // Turn on looping.
    source.loop = true;
    // Connect source to gain.
    source.connect(gainNode);
    // Connect gain to destination.
    gainNode.connect(context.destination);

    return {
    source: source,
    gainNode: gainNode
    };
}

イコールパワークロスフェード

単純な線形クロスフェードアプローチでは、パンしたときに音量が下がる予測します。

この問題に対処するために、等電力曲線を使用します。対応するゲイン曲線は非線形で、あります。これにより、オーディオ領域間の音量低下が最小限に抑えられ、リージョン間でより均等にクロスフェードします。異なります

プレイリストのクロスフェード

もう 1 つの一般的なクロスフェーダーアプリケーションとして、音楽プレーヤーアプリケーションがあります。曲が変わったら、現在のトラックをフェードアウトし、スムーズに移行する必要があります。そのためには、未来へのクロスフェードですsetTimeout を使用してこれを行うこともできますが、これは正確ではありません。Web Audio API では AudioParam インターフェースを使用して、将来の値をスケジュール設定できます。パラメータ（AudioGainNode のゲイン値など）です。

したがって、プレイリストが与えられたときに、特定のトラックのトラックへの移動をスケジュール設定して、現在再生中のトラックのゲインは下がり、トラックのゲインは現在のトラックの再生が終わる少し前に再生します。

function playHelper(bufferNow, bufferLater) {
    var playNow = createSource(bufferNow);
    var source = playNow.source;
    var gainNode = playNow.gainNode;
    var duration = bufferNow.duration;
    var currTime = context.currentTime;
    // Fade the playNow track in.
    gainNode.gain.linearRampToValueAtTime(0, currTime);
    gainNode.gain.linearRampToValueAtTime(1, currTime + ctx.FADE_TIME);
    // Play the playNow track.
    source.noteOn(0);
    // At the end of the track, fade it out.
    gainNode.gain.linearRampToValueAtTime(1, currTime + duration-ctx.FADE_TIME);
    gainNode.gain.linearRampToValueAtTime(0, currTime + duration);
    // Schedule a recursive track change with the tracks swapped.
    var recurse = arguments.callee;
    ctx.timer = setTimeout(function() {
    recurse(bufferLater, bufferNow);
    }, (duration - ctx.FADE_TIME) - 1000);
}

Web Audio API には、便利な RampToValue メソッドのセットが用意されており、パラメータの値を徐々に変更していく linearRampToValueAtTime と exponentialRampToValueAtTime。

遷移タイミング関数は、組み込みの線形関数から（上記のように指数関数的）の場合は、独自の値も setValueCurveAtTime 関数を使って値の配列を曲線で表します。

サウンドにシンプルなフィルタ効果を適用する

Web Audio API を使用すると、あるオーディオノードから別のオーディオノードに音声をパイプで転送できます。処理が複雑になりがちで、処理が複雑になりがち効果音を追加できます

そのためには、音声と音声の間に BiquadFilterNode を配置する方法があります。定義できます。このタイプのオーディオノードでは、さまざまな処理を実行できます。低次フィルタを使用でき、グラフィックイコライザーやより複雑な効果を表現できます。主に、画像のどの部分をどの周波数スペクトルで抑えるかを指定できます

サポートされているフィルタのタイプは次のとおりです。

ローパスフィルタ
ハイパスフィルタ
バンドパスフィルタ
ローシェルフフィルタ
ハイシェルフフィルタ
ピーキングフィルタ
ノッチフィルタ
オールパスフィルタ

どのフィルタにもパラメータが含まれており、ゲイン、フィルタを適用する頻度、品質係数です。ローパスフィルタは、低い周波数帯を維持し、高い周波数帯を破棄あります。ブレークオフポイントは、周波数の値、 Q 係数は単位なしであり、モデルの形状を決定します。表示されます。ゲインは、ローシェルフ / ゲインなどの特定のフィルタにのみ影響し、重要な役割を果たします

単純なローパスフィルタを設定して、音声のサンプル:

// Create the filter
var filter = context.createBiquadFilter();
// Create the audio graph.
source.connect(filter);
filter.connect(context.destination);
// Create and specify parameters for the low-pass filter.
filter.type = 0; // Low-pass filter. See BiquadFilterNode docs
filter.frequency.value = 440; // Set cutoff to 440 HZ
// Playback the sound.
source.noteOn(0);

一般的に、高い頻度で機能させるには、頻度のコントロールを微調整する必要があります。人間の聴覚自体も同じ原理で機能するため、対数スケール（つまり、A4 は 440 Hz、A5 は 880 Hz です）。詳しくは、 FilterSample.changeFrequency 関数（上記のソースコードリンク内）

最後に、サンプルコードを使用すると、 AudioContext グラフを動的に変更します。接続を解除できます node.disconnect(outputNumber) を呼び出してグラフから AudioNode。たとえば、グラフをフィルタを通過し、直接接続する場合、次のことができます。

// Disconnect the source and filter.
source.disconnect(0);
filter.disconnect(0);
// Connect the source directly.
source.connect(context.destination);

もっと聞く

音声の読み込みや再生など、API の基本についてはすでに説明しました。提供しますゲインノードとフィルタを含む音声グラフを作成しました。スケジュール設定されたサウンドとオーディオパラメータを微調整して、一般的なサウンドを有効にするできます。これで、優れたウェブを構築する準備が整いました。あります。

インスピレーションを得ようとしているデベロッパーの多くは、お疲れさまでした。私のお気に入り含める:

AudioJedit: ブラウザ内音声スプライスツールで、 SoundCloud のパーマリンク。
ToneCraft: 音声を作成するサウンドシーケンサーブロックを積み重ねていきます。
Plink: ウェブオーディオとウェブを使用したコラボレーション指向の音楽制作ゲームソケット。