JP5527827B2 - Loudness adjusting device, loudness adjusting method, and program - Google Patents
Loudness adjusting device, loudness adjusting method, and program Download PDFInfo
- Publication number
- JP5527827B2 JP5527827B2 JP2012094004A JP2012094004A JP5527827B2 JP 5527827 B2 JP5527827 B2 JP 5527827B2 JP 2012094004 A JP2012094004 A JP 2012094004A JP 2012094004 A JP2012094004 A JP 2012094004A JP 5527827 B2 JP5527827 B2 JP 5527827B2
- Authority
- JP
- Japan
- Prior art keywords
- audio data
- unit
- loudness
- value
- gain adjustment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Description
本発明はラウドネス調整装置、ラウドネス調整方法、及びプログラムに関する。 The present invention relates to a loudness adjusting device, a loudness adjusting method, and a program.
地上波デジタルテレビ放送の本格運用が開始されている。デジタルテレビ放送は、コンテンツの作成者が生成した音声をそのまま視聴者の視聴する音声とすることができる。しかしその反面、作成者がダイナミックレンジの広いコンテンツを作成した場合、コンテンツ内での音量差が大きくなる。視聴者が生活雑音の中でこのようなコンテンツをデジタルテレビ等で視聴すると、小さな音声が聞きづらいと感じる場合がある。そこで、視聴者がデジタルテレビ等の音量をリモートコントローラ等で大きくした場合、シーンチェンジ等が生じた場合に急に大きな音声が出力されてしまい、不快に感じる場合がある。また、このような場合にはユーザが主導で音量を再調整する必要が生じる。 Full-scale operation of digital terrestrial television broadcasting has started. In digital television broadcasting, the sound generated by the creator of the content can be used as the sound that the viewer views. On the other hand, if the creator creates content with a wide dynamic range, the volume difference within the content increases. When a viewer views such content on a digital television or the like in a daily life noise, it may be difficult to hear a small sound. Therefore, when the viewer increases the volume of a digital television or the like with a remote controller or the like, a loud sound may be suddenly output when a scene change or the like occurs, which may be uncomfortable. In such a case, it is necessary to readjust the volume by the user.
このような状況を鑑みて、音声信号の音量に関する世界的な標準規格の策定が進められている。この標準規格は、番組・素材単位での平均ラウドネス値を計算し、ターゲットラウドネス値に合わせた素材を生成・運用することを目的としている。なお、ラウドネスとは、人間が感じる音の大きさ(音の感覚量)である。ラウドネス値とは、デジタル録音レベルからラウドネス測定アルゴリズムに基づいて算出したラウドネスの計算値である。平均ラウドネス値とは、任意の測定区間のラウドネス値である。ターゲットラウドネス値とは、番組の聴取レベルを適切に保つために目標とする番組の平均のラウドネス値である。詳細は、非特許文献1を参照されたい。
In view of such a situation, development of a global standard regarding the volume of an audio signal is being promoted. The purpose of this standard is to calculate an average loudness value for each program / material, and to generate and operate a material that matches the target loudness value. Note that the loudness is the volume of sound perceived by humans (the amount of sound sensed). The loudness value is a calculated loudness value calculated from a digital recording level based on a loudness measurement algorithm. The average loudness value is a loudness value in an arbitrary measurement interval. The target loudness value is an average loudness value of a target program in order to keep the program listening level appropriate. For details, see Non-Patent
デジタルテレビ放送には、スポーツ中継や記者会見中継等の生放送番組があり、これらの番組に対しては基本的に編集処理を行うことが出来ない。そのため、前述の標準規格に規定された音量感の調整処理をリアルタイムで行う装置を提供する必要がある。 Digital television broadcasts include live broadcast programs such as sports broadcasts and press conference broadcasts, and basically these programs cannot be edited. Therefore, there is a need to provide a device that performs real-time volume adjustment processing defined in the aforementioned standard.
上述したように、生放送番組等を考慮した場合、音量感の調整処理をリアルタイムで行うことが望ましい。しかしながら、前述の標準規格(非特許文献1)に記載された方式では、ラウドネス値が移動二乗平均値であるため、すなわち任意の区間(時間)を待った後に値を算出するため、音量感の調整処理に一定の遅れが生じてしまう。生放送番組等ではない場合(リアルタイム性が求められない場合)、平均ラウドネス値の算出時間を考慮して音声信号を遅延させる手法を用いることができる。しかしながら、生放送番組等である場合(リアルタイム性が求められる場合)、このような音声信号を遅延させる手法を用いることはできない。 As described above, when a live broadcast program or the like is taken into consideration, it is desirable to perform volume adjustment processing in real time. However, in the method described in the above-mentioned standard (Non-Patent Document 1), since the loudness value is a moving mean square value, that is, the value is calculated after waiting for an arbitrary interval (time), the volume adjustment is performed. A certain delay occurs in the processing. When the program is not a live broadcast program or the like (when real-time performance is not required), a method of delaying the audio signal in consideration of the calculation time of the average loudness value can be used. However, in the case of a live broadcast program or the like (when real-time performance is required), such a method of delaying an audio signal cannot be used.
すなわち、前述の標準規格(非特許文献1)に記載された一般的な方式では、リアルタイム性を担保しつつ、音量感の調整処理を行うことが困難であるという問題が生じていた。 That is, in the general method described in the above-mentioned standard (Non-patent Document 1), there is a problem that it is difficult to adjust the volume feeling while ensuring the real-time property.
本発明は、上述した問題点を鑑みてなされたものであり、リアルタイム性を担保しつつ、音量感の調整処理を行うことができるラウドネス調整装置、ラウドネス調整方法、及びプログラムを提供することを主たる目的とする。 The present invention has been made in view of the above-described problems, and mainly provides a loudness adjustment device, a loudness adjustment method, and a program capable of performing volume adjustment processing while ensuring real-time performance. Objective.
本発明にかかるラウドネス調整装置の一態様は、
入力デジタル音声信号のラウドネス調整を行うラウドネス調整装置であって、
前記入力デジタル音声信号から抽出された音声データに対し、ゲイン調整を行うゲイン調整部と、
前記ゲイン調整部によるゲイン調整済みの音声データを特性フィルタ処理したフィルタ済み音声データを生成する第1フィルタ部と、
前記第1フィルタ部の生成したフィルタ済み音声データが第1閾値以下の場合、前記ゲイン調整部によるゲイン調整済みの音声データを増幅して出力するブースト処理部と、
前記ブースト処理部が出力した音声データを特性フィルタ処理したフィルタ済み音声データを生成する第2フィルタ部と、
前記第2フィルタ部の生成したフィルタ済み音声データが第2閾値以上の場合、前記ブースト処理部が増幅した音声データに対してリミッタコンプレッサ処理を行って出力するリミッタコンプレッサ部と、を備えるものである。
One aspect of the loudness adjusting device according to the present invention is:
A loudness adjustment device for adjusting the loudness of an input digital audio signal,
A gain adjustment unit that performs gain adjustment on audio data extracted from the input digital audio signal;
A first filter unit that generates filtered voice data obtained by performing characteristic filtering on the voice data that has been gain-adjusted by the gain adjustment unit;
A boost processing unit that amplifies and outputs the gain-adjusted audio data by the gain adjustment unit when the filtered audio data generated by the first filter unit is equal to or less than a first threshold;
A second filter unit that generates filtered audio data obtained by performing characteristic filtering on the audio data output by the boost processing unit;
A limiter compressor unit that performs a limiter compressor process on the audio data amplified by the boost processing unit when the filtered audio data generated by the second filter unit is equal to or greater than a second threshold value. .
本発明にかかるラウドネス調整方法の一態様は、
入力デジタル音声信号のラウドネス調整を行うラウドネス調整方法であって、
前記入力デジタル音声信号から抽出された音声データに対し、ゲイン調整を行うゲイン調整ステップと、
前記ゲイン調整ステップにおけるゲイン調整済みの音声データを特性フィルタ処理したフィルタ済み音声データを生成する第1フィルタステップと、
前記第1フィルタステップにて生成したフィルタ済み音声データが第1閾値以下の場合、前記ゲイン調整ステップにおいてゲイン調整済みの音声データを増幅して出力するブースト処理ステップと、
前記ブースト処理ステップにて出力された音声データを特性フィルタ処理したフィルタ済み音声データを生成する第2フィルタステップと、
前記第2フィルタステップにて生成したフィルタ済み音声データが第2閾値以上の場合、前記ブースト処理部が増幅した音声データに対してリミッタコンプレッサ処理を行って出力するリミッタコンプレッサステップと、を備えるものである。
One aspect of the loudness adjustment method according to the present invention is:
A loudness adjustment method for adjusting the loudness of an input digital audio signal,
A gain adjustment step for performing gain adjustment on the audio data extracted from the input digital audio signal;
A first filter step for generating filtered audio data obtained by performing characteristic filtering on the audio data after gain adjustment in the gain adjustment step;
A boost processing step of amplifying and outputting the gain-adjusted audio data in the gain adjustment step when the filtered audio data generated in the first filter step is less than or equal to a first threshold;
A second filter step for generating filtered voice data obtained by performing characteristic filtering on the voice data output in the boost processing step;
A limiter compressor step for performing a limiter compressor process on the audio data amplified by the boost processing unit when the filtered audio data generated in the second filter step is equal to or greater than a second threshold value. is there.
本発明にかかるプログラムの一態様は、
入力デジタル音声信号のラウドネス調整をコンピュータに実行させるプログラムであって、
コンピュータに、
前記入力デジタル音声信号から抽出された音声データに対し、ゲイン調整を行うゲイン調整ステップと、
前記ゲイン調整ステップにおけるゲイン調整済みの音声データを特性フィルタ処理したフィルタ済み音声データを生成する第1フィルタステップと、
前記第1フィルタステップにて生成したフィルタ済み音声データが第1閾値以下の場合、前記ゲイン調整ステップにおいてゲイン調整済みの音声データを増幅して出力するブースト処理ステップと、
前記ブースト処理ステップにて出力された音声データを特性フィルタ処理したフィルタ済み音声データを生成する第2フィルタステップと、
前記第2フィルタステップにて生成したフィルタ済み音声データが第2閾値以上の場合、前記ブースト処理部が増幅した音声データに対してリミッタコンプレッサ処理を行って出力するリミッタコンプレッサステップと、
を実行させる、ものである。
One aspect of the program according to the present invention is as follows:
A program that causes a computer to perform loudness adjustment of an input digital audio signal,
On the computer,
A gain adjustment step for performing gain adjustment on the audio data extracted from the input digital audio signal;
A first filter step for generating filtered audio data obtained by performing characteristic filtering on the audio data after gain adjustment in the gain adjustment step;
A boost processing step of amplifying and outputting the gain-adjusted audio data in the gain adjustment step when the filtered audio data generated in the first filter step is less than or equal to a first threshold;
A second filter step for generating filtered voice data obtained by performing characteristic filtering on the voice data output in the boost processing step;
A limiter compressor step for performing a limiter compressor process on the audio data amplified by the boost processing unit when the filtered audio data generated in the second filter step is equal to or greater than a second threshold; and
Is to execute.
本発明によれば、リアルタイム性を担保しつつ、音量感の調整処理を行うことができるラウドネス調整装置、ラウドネス調整方法、及びプログラムを提供することができる。 ADVANTAGE OF THE INVENTION According to this invention, the loudness adjustment apparatus, the loudness adjustment method, and program which can perform the adjustment process of a volume feeling can be provided, ensuring real-time property.
<実施の形態1>
以下、図面を参照して本発明の実施の形態について説明する。図1は、本実施の形態にかかるラウドネス調整装置1の構成を示すブロック図である。ラウドネス調整装置1は、例えばデジタルテレビ受像機に内蔵される装置である。また、ラウドネス調整装置1は、インターネット放送やラジオ放送等の音声を扱う装置(例えばコンピュータ、ラジオ装置、映像/音声処理装置とも記載する。)に内蔵されても良い。
<
Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing a configuration of a
ラウドネス調整装置1は、デコーダ11と、ゲイン調整部12と、音声調整部13と、セレクタ18と、制御部19と、移動二乗平均算出部20と、移動二乗平均算出部21と、Kフィルタ22と、エンコーダ23と、を備える。音声調整部13は、Kフィルタ14と、音声データブースト部15と、Kフィルタ16と、リミッタコンプレッサ部17と、を備える。
The
デコーダ11には、入力デジタル音声信号が供給される。入力デジタル音声信号は、デジタルテレビ受像機のアンテナ等から入力されたデータである。入力音声データは、例えばAES/EBUフォーマット信号、エンベディッドオーディオ信号等である。デコーダ11は、入力デジタル音声信号をデコードし、デコード済みの音声データをゲイン調整部12に供給し、デコードにより得られた付加情報(音声モード情報、切替情報、ラウドネス運用情報等)をセレクタ18に供給する。
An input digital audio signal is supplied to the
なお、デコーダ11は、デコードにより得られた付加情報内にラウドネス調整を行わないことを指示する情報が含まれる場合、デコード済みの音声データをエンコーダ23または任意の処理部にそのまま供給し、ゲイン調整部12への音声データの供給は行わない。
Note that when the additional information obtained by decoding includes information instructing not to perform loudness adjustment, the
ゲイン調整部12は、制御部19から入力されるゲイン調整値を用いて、デコーダ11から入力された音声データのゲインを調整する。ゲイン調整部12は、ゲイン調整済みの音声データをKフィルタ14、及び音声データブースト部15に供給する。
The
音声調整部13は、後述する移動二乗平均の算出処理を待つことなく、入力された音声データのブースト処理及びリミッタコンプレッサ処理を行う。当該ブースト処理は、ラウドネス運用基準の周波数特性に適応した処理である。以下、音声調整部13内の各処理部の処理について説明する。
The
Kフィルタ14は、入力された音声データに対してK特性(ITU−R BS.1770で規定されている聴感補正フィルタの特性)フィルタリング処理を行い、フィルタリング済みの音声データを音声データブースト部15に供給する。
The
音声データブースト部15は、Kフィルタ14から入力された音声データが予め定められた閾値以下の音声データであるか否かを判定する。当該判定は、例えばデシベル値(dB)の比較により行う。閾値以下であると判定した場合、音声データブースト部15は、ゲイン調整部12から入力された音声データを増幅する(ブースト処理を行う)。音声データブースト部15は、増幅済みの音声データをKフィルタ16及びリミッタコンプレッサ部17に供給する。なお、閾値より大きいと判定した場合、音声データブースト部15は、ゲイン調整部12から入力された音声データをそのままKフィルタ16及びリミッタコンプレッサ部17に供給する。
The audio data boost
Kフィルタ16は、音声データブースト部15から入力された音声データに対してK特性(ITU−R BS.1770で規定されている聴感補正フィルタの特性)フィルタリング処理を行い、フィルタリング済みの音声データをリミッタコンプレッサ部17に供給する。
The
リミッタコンプレッサ部17は、Kフィルタ16から入力された音声データが予め定められた閾値以上の音声データであるか否かを判定する。当該判定は、例えばデシベル値(dB)の比較により行う。閾値以上であると判定した場合、リミッタコンプレッサ部17は、音声データブースト部15から入力された音声データに対してリミッタコンプレッサ処理を行い、処理後の音声データをKフィルタ22及びエンコーダ23に供給する。ここで、リミッタコンプレッサ処理は、一般的な放送音声の処理について行われる任意の音声レベルの適正化処理であれば良い。なお、閾値以上ではないと判定した場合、リミッタコンプレッサ部17は、音声データブースト部15から入力された音声データをそのままKフィルタ22及びエンコーダ23に供給する。
The
エンコーダ23は、リミッタコンプレッサ部17またはデコーダ11から入力された音声データを所定のフォーマットにエンコードし、エンコード済みの音声データを任意の処理部(例えばデジタルテレビ受像機のスピーカ等)に供給する。
The
Kフィルタ22は、リミッタコンプレッサ部17から入力された音声データに対してK特性(ITU−R BS.1770で規定されている聴感補正フィルタの特性)フィルタリング処理を行い、フィルタリング済みの音声データを移動二乗平均算出部20及び移動二乗平均算出部21に供給する。
The
移動二乗平均算出部20及び移動二乗平均算出部21は、Kフィルタ22から入力された音声データの信号パワーを求めるための二乗平均値を算出する。ここで、移動二乗平均算出部20と移動二乗平均算出部21は、異なる時間の移動二乗平均処理を行う。以下の説明では、移動二乗平均算出部20は、非特許文献1に規定された最小ブロックである100ms(0.1秒)単位で移動二乗平均値を算出し、算出値S(短い時間での移動二乗平均値)を制御部19に供給する。一方、移動二乗平均算出部21は、EBU R−128に規定された時間である3s(3秒)単位で移動二乗平均を算出し、算出値L(長い時間での移動二乗平均値)を制御部19に供給する。なお、移動二乗平均の算出方法の詳細は、非特許文献1を参照されたい。また、上述の移動二乗平均の単位となる時間(0.1秒、3秒)はあくまで一例であり、これに必ずしも限られない。
The moving mean
セレクタ18には、外部からの制御情報と、デコーダ11からの付加情報と、が入力される。制御情報とは、後述する高速な開放処理(REL処理)を指示する指示情報を含むことができる情報である。付加情報には、上述のように音声モードの切替(例えば、CM(コマーシャル)音声と番組音声の切替)に関する情報が含まれる。セレクタ18は、両入力のうち制御部19の動作を変更する情報を適宜選択し、選択した情報を制御部19に供給する。セレクタ18の動作詳細は、図5を参照して後述する。
The
制御部19には、セレクタ18の選択した情報と、ターゲットラウドネス値と、移動二乗平均算出部20の算出値Sと、移動二乗平均算出部21の算出値Lと、が入力される。制御部19は、これらの情報を基にゲイン調整値を算出し、算出したゲイン調整値をゲイン調整部12に供給する。
The information selected by the
ターゲットラウドネス値とは、前述のように出力音量の目的値となる平均ラウドネス値である。制御部19は、ゲイン調整値に関する抑圧処理(ATK(アタック)処理)、または開放処理(REL(リリース)処理)を行うことにより、ゲイン調整部12における音声データのゲイン調整を制御する。抑圧処理(ATK処理)とは、規定値レベル(dB)以上の音声データが入力された場合には、音声データを抑圧するようなゲイン調整値を定めることを意味する。開放処理(REL処理)とは、規定値レベル(dB)以下の音声データが入力された場合には、音声データを開放するようなゲイン調整値を定めることを意味する。制御部19は、設定したゲイン調整値をゲイン調整部12に供給する。
The target loudness value is an average loudness value that is the target value of the output volume as described above. The
図2及び図3を参照し、一般的な抑圧処理(ATK処理)及び開放処理(REL処理)の概要を説明する。ある音声データが規定値レベル(th)である場合、図2に示すように音声データを抑圧する処理(ATK処理)を行う。例えば音声データのデシベル値(dB)が規定レベル(th)より大きい場合、音声データのレベルを弱めるようなゲイン調整値を設定する。この時、抑圧量がある一定量以上(通常は約90%以上)になるまでの時間を抑圧時間(アタック時間)という。 An outline of general suppression processing (ATK processing) and release processing (REL processing) will be described with reference to FIGS. When certain audio data is at a specified value level (th), a process (ATK process) for suppressing the audio data is performed as shown in FIG. For example, when the decibel value (dB) of the audio data is larger than the specified level (th), a gain adjustment value that weakens the level of the audio data is set. At this time, the time until the suppression amount becomes a certain amount or more (usually about 90% or more) is called suppression time (attack time).
また、図3に示すように、抑圧状態から規定値レベル(th)以下の音声データとなった場合、抑圧状態から開放する処理(REL処理)を行う。この時、開放される量がある一定量以上(通常は開放量が約90%以上)になるまでの時間を開放時間(リリース時間)という。なお、抑圧処理(ATK処理)及び開放処理(REL処理)の詳細は、例えば特許文献1を参照されたい。
In addition, as shown in FIG. 3, when the voice data becomes lower than the specified value level (th) from the suppressed state, a process of releasing from the suppressed state (REL process) is performed. At this time, the time until the amount to be released reaches a certain amount or more (usually the opening amount is about 90% or more) is referred to as an opening time (release time). For details of the suppression process (ATK process) and the release process (REL process), refer to
以下、制御部19の詳細な処理を図4及び図5を参照して説明する。はじめに、図4を参照して制御部19による抑圧処理(ATK処理)について説明する。制御部19は、算出値S(移動二乗平均算出部20の出力値)と、ターゲットラウドネス値(Lth)と、を比較する(ST11)。算出値Sがターゲットラウドネス値(Lth)よりも大きくない場合(ST11:No)、制御部19は、処理を行わない。算出値Sがターゲットラウドネス値(Lth)よりも大きい場合(ST11:Yes)、制御部19は、抑圧処理(ATK処理)の実行中であるか否かを判定する(ST12)。
Hereinafter, detailed processing of the
抑圧処理(ATK処理)の実行中ではない場合(ST12:No)、制御部19は、算出値L(移動二乗平均算出部21の出力値)が増加傾向にあるか否かを判定する(ST13)。算出値Lが増加傾向にはない場合(ST13:No)、制御部19は、処理を行わない。一方、算出値Lが増加傾向にある場合(ST13:Yes)、制御部19は、抑圧処理(ATK処理)を実行する(ST14)。ゲイン調整値は、所望の抑圧時間と、入力音声データのdB値に応じて調整される
When the suppression process (ATK process) is not being executed (ST12: No), the
抑圧処理(ATK処理)の実行中である場合(ST12:Yes)、制御部19は、算出値L(移動二乗平均算出部21の出力値)が増加傾向にあるか否かを判定する(ST15)。算出値Lが増加傾向にはない場合(ST15:No)、制御部19は、抑圧処理(ATK処理)を中断する(ST16)。一方、算出値Lが増加傾向にある場合(ST15:Yes)、制御部19は、抑圧処理(ATK処理)を実行する(ST14)。
When the suppression process (ATK process) is being executed (ST12: Yes), the
続いて、抑圧処理(ATK処理)からの開放処理(REL)処理の流れを図5を参照して説明する。セレクタ18は、音声モードが変更された場合に、変更されたことを示す信号を出力する。制御部19は、セレクタ18からの出力信号により音声モードが切り替わったか否かを判定する(ST21)。音声モードが切り替わっていない場合(ST21:No)、制御部19は、開放用の閾値(開放閾値(REL start th)とも記載する。)と、算出値Sと、を比較する(ST22)。開放閾値は、ターゲットラウドネス値よりも低い値を持つ。
Next, the flow of the release process (REL) process from the suppression process (ATK process) will be described with reference to FIG. The
算出値Sが開放閾値以下である場合(ST22:Yes)、制御部19は、通常の開放処理となるようにゲイン調整値を設定する(ST23)。すなわち、制御部19は、所定の開放時間(T1)となるようにゲイン調整値を設定する(ST23)。一方、算出値Sが開放閾値以下ではない場合(ST22:No)、制御部19は、処理を行わない。
When the calculated value S is less than or equal to the opening threshold (ST22: Yes), the
抑圧処理(ATK処理)の実行中であって音声モードの変更が生じた場合(ST21:Yes)、制御部19は、高速の開放処理となるようにゲイン調整値を設定する(ST24)。すなわち、制御部19は、所定の開放時間(T1)よりも短い開放時間(T2)となるようにゲイン調整値を設定する(ST24)。換言すると、制御部19は、通常の開放処理(REL)よりも開放量が大きくなるようにゲイン調整値を設定する。ゲイン調整値は、所望の開放時間(T1またはT2)と、入力音声データのdB値に応じて調整される。
When the suppression process (ATK process) is being executed and the voice mode is changed (ST21: Yes), the
なお、上述の判定において、高速な開放処理(REL)処理を指示する制御情報がセレクタ18から入力された場合、制御部19は、音声モードの変更時と同様の処理(ST21:Yes)を行う。
In the above determination, when control information for instructing a high-speed release process (REL) process is input from the
続いて、各処理部の動作と出力音声データとの関係を図6〜図9を参照して説明する。図6は、音声調整部13(Kフィルタ14、音声データブースト部15、Kフィルタ16、リミッタコンプレッサ17)の制御を示すグラフである。
Next, the relationship between the operation of each processing unit and output audio data will be described with reference to FIGS. FIG. 6 is a graph showing control of the sound adjustment unit 13 (
前述のように非特許文献1に記載されたラウドネス値の調整手法では、移動二乗平均を用いるため、リアルタイムでのラウドネス調整が困難である。そのため、図6に示すように、瞬間的に大きな音量の音声データが入力された場合、一般的なラウドネス値の調整手法では大きな音量差(図中の(1))が生じてしまう。これにより、視聴者に不快感を与えてしまう。
As described above, the loudness value adjustment method described in
一方、本実施の形態にかかるラウドネス調整装置1は、音声調整部13を備える。そして、当該音声調整部13は、移動二乗平均値を用いることなく、入力音声データの抑圧処理(リミッタコンプレッサ処理)を行う。そのため、瞬間的に大きな音量の音声データが入力された場合であっても、音量差を抑えることが出来る(図中の(2))。これにより、視聴者にとって違和感の無い、すなわち不快感を与えることの無い音声データの提供を実現することができる。
On the other hand, the
図7及び図8は、制御部19のゲイン調整値の調整処理を示すグラフである。図7は、各タイミング(TM1〜TM5)における算出値Sと各閾値(ターゲットラウドネス値及び開放閾値)、及び算出値Lの増減を示す図である。図8は、制御部19によるゲイン調整値の調整を示す図である。図7及び図8には、同一の入力音声データ、算出値S、及び算出値Lが表示されている。
7 and 8 are graphs showing the adjustment process of the gain adjustment value of the
タイミングTM1において、算出値Sは、ターゲットラウドネス値以上であり、かつ算出値Lは増加傾向にある(図7TM1)。そのため、制御部19は、タイミングTM1から抑圧処理(ATK処理)を開始する(図8TM1)。タイミングTM1〜TM2の間、制御部19は、抑圧処理(ATK処理)を実行する。
At timing TM1, the calculated value S is greater than or equal to the target loudness value, and the calculated value L tends to increase (FIG. 7 TM1). Therefore, the
タイミングTM2において、算出値Lは減少傾向にある(図7TM2)。そのため、制御部19は、タイミングTM2から抑圧処理(ATK処理)の実行を保留する(図8TM2)。タイミングTM2〜TM3の間、制御部19は、抑圧処理(ATK処理)を行わない。
At timing TM2, the calculated value L tends to decrease (FIG. 7TM2). Therefore, the
タイミングTM3において、算出値Sは、ターゲットラウドネス値以上であり、かつ算出値Lは増加傾向となる(図7TM3)。そのため、制御部19は、タイミングTM1から抑圧処理(ATK処理)を再開する(図8TM3)。
At timing TM3, the calculated value S is greater than or equal to the target loudness value, and the calculated value L tends to increase (FIG. 7 TM3). Therefore, the
タイミングTM4において、算出値Sは、開放閾値以下となる(図7TM4)。そのため、制御部19は、タイミングTM4から開放処理(REL処理)を開始する(図8TM4)。
At timing TM4, the calculated value S is equal to or less than the open threshold (FIG. 7 TM4). Therefore, the
タイミングTM1において、算出値Sは、ターゲットラウドネス値以上となり、かつ算出値Lは増加傾向にある(図7TM5)。のため、制御部19は、タイミングTM5から抑圧処理(ATK処理)を開始する(図8TM5)。以上のように、制御部19は、算出値S及び算出値Lを用いてゲイン調整値の調整を行う。
At timing TM1, the calculated value S is equal to or greater than the target loudness value, and the calculated value L is increasing (FIG. 7 TM5). Therefore, the
図9は、制御部19による開放処理を示す図である。図9は、一般的な開放処理(ターゲットラウドネス値との比較)を用いて生成した音声データと、開放閾値を用いた開放処理を用いて生成した音声データと、を示すグラフである。図示するように、一般的な開放処理では、音声データがターゲットラウドネス値を下回った場合、即座に開放処理を行う。そのため、ターゲットラウドネス値付近での抑圧、及び開放が交互に繰り返される。これにより、元の音声データに対して振幅の変化が揺らいだ状態になる。換言すると、元の音声データの抑揚を正確に表した音声データを生成することができない。
FIG. 9 is a diagram illustrating an opening process performed by the
一方、ターゲットラウドネス値よりも小さい値である開放閾値を用いた開放処理を用いて生成した音声データは、ターゲットラウドネス値付近において抑圧と開放が交互に繰り返される事象が無くなる。これにより、元の音声データに対して振幅の変化が揺らいだ状態を回避することができる。よって、図9に示すように、元の音声データの抑揚を正確に表した音声データを生成することができる。 On the other hand, the sound data generated by using the release process using the release threshold that is smaller than the target loudness value does not have an event in which suppression and release are alternately repeated in the vicinity of the target loudness value. Thereby, it is possible to avoid a state in which the change in amplitude fluctuates with respect to the original audio data. Therefore, as shown in FIG. 9, it is possible to generate audio data that accurately represents the inflection of the original audio data.
続いて、本実施の形態にかかるラウドネス調整装置1の効果について改めて説明する。上述のように、音声調整部13は、移動二乗平均の算出値を用いることなく、特性フィルタ処理に従ったブースト処理及びリミッタコンプレッサ処理を行う。これらの処理は、移動二乗平均の算出とは異なり、即時的に処理が可能である。当該構成により、極端に大きな音声データを抑圧することができ、かつ、極端に大きな音声データに後続する通常の音量の音声データを不要に抑圧することが無くなる。すなわち、リアルタイム性を担保しつつ、音量感の調整を適切に行うことができる。換言すると、リアルタイム性を保ちつつ、音質を一定に保つ(違和感の無い音声を生成する)ラウドネス調整を実現することが可能となる。
Then, the effect of the
さらに、制御部19は、図4に示すように、算出値Lの増加時にのみ抑圧処理(ATK処理)を行い、算出値Lの減少時には抑圧処理(ATK処理)の保留を行うことにより、過度の抑圧処理(ATK処理)を行わない。これにより、抑圧が行われすぎた音声データを出力することを回避できる。
Furthermore, as shown in FIG. 4, the
さらにまた、抑圧処理(ATK処理)の実行中から開放処理(REL処理)に移行する際にも、音声データのレベルがターゲットラウドネス値よりも小さい値である開放閾値以下となった場合に開放処理を行う。これにより、不要な開放処理を行うことなく、生成する音声データの抑揚を基の音声データの抑揚と近づけることができる。 Furthermore, even when the suppression process (ATK process) is being executed and the process proceeds to the release process (REL process), the release process is performed when the level of the audio data is equal to or less than the release threshold value that is smaller than the target loudness value. I do. As a result, the inflection of the generated voice data can be brought close to the inflection of the original voice data without performing unnecessary release processing.
制御部19は、抑圧処理(ATK処理)の実行中に音声モードの変更や外部からの指示が生じた場合に、通常の開放処理(REL処理)よりも開放時間が短くなるようにゲイン調整値を設定する(高速開放処理を実行する)。デジタルテレビに関する音声信号は、番組コンテンツとコマーシャルが混在し、両者の音量感が全く異なる場合がある。一般的なラウドネス調整の手法では、番組コンテンツからコマーシャルに切り替わる場合、番組コンテンツにかかる音声データの解析(移動二乗平均の算出)に基づく抑圧処理(ATK処理)が行われてしまう恐れがある。すなわち、番組コンテンツに適した抑圧処理(ATK処理)をコマーシャルに対しても行ってしまう。しかし、本実施形態にかかるラウドネス調整装置では、上述の高速開放処理を行うことにより、抑圧量を即座にキャンセルすることができ、コンテンツに応じたラウドネス調整を瞬時に行うことが可能になる。
The
さらにまた、デコーダ11は、デコードにより得られた付加情報内にラウドネス調整を行わないことを指示する情報が含まれる場合、デコード済みの音声データをエンコーダ23または任意の処理部にそのまま供給する。デコーダ11に入力される入力デジタル音声信号は、生放送等のような番組にかかるものの他に、予め非特許文献1に規定のラウドネス調整が行われたコンテンツにかかるものがある。後者の場合、既に制作者の意図通りのラウドネス調整が行われているため、改めてラウドネス調整を行う必要がない。デコーダ11が後者の信号の場合にラウドネス調整を行うことなくそのまま出力を行うため、制作者の意図を変えることなく音声データを供給することができる。
Further, when the additional information obtained by decoding includes information indicating that loudness adjustment is not performed, the
<実施の形態2>
本実施の形態にかかるラウドネス調整装置1は、多チャンネル(サラウンドまたはそれ以上のチャンネル数)の音声データを処理できることを特徴とする。本実施の形態にかかるラウドネス調整装置1について、実施の形態1と異なる点を以下に説明する。
<
The
図10は、本実施の形態にかかるラウドネス調整装置1の構成を示すブロック図である。ラウドネス調整装置1には、多チャンネル(サラウンドまたはそれ以上のチャンネル数)に関する入力デジタル音声信号が入力される。
FIG. 10 is a block diagram showing a configuration of the
ラウドネス調整装置1は、入力デジタル音声信号内の各チャンネルに応じた数の音声調整部13(13−1〜13―n、nは2以上の整数であり以下の記載でも同様である。)、移動二乗平均算出部20(20−1〜20−n)、移動二乗平均算出部21(21−1〜21−n)、Kフィルタ22(22−1〜22−n)、ゲイン乗算部24(24−1〜24−n)、二乗平均積算部25−1、及び二乗平均積算部25−2を備える。
The
デコーダ11は、入力デジタル音声信号をデコードし、各チャネルに対応する音声データを音声調整部13−1〜13−nに供給する。実施の形態1と同様の符号を付した処理部の処理は、チャネル毎に実施の形態1と同様の処理を行うため、その詳細な説明は省略する。
The
ゲイン乗算部24−1は、算出値S及び算出値Lに対して、処理対象のチャネルに対応付けられたゲインを乗算する。そして、ゲイン乗算部24−1は、算出値Sの乗算結果を二乗平均積算部25−1に供給し、算出値Lの乗算結果を二乗平均積算部25−2に供給する。 The gain multiplication unit 24-1 multiplies the calculated value S and the calculated value L by a gain associated with the processing target channel. Then, the gain multiplication unit 24-1 supplies the multiplication result of the calculated value S to the root mean square integration unit 25-1, and supplies the multiplication result of the calculation value L to the root mean square integration unit 25-2.
二乗平均積算部25−1は、各チャネルの算出値S(最小ブロックである100ms(0.1秒)単位で移動二乗平均値)を積算(累積加算)する。二乗平均積算部25−1は、積算結果を制御部19に供給する。
The root mean square accumulating unit 25-1 accumulates (accumulates and adds) the calculated value S of each channel (moving mean square value in units of 100 ms (0.1 second) which is the minimum block). The root mean square integration unit 25-1 supplies the integration result to the
二乗平均積算部25−2は、各チャネルの算出値L((3秒)単位で移動二乗平均)を積算(累積加算)する。二乗平均積算部25−1は、積算結果を制御部19に供給する。
The root mean square accumulating unit 25-2 accumulates (accumulates and adds) the calculated values L (moving mean square in units of (3 seconds)) of each channel. The root mean square integration unit 25-1 supplies the integration result to the
制御部19は、二乗平均積算部25−1及び二乗平均積算部25−2から入力された積算値を基に、各ゲイン調整部12−1〜12−nに供給するゲイン調整部を算出し、供給する。
The
続いて、本実施の形態にかかるラウドネス調整装置1の効果について説明する。ラウドネス調整装置1は、上述の構成により、多チャンネルに関する入力デジタル音声信号が入力された場合であってもリアルタイム性を担保しつつ、音量感の調整処理を行うことができる。
Then, the effect of the
<実施の形態3>
本実施の形態にかかるラウドネス調整装置1は、音声データの無音判定を行う処理部を有することを特徴とする。本実施の形態にかかるラウドネス調整装置1について、実施の形態1と異なる点を以下に説明する。
<Embodiment 3>
The
図11は、本実施の形態にかかるラウドネス調整装置1の構成を示すブロック図である。ラウドネス調整装置1は、実施の形態1の構成(図1)に加えて無音検出部26を更に備える。
FIG. 11 is a block diagram showing a configuration of the
デコーダ11は、デコード済みの音声データをゲイン調整部12と、無音検出部26と、に適宜供給する。無音検出部26は、音声データのレベル変動、すなわちデシベル(dB)変動の有無を検知し、レベル変動が一定時間生じない場合、あるいは、素材切替時に音声データをミュート(無音状態)とする時に生成される音声データが全て"0"となる場合、あるいは特定の音声データとなる状態が一定時間経過する場合、のいずれかを検出した際に制御部19に通知を行う。
The
制御部19は、抑圧処理(ATK処理)を行っている際に無音検出部26からの通知を受け付けた場合、上述の高速開放処理(REL処理、図5ST24)を実行する。
When the
続いて、本実施の形態にかかるラウドネス調整装置1の効果について説明する。一般的に、テレビ番組コンテンツからコマーシャルに切り替わる場合、一定時間の無音区間が存在する。ここで、入力音声デジタル信号内に抽出した付加情報内に、コンテンツの切り替わりにかかる情報が含まれない場合がある。本実施の形態にかかるラウドネス調整装置1は、無音検出部26により無音区間を検出している。そして、制御部19は、付加情報に加えて無音区間の有無に応じて高速開放処理(REL処理)を実行する。これにより、コンテンツが切り替わる前に行われていた抑圧処理(ATK処理)を即座にキャンセルすることができ、コンテンツに応じたラウドネス調整を瞬時に行うことが可能になる。
Then, the effect of the
ここで、改めて本発明の概略を図12を参照して説明する。図12は、ラウドネス調整装置1の概略を示したブロック図である。ラウドネス調整装置1は、ゲイン調整部12と、音声調整部13と、を備える。音声調整部13は、Kフィルタ14と、音声データブースト部15と、Kフィルタ16と、リミッタコンプレッサ部17と、を備える。
Here, the outline of the present invention will be described again with reference to FIG. FIG. 12 is a block diagram showing an outline of the
ゲイン調整部12には、音声データが入力される。ここで、音声データとは、例えばAES/EBUフォーマット信号、エンベディッドオーディオ信号等をデコードすることにより得られるデータである。ゲイン調整部12は、所定のゲイン調整値を用いて入力された音声データのゲインを調整し、ゲイン調整済みの音声データをKフィルタ14及び音声データブースト部15に供給する。
Audio data is input to the
Kフィルタ14は、入力された音声データに対してK特性(フィルタリング処理を行い、フィルタリング済みの音声データを音声データブースト部15に供給する。
The
音声データブースト部15は、Kフィルタ14から入力された音声データが予め定められた閾値以下の音声データであるか否かを判定する。閾値以下であると判定した場合、音声データブースト部15は、ゲイン調整部12から入力された音声データを増幅する(ブースト処理を行う)。音声データブースト部15は、増幅済みの音声データをKフィルタ16及びリミッタコンプレッサ部17に供給する。
The audio data boost
Kフィルタ16は、音声データブースト部15から入力された音声データに対してK特性フィルタリング処理を行い、フィルタリング済みの音声データをリミッタコンプレッサ部17に供給する。
The
リミッタコンプレッサ部17は、Kフィルタ16から入力された音声データが予め定められた閾値以上の音声データであるか否かを判定する。閾値以上であると判定した場合、リミッタコンプレッサ部17は、音声データブースト部15から入力された音声データに対してリミッタコンプレッサ処理を行い、処理後の音声データを出力する。
The
上記のとおり、ラウドネス調整装置1は、移動二乗平均の算出値を用いることなく、特性フィルタ処理に従ったブースト処理及びリミッタコンプレッサ処理を行う。これらの処理は、移動二乗平均の算出とは異なり、即時的に処理が可能である。当該構成により、例えば図6に示すように極端に大きな音声データを抑圧することができ、かつ、極端に大きな音声データに後続する通常の音量の音声データを不要に抑圧することが無くなる。すなわち、リアルタイム性を担保しつつ、音量感の調整を適切に行うことができる。
As described above, the
以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。 As mentioned above, the invention made by the present inventor has been specifically described based on the embodiment. However, the present invention is not limited to the embodiment, and various modifications can be made without departing from the scope of the invention. Needless to say.
上述のデコーダ11、ゲイン調整部12、音声調整部13、制御部19、移動二乗平均算出部20、移動二乗平均算出部21、Kフィルタ22、エンコーダ23の各処理は、任意のコンピュータ内で動作するプログラムとして実現することが可能である。
Each process of the above-described
プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer
readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)、CD−ROM(Read Only Memory)、CD−R、CD−R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(random access memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
The program can be any type of non-transitory computer readable medium.
readable medium) and can be supplied to a computer. Non-transitory computer readable media include various types of tangible storage media. Examples of non-transitory computer-readable media include magnetic recording media (for example, flexible disks, magnetic tapes, hard disk drives), magneto-optical recording media (for example, magneto-optical disks), CD-ROMs (Read Only Memory), CD-Rs, CD-R / W and semiconductor memory (for example, mask ROM, PROM (Programmable ROM), EPROM (Erasable PROM), flash ROM, RAM (random access memory)) are included. The program may also be supplied to the computer by various types of transitory computer readable media. Examples of transitory computer readable media include electrical signals, optical signals, and electromagnetic waves. The temporary computer-readable medium can supply the program to the computer via a wired communication path such as an electric wire and an optical fiber, or a wireless communication path.
上記実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。 A part or all of the above embodiment can be described as in the following supplementary notes, but is not limited thereto.
<付記1>
入力デジタル音声信号のラウドネス調整を行うラウドネス調整装置であって、
前記入力デジタル音声信号から抽出された音声データに対し、ゲイン調整を行うゲイン調整部と、
前記ゲイン調整部によるゲイン調整済みの音声データを特性フィルタ処理したフィルタ済み音声データを生成する第1フィルタ部と、
前記第1フィルタ部の生成したフィルタ済み音声データが第1閾値以下の場合、前記ゲイン調整部によるゲイン調整済みの音声データを増幅して出力するブースト処理部と、
前記ブースト処理部が出力した音声データを特性フィルタ処理したフィルタ済み音声データを生成する第2フィルタ部と、
前記第2フィルタ部の生成したフィルタ済み音声データが第2閾値以上の場合、前記ブースト処理部が増幅した音声データに対してリミッタコンプレッサ処理を行って出力するリミッタコンプレッサ部と、を備えるラウドネス調整装置。
<
A loudness adjustment device for adjusting the loudness of an input digital audio signal,
A gain adjustment unit that performs gain adjustment on audio data extracted from the input digital audio signal;
A first filter unit that generates filtered voice data obtained by performing characteristic filtering on the voice data that has been gain-adjusted by the gain adjustment unit;
A boost processing unit that amplifies and outputs the gain-adjusted audio data by the gain adjustment unit when the filtered audio data generated by the first filter unit is equal to or less than a first threshold;
A second filter unit that generates filtered audio data obtained by performing characteristic filtering on the audio data output by the boost processing unit;
A loudness adjustment device comprising: a limiter compressor unit that outputs the audio data amplified by the boost processing unit when the filtered audio data generated by the second filter unit is equal to or greater than a second threshold value; .
<付記2>
前記リミッタコンプレッサ部が出力した音声データを特性フィルタ処理したフィルタ済み音声データを生成する第3フィルタ部と、
前記第3フィルタ部が生成したフィルタ済み音声データに対し、第1の時間区間を用いた移動二乗平均により第1二乗平均値を算出する第1二乗平均算出部と、
前記第3フィルタ部が生成したフィルタ済み音声データに対し、第1の時間区間より長い第2の時間区間を用いた移動二乗平均により第2二乗平均値を算出する第2二乗平均算出部と、
前記第1及び第2二乗平均値、及びターゲットラウドネス値に基づいて前記ゲイン調整に用いるゲイン調整値を算出する制御部と、
を備える付記1に記載のラウドネス調整装置。
<
A third filter unit for generating filtered audio data obtained by performing characteristic filtering on the audio data output by the limiter compressor unit;
A first mean square calculation unit that calculates a first mean square value by moving mean square using a first time interval for the filtered voice data generated by the third filter unit;
A second mean square calculating unit that calculates a second mean square value by moving mean square using a second time interval longer than the first time interval for the filtered voice data generated by the third filter unit;
A control unit that calculates a gain adjustment value used for the gain adjustment based on the first and second mean square values and the target loudness value;
The loudness adjusting device according to
<付記3>
前記リミッタコンプレッサ部が出力した音声データを特性フィルタ処理したフィルタ済み音声データを生成する第3フィルタ部と、
前記第3フィルタ部が生成したフィルタ済み音声データに対し、第1の時間区間を用いた移動二乗平均により第1二乗平均値を算出する第1二乗平均算出部と、
前記第3フィルタ部が生成したフィルタ済み音声データに対し、第1の時間区間より長い第2の時間区間を用いた移動二乗平均により第2二乗平均値を算出する第2二乗平均算出部と、
前記第1及び第2二乗平均値、及びターゲットラウドネス値に基づいて前記ゲイン調整に用いるゲイン調整値を算出する制御部と、
を備える付記1に記載のラウドネス調整装置。
<Appendix 3>
A third filter unit for generating filtered audio data obtained by performing characteristic filtering on the audio data output by the limiter compressor unit;
A first mean square calculation unit that calculates a first mean square value by moving mean square using a first time interval for the filtered voice data generated by the third filter unit;
A second mean square calculating unit that calculates a second mean square value by moving mean square using a second time interval longer than the first time interval for the filtered voice data generated by the third filter unit;
A control unit that calculates a gain adjustment value used for the gain adjustment based on the first and second mean square values and the target loudness value;
The loudness adjusting device according to
<付記4>
前記制御部は、
外部からの制御情報の入力が無く、前記入力デジタル音声信号の音声モードの変更がなく、前記抑圧処理の実行中であり、かつ前記第1二乗平均値が開放閾値以下である場合、所定時間で前記入力デジタル音声信号から抽出された前記音声データの開放が完了するように前記ゲイン調整値を調整する開放処理を行い、
外部からの制御情報の入力が無く、前記入力デジタル音声信号の音声モードの変更がなく、前記抑圧処理の実行中であり、かつ前記第1二乗平均値が前記開放閾値以下ではない場合、前記開放処理を行わない、
ことを特徴とする付記3に記載のラウドネス調整装置。
<Appendix 4>
The controller is
When there is no input of control information from the outside, there is no change in the audio mode of the input digital audio signal, the suppression process is being executed, and the first mean square value is less than or equal to the open threshold value, a predetermined time Performing an opening process for adjusting the gain adjustment value so that the opening of the audio data extracted from the input digital audio signal is completed;
When there is no input of control information from the outside, there is no change in the audio mode of the input digital audio signal, the suppression process is being executed, and the first mean square value is not less than or equal to the release threshold, the release No processing,
The loudness adjusting device according to Supplementary Note 3, wherein
<付記5>
前記制御部は、
前記抑圧処理の実行中であり、かつ外部からの制御情報の入力及び前記入力デジタル音声信号の音声モードの変更のいずれか一方が生じた場合、前記所定時間よりも短い時間で前記入力デジタル音声信号から抽出された前記音声データの開放が完了するように前記ゲイン調整値を調整する、
ことを特徴とする付記3または付記4に記載のラウドネス調整装置。
<Appendix 5>
The controller is
The input digital audio signal is shorter than the predetermined time when the suppression process is being performed and any one of input of control information from the outside and change of the audio mode of the input digital audio signal occurs. Adjusting the gain adjustment value so as to complete the release of the audio data extracted from
The loudness adjusting apparatus according to Supplementary Note 3 or Supplementary Note 4, wherein
<付記6>
前記入力デジタル音声信号から前記音声データを抽出するデコーダを更に備え、
前記デコーダは、前記入力デジタル音声信号から付加情報を抽出し、前記付加情報内にゲイン調整を行わないことを指示する情報が含まれている場合、抽出した前記音声データを前記ゲイン調整部に供給せずに他の任意の出力装置に供給し、
それ以外の場合には前記ゲイン調整部に抽出した前記音声データを供給する、
ことを特徴とする付記1乃至付記5のいずれか1項に記載のラウドネス調整装置。
<Appendix 6>
A decoder for extracting the audio data from the input digital audio signal;
The decoder extracts additional information from the input digital audio signal, and supplies the extracted audio data to the gain adjustment unit when information indicating that gain adjustment is not performed is included in the additional information. Supply to any other output device without
In other cases, the audio data extracted is supplied to the gain adjustment unit.
The loudness adjustment device according to any one of
<付記7>
前記デコーダが抽出した前記音声データを解析し、無音状態が一定時間続いた場合に前記制御部に通知を行う無音検出部を更に備え、
前記制御部は、前記抑圧処理の実行中であり、かつ前記無音検出部からの通知を受信した場合、前記所定時間よりも短い時間で前記音声データの開放が完了するように前記ゲイン調整値を調整する、
ことを特徴とする付記6に記載のラウドネス調整装置。
<Appendix 7>
Analyzing the audio data extracted by the decoder, and further comprising a silence detection unit for notifying the control unit when a silent state continues for a certain period of time;
When the control unit is executing the suppression process and receives a notification from the silence detection unit, the control unit sets the gain adjustment value so that the release of the audio data is completed in a time shorter than the predetermined time. adjust,
The loudness adjusting device according to appendix 6, wherein
<付記8>
入力デジタル音声信号のラウドネス調整を行うラウドネス調整装置であって、
前記入力デジタル音声信号から第1の音声データ及び第2の音声データを抽出するエンコーダと、
前記エンコーダが抽出した前記第1の音声データに対し、第1ゲイン調整値を用いてゲイン調整を行う第1ゲイン調整部と、
前記エンコーダが抽出した前記第2の音声データに対し、第2ゲイン調整値を用いてゲイン調整を行う第2ゲイン調整部と、
前記第1ゲイン調整部によるゲイン調整済みの音声データを特性フィルタ処理したフィルタ済み音声データを生成する第1フィルタ部と、
前記第2ゲイン調整部によるゲイン調整済みの音声データを特性フィルタ処理したフィルタ済み音声データを生成する第2フィルタ部と、
前記第1フィルタ部の生成したフィルタ済み音声データが第1閾値以下の場合、前記第1ゲイン調整部によるゲイン調整済みの音声データを増幅して出力する第1ブースト処理部と、
前記第2フィルタ部の生成したフィルタ済み音声データが前記第1閾値以下の場合、前記第2ゲイン調整部によるゲイン調整済みの音声データを増幅して出力する第2ブースト処理部と、
前記第1ブースト処理部が出力した音声データを特性フィルタ処理したフィルタ済み音声データを生成する第3フィルタ部と、
前記第2ブースト処理部が出力した音声データを特性フィルタ処理したフィルタ済み音声データを生成する第4フィルタ部と、
前記第3フィルタ部の生成したフィルタ済み音声データが第2閾値以上の場合、前記ブースト処理部が増幅した音声データに対してリミッタコンプレッサ処理を行って出力する第1リミッタコンプレッサ部と、
前記第4フィルタ部の生成したフィルタ済み音声データが前記第2閾値以上の場合、前記ブースト処理部が増幅した音声データに対してリミッタコンプレッサ処理を行って出力する第2リミッタコンプレッサ部と、
を備えるラウドネス調整装置。
<Appendix 8>
A loudness adjustment device for adjusting the loudness of an input digital audio signal,
An encoder for extracting first audio data and second audio data from the input digital audio signal;
A first gain adjustment unit that performs gain adjustment using a first gain adjustment value on the first audio data extracted by the encoder;
A second gain adjustment unit that performs gain adjustment on the second audio data extracted by the encoder using a second gain adjustment value;
A first filter unit that generates filtered audio data obtained by performing characteristic filtering on the audio data that has been gain-adjusted by the first gain adjustment unit;
A second filter unit that generates filtered voice data obtained by performing characteristic filtering on the voice data that has been gain-adjusted by the second gain adjustment unit;
A first boost processing unit that amplifies and outputs the audio data that has been gain-adjusted by the first gain adjustment unit when the filtered audio data generated by the first filter unit is equal to or less than a first threshold;
A second boost processing unit for amplifying and outputting the gain-adjusted audio data by the second gain adjustment unit when the filtered audio data generated by the second filter unit is less than or equal to the first threshold;
A third filter unit for generating filtered audio data obtained by performing characteristic filtering on the audio data output by the first boost processing unit;
A fourth filter unit for generating filtered audio data obtained by performing characteristic filtering on the audio data output from the second boost processing unit;
A first limiter compressor unit that performs a limiter compressor process on the audio data amplified by the boost processing unit when the filtered audio data generated by the third filter unit is equal to or greater than a second threshold;
A second limiter compressor unit that performs a limiter compressor process on the audio data amplified by the boost processing unit when the filtered audio data generated by the fourth filter unit is equal to or greater than the second threshold;
A loudness adjustment device comprising:
<付記9>
前記第1リミッタコンプレッサ部が出力した音声データを特性フィルタ処理したフィルタ済み音声データを生成する第5フィルタ部と、
前記第2リミッタコンプレッサ部が出力した音声データを特性フィルタ処理したフィルタ済み音声データを生成する第6フィルタ部と、
前記第5フィルタ部が処理したフィルタ済み音声データに対し、第1の時間区間を用いた移動二乗平均により算出した第1二乗平均値を算出する第1二乗平均算出部と、
前記第5フィルタ部が処理したフィルタ済み音声データに対し、第1の時間区間より長い第2の時間区間を用いた移動二乗平均により算出した第2二乗平均値を算出する第2二乗平均算出部と、
前記第6フィルタ部が処理したフィルタ済み音声データに対し、前記第1の時間区間を用いた移動二乗平均により算出した第3二乗平均値を算出する第3二乗平均算出部と、
前記第6フィルタ部が処理したフィルタ済み音声データに対し、前記第2の時間区間を用いた移動二乗平均により算出した第4二乗平均値を算出する第4二乗平均算出部と、
前記第1及び第2二乗平均値、及びターゲットラウドネス値に基づいて前記ゲイン調整値を算出する制御部と、
前記第1及び第3二乗平均値の積算値、前記第2及び第4二乗平均値の積算値、及びターゲットラウドネス値に基づいて、前記第1ゲイン調整値及び前記第2ゲイン調整値を算出する制御部と、を備えることを特徴とする付記8に記載のラウドネス調整装置。
<Appendix 9>
A fifth filter unit for generating filtered audio data obtained by performing characteristic filtering on the audio data output from the first limiter compressor unit;
A sixth filter unit for generating filtered audio data obtained by performing characteristic filtering on the audio data output from the second limiter compressor unit;
A first root mean square calculation unit that calculates a first root mean square value calculated by moving root mean square using a first time interval for the filtered voice data processed by the fifth filter unit;
A second root mean square calculating unit that calculates a second root mean square value calculated by moving root mean square using a second time interval longer than the first time interval for the filtered voice data processed by the fifth filter unit When,
A third root mean square calculation unit that calculates a third root mean square value calculated by moving root mean square using the first time interval for the filtered voice data processed by the sixth filter unit;
A fourth mean square calculation unit that calculates a fourth mean square value calculated by moving mean square using the second time interval for the filtered voice data processed by the sixth filter unit;
A controller that calculates the gain adjustment value based on the first and second mean square values and a target loudness value;
The first gain adjustment value and the second gain adjustment value are calculated based on the integrated value of the first and third mean square values, the integrated value of the second and fourth mean square values, and the target loudness value. The loudness adjustment device according to appendix 8, further comprising: a control unit.
<付記10>
付記1乃至付記9のいずれか1項に記載のラウドネス調整装置を内蔵した映像/音声処理装置。
<Appendix 10>
A video / audio processing apparatus including the loudness adjusting apparatus according to any one of
<付記11>
入力デジタル音声信号のラウドネス調整を行うラウドネス調整方法であって、
前記入力デジタル音声信号から抽出された音声データに対し、ゲイン調整を行うゲイン調整ステップと、
前記ゲイン調整ステップにおけるゲイン調整済みの音声データを特性フィルタ処理したフィルタ済み音声データを生成する第1フィルタステップと、
前記第1フィルタステップにて生成したフィルタ済み音声データが第1閾値以下の場合、前記ゲイン調整ステップにおいてゲイン調整済みの音声データを増幅して出力するブースト処理ステップと、
前記ブースト処理ステップにて出力された音声データを特性フィルタ処理したフィルタ済み音声データを生成する第2フィルタステップと、
前記第2フィルタステップにて生成したフィルタ済み音声データが第2閾値以上の場合、前記ブースト処理部が増幅した音声データに対してリミッタコンプレッサ処理を行って出力するリミッタコンプレッサステップと、を備えるラウドネス調整方法。
<
A loudness adjustment method for adjusting the loudness of an input digital audio signal,
A gain adjustment step for performing gain adjustment on the audio data extracted from the input digital audio signal;
A first filter step for generating filtered audio data obtained by performing characteristic filtering on the audio data after gain adjustment in the gain adjustment step;
A boost processing step of amplifying and outputting the gain-adjusted audio data in the gain adjustment step when the filtered audio data generated in the first filter step is less than or equal to a first threshold;
A second filter step for generating filtered voice data obtained by performing characteristic filtering on the voice data output in the boost processing step;
A loudness adjustment comprising: a limiter compressor step for performing a limiter compressor process on the audio data amplified by the boost processing unit when the filtered audio data generated in the second filter step is greater than or equal to a second threshold value; Method.
<付記12>
前記リミッタコンプレッサステップに手出力した音声データを特性フィルタ処理したフィルタ済み音声データを生成する第3フィルタステップと、
前記第3フィルタステップにて生成したフィルタ済み音声データに対し、第1の時間区間を用いた移動二乗平均により第1二乗平均値を算出する第1二乗平均算出ステップと、
前記第3フィルタステップにて生成したフィルタ済み音声データに対し、第1の時間区間より長い第2の時間区間を用いた移動二乗平均により第2二乗平均値を算出する第2二乗平均算出ステップと、
前記第1及び第2二乗平均値、及びターゲットラウドネス値に基づいて前記ゲイン調整に用いるゲイン調整値を算出する制御ステップと、
を備える付記11に記載のラウドネス調整方法。
<
A third filter step for generating filtered audio data obtained by performing characteristic filtering on the audio data manually output to the limiter compressor step;
A first mean square calculating step of calculating a first mean square value by moving mean square using the first time interval for the filtered voice data generated in the third filter step;
A second mean square calculating step of calculating a second mean square value by moving mean square using a second time interval longer than the first time interval for the filtered voice data generated in the third filter step; ,
A control step of calculating a gain adjustment value used for the gain adjustment based on the first and second mean square values and a target loudness value;
The loudness adjustment method according to
<付記13>
前記制御ステップでは、前記第1二乗平均値が前記ターゲットラウドネス値よりも大きく、前記第2二乗平均値が増加傾向にある場合、前記入力デジタル音声信号から抽出された前記音声データを抑圧するように前記ゲイン調整値を調整する抑圧処理を行い、
前記第1二乗平均値が前記ターゲットラウドネス値よりも大きく、前記第2二乗平均値が減少傾向にある場合、前記抑圧処理を中断し、
上記以外の場合には、前記抑圧処理は行わない、
ことを特徴とする付記12に記載のラウドネス調整方法。
<
In the control step, when the first mean square value is larger than the target loudness value and the second mean square value tends to increase, the voice data extracted from the input digital voice signal is suppressed. A suppression process for adjusting the gain adjustment value is performed,
When the first mean square value is larger than the target loudness value and the second mean square value tends to decrease, the suppression process is interrupted,
Otherwise, the suppression process is not performed.
The loudness adjustment method according to
<付記14>
前記制御ステップでは、
外部からの制御情報の入力が無く、前記入力デジタル音声信号の音声モードの変更がなく、前記抑圧処理の実行中であり、かつ前記第1二乗平均値が開放閾値以下である場合、所定時間で前記入力デジタル音声信号から抽出された前記音声データの開放が完了するように前記ゲイン調整値を調整する開放処理を行い、
外部からの制御情報の入力が無く、前記入力デジタル音声信号の音声モードの変更がなく、前記抑圧処理の実行中であり、かつ前記第1二乗平均値が前記開放閾値以下ではない場合、前記開放処理を行わない、
ことを特徴とする付記13に記載のラウドネス調整方法。
<
In the control step,
When there is no input of control information from the outside, there is no change in the audio mode of the input digital audio signal, the suppression process is being executed, and the first mean square value is less than or equal to the open threshold value, a predetermined time Performing an opening process for adjusting the gain adjustment value so that the opening of the audio data extracted from the input digital audio signal is completed;
When there is no input of control information from the outside, there is no change in the audio mode of the input digital audio signal, the suppression process is being executed, and the first mean square value is not less than or equal to the release threshold, the release No processing,
The loudness adjustment method according to
<付記15>
前記制御ステップでは、
前記抑圧処理の実行中であり、かつ外部からの制御情報の入力及び前記入力デジタル音声信号の音声モードの変更のいずれか一方が生じた場合、前記所定時間よりも短い時間で前記入力デジタル音声信号から抽出された前記音声データの開放が完了するように前記ゲイン調整値を調整する、
ことを特徴とする付記13または付記14に記載のラウドネス調整方法。
<
In the control step,
The input digital audio signal is shorter than the predetermined time when the suppression process is being performed and any one of input of control information from the outside and change of the audio mode of the input digital audio signal occurs. Adjusting the gain adjustment value so as to complete the release of the audio data extracted from
The loudness adjustment method according to
<付記16>
入力デジタル音声信号のラウドネス調整をコンピュータに実行させるプログラムであって、
コンピュータに、
前記入力デジタル音声信号から抽出された音声データに対し、ゲイン調整を行うゲイン調整ステップと、
前記ゲイン調整ステップにおけるゲイン調整済みの音声データを特性フィルタ処理したフィルタ済み音声データを生成する第1フィルタステップと、
前記第1フィルタステップにて生成したフィルタ済み音声データが第1閾値以下の場合、前記ゲイン調整ステップにおいてゲイン調整済みの音声データを増幅して出力するブースト処理ステップと、
前記ブースト処理ステップにて出力された音声データを特性フィルタ処理したフィルタ済み音声データを生成する第2フィルタステップと、
前記第2フィルタステップにて生成したフィルタ済み音声データが第2閾値以上の場合、前記ブースト処理部が増幅した音声データに対してリミッタコンプレッサ処理を行って出力するリミッタコンプレッサステップと、
を実行させるプログラム。
<
A program that causes a computer to perform loudness adjustment of an input digital audio signal,
On the computer,
A gain adjustment step for performing gain adjustment on the audio data extracted from the input digital audio signal;
A first filter step for generating filtered audio data obtained by performing characteristic filtering on the audio data after gain adjustment in the gain adjustment step;
A boost processing step of amplifying and outputting the gain-adjusted audio data in the gain adjustment step when the filtered audio data generated in the first filter step is less than or equal to a first threshold;
A second filter step for generating filtered voice data obtained by performing characteristic filtering on the voice data output in the boost processing step;
A limiter compressor step for performing a limiter compressor process on the audio data amplified by the boost processing unit when the filtered audio data generated in the second filter step is equal to or greater than a second threshold; and
A program that executes
<付記17>
前記リミッタコンプレッサステップに手出力した音声データを特性フィルタ処理したフィルタ済み音声データを生成する第3フィルタステップと、
前記第3フィルタステップにて生成したフィルタ済み音声データに対し、第1の時間区間を用いた移動二乗平均により第1二乗平均値を算出する第1二乗平均算出ステップと、
前記第3フィルタステップにて生成したフィルタ済み音声データに対し、第1の時間区間より長い第2の時間区間を用いた移動二乗平均により第2二乗平均値を算出する第2二乗平均算出ステップと、
前記第1及び第2二乗平均値、及びターゲットラウドネス値に基づいて前記ゲイン調整に用いるゲイン調整値を算出する制御ステップと、
を備える付記16に記載のプログラム。
<
A third filter step for generating filtered audio data obtained by performing characteristic filtering on the audio data manually output to the limiter compressor step;
A first mean square calculating step of calculating a first mean square value by moving mean square using the first time interval for the filtered voice data generated in the third filter step;
A second mean square calculating step of calculating a second mean square value by moving mean square using a second time interval longer than the first time interval for the filtered voice data generated in the third filter step; ,
A control step of calculating a gain adjustment value used for the gain adjustment based on the first and second mean square values and a target loudness value;
The program according to
<付記18>
前記制御ステップでは、前記第1二乗平均値が前記ターゲットラウドネス値よりも大きく、前記第2二乗平均値が増加傾向にある場合、前記入力デジタル音声信号から抽出された前記音声データを抑圧するように前記ゲイン調整値を調整する抑圧処理を行い、
前記第1二乗平均値が前記ターゲットラウドネス値よりも大きく、前記第2二乗平均値が減少傾向にある場合、前記抑圧処理を中断し、
上記以外の場合には、前記抑圧処理は行わない、
ことを特徴とする付記17に記載のプログラム。
<
In the control step, when the first mean square value is larger than the target loudness value and the second mean square value tends to increase, the voice data extracted from the input digital voice signal is suppressed. A suppression process for adjusting the gain adjustment value is performed,
When the first mean square value is larger than the target loudness value and the second mean square value tends to decrease, the suppression process is interrupted,
Otherwise, the suppression process is not performed.
The program according to
<付記19>
前記制御ステップでは、
外部からの制御情報の入力が無く、前記入力デジタル音声信号の音声モードの変更がなく、前記抑圧処理の実行中であり、かつ前記第1二乗平均値が開放閾値以下である場合、所定時間で前記入力デジタル音声信号から抽出された前記音声データの開放が完了するように前記ゲイン調整値を調整する開放処理を行い、
外部からの制御情報の入力が無く、前記入力デジタル音声信号の音声モードの変更がなく、前記抑圧処理の実行中であり、かつ前記第1二乗平均値が前記開放閾値以下ではない場合、前記開放処理を行わない、
ことを特徴とする付記18に記載のプログラム。
<
In the control step,
When there is no input of control information from the outside, there is no change in the audio mode of the input digital audio signal, the suppression process is being executed, and the first mean square value is less than or equal to the open threshold value, a predetermined time Performing an opening process for adjusting the gain adjustment value so that the opening of the audio data extracted from the input digital audio signal is completed;
When there is no input of control information from the outside, there is no change in the audio mode of the input digital audio signal, the suppression process is being executed, and the first mean square value is not less than or equal to the release threshold, the release No processing,
The program according to
<付記20>
前記制御ステップでは、
前記抑圧処理の実行中であり、かつ外部からの制御情報の入力及び前記入力デジタル音声信号の音声モードの変更のいずれか一方が生じた場合、前記所定時間よりも短い時間で前記入力デジタル音声信号から抽出された前記音声データの開放が完了するように前記ゲイン調整値を調整する、
ことを特徴とする付記18または付記19に記載のプログラム。
<
In the control step,
The input digital audio signal is shorter than the predetermined time when the suppression process is being performed and any one of input of control information from the outside and change of the audio mode of the input digital audio signal occurs. Adjusting the gain adjustment value so as to complete the release of the audio data extracted from
The program according to
1 ラウドネス調整装置
11 デコーダ
12 ゲイン調整部
13 音声調整部
14 Kフィルタ
15 音声データブースト部
16 Kフィルタ
17 リミッタコンプレッサ部
18 セレクタ
19 制御部
20 移動二乗平均算出部
21 移動二乗平均算出部
22 Kフィルタ
23 エンコーダ
24 ゲイン乗算部
25 二乗平均積算部
26 無音検出部
DESCRIPTION OF
Claims (10)
前記入力デジタル音声信号から抽出された音声データに対し、ゲイン調整を行うゲイン調整部と、
前記ゲイン調整部によるゲイン調整済みの音声データを特性フィルタ処理したフィルタ済み音声データを生成する第1フィルタ部と、
前記第1フィルタ部の生成したフィルタ済み音声データが第1閾値以下の場合、前記ゲイン調整部によるゲイン調整済みの音声データを増幅して出力するブースト処理部と、
前記ブースト処理部が出力した音声データを特性フィルタ処理したフィルタ済み音声データを生成する第2フィルタ部と、
前記第2フィルタ部の生成したフィルタ済み音声データが第2閾値以上の場合、前記ブースト処理部が増幅した音声データに対してリミッタコンプレッサ処理を行って出力するリミッタコンプレッサ部と、を備えるラウドネス調整装置。 A loudness adjustment device for adjusting the loudness of an input digital audio signal,
A gain adjustment unit that performs gain adjustment on audio data extracted from the input digital audio signal;
A first filter unit that generates filtered voice data obtained by performing characteristic filtering on the voice data that has been gain-adjusted by the gain adjustment unit;
A boost processing unit that amplifies and outputs the gain-adjusted audio data by the gain adjustment unit when the filtered audio data generated by the first filter unit is equal to or less than a first threshold;
A second filter unit that generates filtered audio data obtained by performing characteristic filtering on the audio data output by the boost processing unit;
A loudness adjustment device comprising: a limiter compressor unit that outputs the audio data amplified by the boost processing unit when the filtered audio data generated by the second filter unit is equal to or greater than a second threshold value; .
前記第3フィルタ部が生成したフィルタ済み音声データに対し、第1の時間区間を用いた移動二乗平均により第1二乗平均値を算出する第1二乗平均算出部と、
前記第3フィルタ部が生成したフィルタ済み音声データに対し、第1の時間区間より長い第2の時間区間を用いた移動二乗平均により第2二乗平均値を算出する第2二乗平均算出部と、
前記第1及び第2二乗平均値、及びターゲットラウドネス値に基づいて前記ゲイン調整に用いるゲイン調整値を算出する制御部と、
を備える請求項1に記載のラウドネス調整装置。 A third filter unit for generating filtered audio data obtained by performing characteristic filtering on the audio data output by the limiter compressor unit;
A first mean square calculation unit that calculates a first mean square value by moving mean square using a first time interval for the filtered voice data generated by the third filter unit;
A second mean square calculating unit that calculates a second mean square value by moving mean square using a second time interval longer than the first time interval for the filtered voice data generated by the third filter unit;
A control unit that calculates a gain adjustment value used for the gain adjustment based on the first and second mean square values and the target loudness value;
The loudness adjusting device according to claim 1, comprising:
前記第1二乗平均値が前記ターゲットラウドネス値よりも大きく、前記第2二乗平均値が減少傾向にある場合、前記抑圧処理を中断し、
上記以外の場合には、前記抑圧処理は行わない、
ことを特徴とする請求項2に記載のラウドネス調整装置。 The control unit suppresses the audio data extracted from the input digital audio signal when the first mean square value is larger than the target loudness value and the second mean square value tends to increase. A suppression process for adjusting the gain adjustment value is performed,
When the first mean square value is larger than the target loudness value and the second mean square value tends to decrease, the suppression process is interrupted,
Otherwise, the suppression process is not performed.
The loudness adjustment apparatus according to claim 2, wherein
外部からの制御情報の入力が無く、前記入力デジタル音声信号の音声モードの変更がなく、前記抑圧処理の実行中であり、かつ前記第1二乗平均値が開放閾値以下である場合、所定時間で前記入力デジタル音声信号から抽出された前記音声データの開放が完了するように前記ゲイン調整値を調整する開放処理を行い、
外部からの制御情報の入力が無く、前記入力デジタル音声信号の音声モードの変更がなく、前記抑圧処理の実行中であり、かつ前記第1二乗平均値が前記開放閾値以下ではない場合、前記開放処理を行わない、
ことを特徴とする請求項3に記載のラウドネス調整装置。 The controller is
When there is no input of control information from the outside, there is no change in the audio mode of the input digital audio signal, the suppression process is being executed, and the first mean square value is less than or equal to the open threshold value, a predetermined time Performing an opening process for adjusting the gain adjustment value so that the opening of the audio data extracted from the input digital audio signal is completed;
When there is no input of control information from the outside, there is no change in the audio mode of the input digital audio signal, the suppression process is being executed, and the first mean square value is not less than or equal to the release threshold, the release No processing,
The loudness adjusting device according to claim 3.
前記抑圧処理の実行中であり、かつ外部からの制御情報の入力及び前記入力デジタル音声信号の音声モードの変更のいずれか一方が生じた場合、前記所定時間よりも短い時間で前記入力デジタル音声信号から抽出された前記音声データの開放が完了するように前記ゲイン調整値を調整する、
ことを特徴とする請求項4に記載のラウドネス調整装置。 The controller is
The input digital audio signal is shorter than the predetermined time when the suppression process is being performed and any one of input of control information from the outside and change of the audio mode of the input digital audio signal occurs. Adjusting the gain adjustment value so as to complete the release of the audio data extracted from
Loudness adjustment device according to 請 Motomeko 4 you wherein a.
前記デコーダは、前記入力デジタル音声信号から付加情報を抽出し、前記付加情報内にゲイン調整を行わないことを指示する情報が含まれている場合、抽出した前記音声データを前記ゲイン調整部に供給せずに他の任意の出力装置に供給し、
それ以外の場合には前記ゲイン調整部に抽出した前記音声データを供給する、
ことを特徴とする請求項4または請求項5に記載のラウドネス調整装置。 A decoder for extracting the audio data from the input digital audio signal;
The decoder extracts additional information from the input digital audio signal, and supplies the extracted audio data to the gain adjustment unit when information indicating that gain adjustment is not performed is included in the additional information. Supply to any other output device without
In other cases, the audio data extracted is supplied to the gain adjustment unit.
The loudness adjusting apparatus according to claim 4 or 5 , characterized in that
前記制御部は、前記抑圧処理の実行中であり、かつ前記無音検出部からの通知を受信した場合、前記所定時間よりも短い時間で前記音声データの開放が完了するように前記ゲイン調整値を調整する、
ことを特徴とする請求項6に記載のラウドネス調整装置。 Analyzing the audio data extracted by the decoder, and further comprising a silence detection unit for notifying the control unit when a silent state continues for a certain period of time;
When the control unit is executing the suppression process and receives a notification from the silence detection unit, the control unit sets the gain adjustment value so that the release of the audio data is completed in a time shorter than the predetermined time. adjust,
The loudness adjusting apparatus according to claim 6.
前記入力デジタル音声信号から抽出された音声データに対し、ゲイン調整を行うゲイン調整ステップと、
前記ゲイン調整ステップにおけるゲイン調整済みの音声データを特性フィルタ処理したフィルタ済み音声データを生成する第1フィルタステップと、
前記第1フィルタステップにて生成したフィルタ済み音声データが第1閾値以下の場合、前記ゲイン調整ステップにおいてゲイン調整済みの音声データを増幅して出力するブースト処理ステップと、
前記ブースト処理ステップにて出力された音声データを特性フィルタ処理したフィルタ済み音声データを生成する第2フィルタステップと、
前記第2フィルタステップにて生成したフィルタ済み音声データが第2閾値以上の場合、前記ブースト処理ステップにて増幅した音声データに対してリミッタコンプレッサ処理を行って出力するリミッタコンプレッサステップと、を備えるラウドネス調整方法。 A loudness adjustment method for adjusting the loudness of an input digital audio signal,
A gain adjustment step for performing gain adjustment on the audio data extracted from the input digital audio signal;
A first filter step for generating filtered audio data obtained by performing characteristic filtering on the audio data after gain adjustment in the gain adjustment step;
A boost processing step of amplifying and outputting the gain-adjusted audio data in the gain adjustment step when the filtered audio data generated in the first filter step is less than or equal to a first threshold;
A second filter step for generating filtered voice data obtained by performing characteristic filtering on the voice data output in the boost processing step;
A limiter compressor step for performing a limiter compressor process on the audio data amplified in the boost processing step when the filtered audio data generated in the second filter step is greater than or equal to a second threshold value, and a loudness comprising Adjustment method.
コンピュータに、
前記入力デジタル音声信号から抽出された音声データに対し、ゲイン調整を行うゲイン調整ステップと、
前記ゲイン調整ステップにおけるゲイン調整済みの音声データを特性フィルタ処理したフィルタ済み音声データを生成する第1フィルタステップと、
前記第1フィルタステップにて生成したフィルタ済み音声データが第1閾値以下の場合、前記ゲイン調整ステップにおいてゲイン調整済みの音声データを増幅して出力するブースト処理ステップと、
前記ブースト処理ステップにて出力された音声データを特性フィルタ処理したフィルタ済み音声データを生成する第2フィルタステップと、
前記第2フィルタステップにて生成したフィルタ済み音声データが第2閾値以上の場合、前記ブースト処理ステップにて増幅した音声データに対してリミッタコンプレッサ処理を行って出力するリミッタコンプレッサステップと、
を実行させるプログラム。 A program that causes a computer to perform loudness adjustment of an input digital audio signal,
On the computer,
A gain adjustment step for performing gain adjustment on the audio data extracted from the input digital audio signal;
A first filter step for generating filtered audio data obtained by performing characteristic filtering on the audio data after gain adjustment in the gain adjustment step;
A boost processing step of amplifying and outputting the gain-adjusted audio data in the gain adjustment step when the filtered audio data generated in the first filter step is less than or equal to a first threshold;
A second filter step for generating filtered voice data obtained by performing characteristic filtering on the voice data output in the boost processing step;
A limiter compressor step for performing a limiter compressor process on the audio data amplified in the boost processing step when the filtered audio data generated in the second filter step is greater than or equal to a second threshold;
A program that executes
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012094004A JP5527827B2 (en) | 2012-04-17 | 2012-04-17 | Loudness adjusting device, loudness adjusting method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012094004A JP5527827B2 (en) | 2012-04-17 | 2012-04-17 | Loudness adjusting device, loudness adjusting method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013223130A JP2013223130A (en) | 2013-10-28 |
JP5527827B2 true JP5527827B2 (en) | 2014-06-25 |
Family
ID=49593808
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012094004A Active JP5527827B2 (en) | 2012-04-17 | 2012-04-17 | Loudness adjusting device, loudness adjusting method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5527827B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6228100B2 (en) * | 2014-11-17 | 2017-11-08 | Necプラットフォームズ株式会社 | Loudness adjustment device, loudness adjustment method, and loudness adjustment program |
JP6487764B2 (en) * | 2015-04-27 | 2019-03-20 | 日本放送協会 | Volume monitoring device and program |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3297961B2 (en) * | 1994-05-19 | 2002-07-02 | ソニー株式会社 | Volume control device |
JP4050289B2 (en) * | 2005-08-22 | 2008-02-20 | 株式会社コナミデジタルエンタテインメント | Volume adjusting device, volume adjusting method and program |
CA2648237C (en) * | 2006-04-27 | 2013-02-05 | Dolby Laboratories Licensing Corporation | Audio gain control using specific-loudness-based auditory event detection |
JP2009171092A (en) * | 2008-01-15 | 2009-07-30 | Audio Technica Corp | Sound equipment |
EP2352225A1 (en) * | 2008-10-17 | 2011-08-03 | Sharp Kabushiki Kaisha | Audio signal adjustment device and audio signal adjustment method |
-
2012
- 2012-04-17 JP JP2012094004A patent/JP5527827B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2013223130A (en) | 2013-10-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5650227B2 (en) | Audio signal processing apparatus and audio signal processing method | |
JP5236006B2 (en) | Audio signal adjustment apparatus and audio signal adjustment method | |
JP6328627B2 (en) | Loudness control by noise detection and low loudness detection | |
JP5368576B2 (en) | Dynamic volume control and multi-space processing prevention | |
CA2626622C (en) | Systems and methods for controlling audio loudness | |
US8204258B2 (en) | Multiband audio dynamics processor | |
KR20180034565A (en) | Encoded audio metadata-based loudness equalization and dynamic equalization during DRC | |
US20160191007A1 (en) | Adaptive loudness levelling method for digital audio signals in frequency domain | |
US9571055B2 (en) | Level adjustment device and method | |
WO2005064986A1 (en) | Audio output apparatus | |
JP2008504783A (en) | Method and system for automatically adjusting the loudness of an audio signal | |
KR20230156156A (en) | Audio signal processing method and device for controlling loudness level | |
US20160065160A1 (en) | Terminal device and audio signal output method thereof | |
US20160049162A1 (en) | Audio signal size control method and device | |
KR101482945B1 (en) | Terminal appratus and audio signal output method thereof | |
JP5527827B2 (en) | Loudness adjusting device, loudness adjusting method, and program | |
CN112470219B (en) | Compressor target profile to avoid enhanced noise | |
US20160049914A1 (en) | Audio signal size control method and device | |
EP2624449B1 (en) | Peak detection when adapting a signal gain based on signal loudness | |
US8433079B1 (en) | Modified limiter for providing consistent loudness across one or more input tracks | |
EP3342040B1 (en) | Volume-levelling processing | |
Gorlow et al. | Restoring the dynamics of clipped audio material by inversion of dynamic range compression | |
Chang et al. | Audio dynamic range control for set-top box | |
JP2007333787A (en) | Speech speed conversion apparatus | |
TW201119422A (en) | Dynamic volume control and multi-spatial processing protection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131209 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131217 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140129 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140318 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140410 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5527827 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |