WO2022163137A1

WO2022163137A1 - 情報処理装置、情報処理方法、およびプログラム

Info

Publication number: WO2022163137A1
Application number: PCT/JP2021/044926
Authority: WO
Inventors: 梨奈小谷; 志朗鈴木; 千智劔持
Original assignee: ソニーグループ株式会社
Priority date: 2021-01-27
Filing date: 2021-12-07
Publication date: 2022-08-04
Also published as: US20240089686A1; DE112021006957T5; JPWO2022163137A1; CN116848496A

Abstract

【課題】参加者の個性を反映し、参加者の反応に対応する音声データを、伝送上の問題を考慮した上で提供することが可能な情報処理装置、情報処理方法、およびプログラムを提供する。【解決手段】参加者が発した音の特徴を反映させた１以上の個別疑似音データから、取得した前記参加者の反応を示す反応情報に対応する個別疑似音データを選択し、前記選択した個別疑似音データを、会場に設置された音声出力装置から出力する制御を行う制御部を備える、情報処理装置。

Description

情報処理装置、情報処理方法、およびプログラム

　本開示は、情報処理装置、情報処理方法、およびプログラムに関する。

　昨今の通信技術の発達により、コンサートやセミナー、演劇等のイベントの映像をリアルタイムで配信する所謂ライブ配信が行われている。このようなライブ配信では、従来の集客型のライブイベントにあった臨場感や、演者と観客の双方向のコミュニケーションが課題となる。

　ライブ配信イベントにおける観客側の反応の収集に関し、例えば下記特許文献１では、観客のタップ回数などの量的情報を反応データとしてリアルタイムに取得し、取得した量的情報を演者が見ているディスプレイに表示したり、演者が装着しているイヤホン等から、量的情報を反映させた音声を出力したりすることで、演者にフィードバックを行うことが開示されている。

特開２０１５－１２５６４７号公報

　ここで、よりリアルで臨場感のあるフィードバックを演者に提供するため、ライブ配信を視聴する観客（以下、参加者と称する）の歓声等をリアルタイムで演者に届けることが考え得るが、高品位で演者に届けるには高いビットレートが必要となり、伝送上の問題が生じ得る。また、予め用意した笑い声や拍手、歓声等の効果音素材を用いることも考え得るが、予め用意した音声は画一的であり、臨場感が乏しい。

　そこで、本開示では、参加者の個性を反映し、参加者の反応に対応する音声データを、伝送上の問題を考慮した上で提供することが可能な情報処理装置、情報処理方法、およびプログラムを提案する。

　本開示によれば、参加者が発した音の特徴を反映させた１以上の個別疑似音データから、取得した前記参加者の反応を示す反応情報に対応する個別疑似音データを選択し、前記選択した個別疑似音データを、会場に設置された音声出力装置から出力する制御を行う制御部を備える、情報処理装置を提案する。

　本開示によれば、参加者が発した音の特徴を、テンプレートの音データに反映させて、個別疑似音データを生成する処理と、前記生成した個別疑似音データを、前記参加者に対応付けて保存する処理と、を行う制御部を備える、情報処理装置を提案する。

　本開示によれば、プロセッサが、参加者が発した音の特徴を反映させた１以上の個別疑似音データから、取得した前記参加者の反応を示す反応情報に対応する個別疑似音データを選択し、前記選択した個別疑似音データを、会場に設置された音声出力装置から出力する制御を行うことを含む、情報処理方法を提案する。

　本開示によれば、コンピュータを、参加者が発した音の特徴を反映させた１以上の個別疑似音データから、取得した前記参加者の反応を示す反応情報に対応する個別疑似音データを選択し、前記選択した個別疑似音データを、会場に設置された音声出力装置から出力する制御を行う制御部として機能させる、プログラムを提案する。

本開示の一実施形態によるライブ配信システムの概要について説明する図である。本実施形態による個別疑似音データの生成と保存について説明する図である。本実施形態による疑似音生成サーバの構成の一例を示すブロック図である。本実施形態による抽出された参加者の特徴をテンプレート音データに重畳する処理について説明する図である。本実施形態による個別疑似拍手音データの生成の流れの一例を示すフローチャートである。本実施形態による拍手音収音における参加者へのインストラクションの表示画面例を示す図である。本実施形態による個別疑似歓声データの生成の流れの一例を示すフローチャートである。本実施形態による歓声収音における参加者へのインストラクションの表示画面例を示す図である。本実施形態による会場サーバの構成の一例を示すブロック図である。本実施形態に係る会場サーバによる個別疑似音データの出力の動作処理の流れの一例を示すフローチャートである。本実施形態による参加者側における拍手の操作について説明する図である。本実施形態による個別疑似拍手音データのパラメータ調整の一例について説明する図である。本実施形態による参加者側における歓声の操作について説明する図である。本実施形態による個別疑似歓声データのパラメータ調整の一例について説明する図である。本実施形態による個別疑似掛け声データのパラメータ調整の一例について説明する図である。本実施形態による歓声の操作を行うためのフットコントローラの一例について説明する図である。本実施形態によるフットコントローラを用いた場合の個別疑似歓声データのパラメータ調整の一例について説明する図である。本実施形態の変形例による会場サーバの構成の一例を示すブロック図である。本実施形態の変形例による伝達特性Ｈ_Ｏについて説明する図である。本実施形態の変形例による伝達特性Ｈ_Ｉについて説明する図である。本実施形態の変形例による伝達特性付加処理の流れの一例を示すフローチャートである。

　以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

　また、説明は以下の順序で行うものとする。
　１．本開示の一実施形態によるライブ配信システムの概要
　２．個別疑似音データの生成
　　２－１．個別疑似音生成サーバ５０の構成例
　　２－２．個別疑似拍手音データの生成の流れ
　　２－３．個別疑似歓声データの生成の流れ
　　２－４．その他
　３．個別疑似音データの出力
　　３－１．会場サーバ２０の構成例
　　３－２．動作処理例
　　３－３．個別疑似拍手音データの出力
　　（３－３－１．拍手の操作について）
　　（３－３－２．個別疑似拍手音データのパラメータ調整について）
　　３－４．個別疑似歓声データの出力
　　（３－４－１．歓声の操作について）
　　（３－４－２．個別疑似歓声データのパラメータ調整について）
　４．変形例
　　４－１．反響個別疑似音データの生成
　　４－２．会場サーバ２０ａの構成例
　　４－３．伝達特性の付加処理
　５．補足

　＜＜１．本開示の一実施形態によるライブ配信システムの概要＞＞
　図１は、本開示の一実施形態によるライブ配信システムの概要について説明する図である。図１に示すように、本実施形態によるライブ配信システムは、ライブ配信を行う会場サーバ２０（情報処理装置）と、ライブ配信を視聴する各参加者が利用する参加者端末１０（１０Ａ～１０Ｃ・・・）と、を含む。参加者端末１０と会場サーバ２０は、ネットワーク７０を介して通信接続し、データの送受信を行う。また、ライブ会場には、参加者の反応に応じた音声データを出力する疑似音出力装置３０（音声出力装置）と、会場の音声（演奏等）を収集する会場音取得装置４０（音声収音装置）とが配置されている。会場サーバ２０は、疑似音出力装置３０および会場音取得装置４０と通信接続し、データの送受信を行う。

　参加者端末１０は、会場サーバ２０により配信されるライブ映像を参加者が視聴する際に用いる情報処理装置の一例である。参加者は、ライブ会場と異なる場所で、参加者端末１０を用いてライブ配信を視聴することができる。例えば、参加者端末１０は、スマートフォン、タブレット端末、ＰＣ（パーソナルコンピュータ）、ＨＭＤ、ウェアラブルデバイス、プロジェクタ等により実現されてもよい。また、参加者端末１０は、複数の装置により構成されてもよい。

　本実施形態によるライブ配信システムは、コンサートやセミナー、演説、芝居等が行われるリアルの会場（本明細書では、ライブ会場とも称する）の映像と音声を、ネットワーク７０を介して、リアル会場と異なる場所に居る参加者にリアルタイムで届け得ると共に、参加者の反応もリアル会場にリアルタイムで届け得る情報処理システムである。会場の音声は、会場音取得装置４０により取得され、会場サーバ２０に出力される。会場音取得装置４０とは、例えば会場の音響を集約して適宜処理する音響処理装置が挙げられる。より具体的には、ミキサー４２（図１９、図２０）が用いられる。ミキサー４２は、演者の音声や演奏等を収音するマイクロホンや、電子楽器、各種プレーヤー（例えばＣＤプレーヤー、レコードプレーヤー、デジタルプレーヤー）等から入力された各種音源を個別に調整した上で混合（ミックス）して出力する装置である。

　また、本実施形態によるライブ配信システムは、ライブ会場とは異なる場所で視聴している参加者の反応をライブ会場の演者にリアルタイムで提供する。これにより、ライブ配信時に懸念される、従来の集客型のライブイベントの醍醐味である臨場感の不足を解消し得る。このように、本実施形態では、ライブ会場でパフォーマンスを行う演者に対して、ライブの臨場感を提供することができる。さらに、本実施形態では、参加者の個性を反映した個別疑似音データを予め会場サーバ２０に用意しておき、参加者の反応に応じてリアルタイムに会場に設置された疑似音出力装置３０から出力するよう制御する。これにより、画一的なフィードバックではない、より臨場感を与えられるフィードバックを行えると共に、ビットレートの増大や遅延といった伝送上の問題も解消し得る。例えば、本システムを低ビットレートで実現することも可能となる。

　ここで、本実施形態による個別疑似音データとは、拍手の音や歓声、掛け声など、参加者が発生し得る音を個別に疑似的に生成した個別疑似音データである。「歓声」としては、例えばライブ中に発声することが想定される感嘆詞（例えば「わー！」、「おー！」、「きゃー！」、「えー！」、「イェイ！」等）が挙げられる。「掛け声」としては、例えば演者の名前や、アンコールの言葉、賛辞の言葉等が挙げられる。本実施形態では、特にライブ配信における各種音声の取り扱いに着目して説明を行う。

　以下、本実施形態によるライブ配信システムにおいて行われる、個別疑似音データの生成と、個別疑似音データの出力制御について、順次説明する。

　＜＜２．個別疑似音データの生成＞＞
　本実施形態では、ライブ配信開始前に、参加者毎の個別疑似音データを予め生成し、会場サーバ２０に保存する。ここでは、個別疑似音データの生成について図２～図８を参照して具体的に説明する。

　図２は、本実施形態による個別疑似音データの生成と保存について説明する図である。本実施形態による個別疑似音データは、例えば個別疑似音生成サーバ５０により生成される。個別疑似音生成サーバ５０は、参加者端末１０から、収音された拍手音データ（参加者が実際に拍手した音）や歓声データ（参加者の肉声）に基づいて、参加者の個性を反映させた個別疑似音データを生成する情報処理装置の一例である。参加者の個性とは、参加者が発した音の特徴である。より具体的には、個別疑似音生成サーバ５０は、予め用意されたテンプレート拍手音データやテンプレート歓声データ（いずれも、音声信号）に、参加者端末１０から取得した実音（収音された拍手音データや歓声データ）から抽出した特徴（例えば周波数解析の結果）を重畳することで、拍手音や歓声の個別疑似音データ（すなわち、合成音声）を生成する。また、個別疑似音生成サーバ５０は、生成した個別疑似音データの出力を指示する参加者の操作方法の設定情報（本明細書では「操作方法情報」と称する）も参加者端末１０から取得する。そして、個別疑似音生成サーバ５０は、参加者のＩＤに対応付けて、生成した、拍手音または／および歓声の個別疑似音データと、操作方法情報を、会場サーバ２０に出力し、会場サーバ２０において保存する。

　以下、このような個別疑似音データの生成について、より詳細に説明する。

　＜２－１．個別疑似音生成サーバ５０の構成例＞
　図３は、本実施形態による個別疑似音生成サーバ５０の構成の一例を示すブロック図である。図３に示すように、個別疑似音生成サーバ５０は、通信部５１０、制御部５２０、および記憶部５３０を有する。

　（通信部５１０）
　通信部５１０は、他の装置と無線または有線により通信接続してデータの送受信を行い得る。通信部５１０は、例えば有線／無線ＬＡＮ（Local　Area　Network）、Ｗｉ－Ｆｉ（登録商標）、Ｂｌｕｅｔｏｏｔｈ（登録商標）、携帯通信網（ＬＴＥ（Long　Term　Evolution）、３Ｇ（第３世代の移動体通信方式）、４Ｇ（第４世代の移動体通信方式）、５Ｇ（第５世代の移動体通信方式））等により実現される。例えば通信部５１０は、ネットワーク７０を介して参加者端末１０および会場サーバ２０とデータの送受信を行い得る。

　（制御部５２０）
　制御部５２０は、演算処理装置および制御装置として機能し、各種プログラムに従って個別疑似音生成サーバ５０内の動作全般を制御する。制御部５２０は、例えばＣＰＵ（Central　Processing　Unit）、マイクロプロセッサ等の電子回路によって実現される。また、制御部５２０は、使用するプログラムや演算パラメータ等を記憶するＲＯＭ（Read　Only　Memory）、及び適宜変化するパラメータ等を一時記憶するＲＡＭ（Random　Access　Memory）を含んでいてもよい。

　本実施形態による制御部５２０は、実音解析部５２１、個別疑似音データ生成部５２２、および保存制御部５２３としても機能する。実音解析部５２１は、通信部５１０を介して参加者端末１０から受信した、実際に収音した参加者の拍手音や歓声（参加者が実際に発した音）を解析する。参加者端末１０では、マイクロホン（以下、マイクと称する）により、参加者が実際に拍手した際の音や、歓声、掛け声等を収音し、これをデジタル化し、デジタル化した信号（音声信号）を個別疑似音生成サーバ５０に送信する。また、実音解析部５２１は、解析の一例として周波数解析を行い、周波数の特性を特徴として抽出してもよい。また、実音解析部５２１は、解析の一例として時間特性を特徴として抽出してもよい。特徴抽出のプログラム（アルゴリズム）は、記憶部５３０に記憶され得る。

　個別疑似音データ生成部５２２は、実音解析部５２１による解析結果（抽出された特徴、例えば周波数特性）を、予め用意されたテンプレートの音データ（拍手音データや歓声データ）に重畳し、参加者毎の拍手音または歓声の個別疑似音データを生成する。図４は、本実施形態による抽出された参加者の特徴をテンプレート音データに重畳する処理について説明する図である。

　図４上段に示す例は、周波数領域で特徴を重畳する例である。例えば図４上段に示すようにテンプレート音データＡ（テンプレートの拍手音データまたは歓声データ）が持つ特徴的周波数ｆ１、ｆ２がある場合に、ある参加者の特徴（周波数特性）はそこからズレたｆ１´、ｆ２´であるとする。この場合、個別疑似音データ生成部５２２は、テンプレート音データＡのｆ１をｆ１´に、ｆ２をｆ２´に加工または変形する処理を行う。図４上段に示す例では、ｆ１＜ｆ１´、ｆ２＜ｆ２´であるため、生成（個別化）された個別疑似拍手音／歓声データは、テンプレート音データＡに比べて高い音に聞こえるようになる。なお、図４上段に示す例に限らず、新たな特徴的周波数ｆ３を追加したり、特徴的周波数だけではなく、周波数の傾きや、より大局的な傾向を特徴として反映させる等、テンプレート音データＡに対して、ある参加者の特徴を反映するための加工または変形する処理であればどのようなものであってもよい。

　図４下段は、時間軸領域で特徴を重畳する例である。例えば図４下段に示すようにテンプレート音データＢ（テンプレートの拍手音データまたは歓声データ）が始点ｔ１、終点ｔ２を持つ場合に、ある参加者の特徴（周波数特性）はそこからズレたｔ１´、ｔ２´であるとする（時間特性の考慮）。この場合、個別疑似音データ生成部５２２は、テンプレート音データＢのｔ１をｔ１´に、ｔ２をｔ２´に加工または変更する処理を行う。図４下段に示す例では、｜ｔ２－ｔ１｜＞｜ｔ２´－ｔ１´｜であるため、ピッチが高くなり、生成（個別化）された個別疑似拍手音／歓声データは、テンプレート音データＢに比べて高い音に聞こえるようになる。なお、図４下段に示す例に限らず、波形情報の包絡や、より大局的な傾向を特徴として反映させてもよい。なお、実際の多数の拍手や歓声では、個々人の拍手／歓声の開始タイミングは一致せず、バラバラになっている。このため、始点ｔ１／ｔ１´は、各参加者のＩＤに対応付けたランダムな値にすることで、より自然な拍手音／歓声の疑似音データを生成することもできる。

　テンプレート音データは、テンプレート用に予め用意（収録）した拍手や歓声の音データである。また、テンプレート拍手音データや、テンプレート歓声データは、それぞれ複数パターン用意していてもよい。同じ人物の拍手や歓声であっても、叩き方や声の出し方によってそれぞれ音の特徴が異なる。例えばライブ配信で視聴する楽曲の曲調や本人の盛り上がり度合等によって、イベント中の拍手の叩き方に一個人であっても変化が見られる場合がある。そのため、手のフォームを変えた複数パターンの拍手音を生成するようにしてもよい。その際、参加者端末１０で参加者の拍手音を収音する際に、拍手のフォームのイラストを提示する等のインストラクションを加え、マイクによる収音と、収音した音声の解析をパターン数だけ繰り返す。

　また、生成する個別疑似音データは、一例として、１回の拍手音や、１回の歓声、１回の掛け声を想定する。

　そして、保存制御部５２３は、生成された個別疑似音データを、参加者ＩＤと対応付けて会場サーバ２０に保存するよう制御する。また、保存制御部５２３は、参加者端末１０から取得した操作方法情報も、上記参加者ＩＤおよび生成された個別疑似音データと併せて会場サーバ２０に保存するよう制御する。

　以上、個別疑似音生成サーバ５０による疑似音データの生成機能について説明した。なお、生成する疑似音データは、拍手音、歓声に限定されず、掛け声や、足を鳴らす音等も挙げられる。また、「掛け声」とは、例えば出演者の名前、出演者や曲に対応付けられた特定の言葉、アンコールの言葉、賞賛の言葉等が挙げられる。

　また、本実施形態では、テンプレート用に予め用意（収録）した音データを共通して用いて、各参加者の特徴を重畳した個別疑似音データをそれぞれ生成している。参加者端末１０で収音した音声を登録して用いると、拍手や肉声以外の音（雑音）が含まれてしまう恐れや、参加者側での録音環境が高品位とは限らず（マイクの性能など）、ノイズや音切れが生じる可能性もあるため、テンプレート用に予め用意した（高品位でノイズが低減された）音データを用いることが好ましい。なお、本実施形態はこれに限定されず、参加者の肉声を予め保存し、ライブ配信中に参加者の操作に応じて会場で出力することも可能である。

　（記憶部５３０）
　記憶部５３０は、制御部５２０の処理に用いられるプログラムや演算パラメータ等を記憶するＲＯＭ（Read　Only　Memory）、および適宜変化するパラメータ等を一時記憶するＲＡＭ（Random　Access　Memory）により実現される。例えば、記憶部５３０は、テンプレート拍手音データ、テンプレート歓声データ、特徴抽出プログラム等を記憶する。

　以上、本実施形態による個別疑似音生成サーバ５０の構成について説明した。なお、図３に示す個別疑似音生成サーバ５０の構成は一例であって、本開示はこれに限定されない。例えば、個別疑似音生成サーバ５０は、複数の装置から成るシステムであってもよい。また、個別疑似音生成サーバ５０の機能（個別疑似拍手音データの生成）は、会場サーバ２０により実現されてもよい。また、個別疑似音生成サーバ５０の機能（個別疑似拍手音データの生成）を、参加者端末１０で実現してもよい。

　続いて、本実施形態による個別疑似拍手音データの生成の流れと、個別疑似歓声データの生成の流れについて、それぞれ具体的に説明する。

　＜２－２．個別疑似拍手音データの生成の流れ＞
　図５は、本実施形態による個別疑似拍手音データの生成の流れの一例を示すフローチャートである。図５に示す処理は、ライブ配信のイベント開始前に行われる。

　図５に示すように、まず、参加者が参加者端末１０を用いて、本システムにより提供されるサービス（ライブ配信サービス）へのログイン処理を行い、個別疑似音生成サーバ５０の制御部５２０は、参加者ＩＤ（参加者の識別情報）を取得する（ステップＳ１０３）。ログイン画面は、個別疑似音生成サーバ５０が提供してもよい。

　次に、個別疑似音生成サーバ５０の制御部５２０は、参加者端末１０において、参加者の拍手音（実音）の収音を行うよう制御する（ステップＳ１０６）。具体的には、個別疑似音生成サーバ５０は、拍手音収音のためのインストラクションを参加者端末１０の表示部に表示し、参加者端末１０のマイクにより拍手音を収音する。なお、参加者端末１０の表示部は、液晶ディスプレイ（ＬＣＤ：Liquid　Crystal　Display）、有機ＥＬ（Electro　Luminescence）ディスプレイなどの表示装置であってもよい。また、参加者端末１０の表示部は、画像をスクリーンや壁に投影するプロジェクタであってもよい。また、参加者端末１０が、参加者の頭部に装着される透過型ＨＭＤ（Head　Mounted　Display）の場合に、参加者の眼前に配置された透過型表示部に、インストラクションをＡＲ（Augmented　Reality）表示してもよい。また、参加者端末１０が、各種表示装置と通信接続し、インストラクションを表示する制御を行ってもよい。

　ここで、図６に、本実施形態による拍手音収音における参加者へのインストラクションの表示画面例を示す。図６上段に示すように、まず、個別疑似音生成サーバ５０の制御部５２０は、参加者端末１０の表示部１３０に、参加者の拍手音を参加者端末１０のマイク入力によって収音する旨を示す画面１３２を表示する。ここでは一例として、拍手音の特徴をより正確に抽出するため、拍手を行うタイムポイントを参加者に提示する。具体的には、例えば画面上で１秒ごとに５つのマークを順次点灯させ、その点灯に合わせてなるべく均一な方法で拍手を行うよう指示する。この際、拍手のフォームもイラストで提示するようにしてもよい。参加者は、インストラクションおよび画面上に表示されるタイムポイントに合わせて、５回手を叩く。なお、特徴抽出の検出精度を高めるため、複数回（例えば５回）、拍手を行わせている。個別疑似音生成サーバ５０の実音解析部５２１は、複数回タイムポイントに合わせて手を叩いた音のうち、最初の１回は参加者が慣れずに精度が下がる場合もあるため、２回目以降を解析対象のデータとして用いるようにしてもよい。また、個別疑似音生成サーバ５０の実音解析部５２１は、複数回分の拍手音を平均化して解析対象のデータとしてもよい。

　次いで、実音解析部５２１は、１秒ごとに点灯した時刻をタイムポイントとして、そのタイムポイントを中心に、収音された拍手音の周波数特性を算出する（ステップＳ１０６、Ｓ１０９）。具体的には、例えば実音解析部５２１は、タイムポイントを目安とした拍手音をスペクトル解析し、スペクトル情報から周波数特性を抽出する。

　次に、実音解析部５２１は、周波数特性をテンプレートの拍手音データに重畳することで、参加者の特徴（個性）を反映させた個別疑似拍手音データの生成を行う（ステップＳ１１５）。特徴（周波数特性）の重畳については、図４を参照して上述した通りである。

　このような解析および生成を行っている間、制御部５２０は、図６中段に示すような、「解析中」であることを示す画面１３３を表示部１３０に表示してもよい。

　また、同じ人物であっても異なる特徴の拍手を行うことが想定されるため、個別疑似音生成サーバ５０は、上記ステップＳ１０６～Ｓ１１５に示す処理を複数回繰り返し、複数の個別疑似拍手音データを生成してもよい。例えば、個別疑似音生成サーバ５０は、拍手する際の手のフォームや、拍手の強さ（強く、弱く）、タイミング（早く、ゆっくり）等を異ならせたインストラクションやイラスト等を提示し、参加者による複数パターンの拍手音（実音）を取得し、それぞれ解析し、個別疑似拍手音データを複数生成し得る。

　続いて、拍手音の解析および個別疑似拍手音データの生成がすべて終了すると、個別疑似音生成サーバ５０は、ライブ配信のイベント中に行う当該個別疑似拍手音データの操作方法の設定を行う（ステップＳ１１８）。個別疑似音生成サーバ５０は、例えば図６下段に示すような、操作方法の説明等を示す画面１３４を表示し、操作方法の設定を参加者に促す。

　操作方法としては、例えば、イベント中に参加者端末１０のマイク入力を許可した状態とした場合、参加者の実際の拍手のタイミング等を、反応情報（拍手の出力指令）として用いることができる。また、マイクを用いない操作方法としては、イベント中に画面に表示されるアイコンのクリック（マウスを用いたクリック、または指や電子ペン等によるタップ）、キーボードの所定キーの操作、ジェスチャ（カメラにより検出）、コントローラのボタン操作、コントローラ（例えばペンライト）を振る操作等であってもよい。また、参加者の腕等に装着したセンサにより検出される腕等の動きであってもよい。

　そして、個別疑似音生成サーバ５０の保存制御部５２３は、生成した１以上の個別疑似拍手音データと、設定した操作方法を示す操作方法情報を、参加者ＩＤに対応付けた状態で、会場サーバ２０に送信する（ステップＳ１２１）。会場サーバ２０では、参加者ＩＤ、１以上の個別疑似拍手音データ、および操作方法情報を、対応付けて記憶部に格納する。

　＜２－３．個別疑似歓声データの生成の流れ＞
　続いて、図７および図８を参照して個別疑似歓声データの生成の流れについて説明する。

　図７は、本実施形態による個別疑似歓声データの生成の流れの一例を示すフローチャートである。図７に示すように、まず、個別疑似音生成サーバ５０の制御部５２０は、参加者ＩＤを取得する（ステップＳ１４３）。図５を参照して説明したように参加者により行われるログイン処理から取得してもよいし、個別疑似拍手音データの生成に引き続き個別疑似歓声データの生成が行われる場合は、上記ステップＳ１０３に示すログイン処理から引き続き参加者ＩＤを取得している状態といえる。

　次に、個別疑似音生成サーバ５０の制御部５２０は、参加者端末１０において、参加者の歓声（実音）の収音を行うよう制御する（ステップＳ１４６）。具体的には、個別疑似音生成サーバ５０は、歓声収音のためのインストラクションを参加者端末１０の表示部に表示し、参加者端末１０のマイクにより歓声を収音する。ここで、図８に、本実施形態による歓声収音における参加者へのインストラクションの表示画面例を示す。図８上段に示すように、まず、個別疑似音生成サーバ５０の制御部５２０は、参加者端末１０の表示部１３０に、参加者の歓声を参加者端末１０のマイク入力によって収音する旨を示す画面１３５を表示する。ここでは一例として、発信音が鳴った後、３秒以内で入力するよう指示する画面が表示される。歓声としては、上述したように様々な感嘆詞が挙げられるが、参加者は、登録したい歓声を選択した上で、声を出すようにしてもよい。例えば、選んだ歓声と同じ感嘆詞で声を出すようにしてもよいし、選んだ歓声と異なる感嘆詞で声を出してもよい。参加者の肉声から声の特徴が抽出され、選んだ感嘆詞のテンプレート疑似歓声データに当該特徴が反映され、個別疑似歓声データが生成され得る。用意される歓声のパターンは複数であってもよいし、単数であってもよい。

　次に、実音解析部５２１は、収音された歓声を解析して特徴を抽出する（ステップＳ１４９、Ｓ１５２）。具体的には、例えば実音解析部５２１は、収音された歓声をスペクトル解析し、スペクトル情報から、スペクトル包絡やフォルマントを特徴（周波数特性）として抽出する。

　続いて、実音解析部５２１は、予め用意されたテンプレートの歓声データに、周波数特性を反映させ、個別疑似歓声データを生成する（ステップＳ１５５）。自宅などライブ会場の雰囲気と異なる場所では自身の歓声を完全には再現できない可能性があるため、予め用意したテンプレート歓声データに各参加者の声の特徴を重畳させることで、個別疑似歓声データを生成する。

　このような解析および生成を行っている間、制御部５２０は、図８中段に示すような、「解析中」であることを示す画面１３６を表示部１３０に表示してもよい。

　次いで、個別疑似音生成サーバ５０は、生成した個別疑似歓声データを再生して参加者に確認させてもよい（ステップＳ１５８）。例えば個別疑似音生成サーバ５０は、図８下段に示すように、個別疑似歓声データの確認を促す画面１３７を表示部１３０に表示する。なお、個別疑似歓声データの生成をやり直したい場合は、画面１３７の「戻る」ボタンを選択し、再度歓声の収音を行い得る。すなわち上記ステップＳ１４６～Ｓ１５８が繰り返される。

　さらに、イベントで頻繁に使う掛け声等がある場合、参加者は、オプションワードの追加を行い得る（ステップＳ１６１）。例えば参加者は、図８下段に示す画面１３７に表示される案内に従って、追加可能な言葉（掛け声）から追加する言葉を選択し得る。「アンコール」の掛け声や、アーティストの名前、特定の曲で行われる決まったコールなど、ライブ配信者側は、予めオプションワードの候補を用意することが可能である。

　次いで、オプションワードを追加する場合（ステップＳ１６１／Ｙｅｓ）、まず、個別疑似音生成サーバ５０は、オプションワードの登録を行う（ステップＳ１６４）。オプションワードの登録は、例えば参加者が参加者端末１０を用いて、図８下段に示す画面１３７に表示される各フォームにおいて、追加したい言葉を選択する（例えば各フォームにおいて、プルダウン方式により選択可能な言葉で提示される）。

　次に、個別疑似音生成サーバ５０は、入力された単語が、倫理的に発してはいけない言葉ではないかを、コーパス等の特定の辞書（例えば禁止用語リストなど）を用いた照合により判定する（ステップＳ１６７）。予め演者側に用意された候補から選ぶ場合は、かかる倫理判定処理はスキップされてもよい。参加者が自由にオプションワードを追加することも可能であり、その場合は、例えば予め演者側が用意した禁止用語リストと照合して判定され得る。禁止用語リストに含まれる言葉が入力された場合、個別疑似音生成サーバ５０は、登録できない旨を参加者に通知する。

　次いで、登録できる言葉が入力されると、個別疑似音生成サーバ５０は、参加者の掛け声の収音を行うよう制御する（ステップＳ１７０）。参加者は、インストラクションに従って、追加するワードを声に出して参加者端末１０のマイクに入力する。

　次に、個別疑似音生成サーバ５０の実音解析部５２１は、収音した掛け声をスペクトル解析し、スペクトル情報から、スペクトル包絡やフォルマントを特徴（周波数特性）として抽出する（ステップＳ１７６）。

　次いで、個別疑似音データ生成部５２２は、抽出した周波数特性を用いて、音声合成により個別疑似掛け声データを生成する（ステップＳ１７９）。音声合成には、演者側が予め用意したテンプレートの掛け声を用いてもよい。また、参加者が任意に入力した単語の場合、個別疑似音データ生成部５２２は、入力された単語（テキスト）に基づいて音声合成によりテンプレートの掛け声を生成し、当該生成したテンプレートの掛け声に周波数特性を重畳して個別疑似掛け声データを生成してもよい。

　次に、個別疑似音生成サーバ５０は、生成した個別疑似掛け声データを再生して参加者に確認させてもよい（ステップＳ１８２）。個別疑似掛け声データの生成をやり直す指示が参加者により入力された場合、ステップＳ１７０に戻り、再度音声収音を行う。また、オプションワードをさらに追加する指示が参加者により入力された場合、ステップＳ１６４に戻り、オプションワードの追加処理を繰り返す。

　なお、ステップＳ１６４～Ｓ１７９に示す処理では、オプションワードを登録する毎に音声の収音を行い、都度解析を行っているが、本実施形態はこれに限定されない。例えば、参加者から複数のサンプル音声データを収音し、収音したサンプルデータと、入力されたオプションワードを組み合わせて、より汎用的に個別疑似掛け声データを生成することも可能である。これにより、都度収音や音声解析を行うことなく、個別疑似掛け声データを生成することができる。

　続いて、個別疑似歓声データ等の生成がすべて終了すると、個別疑似音生成サーバ５０は、ライブ配信のイベント中に行う当該個別疑似歓声データ等の操作方法の設定を行う（ステップＳ１８５）。個別疑似音生成サーバ５０は、操作方法の説明等を示す画面を参加者端末１０の表示部１３０に表示し、操作方法の設定を参加者に促す。

　操作方法としては、例えば、イベント中に画面に表示されるアイコンのクリック（マウスを用いたクリック、または指や電子ペン等によるタップ）、またはキーボードの所定キーの操作を、反応情報（歓声等の出力指令）として用いることができる。例えば歓声や掛け声等の個別疑似音データが複数登録された場合、それぞれに対応するアイコンがライブ配信中に表示部１３０に表示され、参加者はどの歓声や掛け声を出力させるかをアイコンの操作により選択することができる。また、拍手の操作をマイク入力とした場合に、拍手と歓声を同時に入力することを可能とするため、歓声の操作は例えば足で踏んで操作するフットコントローラとしてもよい。フットコントローラについては、図１４を参照して後述する。

　なお、歓声の操作方法は上述した例に限定されず、手で操作するハンディコントローラのボタン操作、ジェスチャ（カメラや加速度センサ等により検出）等により行うことも可能である。

　そして、個別疑似音生成サーバ５０の保存制御部５２３は、生成した１以上の個別疑似歓声データ等と、設定した操作方法を示す操作方法情報を、参加者ＩＤに対応付けた状態で、会場サーバ２０に送信する（ステップＳ１８８）。会場サーバ２０では、参加者ＩＤ、１以上の個別疑似歓声データ、および操作方法情報を、対応付けて記憶部に格納する。

　＜２－４．その他＞
　以上、本実施形態による個別疑似音データの生成について具体的に説明した。なお、本実施形態では一例として個別疑似音生成サーバ５０で個別疑似音データを生成する旨を説明したが、本開示はこれに限定されない。例えば、実音解析部５２１で行う実音解析処理と、個別疑似音データ生成部５２２で行う個別疑似音データの生成処理を、参加者端末１０で行うようにしてもよい。また、参加者端末１０で実音解析処理（特徴の抽出）まで行い、解析結果（抽出した特徴）や操作方法情報を参加者ＩＤと共に個別疑似音生成サーバ５０に送信し、個別疑似音生成サーバ５０が解析結果に基づいて個別疑似音データを生成する処理を行ってもよい。参加者端末１０で実音の解析や個別疑似音データの生成を行う場合、個別疑似音生成サーバ５０は、適宜必要なプログラムやテンプレートの音声等を参加者端末１０に送信する。

　＜＜３．個別疑似音データの出力＞＞
　次に、ライブ配信中における個別疑似音データの出力について説明する。本システムでは、会場サーバ２０により、ライブ配信中に、ライブ参加者の反応に対応する個別疑似音データをリアルタイムでライブ会場に出力する。具体的には、会場サーバ２０は、ライブ会場に設置された疑似音出力装置３０（スピーカ）から個別疑似拍手音データや、個別疑似歓声データを出力する制御を行う。これにより、ライブ会場でライブを行っている演者に対し、多数の参加者のリアルタイムの反応を届けることが可能となり、ライブの臨場感が増す。

　以下、本実施形態における個別疑似音データの出力制御を行う会場サーバ２０の構成と、動作処理例について順次説明する。

　＜３－１．会場サーバ２０の構成例＞
　図９は、本実施形態による会場サーバ２０の構成の一例を示すブロック図である。図９に示すように、会場サーバ２０は、通信部２１０、制御部２２０、および記憶部２３０を有する。

　（通信部２１０）
　通信部２１０は、他の装置と無線または有線により通信接続してデータの送受信を行い得る。通信部２１０は、例えば有線／無線ＬＡＮ（Local　Area　Network）等により実現される。例えば通信部２１０は、ネットワーク７０を介して参加者端末１０とデータの送受信を行い得る。また、通信部２１０は、ライブ会場に設けられた疑似音出力装置３０に個別疑似音データを送信したり、会場音取得装置４０から会場の音声信号（演者の音声が入力されるマイクや楽器から収集した音源）を受信したりする。

　（制御部２２０）
　制御部２２０は、演算処理装置および制御装置として機能し、各種プログラムに従って会場サーバ２０内の動作全般を制御する。制御部２２０は、例えばＣＰＵ（Central　Processing　Unit）、マイクロプロセッサ等の電子回路によって実現される。また、制御部２２０は、使用するプログラムや演算パラメータ等を記憶するＲＯＭ（Read　Only　Memory）、及び適宜変化するパラメータ等を一時記憶するＲＡＭ（Random　Access　Memory）を含んでいてもよい。

　また、本実施形態による制御部２２０は、疑似音生成部２２１、疑似音出力制御部２２２、および会場音送信制御部２２３としても機能する。

　疑似音生成部２２１は、会場に配置された疑似音出力装置３０から出力（再生）する疑似音を生成する機能を有する。具体的には、疑似音生成部２２１は、通信部２１０を介して参加者端末１０から受信した参加者の反応を示す反応情報に応じて個別疑似音データを選択し、選択した個別疑似音データに対して反応情報に基づいてパラメータ調整を行う。

　ここで、「反応情報」とは、参加者による拍手や歓声の操作（動作）に関する操作情報が一例として挙げられる。操作情報には、例えば、単位時間における操作回数、操作タイミング、操作量（押し込み量）、または選択操作情報（選択した項目のＩＤなど）が含まれ得る。また、操作情報には、参加者側で入力された拍手音の周波数解析により得られたスペクトルが含まれていてもよい。また、操作情報は、単位時間（一定時間）毎の操作情報であって、継続的に参加者端末１０から送信され得る。

　疑似音生成部２２１は、これら操作情報に基づいて、単位時間（一定時間）における操作回数や操作タイミング情報等に予め対応付けられた個別疑似音データを選択する。また、疑似音生成部２２１は、参加者により実際に行われた拍手音のスペクトル情報を操作情報として取得し、当該スペクトル情報と類似した個別疑似音データを選択してもよい。また、場合によっては、ライブ会場で流れている音楽の曲調やイベントの内容に合わせて、個別疑似音データの選択を演者側から制御してもよい。例えば、バラードの曲であれば軽く叩く拍手の個別疑似音データ、イベント後半で盛り上がる部分は勢いのある拍手の個別疑似音データなどを選択するよう設定することも可能である。なお、本実施形態による参加者側での拍手や歓声の操作については、図１１～図１７を参照して具体的に説明する。

　次いで、疑似音生成部２２１は、選択された個別疑似音データに対して、操作情報に基づいて、パラメータ調整を行う。例えば疑似音生成部２２１は、操作回数に比例した音量の調整や、操作タイミングに応じた出力タイミングの調整等を行う。これにより、各参加者のリアルタイムの反応を、より自然で臨場感溢れるフィードバックとして提供することができる。

　疑似音出力制御部２２２は、疑似音生成部２２１により選択され、パラメータ調整が行われた個別疑似音データを疑似音出力装置３０から出力する制御を行う。疑似音出力装置３０の一例として、ライブ会場の各観客席に配置された小型スピーカ（個別音声出力装置）が挙げられる。例えば参加者ＩＤに、ライブ会場における参加者の仮想的な位置（以下、仮想位置と称する）が対応付けられている場合（観客席ＩＤを用いてもよい）、疑似音出力制御部２２２は、各参加者の仮想位置に設置されている小型スピーカから、各参加者の個別疑似音データを出力する制御を行う。これにより、ライブ会場の各観客席から各参加者の拍手や歓声等が聞こえ、観客席に実際に観客が居るような臨場感を演者に与えることができる。

　なお、小型スピーカは、全ての観客席にそれぞれ設けられていてもよいし、複数の観客席毎に１つの小型スピーカが設けられていてもよい。よりリアルな臨場感を演者に与えるには全ての観客席（少なくとも視聴している参加者それぞれに割り当てられている会場内の位置）に小型スピーカが設けられていることが望ましいが、必ずしもこれに限定されない。

　会場音送信制御部２２３は、会場音取得装置４０から出力された会場の音声（会場音信号）を、各参加者端末１０に送信する制御を行う。会場音取得装置４０の一例として、ライブ会場の各観客席に配置された小型マイクロホン（個別収音装置）（以下、小型マイクと称する）が挙げられる。例えば会場音送信制御部２２３は、参加者ＩＤに対応付けられている、ライブ会場における参加者の仮想位置に設置されている小型マイクにより収音された会場音信号を取得し、参加者の参加者端末１０に送信する。仮想位置に対応する観客席に設置された小型マイクにより会場音を収音することで、会場の空間の反響や遠近感、方向感を含む会場音が得られる。これにより、ライブ会場の観客席で実際に聞いているような臨場感を参加者に与えることができる。すなわち、近くの観客席（に配置されている小型スピーカ）からの音は近くで聴こえ、各参加者の反応やライブ演奏の音は会場の反響を伴って聴こえる。

　また、会場音送信制御部２２３は、会場音信号に対して微調整（ノーマライズ等）を行った上で送信するようにしてもよい。例えば会場音送信制御部２２３は、ダイナミックレンジ調整等を行う。

　（記憶部２３０）
　記憶部２３０は、制御部２２０の処理に用いられるプログラムや演算パラメータ等を記憶するＲＯＭ（Read　Only　Memory）、および適宜変化するパラメータ等を一時記憶するＲＡＭ（Random　Access　Memory）により実現される。例えば、記憶部２３０は、参加者ＩＤに対応付けて、個別疑似音データ、操作方法情報、および会場における仮想位置等を記憶する。

　以上、本実施形態による会場サーバ２０の構成について説明した。なお、図９に示す会場サーバ２０の構成は一例であって、本開示はこれに限定されない。例えば、会場サーバ２０は、複数の装置から構成されていてもよい。

　＜３－２．動作処理例＞
　続いて、本実施形態による個別疑似音データの出力の動作処理について図１０を参照して説明する。図１０は、本実施形態に係る会場サーバ２０による個別疑似音データの出力の動作処理の流れの一例を示すフローチャートである。図１０に示す処理は、ライブ配信中に継続的に行われ得る。

　図１０に示すように、まず、会場サーバ２０は、参加者端末１０から、参加者ＩＤ、操作回数、およびタイミング情報等をリアルタイムで取得する（ステップＳ２０３）。操作回数、およびタイミング情報は、操作情報の一例である。

　次に、会場サーバ２０の疑似音生成部２２１は、参加者ＩＤに対応付けられた１以上の個別疑似音データのうち、操作回数やタイミング情報に応じて１の個別疑似音データを選択する（ステップＳ２０６）。

　次いで、疑似音生成部２２１は、選択された個別疑似音データに対して、必要に応じてパラメータ調整を行う（ステップＳ２０９）。例えば疑似音生成部２２１は、操作回数に比例した音量調整や、操作タイミングに応じたタイミング調整（トリガーや、拍手音の打音タイミング等）を行う。パラメータ調整のより具体的な例については、図１２、図１５～図１７を参照して説明する。また、場合によっては、演者側がイベントの内容や曲調、曲のジャンル等に応じて予め指定した比例係数αを掛けて調整してもよい。これにより、拍手や歓声に個性を持たせ、同じ人物であってもパフォーマンスの雰囲気に応じて変化のある拍手や歓声をリアルタイムに出力することが可能となる。

　次に、疑似音出力制御部２２２は、参加者ＩＤに対応付けられた仮想位置に配置された小型スピーカ（疑似音出力装置３０の一例）から、個別疑似音データを再生する制御を行う（ステップＳ２１２）。なお、本実施形態では一例として会場の各観客席に疑似音出力装置３０として小型スピーカがそれぞれ配置されている場合を想定している。

　次いで、会場音送信制御部２２３は、参加者ＩＤに対応付けられた仮想位置に置かれた小型マイクにより収音される会場音信号を取得する（ステップＳ２１５）。ここでは一例として会場の各観客席に会場音取得装置４０として小型マイクがそれぞれ配置されている場合を想定している。

　また、会場音送信制御部２２３は、会場音信号の微調整（ノーマライズ等）を行い（ステップＳ２１８）、会場音信号を参加者端末１０に送信する制御を行う（ステップＳ２２１）。

　以上、本実施形態による個別疑似音データの出力処理の流れについて具体的に説明した。なお、図１０に示すフローチャートの各ステップは、適宜並列に処理してもよいし、逆の順序で処理してもよい。また、必ずしもすべてのステップを処理しなくともよい。例えば、ステップＳ２０３～Ｓ２１２に示す処理は、会場への観客音声（個別疑似音データ）出力処理であって、ライブ配信中に継続的に繰り返し処理される。また、観客音声出力処理と並列して、ステップＳ２１５～Ｓ２２１に示す参加者への会場音声（会場音信号）伝送処理も、ライブ配信中に継続的に繰り返し処理される。

　続いて、個別疑似音データの出力に関し、具体例を挙げてより詳細に説明する。

　＜３－３．個別疑似拍手音データの出力＞
　まず、個別疑似音データの一例である個別疑似拍手音データの出力処理について説明する。

　（３－３－１．拍手の操作について）
　図１１は、本実施形態による参加者側における拍手の操作について説明する図である。図１１に示すように、参加者端末１０は、通信部１１０、制御部１２０、表示部１３０、スピーカ１５０、およびマイク１６０を有する。また、図１１には図示していないが、参加者端末１０は、さらに記憶部や操作入力部１４０を有する。参加者端末１０は、会場サーバ２０により配信されるライブ映像や音声を出力する機能を有する。

　制御部１２０は、演算処理装置および制御装置として機能し、各種プログラムに従って参加者端末１０内の動作全般を制御する。制御部１２０は、例えばＣＰＵ（Central　Processing　Unit）、マイクロプロセッサ等の電子回路によって実現される。また、制御部１２０は、使用するプログラムや演算パラメータ等を記憶するＲＯＭ（Read　Only　Memory）、及び適宜変化するパラメータ等を一時記憶するＲＡＭ（Random　Access　Memory）を含んでいてもよい。

　本実施形態による制御部１２０は、通信部１１０によりネットワーク７０を介して会場サーバ２０から受信したライブ映像を表示部１３０に表示（または壁やスクリーンに投影）する制御や、スピーカ１５０から会場音信号を出力する制御を行う。

　表示部１３０は、液晶ディスプレイ（ＬＣＤ：Liquid　Crystal　Display）、有機ＥＬ（Electro　Luminescence）ディスプレイなどの表示装置であってもよい。また、参加者端末１０の表示部１３０は、画像をスクリーンや壁に投影するプロジェクタであってもよい。また、参加者端末１０が、参加者の頭部に装着される透過型ＨＭＤ（Head　Mounted　Display）の場合に、参加者の眼前に配置された透過型表示部に、ライブ映像等をＡＲ（Augmented　Reality）表示してもよい。また、参加者端末１０が、各種表示装置と通信接続し、ライブ映像等を表示する制御を行ってもよい。図１１に示す例では、表示部１３０に、ライブ映像と、参加者側のマイク入力のＯＮ／ＯＦＦや拍手や歓声を示すアイコン画像が表示されている。例えばマイク入力がＯＮの場合、参加者Ｐは実際に手を叩いて拍手を行うことで、拍手の操作を行い得る。制御部１２０は、マイク１６０により収音した拍手音声を解析し、単位時間における拍手回数、または拍手タイミングを、操作情報（拍手の操作指令）として参加者ＩＤと共に通信部１１０から会場サーバ２０に送信する。制御部１２０は、単位時間毎に操作情報等を会場サーバ２０に送信し得る。

　また、マイク入力がＯＦＦの場合、参加者Ｐは拍手のアイコン画像をマウスでクリックしたり、画面を指等でタップしたり、キーボードの対応する所定のキーを押したりすることで、拍手の操作を行い得る。この場合、制御部１２０は、単位時間におけるクリック回数、またはクリックタイミング等を、操作情報（拍手の操作指令）として参加者ＩＤと共に通信部１１０から会場サーバ２０に送信する。なお、操作方法はこれらに限定されず、参加者Ｐが手に持つコントローラ（ペンライト等であってもよい）を振ったり、所定のジェスチャを行ったりすることで、拍手の操作を行い得る。これらの動作は、各種センサ（加速度センサ、ジャイロセンサ、カメラ等）により検出され得る。

　なお、表示部１３０に表示される拍手のアイコン画像は、拍手操作を受け付けた際に、操作タイミングに合わせて点滅するよう制御されてもよい。これにより、操作を受け付けたことを参加者Ｐにフィードバックすることが可能となる。

　（３－３－２．個別疑似拍手音データのパラメータ調整について）
　会場サーバ２０の疑似音生成部２２１は、参加者端末１０から送信された参加者ＩＤおよび操作情報に基づいて、個別疑似拍手音データを選択する。例えば疑似音生成部２２１は、単位時間における操作回数（拍手の回数、クリック操作の回数、タップ操作の回数等）に対応付けられた個別疑似拍手音データを選択する。そして、疑似音生成部２２１は、選択された個別疑似拍手音データに対して、操作情報に基づいてパラメータ調整を行う。

　図１２は、本実施形態による個別疑似拍手音データのパラメータ調整の一例について説明する図である。疑似音生成部２２１は、図１２に示すように、例えば単位時間ｂ１における操作回数（例えば５回）に応じた第１の個別疑似拍手音データを、単位時間ｂ１における操作回数に比例した音量（振幅）に調整し、さらに５回の各操作のタイミングに合わせて第１の個別疑似拍手音データの５回の各再生のタイミングを調整する。続いて、疑似音生成部２２１は、単位時間ｂ２における操作回数（例えば６回）に応じた第２の個別疑似拍手音データを、単位時間ｂ２における操作回数に比例した音量（振幅）に調整し、さらに６回の各操作のタイミングに合わせて第２の個別疑似拍手音データの６回の各再生のタイミングを調整する。このように、単位時間毎に操作情報に応じて適宜パラメータ調整（音量、タイミング）を行って再生することで、参加者の実際の拍手をよりリアルに再現した個別疑似音データを再生することが可能となる。また、本システムでは、単位時間毎に、操作回数等に応じて、個別疑似拍手音データが自動的に選択され得る。

　＜３－４．個別疑似歓声データの出力＞
　次に、個別疑似音データの一例である個別疑似歓声データの出力処理について説明する。なお、ここでは代表して個別疑似歓声データの出力処理について主に説明するが、個別疑似掛け声データの出力処理も同様に行われ得る。

　（３－４－１．歓声の操作について）
　図１３は、本実施形態による参加者側における歓声の操作について説明する図である。図１３に示す例では、参加者端末１０が有する操作入力部１４０の一例として、キーボード１４１、マウス１４２、およびフットコントローラ１４３を挙げる。

　表示部１３０では、ライブ映像と、参加者側のマイク入力のＯＮ／ＯＦＦや拍手や歓声を示すアイコン画像が表示されている。歓声を示すアイコン画像は、歓声のパターンに応じてそれぞれ表示され得る。これらのアイコン画像は、例えば色を変えて表示されてもよい。また、歓声を示す各アイコン画像には、歓声のパターンを示すテキストが表示されていてもよい。また、掛け声の出力操作を行うためのアイコン画像も歓声のアイコン画像と同様に表示されてもよい（掛け声の内容を示すテキストを併せて表示する）。

　参加者Ｐは、歓声等のアイコン画像をマウスでクリックしたり、画面を指等でタップしたり、キーボードの対応する所定のキーを押したりすることで、歓声の選択操作を行い得る。この場合、制御部１２０は、選択された歓声パターンを示す情報（選択操作を示す情報）と、単位時間におけるクリック回数、またはクリックタイミング等を、操作情報（歓声等の操作指令）として参加者ＩＤと共に通信部１１０から会場サーバ２０に送信する。なお、選択操作を示す情報は、選択された歓声等のパターンに対応付けられたＩＤ（歓声ＩＤ）であってもよい。予め生成される個別疑似歓声データには歓声ＩＤが割り振られ得る。制御部１２０は、参加者Ｐに選択された歓声ＩＤを会場サーバ２０に送信してもよい。また、歓声は一定時間の長さを有する音声であるため、制御部１２０は、操作タイミング情報として、歓声のアイコン画像をクリック等した時刻（開始タイミング）のみを記録し、会場サーバ２０にトリガーとして出力することで歓声の再生を開始させてもよい。また、制御部１２０は、操作回数としては、単位時間毎のクリック回数等を集計して会場サーバ２０に送信してもよい。

　（３－４－２．個別疑似歓声データのパラメータ調整について）
　会場サーバ２０の疑似音生成部２２１は、参加者端末１０から送信された参加者ＩＤ、および参加者が選択した歓声パターンを示す歓声ＩＤ（選択操作情報の一例）に基づいて、個別疑似歓声データを選択する。そして、疑似音生成部２２１は、選択された個別疑似歓声データに対して、操作情報に基づいてパラメータ調整を行う。

　図１４は、本実施形態による個別疑似歓声データのパラメータ調整の一例について説明する図である。疑似音生成部２２１は、図１４に示すように、例えばトリガーが入力された際に、選択された個別疑似歓声データの再生を開始し、歓声が再生されている間、単位時間毎の操作回数に比例して音量（振幅）を調整してもよい。例えば図１４に示す例では、トリガーが入力されたタイミングで、選択された歓声ＩＤに応じた第１の個別疑似歓声データの再生が開始され、第１の個別疑似歓声データは、単位時間ｂ１における操作回数（例えば５回）に比例した音量（振幅）に調整され、次いで、引き続き第１の個別疑似歓声データが、単位時間ｂ２における操作回数（例えば６回）に比例した音量（振幅）に調整されている。歓声パターンの選択は、選択したパターンの音声出力が終了するまで（次のトリガーが入力されるか、言葉など一定時間発する必要がある場合は所定の持続時間が終了するまで）、アクティブな状態となる。

　なお、操作回数に比例して音量を調整すると、ある一定の長さがある言葉（単語や文章）から成る掛け声の場合、言葉の末尾まで発するためには操作を行い続けなければならない（例えば掛け声のアイコン画像を連打し続ける等）。仮に参加者Ｐによる操作時間が、掛け声の持続時間よりも短い場合、音声が途中で消えてしまうことになる。そこで、会場サーバ２０の疑似音生成部２２１は、参加者端末１０からトリガーが送られた後、個別疑似掛け声データの持続時間が終了するまで、音量のベースラインを０より大きな値にすることで、言葉が途中で消えてしまうことを回避することができる。図１５は、本実施形態による個別疑似掛け声データのパラメータ調整の一例について説明する図である。図１５に示すように、例えばトリガーが入力されてから再生した掛け声の持続時間の間において、単位時間に含まれる操作回数が０となった場合でも、疑似音生成部２２１は、最小の音量とするよう調整することで、音声が消えてしまうことを回避することが可能である。

　（フットコントローラ１４３について）
　歓声や掛け声の操作方法は、上述したアイコン画像のクリック操作等に限定されない。例えば拍手の操作を実際の拍手によるマイク入力で行う場合、歓声のアイコン画像を並行してクリックしたりキーボード操作したりすることは困難である。したがって、本実施形態では、足で操作するフットコントローラ１４３を歓声操作に用いてもよい。

　図１６は、本実施形態による歓声の操作を行うためのフットコントローラ１４３の一例について説明する図である。図１６に示すように、例えばフットコントローラ１４３には、複数のスイッチが設けられ、足で押し込むことで操作する。複数のスイッチは、例えば色や形が異なり、それぞれ異なるパターンの歓声に対応している。また、フットコントローラ１４３の場合は、操作回数ではなく、操作の強さ（スイッチを押し込む強さ）が、疑似音生成部２２１によるパラメータ調整に用いられ得る。

　フットコントローラ１４３の各スイッチには、押し込みを検知するセンサが設けられ得る。押し込みの程度は、圧力センサにより検知されてもよいし、図１６下段に示すように、スイッチの高さの変化量が検知されてもよい。スイッチ部分は、例えばゴム状弾性部材で形成され、押す強さに応じてスイッチ部分の高さが変化する。また、図１６上段に示すように、フットコントローラ１４３には、各スイッチの押し込みの程度を示す表示部（押し込み力のメータ）が設けられていてもよい。

　図１７は、本実施形態によるフットコントローラ１４３を用いた場合の個別疑似歓声データのパラメータ調整の一例について説明する図である。フットコントローラ１４３を用いた場合、操作量（スイッチを押す強さ、押し込み量、またはスイッチの高さの変化量）は、連続的に変化する。制御部１２０は、その変化をサンプリングして操作量を会場サーバ２０に送信する。例えば制御部１２０は、データ量を小さくするため、低い周波数でサンプリングしてもよい。具体的には、例えば図１７の上段に示すように単位時間毎に周波数でサンプリングし、開始時刻と終了時刻の２点の強度情報のみを、操作量情報として送信するようにしてもよい。

　会場サーバ２０の疑似音生成部２２１は、単位時間毎に、サンプリングされた２点間の補完を行い、図１７の上段に点線で示すように、なだらかな近似信号を作成する。そして、疑似音生成部２２１は、作成した近似信号に合わせて、図１７下段に示すように、個別疑似歓声データの音量（振幅）を調整する。単位時間内にトリガー時刻が含まれる場合は、開始時刻をトリガー時刻に置き換えて音量の包絡信号を生成する。

　また、フットコントローラ１４３の場合も、操作量に応じて音声を調整すると、ある一定の持続時間を要する掛け声を言葉の末尾まで発するためには操作を継続しなければならなくなる。そこで、疑似音生成部２２１は、単位時間内に含まれる操作量情報（押す強さ等の情報）が０の場合でも、疑似音の掛け声の持続時間内であれば、最小の音量で再生を継続するようパラメータ調整を行ってもよい。また、図１６上段に示すように、フットコントローラ１４３の各スイッチに対応する位置に、操作時間（掛け声の持続時間）を示すメータを設置してもよい。点灯している間は掛け声を発している最中であることを明示することで、参加者が意識的に、掛け声の持続時間が終了するまで操作し続けることを促すことが可能となる。なお、かかる足元に位置するメータをライブ配信中に見ることが難しい場合も考慮し、制御部１２０は、フットコントローラ１４３の制御のパラメータを表示部１３０に表示するようにしてもよい。例えば、制御部１２０は、図１３に示すように、歓声のアイコン画像の横に、操作時間（掛け声の持続時間）を示すメータを表示し、点灯している間は掛け声を発している最中であることを明示するようにしてもよい。また、制御部１２０は、アイコン画像の色の濃さ等を、フットコントローラ１４３のスイッチを押す強さに応じて変化させてもよい。

　＜＜４．変形例＞＞
　続いて、本実施形態によるライブ配信システムの変形例について、図１８～図２１を参照して説明する。

　上述した実施形態では、疑似音出力装置３０の一例として、ライブ会場の各観客席に小型スピーカを配置し、各小型スピーカからそれぞれ対応する参加者の個別疑似音データを出力することで、観客席に実際に観客が存在しているかのような感覚をステージ上の演者に与えることができる旨を説明した。しかしながら、多数の小型スピーカを用いず、ステージ上やステージの周辺などに演者向けに設置した大型スピーカ（疑似音出力装置の他の例）から各参加者の個別疑似音データを出力する場合も想定される。この場合、出力する各参加者の個別疑似音データに、遠近感や方向感、および会場の反響特性（これらをまとめて伝達特性と称する）を付加することで、会場の観客席から音が聞こえるような感覚を、ステージ上の演者に与えることが可能となる。

　また、上述した実施形態では、会場音取得装置４０の一例として、各観客席に小型マイクを用いたが、会場に多数の（例えば観客席分の）小型マイクを用意できない場合であっても、会場サーバ２０は、会場のミキサー（会場音取得装置４０の他の例）から出力される会場音信号に所定の処理を行うことで、会場の空間の反響等が感じられる、実際に観客席で聞いているかのような感覚を参加者に与えることが可能となる。ミキサーとは、演者の音声や演奏等を収音するマイクロホンや、電子楽器、各種プレーヤー（例えばＣＤプレーヤー、レコードプレーヤー、デジタルプレーヤー）等の音響機器から入力される各種音源を個別に調整した上で混合（ミックス）して出力する装置であって、会場の音響を集約して適宜処理する音響処理装置の一例である。

　また、ミキサーから出力される会場音信号に対して行う所定の処理とは、参加者に対応付けられているライブ会場内の仮想的な観客席の位置（以下、仮想位置とも称する）に対応する、遠近感、方向感、会場の空間の反響等の特性（これらをまとめて伝達特性と称する）を付加する処理である。

　またさらに、会場の空間の反響等を含む反響個別疑似音データを予め用意し、各参加者の反応に応じて選択された全ての反響個別疑似音データを合算して、上記会場音信号と共に参加者端末１０に送信してもよい。反響個別疑似音データとは、各参加者の反応に応じて選択される反響疑似拍手音や反響疑似歓声等である。これにより、参加者は、参加者自身を含む会場内の全観客の反応を、実際に観客席で聞いているかのような感覚で視聴することが可能となる。

　以下、本実施形態による反響個別疑似音データの利用と、伝達特性の付加処理について具体的に説明する。

　＜４－１．反響個別疑似音データの生成＞
　本変形例では、まず、実際のライブ会場で収録された拍手等の音声データ、すなわち反響テンプレート疑似音データを用意する。予め実際のライブ会場で反響テンプレート疑似音データ（反響テンプレート拍手音データや反響テンプレート歓声データ）を収録することで、会場の空間の反響等を含む音声データが得られる。次いで、ライブ配信開始前に、予め用意した反響テンプレート疑似音データに、参加者が発する音の特徴（例えば周波数特性）を合成し、参加者毎の反響個別疑似音データを生成する。

　反響個別疑似音データの生成は、個別疑似音データと同様に、個別疑似音生成サーバ５０により行われ得る。そして、生成された反響個別疑似音データは、個別疑似音データと同様に、参加者ＩＤに対応付けて会場サーバ２０の記憶部２３０に保存され得る。なお、反響個別疑似音データは、同パターンの個別疑似音データと対応付けられてもよい。この際、各疑似音データに疑似音ＩＤを付与し、当該疑似音ＩＤを用いて対応付けを行ってもよい。

　反響個別疑似音データの生成処理は、生成に用いるテンプレートの性質が異なるだけで、上述した個別疑似音データの生成と同様である。個別疑似音生成サーバ５０は、参加者がマイク入力した拍手音や歓声から抽出した特徴を、テンプレート疑似音データと、反響テンプレート疑似音データに合成することで、個別疑似音データと、反響個別疑似音データを生成し得る。

　テンプレート疑似音データは、無響環境で収録された拍手や歓声等の音データであり、反響テンプレート疑似音データは、実際のライブ会場で予め収録された拍手や歓声等の音データである。また、用いる反響テンプレート疑似音データは、参加者のライブ会場における仮想位置に対応する反響テンプレート疑似音データ（すなわち、仮想位置に対応する実際の場所で行った拍手や歓声等をその場所で収録した音声）であってもよい。

　＜４－２．会場サーバ２０ａの構成例＞
　図１８は、本実施形態の変形例による会場サーバ２０ａの構成の一例を示すブロック図である。図１８に示すように、会場サーバ２０ａは、通信部２１０、制御部２２０ａ、および記憶部２３０を有する。なお、図９を参照して説明した会場サーバ２０の同符号の構成については、上述の通りであるため、ここでの詳細な説明は省略する。

　本変形例による制御部２２０ａは、疑似音生成部２２１ａ、伝達特性Ｈ_Ｏ付加部２２５、疑似音出力制御部２２２ａ、伝達特性Ｈ_Ｉ付加部２２６、全参加者反響疑似音合成部２２７、および会場音送信制御部２２３ａとしても機能する。

　（疑似音生成部２２１ａ）
　疑似音生成部２２１ａは、通信部２１０により参加者端末１０から取得した参加者ＩＤ、操作情報等に基づいて、個別疑似音データを選択する。また、疑似音生成部２２１ａは、併せて、反響個別疑似音データも選択する。例えば疑似音生成部２２１ａは、選択した個別疑似音データに対応付けられた、同パターンの反響個別疑似音データを選択する。上述したように、反響個別疑似音データは、個別疑似音データと同様に予め生成され、記憶部２３０に保存され得る。

　そして、疑似音生成部２２１ａは、選択した個別疑似音データと反響個別疑似音データについて、それぞれ、パラメータ調整を行う。パラメータ調整の詳細は、上述した実施形態と同様であり、例えば操作回数に比例した音量の調整や、操作タイミングに応じた出力タイミングの調整等が挙げられる。

　（伝達特性Ｈ_Ｏ付加部２２５）
　伝達特性Ｈ_Ｏ付加部２２５は、疑似音生成部２２１ａから出力された個別疑似音データに、予め計測された会場の反響の伝達特性Ｈ_Ｏを付加する。伝達特性Ｈ_Ｏは、観客席から、会場のステージ（演者が居る場所周辺）に向けての伝達特性である。個別疑似音データに、伝達特性Ｈ_Ｏを付加することで、会場の各観客席に会場小型スピーカを配置できず、例えばステージ上において演者の目の前の足元に１つの大型スピーカ３２（疑似音出力装置３０の一例）しか設置できない場合であっても、会場の空間に観客が存在しているような感覚を演者に持たせることが可能となる。

　図１９は、本実施形態の変形例による伝達特性Ｈ_Ｏについて説明する図である。図１９に示すように、ライブ会場にステージと観客席を設け、各席にはＩＤ（観客席ＩＤ）を割り当てる。図１９に示す例では、ライブ会場における参加者Ａの仮想的な位置（仮想位置）と、参加者Ｂの仮想位置を例示する。仮想位置に対応する観客席を起点、演者付近（例えば破線で囲った部分）を受音点として、各観客席（Ａ、Ｂ）からの伝達特性（Ｈ_Ｏ（Ａ）、Ｈ_Ｏ（Ｂ））が計測される。なお、伝達特性Ｈ_Ｏの計測は、全ての観客席について行われ得る。

　なお、演者がステージ上を動かない場合は演者の立ち位置、演者がある程度動く場合や複数の演者が居る場合は、ステージ上の演者の目の前の足元等に配置される少なくとも１つの大型スピーカ３２（全参加者の個別疑似音データを演者に向けて出力する総合音声出力装置）を受音点とする等、適宜変更してもよい。

　計測された伝達特性Ｈ_Ｏは、観客席ＩＤと対応付けて会場サーバ２０の記憶部２３０に保存される。伝達特性Ｈ_Ｏ付加部２２５は、参加者ＩＤに対応付けられた観客席ＩＤ（仮想位置）に基づいて、対応する伝達特性Ｈ_Ｏを取得する。次いで、伝達特性Ｈ_Ｏ付加部２２５は、疑似音生成部２２１ａにより選択された個別疑似音データに、取得した上記伝達特性Ｈ_Ｏを付加する。

　（疑似音出力制御部２２２ａ）
　疑似音出力制御部２２２ａは、伝達特性Ｈ_Ｏ付加部２２５により伝達特性Ｈ_Ｏが付加された個別疑似音データを全参加者分加算して、大型スピーカ３２から出力する制御を行う。

　（伝達特性Ｈ_Ｉ付加部２２６）
　伝達特性Ｈ_Ｉ付加部２２６は、ミキサー４２（会場音取得装置４０の一例）から出力された会場音信号に、会場において観客席に向けて設けられ、ミキサー４２から入力される会場音信号を出力する演者スピーカ６０（音声出力装置）から各観客席への伝達特性Ｈ_Ｉを付加する。本実施形態では、ライブ会場の演者が用いるマイクや楽器等の各種音響機器からの音源が、例えばミキサー４２でミックスされ、ライブ会場において演者スピーカ６０から観客席に向けて出力され、また、参加者端末１０に配信される。ここで、参加者端末１０に送信する会場音信号に、伝達特性Ｈ_Ｉを付加することで、会場の音声を各観客席で聴いているかのような感覚を再現することが可能となる。

　伝達特性Ｈ_Ｉは、ライブ配信を開始する前に予め計測され得る。図２０は、本実施形態の変形例による伝達特性Ｈ_Ｉについて説明する図である。図２０に示すように、ライブ会場にはステージと観客席が設けられ、各席にはＩＤ（観客席ＩＤ）が割り当てられる。図２０に示す例では、参加者Ａのライブ会場における仮想的な位置（仮想位置）と、参加者Ｂの仮想位置を例示する。会場に設置される演者スピーカは、一例としてステージの左右に設けられる２つのスピーカ（演者スピーカ６０Ｒと演者スピーカ６０Ｌ）を想定する。そして、仮想位置に対応する各観客席（Ａ、Ｂ）についてそれぞれ、左右両方の演者スピーカ６０Ｒ、６０Ｌからの伝達特性（Ｈ^Ｒ _Ｉ（Ａ）、Ｈ^Ｌ _Ｉ（Ａ）、Ｈ^Ｒ _Ｉ（Ｂ）、Ｈ^Ｌ _Ｉ（Ｂ））が計測される。なお、伝達特性Ｈ_Ｉの計測は、全ての観客席について行われ得る。

　計測された伝達特性Ｈ_Ｉは、観客席ＩＤと対応付けられて、会場サーバ２０に保存される。伝達特性Ｈ_Ｉ付加部２２６は、参加者ＩＤに対応付けられた観客席ＩＤ（仮想位置）に基づいて、対応する伝達特性Ｈ_Ｉを取得する。次いで、伝達特性Ｈ_Ｉ付加部２２６は、ミキサー４２から出力された会場音信号に、取得した上記伝達特性Ｈ_Ｉを付加する。これにより、各観客席で会場の演奏等を聴いた時の音空間を模した音が合成される。

　（全参加者反響疑似音合成部２２７）
　全参加者反響疑似音合成部２２７は、疑似音生成部２２１ａから出力された全参加者の反響個別疑似音データを全て合算する機能を有する。ミキサー４２から出力される会場音信号は、ミキサー４２に接続された演者のマイクや楽器、プレーヤー等の出力のみであるため、全観客の拍手音や歓声等が含まれない。そのため、各参加者の反響個別疑似音データを全て加算し、会場音送信制御部２２３ａで会場音信号と共に参加者端末１０に送信することで、会場の反響を模した参加者全員の反応、すなわち会場の音空間にマッチした拍手音や歓声等を、参加者に届けることが可能となる。これにより、参加者は、参加者自身を含む会場内の全観客の反応を、実際に観客席で聞いているかのような感覚で視聴することができる。

　（会場音送信制御部２２３ａ）
　会場音送信制御部２２３ａは、ミキサー４２から出力された会場の音声（会場音信号）と、全参加者反響疑似音合成部２２７により合成された全参加者の反響個別疑似音データを、参加者端末１０に送信する制御を行う。

　以上、本変形例による会場サーバ２０ａの構成について具体的に説明した。なお、図１８に示す構成は一例であって、本開示はこれに限定されない。例えば、会場サーバ２０ａが複数の装置により構成されていてもよい。また、会場サーバ２０ａに示す全ての構成を有していなくともよい。

　＜４－３．伝達特性の付加処理＞
　図２１は、本実施形態の変形例による伝達特性付加処理の流れの一例を示すフローチャートである。

　図２１に示すように、まず、会場サーバ２０ａは、参加者端末１０から、参加者ＩＤ、操作回数、およびタイミング情報等をリアルタイムで取得する（ステップＳ３０３）。操作回数、およびタイミング情報は、操作情報の一例である。

　次に、会場サーバ２０の疑似音生成部２２１は、参加者ＩＤに対応付けられた１以上の個別疑似音データのうち、操作回数やタイミング情報に応じて１の個別疑似音データを選択する（ステップＳ３０６）。

　次いで、疑似音生成部２２１は、選択された個別疑似音データに対して、必要に応じてパラメータ調整を行う（ステップＳ３０９）。

　次に、伝達特性Ｈ_Ｏ付加部２２５は、個別疑似音データに、参加者ＩＤに対応付けられたライブ会場における仮想位置（例えば観客席ＩＤ）に対応する伝達特性Ｈ_Ｏを付加する（ステップＳ３１２）。

　次いで、疑似音出力制御部２２２ａは、大型スピーカ３２から、伝達特性Ｈ_Ｏ付加した個別疑似音データを再生する制御を行う（ステップＳ３１５）。伝達特性Ｈ_Ｏとは、上述したように、所定の観客席から演者の居るステージ上への伝達特性である。疑似音出力制御部２２２ａは、全参加者の各仮想位置に対応する伝達特性Ｈ_Ｏをそれぞれ付加した個別疑似音データを合成して大型スピーカ３２から出力（再生）する制御を行う。大型スピーカ３２は、例えばライブ会場のステージ上の演者の目の前の足元等に、演者に向けて配置された大型のスピーカであるが、参加者の仮想位置を考慮した伝達特性Ｈ_Ｏを付加した個別疑似音データが出力されることで、ライブ会場の観客席から拍手や歓声が届いているような、遠近感や方向感、および会場の反響感を、ステージ上の演者に与えることができる。

　続いて、会場サーバ２０ａは、会場のミキサー４２から、会場音信号を取得する（ステップＳ３１８）。

　次に、伝達特性Ｈ_Ｉ付加部２２６は、会場音信号に、参加者ＩＤに対応付けられた仮想位置（観客席ＩＤ）に応じた伝達特性Ｈ_Ｉを付加する（ステップＳ３２１）。伝達特性Ｈ_Ｉとは、上述したように、例えば演者スピーカ６０から所定の観客席への伝達特性である。これにより、参加者の仮想位置を考慮したライブ会場の空間の反響等を再現した会場音信号を生成することができる。

　次いで、会場音送信制御部２２３ａは、会場の反響を模した会場音信号を微調整（ノーマライズ等）する（ステップＳ３２４）。

　また、一方で、疑似音生成部２２１ａは、参加者端末１０から受信した操作情報等に基づいて、参加者ＩＤに対応付けられた反響付き個別疑似音データのうち１の反響付き個別疑似音データを選択し、操作情報等に基づいてパラメータ調整を行う（ステップＳ３２７）。かかる処理は、上記ステップＳ３０６に示す処理と並列して行われてもよい。また、疑似音生成部２２１ａは、ステップＳ３０６に示す処理で選択した個別疑似音データに対応付けられる反響付き個別疑似音データ（同じパターンの疑似音データ）を選択するようにしてもよい。そして、疑似音生成部２２１ａは、ステップＳ３０９に示すパラメータ調整と同様に、選択した反響付き個別疑似音データに対して、操作回数に比例した音量調整や、操作タイミングに応じたタイミング調整等を行う。

　次に、全参加者反響疑似音合成部２２７は、全参加者の反響付き個別疑似音データ（パラメータ調整済み）を合成する（ステップＳ３３０）。

　そして、会場音送信制御部２２３ａは、会場の反響を模した会場音信号と、全参加者の反響付き個別疑似音データを、参加者端末１０に送信する制御を行う（ステップＳ３３３）。これにより、参加者は、参加者の仮想位置を考慮したライブ会場の空間の反響等を再現した会場音信号と、参加者自身を含む会場内の全観客の反応を、実際に観客席で聞いているかのような感覚で視聴することができる。

　以上、本実施形態の変形例による伝達特性付加処理の流れについて具体的に説明した。なお、図２１に示すフローチャートの各ステップは、適宜並列に処理してもよいし、逆の順序で処理してもよい。また、必ずしもすべてのステップを処理しなくともよい。例えば、ステップＳ３０３～Ｓ３１５に示す処理は、会場への観客音声（個別疑似音データ）出力処理であって、ライブ配信中に継続的に繰り返し処理される。また、観客音声出力処理と並列して、ステップＳ３２７～Ｓ３３０に示す参加者への疑似音返送準備処理と、ステップＳ３１８～Ｓ３３３に示す参加者への会場音声（会場音信号）伝送処理を、ライブ配信中に継続的に繰り返し処理されてもよい。

　＜＜５．補足＞＞
　以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本技術はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

　例えば、上述した実施形態および変形例を適宜組み合わせてもよい。一例としては、会場サーバ２０により各参加者の反応に応じた個別疑似音データを各観客席に設けられた小型スピーカから出力する一方、ミキサー４２から取得した会場音信号（伝達特性Ｈ_Ｉ付加）と、全参加者の反響個別疑似音データを、参加者端末１０に送信してもよい。

　また、会場サーバ２０により各参加者の反応に応じた個別疑似音データを、伝達特性Ｈ_Ｏの付加処理を行わずに、ステージ上などに演者向けに配置した少なくとも１つの大型スピーカから出力してもよい。

　また、上述した参加者端末１０、会場サーバ２０、または個別疑似音生成サーバ５０に内蔵されるＣＰＵ、ＲＯＭ、およびＲＡＭ等のハードウェアに、参加者端末１０、会場サーバ２０、または個別疑似音生成サーバ５０の機能を発揮させるための１以上のコンピュータプログラムも作成可能である。また、当該１以上のコンピュータプログラムを記憶させたコンピュータ読み取り可能な記憶媒体も提供される。

　また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。

　なお、本技術は以下のような構成も取ることができる。
（１）
　参加者が発した音の特徴を反映させた１以上の個別疑似音データから、取得した前記参加者の反応を示す反応情報に対応する個別疑似音データを選択し、前記選択した個別疑似音データを、会場に設置された音声出力装置から出力する制御を行う制御部を備える、情報処理装置。
（２）
　前記制御部は、前記会場と異なる場所においてリアルタイムに取得される前記参加者の反応情報に対応する個別疑似音データを選択し、前記会場の演者に対して前記音声出力装置から出力する制御を行う、前記（１）に記載の情報処理装置。
（３）
　前記参加者の反応情報は、前記参加者の操作回数を示す情報、前記参加者による操作タイミングを示す情報、操作量を示す情報、前記参加者が発した音を周波数解析して得られたスペクトルの情報、または前記参加者による選択操作情報のうち、少なくとも一つを含む、前記（１）または（２）に記載の情報処理装置。
（４）
　前記１以上の個別疑似音データは、１以上の異なる個別疑似拍手音データであり、
　前記制御部は、前記参加者による一定時間における拍手の回数、クリック操作の回数、タップ操作の回数、またはスペクトルの少なくとも一つに基づいて、前記１以上の異なる個別疑似拍手音データから、対応する個別疑似拍手音データを選択する、前記（３）に記載の情報処理装置。
（５）
　前記参加者の反応情報には、前記参加者による拍手のタイミングを示す情報が含まれ、
　前記制御部は、前記拍手のタイミングに合わせて、前記選択した個別疑似拍手音データの出力タイミングを調整する、前記（４）に記載の情報処理装置。
（６）
　前記参加者の反応情報には、前記参加者による拍手の回数を示す情報が含まれ、
　前記制御部は、一定時間における前記拍手の回数に応じて、前記出力する個別疑似拍手音データの音量を調整する、前記（４）または（５）に記載の情報処理装置。
（７）
　前記１以上の個別疑似音データは、１以上の異なる個別疑似歓声データまたは個別疑似掛け声データであり、
　前記制御部は、前記参加者による選択操作に従って、対応する個別疑似歓声データまたは個別疑似掛け声データを選択する、前記（３）に記載の情報処理装置。
（８）
　前記制御部は、
　　前記参加者による選択操作の開始タイミングをトリガーとして、前記選択した個別疑似歓声データまたは個別疑似掛け声データの出力を開始し、
　　前記選択操作の回数または前記選択操作の操作量に応じて、前記出力している個別疑似歓声データまたは個別疑似掛け声データの音量をリアルタイムで変化させる制御を行う、前記（７）に記載の情報処理装置。
（９）
　前記制御部は、前記個別疑似掛け声データの持続時間終了まで、少なくとも最小の音量で出力を継続するよう調整する、前記（７）または（８）に記載の情報処理装置。
（１０）
　前記制御部は、前記選択した個別疑似音データを、前記会場における前記参加者の仮想位置に配置される個別音声出力装置から出力する制御を行う、前記（１）～（９）のいずれか１項に記載の情報処理装置。
（１１）
　前記制御部は、前記会場における前記参加者の仮想位置に配置される個別収音装置から取得される会場音信号を、前記会場と異なる場所に居る前記参加者が利用する参加者端末に送信する制御を行う、前記（１０）に記載の情報処理装置。
（１２）
　前記制御部は、前記選択した個別疑似音データに、前記会場における前記参加者の仮想位置から前記会場の演者までの伝達特性を付加した上で、前記会場において前記演者の周辺に配置される総合音声出力装置から出力する制御を行う、前記（１）～（９）のいずれか１項に記載の情報処理装置。
（１３）
　前記制御部は、前記会場の音響機器からの音源を集約する音響処理装置から取得される会場音信号を、前記会場と異なる場所に居る前記参加者が利用する参加者端末に送信する制御を行う、前記（１）～（９）のいずれか１項に記載の情報処理装置。
（１４）
　前記制御部は、前記音響処理装置から取得される前記会場音信号に、前記会場において観客席に向けて前記会場音信号を出力する音声出力装置から前記会場における前記参加者の仮想位置までの伝達特性を付加した上で、前記参加者端末に送信する制御を行う、前記（１３）に記載の情報処理装置。
（１５）
　前記制御部は、
　　前記会場の反響を含む反響疑似音データに前記参加者が発した音の特徴を反映させて予め生成した１以上の反響個別疑似音データから、前記参加者のリアルタイムの反応を示す反応情報に対応する反響個別疑似音データを選択し、
　　全参加者の前記選択した反響個別疑似音データを合成し、
　　前記合成した全参加者の反響個別疑似音データを、前記会場音信号と共に、前記参加者端末に送信する、前記（１３）または（１４）に記載の情報処理装置。
（１６）
　前記制御部は、前記会場の音響機器からの音源を集約する音響処理装置から取得される会場音信号に、前記会場において観客席に向けて当該会場音信号を出力する音声出力装置から前記会場における前記参加者の仮想位置までの伝達特性を付加した上で、前記参加者端末に送信する制御を行う、前記（１）～（９）のいずれか１項に記載の情報処理装置。
（１７）
　参加者が発した音の特徴を、テンプレートの音データに反映させて、個別疑似音データを生成する処理と、
　前記生成した個別疑似音データを、前記参加者に対応付けて保存する処理と、
を行う制御部を備える、情報処理装置。
（１８）
　前記制御部は、前記参加者が発した音を解析して得られる周波数特性と時間特性の一方または両方を、前記テンプレートの音データに合成することで、前記個別疑似音データを生成する、前記（１７）に記載の情報処理装置。
（１９）
　前記情報処理装置は、さらに通信部を備え、
　前記通信部は、
　　前記参加者が利用する参加者端末で収音して解析された前記参加者が発した音の特徴を受信し、
　　前記生成した個別疑似音データを、前記参加者の識別情報と対応付けて、会場に設置された音声出力装置からの出力制御を行う会場サーバに送信する、前記（１７）または（１８）に記載の情報処理装置。
（２０）
　プロセッサが、
　参加者が発した音の特徴を反映させた１以上の個別疑似音データから、取得した前記参加者の反応を示す反応情報に対応する個別疑似音データを選択し、前記選択した個別疑似音データを、会場に設置された音声出力装置から出力する制御を行うことを含む、情報処理方法。
（２１）
　コンピュータを、
　参加者が発した音の特徴を反映させた１以上の個別疑似音データから、取得した前記参加者の反応を示す反応情報に対応する個別疑似音データを選択し、前記選択した個別疑似音データを、会場に設置された音声出力装置から出力する制御を行う制御部として機能させる、プログラム。
（２２）
　プロセッサが、
　参加者が発した音の特徴を、テンプレートの音データに反映させて、個別疑似音データを生成することと、
　前記生成した個別疑似音データを、前記参加者に対応付けて保存することと、
を含む、情報処理方法。
（２３）
　コンピュータを、
　参加者が発した音の特徴を、テンプレートの音データに反映させて、個別疑似音データを生成する処理と、
　前記生成した個別疑似音データを、前記参加者に対応付けて保存する処理と、
を行う制御部として機能させる、プログラム。
（２４）
　参加者が利用する参加者端末と、会場に設置された音声出力装置からの出力を制御するサーバと、を備え、
　前記サーバは、
　　前記参加者端末から、前記参加者の反応を示す反応情報を受信する通信部と、
　　前記参加者が発した音の特徴を反映させた１以上の個別疑似音データから、前記受信した前記参加者の反応を示す反応情報に対応する個別疑似音データを選択し、前記選択した個別疑似音データを、前記音声出力装置から出力する制御を行う制御部と、を有する、
システム。

　１０　参加者端末
　　１１０　通信部
　　１２０　制御部
　　１３０　表示部
　　１４０　操作入力部
　　１５０　スピーカ
　　１６０　マイク
　２０、２０ａ　会場サーバ
　　２１０　通信部
　　２２０、２２０ａ　制御部
　　　２２１、２２１ａ　疑似音生成部
　　　２２２、２２２ａ　疑似音出力制御部
　　　２２３、２２３ａ　会場音送信制御部
　　　２２５　伝達特性Ｈ_Ｏ付加部
　　　２２６　伝達特性Ｈ_Ｉ付加部
　　　２２７　全参加者反響疑似音合成部
　　２３０　記憶部
　３０　疑似音出力装置
　４０　会場音取得装置
　５０　個別疑似音生成サーバ
　　５１０　通信部
　　５２０　制御部
　　　５２１　実音解析部
　　　５２２　個別疑似音データ生成部
　　　５２３　保存制御部
　　５３０　記憶部
　６０　演者スピーカ
　７０　ネットワーク

Claims

　参加者が発した音の特徴を反映させた１以上の個別疑似音データから、取得した前記参加者の反応を示す反応情報に対応する個別疑似音データを選択し、前記選択した個別疑似音データを、会場に設置された音声出力装置から出力する制御を行う制御部を備える、情報処理装置。
　前記制御部は、前記会場と異なる場所においてリアルタイムに取得される前記参加者の反応情報に対応する個別疑似音データを選択し、前記会場の演者に対して前記音声出力装置から出力する制御を行う、請求項１に記載の情報処理装置。
　前記参加者の反応情報は、前記参加者の操作回数を示す情報、前記参加者による操作タイミングを示す情報、操作量を示す情報、前記参加者が発した音を周波数解析して得られたスペクトルの情報、または前記参加者による選択操作情報のうち、少なくとも一つを含む、請求項１に記載の情報処理装置。
　前記１以上の個別疑似音データは、１以上の異なる個別疑似拍手音データであり、
　前記制御部は、前記参加者による一定時間における拍手の回数、クリック操作の回数、タップ操作の回数、またはスペクトルの少なくとも一つに基づいて、前記１以上の異なる個別疑似拍手音データから、対応する個別疑似拍手音データを選択する、請求項３に記載の情報処理装置。
　前記参加者の反応情報には、前記参加者による拍手のタイミングを示す情報が含まれ、
　前記制御部は、前記拍手のタイミングに合わせて、前記選択した個別疑似拍手音データの出力タイミングを調整する、請求項４に記載の情報処理装置。
　前記参加者の反応情報には、前記参加者による拍手の回数を示す情報が含まれ、
　前記制御部は、一定時間における前記拍手の回数に応じて、前記出力する個別疑似拍手音データの音量を調整する、請求項４に記載の情報処理装置。
　前記１以上の個別疑似音データは、１以上の異なる個別疑似歓声データまたは個別疑似掛け声データであり、
　前記制御部は、前記参加者による選択操作に従って、対応する個別疑似歓声データまたは個別疑似掛け声データを選択する、請求項３に記載の情報処理装置。
　前記制御部は、
　　前記参加者による選択操作の開始タイミングをトリガーとして、前記選択した個別疑似歓声データまたは個別疑似掛け声データの出力を開始し、
　　前記選択操作の回数または前記選択操作の操作量に応じて、前記出力している個別疑似歓声データまたは個別疑似掛け声データの音量をリアルタイムで変化させる制御を行う、請求項７に記載の情報処理装置。
　前記制御部は、前記個別疑似掛け声データの持続時間終了まで、少なくとも最小の音量で出力を継続するよう調整する、請求項７に記載の情報処理装置。
　前記制御部は、前記選択した個別疑似音データを、前記会場における前記参加者の仮想位置に配置される個別音声出力装置から出力する制御を行う、請求項１に記載の情報処理装置。
　前記制御部は、前記会場における前記参加者の仮想位置に配置される個別収音装置から取得される会場音信号を、前記会場と異なる場所に居る前記参加者が利用する参加者端末に送信する制御を行う、請求項１０に記載の情報処理装置。
　前記制御部は、前記選択した個別疑似音データに、前記会場における前記参加者の仮想位置から前記会場の演者までの伝達特性を付加した上で、前記会場において前記演者の周辺に配置される総合音声出力装置から出力する制御を行う、請求項１に記載の情報処理装置。
　前記制御部は、前記会場の音響機器からの音源を集約する音響処理装置から取得される会場音信号を、前記会場と異なる場所に居る前記参加者が利用する参加者端末に送信する制御を行う、請求項１に記載の情報処理装置。
　前記制御部は、前記音響処理装置から取得される前記会場音信号に、前記会場において観客席に向けて前記会場音信号を出力する音声出力装置から前記会場における前記参加者の仮想位置までの伝達特性を付加した上で、前記参加者端末に送信する制御を行う、請求項１３に記載の情報処理装置。
　前記制御部は、
　　前記会場の反響を含む反響疑似音データに前記参加者が発した音の特徴を反映させて予め生成した１以上の反響個別疑似音データから、前記参加者のリアルタイムの反応を示す反応情報に対応する反響個別疑似音データを選択し、
　　全参加者の前記選択した反響個別疑似音データを合成し、
　　前記合成した全参加者の反響個別疑似音データを、前記会場音信号と共に、前記参加者端末に送信する、請求項１３に記載の情報処理装置。
　参加者が発した音の特徴を、テンプレートの音データに反映させて、個別疑似音データを生成する処理と、
　前記生成した個別疑似音データを、前記参加者に対応付けて保存する処理と、
を行う制御部を備える、情報処理装置。
　前記制御部は、前記参加者が発した音を解析して得られる周波数特性と時間特性の一方または両方を、前記テンプレートの音データに合成することで、前記個別疑似音データを生成する、請求項１６に記載の情報処理装置。
　前記情報処理装置は、さらに通信部を備え、
　前記通信部は、
　　前記参加者が利用する参加者端末で収音して解析された前記参加者が発した音の特徴を受信し、
　　前記生成した個別疑似音データを、前記参加者の識別情報と対応付けて、会場に設置された音声出力装置からの前記個別疑似音データの出力制御を行う会場サーバに送信する、請求項１６に記載の情報処理装置。
　プロセッサが、
　参加者が発した音の特徴を反映させた１以上の個別疑似音データから、取得した前記参加者の反応を示す反応情報に対応する個別疑似音データを選択し、前記選択した個別疑似音データを、会場に設置された音声出力装置から出力する制御を行うことを含む、情報処理方法。
　コンピュータを、
　参加者が発した音の特徴を反映させた１以上の個別疑似音データから、取得した前記参加者の反応を示す反応情報に対応する個別疑似音データを選択し、前記選択した個別疑似音データを、会場に設置された音声出力装置から出力する制御を行う制御部として機能させる、プログラム。