CN100425072C - 信息处理设备、信息处理方法 - Google Patents
信息处理设备、信息处理方法 Download PDFInfo
- Publication number
- CN100425072C CN100425072C CNB2005100884588A CN200510088458A CN100425072C CN 100425072 C CN100425072 C CN 100425072C CN B2005100884588 A CNB2005100884588 A CN B2005100884588A CN 200510088458 A CN200510088458 A CN 200510088458A CN 100425072 C CN100425072 C CN 100425072C
- Authority
- CN
- China
- Prior art keywords
- content
- image
- user
- analysis
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/44012—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving rendering scenes according to scene graphs, e.g. MPEG-4 scene graphs
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/23412—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs for generating or manipulating the scene composition of objects, e.g. MPEG-4 objects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/141—Systems for two-way working between two video terminals, e.g. videophone
- H04N7/147—Communication arrangements, e.g. identifying the communication as a video-communication, intermediate storage of the signals
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Information Transfer Between Computers (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Processing Or Creating Images (AREA)
Abstract
本发明提出了一个信息处理设备,该设备用于与通过网络与该信息处理设备连接的另一个信息处理设备通讯。设备包括用于同步复制与其他设备共有的内容数据的复制工具,用于接收来自另一个设备的用户的声音和图像的用户信息接收工具,用于把用户接收部件接收的声音和图像与由内容复制部件同步复制的内容数据的声音和图像进行合成作为另一个用户的声音和图像的合成工具,用于分析至少由复制部件同步复制的内容数据的一个声音,内容数据的一个图像以及为了辨认内容数据特征而添加到内容数据的辅助信息的特征分析工具,用于在由特征分析部件产生的分析结果的基础上设置用于控制一个由合成部件执行来合成声音和图像的进程的控制参数的参数设置工具。
Description
有关申请的交叉参照:
本发明包括涉及在2004年七月27日在日本专利局登记为日本专利号JP2004-218531的主题,它的全部内容在此作为参考。
(1)技术领域
本发明涉及一个信息处理设备,一个信息处理方法,一个记录媒体和一个程序。本发明尤其涉及一个信息处理设备,一个信息处理方法,一个程序和一个记录媒体,它们和其他设备通过网络互相联结,用于综合操作设备的用户的声音和图像合成与该设备的共有的内容和用于同步复制合成结果。
(2)发明背景
在相关领域中用于所在位置相隔遥远的人们相互联系的设备包括电话,所谓的电视电话,视频会议系统。也有一种方法凭借个人计算机或类似的设备被连接到互联网络并被用于基于文本的聊天和基于图像和声音的视频聊天。这类相互联系以下被称为远程通讯。
另外,已经有一种系统被提出,在其中执行互相远程通讯的每个人通过连接到互联网的个人计算机或类似设备共享一个虚拟空间和同样的内容。需要关于这类系统的更多信息,参考文件如日本专利公开文件No.2003-271530。
(3)发明内容
相关领域的方法使所在位置相隔遥远的使用者能共享同样的内容,然而,使用者主要通过用一种语言书写的信息的传递互相沟通。因此,相关领域的方法和在面对面交流中使用者确实地面对交流伙伴相比有一个难以向另一个使用者表达一个使用者的情绪和心理情景的问题。
另外,在相关领域的方法中,使用者可以看见通讯伙伴的图像并听见伙伴的声音,连同了解与通讯伙伴共享的内容。这种方法有一个归因于设备复杂程度,由使用者执行的,难以操作设备以使得通过人工的操作或类似的用内容的图像和声音最优地合成通讯伙伴的图像和声音的问题。
对于上述的问题,本发明的发明者们已经发明了一种能够在一个由使用者们通过看和听同样的内容实行的进程中,依照所在位置相隔遥远的使用者的情形轻而易举地完成大部分的图像和大部分的声音的合成的技术。
依照本发明的具体装置,提供的信息处理设备包括:
复制装置用于和另一个信息处理设备同步地复制一个信息处理设备和另一个信息处理设备共有的内容数据;
用户信息接收装置用于接收来自另一个信息处理设备的用户的声音和图像;
合成装置用于把由用户接收装置接收的声音和图像和由复制装置同步复制的内容数据的声音和图像合成起来作为另一个用户的声音和图像;
特征分析装置用于分析至少由复制装置同步复制的内容数据的一个声音,内容数据的一个图像以及为了辨认内容数据特征而添加到内容数据的辅助信息;和
参数设置装置用于在由特征分析装置产生的分析结果的基础上设置用于控制一个由合成装置执行来合成声音和图像的进程的控制参数。
依照本发明的具体装置,有可能提供一个配置,其中特征分析装置执行分析以为了辨认包括在内容数据中的一个场景的特征;参数设置装置设置在由特征分析装置产生的被认出作为分析结果的场景特征的基础上,设置用于控制一个由合成装置执行来合成声音和图像的进程的控制参数。
依照本发明的另一具体装置,还有可能提供一个配置,其中特征分析装置执行分析以为了辨认出包括在内容数据中的图像的特征信息位置作为图像的特征;参数设置装置在由特征分析装置产生的作为分析结果的图象特征信息的位置的基础上设置用于控制一个由合成装置执行来合成声音和图像的进程的控制参数。
依照本发明更多的具体装置,还有可能提供一个配置,其中参数设置装置在特征分析装置产生的分析结果的基础上也设置另一个信息处理设备的控制参数;送出装置把参数设置装置设置的控制参数传递给另一个信息处理设备。
依照本发明的具体装置,提供的信息处理方法包括以下步骤:
和另一个信息处理设备同步地复制一个信息处理设备和另一个信息处理设备共有的内容数据;
接收来自另一个信息处理设备的用户的声音和图像;
把用户信息接收步骤执行的进程中接收的声音和图像与由复制步骤执行的进程中同步复制的内容数据的声音和图像进行合成作为另一个用户的声音和图像;
分析至少由复制步骤执行的进程中同步复制的内容数据的一个声音,内容数据的一个图像以及为了辨认内容数据特征而添加到内容数据的辅助信息;和
在由特征分析步骤执行的进程中产生的分析结果的基础上设置用于控制一个由合成步骤执行合成声音和图像的进程的控制参数。
依照本发明的具体装置,提供一个用于记录程序的记录媒体,这个程序包括以下步骤:
和一个信息处理设备同步地复制计算机和该信息处理设备共有的内容数据;
接收来自该信息处理设备的另一个用户的声音和图像;
把用户信息接收步骤执行的进程中接收的声音和图像与由复制步骤执行的进程中同步复制的内容数据的声音和图像进行合成作为另一个用户的声音和图像;
分析至少由复制步骤执行的进程中同步复制的内容数据的一个声音,内容数据的一个图像以及为了辨认内容数据特征而添加到内容数据的辅助信息;和
在由特征分析步骤执行的进程中产生的分析结果的基础上设置用于控制一个由合成步骤执行合成声音和图像的进程的控制参数。
依照本发明的具体装置,提供的一个程序包括以下步骤:
和一个信息处理设备同步地复制计算机和该信息处理设备共有的内容数据;
接收来自该信息处理设备的另一个用户的声音和图像;
把由复制步骤执行的进程中同步复制的内容数据的声音和图像与由用户信息接收步骤执行的进程中接收的声音和图像进行作为另一个用户的声音和图像;
分析至少由复制步骤执行的进程中同步复制的内容数据的一个声音,内容数据的一个图像以及为了辨认内容数据特征而添加到内容数据的辅助信息;和
在由特征分析步骤执行的进程中产生的分析结果的基础上设置用于控制一个由合成步骤执行合成声音和图像的进程的控制参数。
依照本发明的具体装置,提供的一个信息处理设备包括:
复制部件用于另一个信息处理设备同步地一个复制信息处理设备和另一个信息处理设备共有的内容数据;
用户信息接收部件用于接收来自另一个信息处理设备的用户的声音和图像;
合成部件用于把用户接收部件接收的声音和图像与由内容复制部件同步复制的内容数据的声音和图像进行合成作为另一个用户的声音和图像;
特征分析部件用于分析至少由复制部件同步复制的内容数据的一个声音,内容数据的一个图像以及为了辨认内容数据特征而添加到内容数据的辅助信息;和
参数设置部件用于在由特征分析部件产生的分析结果的基础上设置用于控制一个由合成部件执行来合成声音和图像的进程的控制参数。
如上所描述的,在本发明的具体装置中,一个信息处理设备和另一个信息处理设备共有的内容被该信息处理设备和另一个信息处理设备同步地复制。来自被另一个用户操作的另一个信息处理设备的另一个用户的声音和图像被收到。然后,同步复制的内容的声音与来自另一个用户的声音被合成,同步复制的内容的图像与来自另一个用户的图像被合成。另外,同步复制内容的声音,内容的图像和添加于内容的辅助信息被分析以为了辨认内容的特征。然后,在分析结果的基础上,用于控制执行合成声音和图像的进程的控制参数被设定。
网络是用来将至少两个设备互相连起来并将信息从一个设备传递给另一个设备的一种装置。通过网络互相通讯的设备可以是独立的设备或者是包括在设备中的内部组块。
通讯可以是无线电通讯或有线通讯。作为一个二中选一的,通讯可以也可以是无线电通讯和有线通讯的组合,两者互相混合。即,无线电通讯在某个的操作区域被采用同时有线通讯被用于其它区域。作为另一种方式的,通过应用无线通讯到从一个某个设备到另一个设备的通讯中并应用有线通讯到从别的设备到该设备的通讯中,无线通讯和有线通讯互相混合在一起。
依照本发明的具体装置,依照被复制的内容,大部分图像和大部分声音的合成可以被轻而易举的完成。另外,所在位置相隔遥远的使用者现在能够以一种生动的方式互相通讯。
(4)附图说明
通过参考以下和附图联系的描述,本发明的这些和其他对象将会被看到,其中:
图1是一个框图依照本发明的具体装置显示了一个通讯系统的代表性的配置;
图2A到2C是显示了一个内容的一个代表性的图像和在图1所显示的在通讯系统中用户的代表性的图像的框图;
图3A到3C是显示了一个内容图像和用户图像的合成的代表性的图像的框图;
图4是显示了在图1中显示的通讯系统所使用的通讯设备1-1的代表性的配置的方块图;
图5显示了一个流程图涉及由图4所显示的通讯设备执行的远程通讯处理的说明;
图6是一个方块图显示了在图4所显示的通讯设备中使用的一个数据分析部件的一个详细的代表性的配置;
图7是一个框图涉及解释依照内容场景执行的一个代表性的特征分析混合进程;
图8是一个框图涉及解释依照内容类别执行的一个代表性的特征分析混合进程;
图9显示了一个流程图涉及解释在图5所显示的流程图的S5步骤执行的内容特征分析混合进程;
图10显示了一个流程图涉及解释在图9所显示的流程图的S22步骤执行的内容分析进程;
图11显示了一个流程图涉及解释在图9所显示的流程图的S22步骤执行的内容分析进程的另一种执行方式;
图12显示了一个流程图涉及解释在图9所显示的流程图的S24步骤执行的信息控制接收进程;和
图13是一个方块图依照本发明具体装置显示了一台个人计算机的代表性的配置。
(5)具体实施方式
在本发明的首选实施例被说明前,公布的发明和实施例的关系会在以下的比较描述中被说明。需要注意的是,即使有这本说明书描述的实施例但没作为与发明相应的实施例包括在以下比较说明中,这样一个具体装置不应该被解释为与发明不相应的具体装置。反过来,在以下比较说明中,一个作为与某个特定的发明相应的具体装置不能解释为与该特定发明之外其他发明不相适应的具体方式。
另外,接下来的比较说明不应该被理解为一个全面的包含在这本说明书中公布的所有发明的描述。换句话说,以下比较说明决不否认在这本说明书中公布的但没有作为专利申请的发明包括在声明中的发明的存在。即,以下比较说明决不否认将被包括在分开的专利申请中的发明的存在,将被包括在这本说明书的修订中的发明的存在,或在将来被添加的发明的存在。
依照本发明的具体装置,一个信息处理设备(如在图1中显示的通讯设备1-1)包括:
复制装置(如在图4中显示的内容复制部件25)用于和另一个信息处理设备同步地复制这个信息处理设备和另一个信息处理设备共有的内容数据(如图1中显示的通讯设备1-2);
用户信息接收装置(如在图4中显示的一个通讯部件23)用于接收从另一个信息处理设备来的另一个用户的声音和图像;
合成装置(如在图4中显示的音频/视频合成部件26)用于把由复制装置同步复制的内容数据的声音和图像与由用户信息接收装置接收的声音和图像进行合成作为另一个用户的声音和图像;
特征分析装置(如在图4中显示的内容特征分析部件71)用于分析至少由复制装置同步复制的内容数据的一个声音,内容数据的一个图像以及为了辨认内容数据特征而添加到内容数据的辅助信息;和
参数设置装置(如在图4中显示的一个控制信息产生部件72)用于在由特征分析装置产生的分析结果的基础上设置用于控制一个由合成装置执行来合成声音和图像的进程的控制参数。
依照本发明的具体装置,有可能将信息处理设备应用于一个这样的配置,其中特征分析装置(如在图4中显示的内容特征分析部件71用于执行在图10所显示的流程图的步骤S51的进程)执行分析以辨认包括在内容数据中的一个场景的特征;参数设置装置(如在图4中显示的一个控制信息产生部件72用于执行在图10所显示的流程图的步骤S57的进程)在由特征分析装置产生的被认出作为分析结果的场景特征的基础上,设置用于控制一个由合成装置执行来合成声音和图像的进程的控制参数。
依照本发明的另一具体装置,有可能将信息处理设备应用于一个这样的配置,其中特征分析装置(如在图4中显示的内容特征分析部件71用于执行在图11所显示的流程图的步骤S73的进程)执行分析以辨认出包括在内容数据中的图像的特征信息位置作为图像的特征;参数设置装置(如在图4中显示的一个控制信息产生部件72用于执行在图11所显示的流程图的步骤S74的进程)在由特征分析装置产生的作为分析结果的图象特征信息的位置的基础上设置用于控制一个由合成装置执行来合成声音和图像的进程的控制参数。
依照本发明更多的具体装置,还有可能将信息处理设备应用于一个这样的配置,其中参数设置装置在特征分析装置产生的分析结果的基础上也设置另一个信息处理设备的控制参数;送出装置(如在图4中显示的一个信息操作输出部件87)把参数设置装置设置的控制参数传递给另一个信息处理设备。
依照本发明的具体装置,提供的信息处理方法包括以下步骤:
和另一个信息处理设备同步地复制一个信息处理设备和另一个信息处理设备共有的内容数据;(如图5所显示的流程图的步骤S4)
接收来自另一个信息处理设备的用户的声音和图像;(如图5所显示的流程图的步骤S2)
把用户信息接收步骤执行的进程中接收的声音和图像与由复制步骤执行的进程中同步复制的内容数据的声音和图像进行合成作为另一个用户的声音和图像;(如图9所显示的流程图的步骤S23)
分析至少由复制步骤执行的进程中同步复制的内容数据的一个声音,内容数据的一个图像以及为了辨认内容数据特征而添加到内容数据的辅助信息;(如图10所显示的流程图的步骤S51)和
在由特征分析步骤执行的进程中产生的分析结果的基础上设置用于控制一个由合成步骤执行合成声音和图像的进程的控制参数。(如图10所显示的流程图的步骤S57)
应该被注意到的是,记录媒体和本发明具体的执行的之间的关系与以上描述的信息处理方法和本发明的具体执行之间的关系是一样的。相似的,程序和本发明的具体执行之间的关系与以上描述的信息处理方法和本发明的具体执行之间的关系是一样的。因此,为避免重复,不再说明记录媒体和本发明具体的执行的之间的关系以及程序和本发明的具体执行之间的关系。
参考以下图表,本发明的具体装置被详细说明。
图1是一个框图依照本发明的具体装置显示了一个通讯系统的代表性的配置。在这个通讯系统中,通讯设备1-1通过通讯网络2与另一个通讯设备1连接。在图1显示的典型配置情况下,通讯设备1-2用作另一个通讯设备1。通讯设备1-1和1-2以和所谓电视电话相似的途径互相交换他们的用户的图像和声音。另外,通讯设备1-1和1-2同步地复制通讯设备1-1和1-2共有的内容。通过以这种方式显示共有内容支持用户间的远程通讯。在接下来的说明中,在没有必要把通讯设备1-1和1-2互相区分开来的情况下,通讯设备1-1和1-2各自被简单的称为通讯设备1。
应该注意到共有内容的例子有作为接收电视广播的结果的节目内容,已经获得的电影内容或下载得到的相似内容,用户间相互交换的私人内容,游戏内容,音乐内容,和用DVD(数码通用碟片)表现的预录在光碟上的内容。应该注意到光碟本身在图中没有显示。
通讯设备1可以被大量用户同时使用。在图1显示的代表性的配置的情况下,例如,用户A和B使用通讯设备1-1,而用户X使用通讯设备1-2。
作为一个例子,在图2A中显示一个共有内容的图像。通讯设备1-1获得的一个图像是用户A的一个图像就像图2B显示的。另一方面,通讯设备1-2获得的一个图像是用户X的一个图像就像图2C显示的。在这种情况下,如图4显示的在通讯设备1-1中使用的显示器41显示了一个如图3A展现的画中画屏幕,如图3B展现的交替淡变屏,或如图3展现的划变屏。在任一种情况下,共有内容的图像和用户的图像互相叠加在一起。
需要注意到,在如图3A展现的画中画显示中,用户的图像作为一个子屏被一个个叠加到共有内容上。每个子屏的位置和大小可以被任意的改变。另外,只有任一个用户的图像可以被显示,而不是用户的图像都被显示,那就是,不是既显示用户A的图像又显示作为用户A的通讯伙伴的用户X的图像。
在如图3B展现的交叉混合叠像渐变屏中,共用内容的图像和可以是用户A或X的用户图像被合成。这个划变屏可以被用于如当用户指向共有内容的图像的任意位置或区域时的例示。
在如图3C展现的划变屏中,用户的图像显示在屏幕上,向某个方向移动渐渐地覆盖共有内容的图像。在图3C中展示的代表性的的屏幕中,用户的图像从右边起显示。
上面屏幕的合成图像可是时常改变。另外,每个合成模式都有合成参数,如图像平衡来设定图3A到3C展示的合成模式中的每个图像的透明度和音量平衡来设置用户和内容的音量。这些合成参数也可以被时常改变。显示从一个到另一个的合成模式的改变和合成参数的改变的历史被存储在一个如图4显示的合成信息存储部件64中。需要注意到,显示内容的图像和用户的图像的模式并不限制在以上描述的合成模式。即,图像也可以按照一种合成模式而不是以上描述的模式被显示。
回到图1。通讯网络2是一个典型地由互联网代表的宽带数据通讯网络。在通讯设备1制造的一个请求中,内容提供服务器3通过通讯网络2给通讯设备1提供内容。在通讯设备1的用户可以使用这个通讯系统前,鉴定服务器4鉴定该用户。另外,对一个被成功地鉴定的用户,鉴定服务器4也执行统计进程和其他进程。
广播设备5是一个用来传递内容的元件,代表性的是电视广播或类似的东西的程序。因此,通讯设备1能够同步地接收和复制来自广播设备5的内容。需要注意到,广播设备5能够通过无线电或有线通讯把内容传递给通讯设备1。另外,广播设备5也能经由通讯网络2把内容传递给通讯设备1。
标准时间信息广播设备6是一个用于在标准时间给通讯设备1提供信息的元件。标准时间信息被用来使如图4所展示的在每个通讯设备1中使用的用作时钟的标准时间测量部件30和标准时间正确地同步。用时钟测量的标准时间可以是典型性的世界或日本标准时间。需要注意到标准时间信息广播设备6能够在标准时间通过无线电或有线通讯传递信息给通讯设备1。另外,标准时间信息广播设备6也能够在标准时间通过经由通讯网络2传递信息给通讯设备1。
在图1展示的代表性的通讯系统中,只有两个通讯设备1通过通讯网络2互相连接。然而,值得注意的是连接到通讯网络2的通讯设备1的数目可以不只2个。即任意数量的通讯设备1可以通过通讯网络2互相连接。
接下来,参考图4,通讯设备1-1的代表性的配置会被详细说明。在通讯设备1-1中使用的一个输出部件21包括一个显示器41和一个扬声器42。输出部件21在显示器41上显示对应于从音频/视频合成部件26接收的视频信号的图像并输出对应于从音频/视频合成部件26接收的音频信号的声音给扬声器42。
输入部件22-1包括一个摄像机51-1,一个麦克风52-1和一个传感器53-1。出于同样的原因,输入部件22-2包括一个摄像机51-2,一个麦克风52-2和一个传感器53-2。在接下来的说明中,在没有必要把输入部件22-1和22-2互相区分开来的情况下,输入部件22-1和22-2各自被简单的称为输入部件22。同样的,在没有必要把摄像机51-1和51-2互相区分开来的情况下,摄像机51-1和51-2各自被简单的称为摄像机51。同样的,在没有必要把麦克风52-1和52-2互相区分开来的情况下,麦克风52-1和52-2各自被简单的称为麦克风52。同样的,在没有必要把传感器53-1和53-2互相区分开来的情况下,传感器53-1和53-2各自被简单的称为传感器53。
摄像机51是获取用户图像的一个构件。用户的图像可以是活动的或是静止的图像。麦克风52是一个收集用户声音和其他声响的构件。传感器53是一个检测用户周围环境信息的构件。环境信息包括亮度,周围的温度和湿度。输入部件22把获得的图像,声音/声响,和环境信息作为用户的实时数据输出给通讯部件23,存储部件27,和数据分析部件28。另外,输入部件22也输出获得的用户图像和用户声音给音频/视频合成部件26。
需要注意到,以适应大量的用户,也可以提供大量的各自适应自己的用户的输入部件22。例如,在图4展示的通讯设备1-1中,提供两个输入部件22以适应图1展示的两个用户A和B。
通讯部件23是一个经由通讯网络2传输输入部件22输入的作为用户A和/或用户B的数据的实时数据给用作通讯伙伴的通讯设备1-2,并接收来自通讯设备1-2的用户X的实时数据的元件。通讯部件23提供用户X的实时数据给音频/视频合成部件26和存储部件27。另外,通讯部件23也接收由通讯设备1-2或内容提供服务器3经由通讯网络2传输的内容并提供内容给内容复制部件25和存储部件27。这样一个内容以后也被称为内容数据。经由通讯网络2,通讯部件23传输内容和信息给通讯设备1-2。该内容是从存储部件27读出的内容,该信息是操作信息和操作信息输出部件87产生的控制信息。
广播接收部件24是用于接收广播设备5播送的电视广播信号并把由信号传达的播放的节目作为内容提供给内容复制部件25并且如果必要也传递给存储部件27。内容复制部件25是复制广播接收部件24接收的播送的节目内容的元件。复制的内容也可以是通讯部件23接收的内容,从存储部件27读出的内容,或从碟片如光碟读出的内容。应该注意的是碟片本身没在图中展示。内容复制部件25提供复制内容的声音和图像给音频/视频合成部件26和数据分析部件28。需要注意到,那时内容复制部件25也输出辅助信息如后数据给数据分析部件28。辅助信息包括组成内容的每个场景的概要,补充信息和有关信息。
音频/视频合成部件26是混合接收自内容复制部件25的图像和声响作为内容的图像和声音,混合接收自输入部件22的图像和声音作为用户A的图像和声音,接收自通讯部件23的图像和声音作为用户X的图像和声音和用于代表性的激起用户A警惕的字符串,并提供获得的作为合成结果的视频信号给输出部件21。由音频/视频合成部件26执行的混合进程是一个混合和调整图像,声响,声音和字符串的进程,以后被称为合成进程。
存储部件27包括一个内容存储部件61,一个许可证存储部件62,一个用户信息存储部件63,和之前提到的合成信息存储部件64。内容存储部件61是一个元件用于将接收自输入部件22的数据作为一个用户如用户A的实时数据存储,将接收自通讯部件23的数据作为一个通讯伙伴如用户X的实时数据存储,将接收自广播接收部件24的广播节目作为一个内容,一个由通讯部件23接收到的内容。许可存储部件62是一个存储信息的元件,它存储如给通讯设备1-1的许可证,作为可以使用内容存储部件61的许可证。用户信息存储部件63是一个元件用来存储数据如通讯设备1-1所属的一个组的隐秘信息。合成信息存储部件64是一个元件用于存储作为合成信息的可被合成控制部件84改变的每个合成模式和每个合成参数。
由内容特征分析部件71和控制信息产生部件72组成的数据分析部件28是一个元件用于输入接收自输入部件22作为一个用户如用户A的实时数据的数据,接收自通讯部件23的作为一个通讯伙伴如用户X的实时数据的数据,和接收自内容复制部件25的内容。
内容特征分析部件71是一个元件用于分析信息(如内容的图像和声响或添加到内容上的辅助信息)以辨认内容的特征(或实质)并提供内容的特征(或实质)作为分析结果给控制信息产生部件72。
控制信息产生部件72是一个元件用于产生被用来依照接收自内容特征分析部件71的分析结果控制音频/视频合成部件26的控制信息。控制信息产生部件72输出产生的控制信息给控制部件32。即控制信息产生部件72产生用于控制音频/视频合成部件26的控制信息,来依照根据分析结果和为合成模式设置得到的合成参数的合成模式,将包含在由内容复制部件25复制的内容中的图像和声音与包含在接收自通讯部件23的实时数据中的图像和声音合成为通讯伙伴的实时数据。然后,控制信息产生部件72提供产生的控制信息给控制部件32。另外,控制信息产生部件72为通讯伙伴操作的通讯设备1-2产生控制信息,该信息作为用来依照接收自内容特征分析部件71的分析结果执行对通讯设备1-2的控制的信息。在通讯设备1-2中,产生的控制信息被提供给控制部件32。
通讯环境检测部件29是一个元件用来通过通讯部件23和通讯网络2与通讯设备1-2一起监控通讯的环境并输出监控的结果给控制部件32。通讯的环境包括通讯速率和通讯延迟时间。标准时间测量部件30是一个元件用来在接收自标准时间信息广播设备6的标准时间的基础上调整自己测量的标准时间,并提供调整好的标准时间给控制部件32。操作输入部件31是代表性的用于认可用户执行的操作并发布与操作相应的命令给控制部件32的远程控制器。
控制部件32是一个元件用来在例如表征作为用户执行的操作的接收自操作输入部件31的操作的信号和接收自数据分析部件28的控制信息的基础上,控制通讯设备1-1的其他构件。控制部件32包括对话管理部件81,视/听记录等级设置部件82,复制同步部件83,上述的合成控制部件84,复制允许部件85,记录允许部件86,前面提到过的操作信息输出部件87,和电子设备控制部件88。需要注意到,图4展示的代表性的配置中,用于输出来自控制部件32的控制命令给通讯设备1-1的控制线被省略了。
对话管理部件81是一个元件用于控制通讯部件23执行的进程来通过通讯网络2,将通讯设备1-1连接到其他设备如通讯设备1-2,内容提供服务器3,和鉴定服务器4。另外,对话管理部件81也决定是否接受接收自另一个设备如通讯设备1-2的控制信息,作为用于控制在通讯设备1-1中使用的部件的信息。
视/听记录等级设置部件82是一个元件用于在用户执行的操作的基础上,决定作为用户A或其他用户的数据的由输入部件22获得的实时数据和/或作为用户个人内容的存储在内容存储部件61中的内容能否被用作通讯伙伴的通讯设备1-2复制和记录。如果实时数据和/或个人内容被确定为可以被通讯设备1-2记录的数据和/或内容,数据和/内容的可被记录的次数的可记录数和其他信息就被设置。这个设置信息作为隐秘信息被添加到用户的实时数据并从通讯部件23被传送到通讯设备1-2。复制同步部件83是一个元件用于控制内容复制部件25来和用作通讯伙伴的通讯设备1-2同步复制它们共有的内容。
合成控制部件84是一个元件用于控制数据分析部件28来在用户执行操作的基础上,完成用于辨认复制内容的特征的分析。另外,合成控制部件84也控制音频/视频合成部件26来依照用户执行的操作或接收自数据分析部件28的控制信息,将内容的图像与用户们的图像合成在一起,将内容的声音与用户们的声音合成在一起。即,在接收自数据分析部件28的控制信息的基础上,合成控制部件84把合成模式的设置改变到图3A到3C中展示的任一模式,把合成参数的设置改变为新设的合成模式。合成控制部件84然后依照新设的合成模式和合成参数控制音频/视频合成部件26。另外,合成控制部件84将新设的合成模式和在合成信息存储部件64中的合成参数作为合成信息记录。
复制允许部件85是一个元件用于输出关于在诸如附属于内容的许可证和/或在通讯伙伴中使用的视/听记录等级设置部件82设置的隐密信息的信息的基础上,内容能否被复制的决定结果,并在决定结果的基础上控制内容复制部件25。记录允许部件86是一个元件用于输出关于在包含附属于内容的许可证和/或隐密信息的信息的基础上,内容能否被记录的决定结果,并在决定结果的基础上控制存储部件27。
信息操作输出部件87是一个元件用于为用户执行的操作产生操作信息,并经由通讯部件23传输信息给用作通讯伙伴的通讯设备1-2。用户执行的操作可以是改变频道来接收电视广播的操作,开始复制内容的进程的操作,结束复制内容的进程的操作,在快进进程中复制内容的操作,或另一个操作。操作信息过程包括操作的说明和操作被执行的时间。操作信息的详情之后将被描述。操作信息被用于内容的同步复制中。另外,操作信息输出部件87也将接收自数据分析部件28的控制信息经由通讯部件23传输给通讯设备1-2。
电子设备控制部件88是一个元件用于在用户执行的操作的基础上设置输出部件21的输出,设置输入部件22的输入,并控制连接到通讯设备1-1的作为外部设备的预定电子设备。预定电子设备的例子是照明设备和空气调节设备,它们没在图中显示。
需要注意到,既然通讯设备1-2的详细代表性配置和图4所展示的通讯设备1-1的一样,通讯设备1-2的详细代表性配置的专门说明就没有被给出。
接下来,通过参考图5展示的流程图解释通讯设备1-1执行的与通讯设备1-2通讯的远程通讯进程如下。需要注意到,通讯设备1-2也和通讯设备1-1以同样的方式执行这个进程。
当开始远程通讯的操作被用户通过操作输入部件31执行并对应于操作的操作信号被操作输入部件31提供给控制部件32,与通讯设备1-2通讯的远程通讯进程就开始。
图中展示的流程图开始于步骤S1,在步骤S1,通讯部件23通过通讯网络2在对话管理部件81执行的控制的基础上建立与通讯设备1-2的连接以通报通讯设备1-2远程通讯开始了。然后,进程流继续到步骤S2。为响应这一通知,通讯设备1-2返回一个通报的确认给通讯设备1-1作为接受远程通讯开始。
在步骤S2,通讯部件23在控制部件32执行的控制的基础上,开始经由通讯网络2传输用户A的实时数据和接收自输入部件22的其他实时数据。通讯部件23也可开始从通讯设备1-2接收用户X的实时数据。然后,进程流继续到步骤S3。那时,接收自输入部件22作为用户A的实时数据的数据和其他实时数据与接收自通讯设备1-2的作为用户X的实时数据的数据被提供给数据分析部件28。包括在用户A的实时数据中的图像和声音和包括在其他实时数据中的图像和声音与包括在用户X的实时数据中的图像和声音被提供给音频/视频合成部件26。
在步骤S3,通讯部件23在被对话管理部件81执行的控制的基础上,通过通讯网络2建立与鉴定服务器4的连接以执行用于获得内容的鉴定进程。在鉴定进程被成功的完成后,通讯部件23通过通讯网络2给内容提供服务器3一个许可以获得被用户指定的内容。然后,进程流继续到步骤S4。同时,通讯设备1-2与通讯设备1-1执行一样的进程以获得一样的内容。
需要注意到,如果指定的内容是将被作为电视广播或存储在存储部件27中并准备好复制的已获得的内容,那步骤S3的进程可以被省略。
在步骤S4,内容复制部件25在同步复制部件83执行的控制的基础上,开始与通讯设备1-2同步复制内容的进程。然后进程流继续到步骤S5。通过执行与通讯设备1-2同步复制内容的进程,通讯设备1-1和1-2在标准时间测量部件30(或标准时间信息广播设备6)提供的标准时间的基础上,同步的复制相同的内容。复制的内容被提供给音频/声频合成部件26和数据合成部件28。
在步骤S5,存储部件27开始远程通讯记录进程。然后进程流继续到步骤S6。具体的说,音频/声频合成部件26依照合成控制部件84执行的控制,合成已经开始被复制的内容,包含在用户A的输入实时数据中的图像和声音和其他输入实时数据,与包含在用户X的接收到的实时数据中的声音和图像。然后音频/声频合成部件26提供作为合成结果获得的音频和视频信号给输出部件21。需要注意到,那时,合成控制部件84在合成模式和模式的合成参数的基础上,控制音频/声频合成部件26执行的合成进程。如之前描述的,合成模式和模式的合成参数依照用户执行的操作被提前设置。
输出部件21显示基于相那里提供的视频信号的图像并生成基于接收到的音频信号的声响。在这个阶段,用户之间图像和声音的交换和同步复制内容的进程已经开始。
然后,记录已经开始被复制的内容,包含在用户A的输入实时数据中的图像和声音和其他输入实时数据,与包含在用户X的接收到的实时数据中的声音和图像,和包含合成模式与为合成模式设的合成参数的合成信息的进程跟在用户之间图像和声音的交换和同步复制内容的进程开始后开始。
在步骤S6,依照合成控制部件84执行的控制,数据分析部件28和音频/声频合成部件26执行内容特征分析混合过程,它的详细细节之后将被说明。更为详细的,在步骤S6,数据分析部件28分析由内容复制部件25复制的内容的图像和声音或内容的辅助信息以辨认内容的实质和/或特征。然后,数据分析部件28在分析结果的基础上,产生控制信息,该信息将被用于控制包括音频/声频合成部件26的部件。这样,合成控制部件84在由用户执行而不是依照用户执行的操作和作为决定了的合成模式的参数的预先设定的合成参数预先决定的合成参数的基础上,通过改变合成模式和适当的设置新合成模式的合成参数,执行控制音频/声频合成部件26执行的合成进程的进程。
然后,在下一个步骤S7,控制部件32产生关于用户是否已经执行一个操作以请求远程通讯的终止的决定。控制部件32重复地执行这步的进程,直到用户执行这样一个操作。因为在步骤S7执行的进程中产生的决定结果说明用户已经执行请求远程通讯终止的操作,进程流继续到步骤S8。
在步骤S8,通讯部件23在对话管理部件81执行的控制的基础上,通过通讯网络2建立与通讯设备1-2的连接,以通知通讯设备1-2远程通讯已被停止。为响应这一通知,通讯设备1-2返回一个通报的确认给通讯设备1-1作为接受远程通讯的终止。
然后,在下一步骤S9,存储部件27终止远程通讯记录进程。需要注意到,这样,当下一个远程通讯稍后被执行,有可能利用终止了的远程通讯的存储的数据。终止了的远程通讯的存储的数据包括复制的内容,包含在用户A的输入实时数据中的图像和声音和其他输入实时数据,与包含在用户X的接收到的实时数据中的声音和图像,和以上说明的合成信息。
以上已经解释了作为通讯设备1-1和通讯设备1-2之间的通讯处理的由通讯设备1-1执行的远程通讯处理的进程。
接下来的说明解释之前提到的在表征以上描述的远程通讯处理的流程图的步骤S6执行的内容特征分析混合进程的细节。
图6是一个框图展示了用于执行内容特征分析混合进程的数据分析部件28的详细配置。需要注意到,作为与图4展示的配置中使用的他们各自的相应部件等同的部件在图6中显示的详细配置部件和其相应部件被标示以相同的参考数字,为避免重复,详细配置部件的说明被省略了。
如图6所示,内容特征分析部件71的代表性配置包括分析控制部件101,动作信息分析部件102,书面信息分析部件103,音频信息分析部件104,辅助信息分析部件105。
分析控制部件101是一个元件用于依照合成控制部件84执行的控制,控制部件来分析内容复制部件25复制的内容的图像和声音或内容的辅助信息以识别内容的实质和/或特征并提供分析结果给控制信息产生部件72。受分析控制部件101控制的部件是:动作信息分析部件102,书面信息分析部件103,音频信息分析部件104,辅助信息分析部件105。
动作信息分析部件102是一个元件,用于从内容中提取人的动作信息,分析提取出来的动作信息并将分析结果提供给分析控制部件101。书面信息分析部件103是一个元件用于从内容的图像中提取书面信息,分析提取的书面信息并提供分析结果给分析控制部件101。从内容的图像中提取的书面信息包括一个一般在广播节目中播放的新闻消息及欲在比赛内容中显示的操作信息。欲在比赛内容中显示的操作信息的例子是参数和一个分数。
音频信息分析部件104是一个元件,用于分析从内容的声响中提取的音频信息并提供分析结果给分析控制部件101。音频信息的例子是声音的音量和频率。需要注意到,音频信息分析部件104可以被应用于一个装置来分析与声音有关的信息。关于声响的信息的例子是频道的数目,说明立体声模式的信息,和说明双语模式的信息。辅助信息分析部件105是一个元件用于分析添加到内容上的辅助信息并提供分析结果给分析控制部件101。
在依照分析控制部件101执行的控制的生成的分析结果的基础上,控制信息产生部件72产生用于控制通讯设备1-1中使用的部件执行的进程的控制信息。控制信息产生部件72然后提供控制信息给合成控制部件84。另外,也在接收自分析控制部件101的分析结果的基础上,控制信息产生部件72产生用于控制由在通讯设备1-2中使用的音频/视频合成部件26执行的进程的控制信息。在这种情况下,控制信息产生部件72提供控制信息给操作信息输出部件87。
接下来,参考图7,具体说明内容特征分析混合处理。
图7是一个图表展示在图5中表征的远程通讯处理中的被用户A和X共享的内容的代表性配置。
在图7中展示的例子,图像,声响,和辅助信息,这些被用户A和X共享的内容的构件,沿着时间轴同时地被输出。例如,共享的内容是一个运动如英式足球比赛。需要注意到在图7所展示的例子中,从声响中提取的音量特征被作为输出声响显示。虚线G上面的音量特征表征大音量,而虚线G下面的音量特征表征小音量。
在这图中显示的内容的场景被分为三类场景。每个场景种类有一独特的特征。在时间t0到t1的时期中展示的场景是一个传播英式足球比赛的真实动作的转播场景。在时间t1到t2的时期中展示的场景是英式足球比赛的真实条件的传播中的亮点场景。亮点场景是通常被VTR(录像带录像机)复制的场景。在时间t2到t3的时期中展示的场景是在英式足球比赛的期间中显示商业的CM(商业)场景。
在转播场景中,例如,显示展示英式足球比赛的足球运动员的图151被展示。那时,有在时间t0到t1的时期中的音频特征的声响被输出。因此,提取自图151的运动改变作为本体(运动员)运动中的改变很大。另外,在一些情况下陈述“实时的”书面信息可能被叠加到场景的图151上。需要注意到这个书面信息没在图中显示。
在这个转播场景中产生的声响是在一个场景中用重复的通道制作不变的注释。因此,声响是一个相对安静的声响。然而,在进攻配合,进球配合,或罚任意球的情况下,声响展示出这里那里都有欢呼声的特征。因此,在这一情况下,如音量特征161显示的,特征包括不时地重复的大音量和小音量状态。在转播场景中的内容包括辅助信息,如这个内容的节目的信息,球队成员的信息,和分数。
亮点场景显示如有运动员进球的场景的图152。这样一个代表性的场景在传播中被VTR重复的复制。那时,在时间t1到t2的时期中的有音频特征的声响被输出。另外,在某种情况下,陈述“重播”的输出信息也许被叠加到场景的图152。需要注意到,这个书面信息没在该图中显示。在许多情况下,特殊的编辑效果如图152的慢速再现也许被添加。
在亮点场景中产生的声响代表性的包括一个进球后的大声的欢呼。在许多情况下,这种欢呼持续一个相对长的时间时期或这个场景被重复。因此,如声音特征162所示,音量特征显示一个音量,该音量一度增大以使得它被增大音量的持续状态所跟随。在转播场景中的内容包括辅助信息如亮点信息(亮点场景中的信息)和得分者的信息。
CM场景展示图153,该图显示赞助足球比赛节目的提供者的广告。那时,有在时间t2到t3的时期中的音频特征被输出。因此,CM场景的图153依赖于CM广告的内容而变化。例如在展示安静的海滩的商业显示的情况下,图153中的人的动作的数量小于转播场景。
在商业场景中产生声响有不同于在时间t0到t2的时期中产生的作为足球比赛节目的声响的特征。即,如图7中展示的例子163的音量特征显示的,音量没有突然增加和减小。取而代之的,音量处在虚线G显示的近似的参比状态。因此,特征与在时间t0到t2的时期中产生的作为足球比赛节目的声响的特征不同。CM场景中的内容包括辅助信息如CM信息,该信息是在商业中的信息。需要注意到,商业的声响只是一个代表性的声响。在一些情况下,依赖于商业的内容,商业的声响也许与音量特征163不同。
如上所述,即使对于一样的内容,图像,声响,和辅助信息各自的特征随从一个场景到另一个场景而变化。
现在,让我们假设,例如用户A操作通讯设备1-1来执行图5所展示的流程图中的步骤S5的远程通讯记录进程,来与操作通讯设备1-2的用户X通讯。在这种情况下,内容的图像和用户X的图像被互相合成并依照参考图3A说明的画中画模式被显示在通讯设备1-1使用的显示器41上。那时,当用户A操作操作输入部件31来输入一个命令请求开始内容特征分析混合进程,分析控制部件101分析包括正被复制的内容的图像和声音的场景或添加到内容的辅助信息以辨认内容的特征(或实质),并将内容的特征(或实质)作为分析结果提供给控制信息产生部件72。控制信息产生部件72依照接受自内容特征分析部件71的分析结果,产生用于控制一个进程的控制信息,该进程被执行来合成内容的图像和声音与用用户X的图像和声音。
即,在图7所示的例子中,对于一个场景的特征分析混合进程依照内容的场景的特征被执行。需要注意到,换句话说,在这种情况下,分析控制部件101执行一个分析来辨认场景的特征以确定场景的监视或通讯处理是否重要。
首先,说明转播场景。如上所述,在显示足球比赛的图151中,动作的变化很大。因此,分析控制部件101(或动作信息分析部件102)内容的图像中提取人的动作信息,并分析提取的动作信息。即,如果动作信息显示动作的变化大,分析控制部件101决定参赛者的动作和/或比赛的进展是快的,假设用户可能希望集中精力在看内容而不是与通讯伙伴通讯。
然后,依照分析控制部件101产生的分析结果,控制信息产生部件72产生控制信息以用于以某种方式控制合成图像的进程来将用户X的图像作为小尺寸的低浓度图像显示在叠加到图7的显示屏41A中展示的内容显示171A的子屏172A上。需要注意到,同时,控制信息产生部件72产生控制信息以用于以某种方式控制合成声响的进程来产生音量小于内容的声响的音量的用户X的声音。
在这种情况下,控制被执行,所以,如内容显示171A展示的,内容的图像151被显示在显示屏41A,填满显示屏41A的全部区域。同时,控制被执行,所以叠加到内容显示171A的作为显示用户X的图像的子屏172A作为小尺寸的低浓度图像显示以不妨碍内容的观看。另外,用户X的声音的音量被减小以阻止内容的观看被打扰。
作为结果,用户能够获得一个环境,该环境允许该用户集中注意力观看内容而不需要执行设置,该设置花费时间和劳动力。
如果动作的信息只显示动作的小变化,另一方面,分析控制部件101决定参赛者的动作和/或比赛的进程是慢的,假设用户可能希望在观看内容的同时与通讯伙伴通讯。在这种情况下,依照分析控制部件101产生的分析结果,控制信息产生部件72产生控制信息以用于以某种方式控制合成图像的进程来将用户X的图像作为高浓度图像显示在叠加到内容显示171A上。同时,控制信息产生部件72产生控制信息以用于以某种方式控制合成声响的进程来产生音量大于内容的声响的音量的用户X的声音。
作为结果,用户能够获得一个环境,该环境允许该用户与通讯伙伴通讯同时观看内容而不需要执行设置,该设置花费时间和劳动力。
接下来,亮点场景被说明。如上所述,亮点场景是一个有特殊编辑效果如重播被VTR执行以再现内容中的场景的场景。因此,分析控制部件101分析场景的编辑效果或鉴别场景的编辑效果是什么以决定于通讯伙伴的交流或观看内容是否被做的更生动。依照分析结果,控制信息产生部件72产生控制信息以用于以某种方式控制合成图像的进程来将内容显示171B和叠加到内容显示171B的子屏172B显示在图7中展示的显示屏41B上。
例如,在内容图像152的情况下,该图像是在重播中被VTR再现的作为显示参赛者进球的图像,分析结果说明用户可能希望与通讯伙伴共享观看显示参赛者进球的图像的情绪。因此,在这种情况下,控制信息产生部件72产生控制信息以用于以某种方式控制合成图像的进程来将内容的图像152用比内容显示171A小一点的尺寸显示在内容显示171B上,将用户X的图像用大于子屏172A的尺寸和高于子屏172A的浓度显示在子屏172B上,该子屏作为叠加到内容显示171B的子屏显示在显示屏41B上。同时,依照子屏172B的尺寸,即依照分析结果,比控制信息产生部件72也产生控制信息以用于以某种方式控制合成声响的进程来产生音量大于在重播场景中用户X声响大一点的音量的用户X的声音。
作为结果,用户能够获得一个环境,该环境允许该用户与通讯伙伴共享作为观看内容结果获得的情绪而不需要执行设置,该设置花费时间和劳动力。
另外,在商业场景的情况下,相似的控制被执行。即,分析结果可能说明用户可能希望在足球比赛的内容的期间给出的休息中,享受与通讯伙伴的会话或用户可能希望交换对CM场景中图153显示的广告的意见。在这种情况下,控制信息产生部件72产生控制信息以用于以某种方式控制合成图像的进程来将图153作为尺寸略小于内容显示171B的内容显示171C显示在图7展示的显示屏41C,并显示用大于子屏172B的尺寸和高于子屏172B的浓度显示用户X的图像的子屏172C,该子屏作为叠加到内容显示171C的子屏。同时,依照子屏172C的尺寸,即依照分析结果,控制信息产生部件72也产生控制信息以用于以某种方式控制合成声响的进程来输出音量略大于在亮点场景中的音量的用户X的声音。
结果,用户能够获得一个环境,该环境允许该用户与通讯伙伴对感兴趣的广告交换意见或在观看内容期间的休息中享受与通讯伙伴的对话而不需要执行设置,该设置花费时间和劳动力。在这种情况下,因为用户能够在观看广告时立刻与通讯伙伴交换意见,在用户心中激起了购买广告的产品或服务的期望。
图8是一个框图展示了图7中所示的内容特征分析混合进程的另一个例子。
例如,远程通讯记录过程开始于图5所示的流程图中的步骤S5,并且合成控制部件84依照在用户执行的操作的基础上预先设定的合成模式和参数,控制由音频/视频合成部件26执行的合成进程。在这种情况下,正被复制的内容的图像201D被显示在通讯设备1-1的显示屏41D上,并且,在图像201D的右下角,作为通讯伙伴的用户X的图像被显示为一个叠加在图像201D之上的子屏。
那时,当用户A使用操作输入部件31来输入命令请求开始一个内容特征分析混合进程,分析控制部件101一般从内容附加的辅助信息来检测内容的类型并分析检测到的内容类型以识别该内容的图像构成特征或该内容的显示屏幕的构成特征。依照分析结果,控制信息产生部件72产生将被用于控制进程的控制信息,该进程以用来合成内容的图像和声音与通讯伙伴的用户的图像和声音。这就是说,在图8所示的例子的情况中,内容特征分析混合进程是根据内容的类型和/或图像的构成特征来执行的。
让我们假设举例,这个内容是一个由一个图像和这个图像中的许多书面信息组成的广播节目。这种内容的例子是新闻和小型报道。在这种情况下,分析控制部件101(或书面信息分析部件103)通过采取特征识别技术或固定显示部分识别技术,从内容的图像中提取书面信息,并分析书面信息以识别信息在图像中的位置。依照分析控制部件101产生的分析结果,控制信息产生部件72产生控制信息来用于控制一个进程,该进程是以某种方式合成图像从而将用于显示用户X的图像的子屏移动到一个未显示书面信息的地方。
让我们假设,如图8中的显示屏41E所展示的,书面信息211以重叠在图像201E上的子屏的形式被显示在该内容的图像201E的右上角,且书面信息212以重叠在图像201E上的子屏的形式被显示在图像201E的右下角。在这种情况下,如果另外一个子屏在图像201E的右下角如子屏202D那样被合成,那么这个子屏将重叠在书面信息212上,而书面信息212将几乎不可见。由于这个原因,分析控制部件101从内容的图像201E提取书面信息211和212的几条信息,并分析书面信息211和212的这几条信息来识别它们在图像201E上的位置。依照分析控制部件101产生的结果,控制信息产生部件72产生控制信息来控制一个进程,该进程是以某种方式合成图像从而将用于显示用户X的图像的子屏移动到一个未显示书面信息的地方。在这个例子中,子屏被移动到左上角并在这个角上显示为子屏202E。
通过这种方式,可以使一个内容的书面信息避免变得几乎不可见,而不要求用户执行手动操作。
此外,让我们假设举例,这个内容是一个比赛,它由许多显示在内容的图像上,作为如何操作通讯设备1-1的信息的信息组成。有关于如何操作通讯设备1-1的信息包括参数和一个分数。在这种情况下,分析控制部件101(或书面信息分析部件103)通过采取特征识别技术或固定显示部分识别技术,从内容的图像中提取书面信息和操作信息,并分析提取出的书面信息和操作信息以便于识别这几条信息在图像中的位置。依照分析控制部件101产生的分析结果,控制信息产生部件72产生控制信息来用于控制一个进程,该进程是以某种方式合成图像从而将用于显示用户X的图像的子屏移动或缩小到一个未显示书面信息或操作信息的位置以避免子屏重叠在书面信息或操作信息上。
让我们假设,如图8中的显示屏41F所示,分数213以一个叠加在图像201F上的子屏的形式显示在图像201F的左上角,同时参数214以一个叠加在图像201F上的子屏的形式显示在图像201F的底部。在这种情况中,如果另一个子屏在图像201F的右下角如子屏202D那样被合成,那么这个子屏将重叠在参数214上,而参数214将几乎不可见。由于这个原因,分析控制部件101从内容的图像201F中提取操作信息例如分数213和参数214,并分析分数213和参数214以识别它们在图像201F上的位置。依照分析控制部件101产生的结果,控制信息产生部件72产生控制信息来用于控制一个进程,该进程是以某种方式合成图像从而将用于显示用户X的图像的子屏移动到远离操作信息的位置。在这个例子中,用于显示用户X的图像的子屏被移动到内容的图像201F的右上角并在这个角上显示为子屏202F。
这样,关于如何操作一个内容的信息可以避免变为几乎不可见而不要求用户进行手动操作。
在图8所示的例子中,内容是一个广播节目或一个比赛。然而,需要注意到,内容的类型不仅限于广播节目和比赛。例如,内容也可以是电影播放字幕。
在以上描述中,画中画方法被采用了。然而,本发明的范围不只限于画中画方法。就是说,本发明也可以用于之前参考图3B解释过的交叉混合方法,参考图3C解释过的划变方法,以及其他合成模式。
此外,以上描述仅仅解释了对一通讯伙伴的图像和声音与内容的图像和声音进行合成。然而,输入部件22输入的图像和声音如用户A的一个图像和声音,也可以和内容的图像和声音进行合成。
接下来,图5所示的流程图的步骤S6执行的内容特征分析混合进程通过参考图9显示的流程图解释如下。
在图5所示流程图的步骤S5中,开始了一个远程通讯记录进程。在由用户执行的操作预设的合成模式和合成参数的基础上,合成控制部件84开展一个进程来控制音频/视频合成部件运行的合成进程。此外,数据分析部件28得到一个复制的内容,输入用户A和其他用户的实时数据并接收用户X的实时数据。
然后,用户A使用操作输入部件31来输入一个命令请求开始内容特征分析混合进程。操作输入部件31响应用户A执行的操作,产生一个操作信号并且提供操作信号给合成控制部件84。一收到从操作输入部件31中来的操作信号,在图13显示的流程图的第一个步骤S21中,合成控制部件84就产生一个关于用户是否开始内容特征分析混合进程的决定结果。如果决定结果指出内容特征分析混合进程要开始,进程流继续到步骤S22,在这里合成控制部件84控制数据分析部件28去执行一个内容分析进程。
如后文将要参考图10中的说明内容分析进程的流程图详细描述的那样,在图9的流程图的步骤S22执行的内容分析进程中,内容的图像和声响或添加到内容上的辅助信息被分析以便于识别内容的实质和/或特征。此外,控制信息被生成以用于控制音频/视频合成部件26依照分析结果相应的合成模式和为该模式设定的合成参数去执行一个进程:改进程对内容的图像和声响与实时数据中的某用户的图像和声音进行合成,该用户是通讯伙伴。然后控制信息提供给合成控制部件84。需要注意的是,如果用于控制通讯伙伴操作的通讯设备1-2中使用的音频/视频合成部件26的控制信息也被生成了,那么生成的这个控制信息被提供给操作信息输出部件87。
在步骤S22开展的进程结束之后,进程流继续到步骤S3,在这里,依照从控制信息产生部件72接收的控制信息,合成控制部件84为音频/视频合成部件26设定一个合成模式以及为这个合成模式设定一个合成参数,控制音频/视频合成部件26来开展一个对内容的图像和声响与包含在实时数据中的某用户的图像和声音进行合成进程,该用户是通讯伙伴。然后,进程流继续到步骤S24。
这样,输出部件21所采用的显示器41显示了内容的一个图像和作为通讯伙伴的用户的一个图像,作为依照控制信息产生部件72在内容特征分析部件71产生的合成结果的基础上生成的控制信息来合成图像的进程的结果。出于同样原因,输出部件21所采用的扬声器42产生了内容的一个声响和作为通讯伙伴的用户的一个声音,作为依照控制信息产生部件72在内容特征分析部件71产生的合成结果的基础上生成的控制信息来合成声音的进程的结果。
然后,依照控制信息产生部件72生成的控制信息更新的合成模式和合成参数被记录为与内容一起的合成信息,该内容的复制已经开始了,内容是包含在用户A的输入实时数据中的图像和声音和其他输入实时数据,与包含在用户X的接收到的实时数据中的声音和图像。
随后,在下一个步骤S24中,操作信息输出部件87将从控制信息产生部件72接收到的控制信息作为对用户X操作的通讯设备1-2的控制信息通过通讯部件23和通讯网络2传输到通讯设备1-2。然后,进程流继续到步骤S25。需要注意到,通讯设备1-2开展的进程从通讯设备1-1接收控制信息将稍候描述。用户A可以操作操作输入部件31来输入一个命令请求结束这个内容特征分析混合进程。在这种情况下,操作输入部件31产生一个操作信号响应用户A执行的操作,并提供这个操作信号给合成控制部件84。在上面已经引述过的下一个步骤S25中,在操作输入部件31产生的这样一个操作信号的基础上,合成控制部件84产生一个决定结果以决定是否结束内容特征分析混合进程。如果决定结果指出内容特征分析混合进程将被结束,那么内容特征分析混合进程被终止且进程流返回步骤S7,该步骤包含在图5所示的流程图中,是步骤S6之后的一个步骤。
另一方面,如果步骤S25开展的进程产生的决定结果指出内容特征分析混合进程不应被终止,进程流返回步骤S22。
另一方面,如果步骤S21开展的进程产生的决定结果指出内容特征分析混合进程不应开始,内容特征分析混合进程被终止且进程流返回步骤S7,该步骤包含在图5所示的流程图中,是步骤S6之后的一个步骤。这就是说,在步骤S7中,合成控制部件84继续开展一个进程,即在依照用户执行的操作预先设定的合成模式和合成参数的基础上,控制由音频/视频合成部件26执行的合成进程,直到用户执行一个操作请求终止远程通讯。
接下来,通过参考图10中的流程图,接下来的描述解释了图9所示的流程图的步骤S22开展的内容分析进程的细节。需要注意到,图10所示的流程图代表的内容分析进程是一个依照内容的一个场景特征开展的特征分析混合进程,如稍早参考图7所解释的。
在图10所示的流程图的第一个步骤S51中,分析控制部件101控制动作信息分析部件102,书面信息分析部件103,音频信息分析部件104或辅助信息分析部件105,在一个内容的图像和声响或改内容附加的辅助信息的基础上,来检测被内容复制部件25复制的该内容的一个场景。这个场景可以被检测到是转播场景,亮点场景,CM场景之一,这稍早已经参考图7解释过了。
为了使之更具体,分析控制部件101至少控制动作信息分析部件102,书面信息分析部件103,音频信息分析部件104和辅助信息分析部件105之中的一个来检测某内容的一个场景。依照分析控制部件101执行的控制,动作信息分析部件102,书面信息分析部件103,音频信息分析部件104和辅助信息分析部件105各自开展它们的进程如下。
动作信息分析部件102从内容的图像中提取一个人的动作信息并分析提取出来的信息以便于决定内容中的动作的数量。作为分析结果得到的动作数量被用于识别场景的类型。例如,如果发现内容中的动作数量大,则决定这个场景是一个转播场景。
书面信息分析部件103从内容的图像中提取书面信息并分析提取出来的信息。例如,如果分析结果指出从图7所示的图像151中提取的书面信息是“实况”并且从图像152中提取出来的书面信息是“重播”。在分析结果的基础上,书面信息分析部件103识别出每个场景的类型。例如,书面信息显示“实况”,则决定这个场景是一个转播场景。通过这种方法,可以识别每个场景的类型。
音频信息分析部件104从内容中提取如图7所示的声响音量特征161至163,并分析提取出来的声响音量特征以便于根据分析结果识别每个场景的类型。如果分析结果指出,例如,如果声响音量特征变化突然,如有着声响音量特征163的情况,则这个场景被决定为是一个CM场景。通过这种方法,可以识别每个场景的类型。
辅助信息分析部件105从内容中提取辅助信息并分析提取出来的辅助信息以便于根据分析结果识别每一个场景的类型。例如,如果提取出来的辅助信息包括一个分数,如有着图7所示的例子中的辅助信息的情况,则这个场景被决定为是一个转播场景。通过这种方法,可以识别每个场景的类型。需要注意的是,通过这种方法,辅助信息也可以预先附加到包括有特殊编辑效果的场景的内容上,作为指出这个场景含有一个特殊编辑效果的辅助信息。在这种情况下,辅助信息分析部件105分析这个辅助信息以识别这个场景的类型。具有特殊编辑效果的场景的一个例子是亮点场景。
需要注意的是,执行用于检测场景的分析进程的方法可以结合起来并且不局限于上述方法。这就是说,也可以采取另一种分析方法。
如上文所述,在步骤S51中,检测了一个场景,然后在下一个步骤S52和随后的步骤中,根据检测到的场景特征产生了一个用于控制合成进程的控制信息。
在步骤S52中,分析控制部件101产生一个决定结果来决定在步骤S51中检测的场景是否是一个转播场景。如果决定结果指出在步骤S51中检测的场景是一个转播场景,那么进程继续到步骤S53,在这个步骤中分析控制部件101控制动作信息分析部件102去从内容的图像中提取一个人的动作信息,分析提取出来的信息以便于决定内容中的动作的数量,并产生决定结果以决定识别的动作数量大不大。
需要注意的是,如果内容中的动作数量早已在步骤S51执行分析结果被进程的同时被识别出来,那么动作信息分析部件102在步骤S53中,根据步骤S51执行的分析结果进程,产生一个决定结果来决定识别出来的动作数量大不大。
如果步骤S53执行的进程中产生的决定结果表明识别出来的动作数量大,即,如果决定结果表明运动员的动作和/或比赛的发展迅速,假设用户可能希望集中精力在内容的查看而不是与通讯伙伴的交流上,那么分析控制部件101提供这个分析结果给控制信息产生部件72。然后,进程流继续到步骤S54。
在步骤S54中,依照从分析控制部件101接收到的分析,控制信息产生部件72产生控制信息以用于控制一个进程以某种方式合成图像以使得显示用户X图像的子屏172A以低浓度显示叠加在出现在图7所示的显示屏41A中的内容显示171A之上,并且,同时,产生控制信息以用于控制一个进程以某种方式合成声响来输出音量小于内容的声响的音量的用户X的声音。然后,控制信息产生部件72提供产生的控制信息给合成控制部件84并终止内容分析处理。最后,进程流回到包括在图9展示的流程图的步骤S23,该步骤作为紧接着步骤S22的步骤。
另一方面,如果在步骤S53执行的进程所产生的决定结果说明辨认的动作数量不大,即,如果决定结果说明参赛者的动作和/或比赛的进展是慢的,假设用户可能希望在观看内容时与通讯伙伴通讯,分析控制部件101提供分析结果给控制信息产生部件72。然后,进程流继续到步骤S55。
在步骤S55,依照接收自分析控制部件101的分析,控制信息产生部件72产生控制信息以用于控制一个进程以一种方式合成图像,该方式是显示用户X的图像的子屏172A以高浓度叠加到出现在图7所展示的显示屏41A上的内容显示171A上被显示,同时,产生控制信息以用于控制一个进程以某种方式合成声响来输出,与在步骤S54执行的进程所产生的控制信息相比较,音量略大于内容声响的音量的用户X的声音。然后,控制信息产生部件72提供产生的控制信息给合成控制部件84并终止内容分析处理。最后,进程流回到包括在图9展示的流程图的步骤S23,该步骤作为紧接着步骤S22的步骤。
如果在步骤S52执行的进程所产生的决定结果指出在步骤S51检测的场景不是一个转播场景,另一方面,进程流继续到步骤S56,在该步骤分析控制部件101产生一个决定关于在步骤S51检测的场景是否是一个亮点场景的结果。
如果在步骤S56执行的进程所产生的决定结果指出在步骤S51检测的场景是一个亮点场景,如在图7的例子中显示,在重播中被VTR再现的作为显示参赛者进球的内容图像152,分析结果说明用户可能希望与通讯伙伴共享观看内容的情绪。在这种情况下,分析控制部件101提供分析结果给控制信息产生部件72。然后,进程流继续到步骤S57。
与在步骤S54执行的进程所产生的控制信息相较,在步骤S57,依照从分析控制部件101接收到的分析,控制信息产生部件72产生控制信息以用于控制一个进程以某种方式合成图像来将内容的图像152用比内容显示171A小一点的尺寸显示在内容显示171B,将用户X的图像用大于子屏172A的尺寸和高于子屏172A的浓度显示在子屏172B,该子屏作为叠加到内容显示171B的子屏显示在图7显示的显示屏41B上。同时,控制信息产生部件也产生控制信息以用于控制一个进程以某种方式合成声响来产生音量略大于内容声响的音量的用户X的声音。然后,控制信息产生部件72提供产生的控制信息给合成控制部件84并终止内容分析处理。最后,进程流回到包括在图9展示的流程图的步骤S23,该步骤作为紧接着步骤S22的步骤。
如果在步骤S56执行的进程所产生的决定结果指出在步骤S51检测的场景不是一个亮点场景,即,如果在图7展示的例子的情况下在步骤S51检测到场景使一个商业场景,另一方面,分析结果可能说明,例如用户可能希望交换对在CM场景中的图像153显示的广告的意见。在这种情况下,分析控制部件101提供分析结果给控制信息产生部件72。然后,进程流继续到步骤S58。
在步骤S58,依照从分析控制部件101接收到的分析,控制信息产生部件72产生控制信息以用于控制一个进程以某种方式合成图像来将图153作为尺寸小于内容显示171B的内容显示171C显示在图7展示的显示屏41C,并显示用大于子屏172B的尺寸和高于子屏172B的浓度显示用户X的图像的子屏172C,该子屏作为叠加到内容显示171C的子屏。同时,控制信息产生部件72产生控制信息以用于控制一个进程以某种方式合成声响来输出,与在步骤S57执行的进程所产生的控制信息相较,音量略大于内容声响的音量的用户X的声音。然后,控制信息产生部件72提供产生的控制信息给合成控制部件84并终止内容分析处理。最后,进程流回到包括在图9展示的流程图的步骤S23,该步骤作为紧接着步骤S22的步骤。
如上所述,在图10展示的流程的步骤S54,S55,S57,和S58执行的进程所产生的控制信息只被提供给合成控制部件84。需要注意到,如果用于控制在用户X操作的用作通讯伙伴的通讯设备1-2中使用的音频/视频合成部件26的控制信息也在同时被产生,控制信息被提供给操作信息输出部件87。同样值得注意,在这种情况下,在通讯设备1-2中的显示器上的子屏显示操作通讯设备1-1的用户A的图像而不是用户X的图像。
因此,既然通讯伙伴操作的通讯设备也可以同样被控制,用户和通讯伙伴可以观看他们各自的有着一样配置的显示屏,除了在显示屏上的子屏显示不同的图像。
如上所述,内容的图像和声音与添加到内容的辅助信息都被分析以辨认内容和特征和/或动作变化的数量的特征。然后,分析结果被用作一个根据用于控制一个进程来将内容的图像和声音与通讯伙伴的图像和声音分别进行合成。因此可能意识到通讯实时的反映内容的实质。作为结果,尽管事实用户所处地相隔遥远,仍可能产生执行面对面通讯的效果。
另外,既然可能容易地在任何特殊的通讯设备中设置一个作为依照内容的实质和特征合成操作另一个通讯设备的另一个用户的图像和声音的进程的进程,该进程在过去常常是一个既困难又花费时间和劳动的进程,用户可以消去用于操作特殊设备的时间和执行设置的劳动。
接下来,通过参考图11展示的流程图,以下说明详细解释另一个在图9展示的流程图的步骤S22执行的代表性的内容分析进程的执行。需要注意到,图11展示的流程图表征的内容分析进程是一个依照内容的类型的特征执行的特征分析混合进程,如之前参考图8说明的。
在图11展示的流程图的第一个步骤S71,分析控制部件101控制辅助信息分析部件105来检测添加到内容复制部件25复制的内容的辅助信息并分析检测的辅助信息以辨认内容的类型。然后进程流继续到步骤S72。
在步骤S72,分析控制部件101产生一个关于在步骤S71辨认的内容类型是否是一个有在其图像中包含很多关于它的书面信息的特征的广播节目。如果决定结果指出辨认的内容类型是一个广播节目的类型,进程流继续到步骤S73,在该步骤书面信息在内容的图像中的位置(即,书面信息显示在内容的图像上的位置)被确认为分析结果。然后,进程流继续到步骤S74。
在步骤S74,依照分析控制部件101产生的分析结果,控制信息产生部件72产生控制信息以用于控制一个进程以某种方式合成图像来将用于显示用户X的图像的子屏移到不显示操作信息的位置,并提供控制信息给合成控制部件84。然后,内容分析处理被终止。最后,进程流回到包括在图9展示的流程图的步骤S23,该步骤作为紧接着步骤S22的步骤。
如果在步骤S72执行的进程所产生的决定结果指出辨认的内容类型不是一个广播节目,另一方面,进程流继续到步骤S75,在该步骤分析控制部件101产生一个关于在步骤S71辨认的内容类型是否是一个有在其图像中包含很多有关操作信息的特征的比赛类型的决定结果。如果决定结果指出辨认的内容类型是比赛类型,进程流继续到步骤S76。
在步骤S76,分析控制部件101将在内容的图像上的操作信息的位置(即,操作信息显示在内容的图像上的位置)确认为分析结果。然后进程流继续到步骤S77.
在步骤S77,依照分析控制部件101产生的分析结果,控制信息产生部件72产生控制信息以用于控制一个进程以某种方式合成图像来将用于显示用户X的图像的子屏移到不显示操作信息的位置,并在必要时减小子屏的尺寸,提供控制信息给合成控制部件84。然后,内容分析处理被终止。最后,进程流回到包括在图9展示的流程图的步骤S23,该步骤作为紧接着步骤S22的步骤。
如果在步骤S75执行的进程所产生的决定结果指出在步骤S71辨认的内容类型不是比赛类型,即,如果决定结果指出辨认的内容类型是另一个内容类型,另一方面,进程流回到包括在图9展示的流程图的步骤S23,该步骤作为紧接着步骤S22的步骤。
很像图10展示的流程图,在图11展示的流程图的步骤S74和S77执行的进程所产生的控制信息只被提供给合成控制部件84。需要注意到,如果用于控制在用户X操作的用作通讯伙伴的通讯设备1-2中使用的音频/视频合成部件26的控制信息也在同时被产生,控制信息被提供给操作信息输出部件87。
如上所述,内容的图像和声响与添加到内容的辅助信息都被分析以辨认内容的类型和/或内容的图像的构成特征。然后分析结果被用作一个根据用于控制一个进程来把内容的图像和声音与通讯伙伴的图像和声音分别进行合成。因此可能意识到通讯实时的反映内容的实质和特征。作为结果,尽管事实用户所处地相隔遥远,仍可能产生执行面对面通讯的效果。
另外,既然可能容易地在任何特殊的通讯设备中设置一个作为依照内容的实质和特征合成操作另一个通讯设备的另一个用户的图像和声音的进程,该进程在过去常常是一个既困难又花费时间和劳动的进程,用户可以消去用于操作特殊设备的时间和执行设置的劳动。
通讯伙伴操作的通讯设备也可以同样被控制。
接下来,通过参考图12展示的流程图,以下说明解释通讯设备1-2执行的控制信息接收进程,该进程接收在图9展示的流程图的步骤S24执行的进程中通讯设备1-1传输的控制信息。
需要注意的是,图12所示的流程图代表的控制信息接收进程是当远程通讯记录进程在图5所示的流程图中的步骤S5之后被执行的时候,由通讯设备1-2执行的一个进程。这就是说,控制信息接收进程是一个由通讯设备1-2依照另一个通讯设备1-1执行的内容特征分析得到的结果来执行的混合进程。
图12所示的流程图以步骤S101开始,在这个步骤中,通讯设备1-2所使用的通讯部件23从通讯设备1-1所使用的操作信息输出部件87中接收控制信息,并提供这个控制信息给对话管理部件81。
然后,再下一个步骤S102中,对话管理部件81产生一个决定结果来决定从通讯设备1-1接收的控制信息是否为会产生用户X不想要的操作和/或效果的信息。如果决定结果表明该控制信息是会产生用户X不想要的操作和/或效果的信息,那么对话管理部件81决定拒绝这个信息。最后,控制信息接收进程终止了。
让我们紧记,也可能将通讯设备1-2设定成随意接收或拒绝从通讯设备1-1来的信息或完全拒绝这种信息。此外,也可能提供一个配置,在其中,如果控制信息被通讯设备1-2接收,那么通讯设备1-2自己分析这个信息,同时设定了已产生的控制信息的排外执行的优先级或者在通讯设备之间预先设定了主从关系。
如果在步骤S102执行的进程中对话管理部件81产生的决定结果表明,从通讯设备1-1接收的控制信息不是应被拒绝的信息另一方面,控制信息被提供给合成控制部件84。然后,进程流继续到步骤S103。
在步骤S103中,合成控制部件84依照从控制信息产生部件72接收到的控制信息,为音频/视频合成部件26设定合成模式并为合成模式设定合成参数。然后,合成控制部件84控制音频/视频合成部件26来把内容的一个图像和声响与通讯伙伴的用户的图像和声音进行合成。最终,控制信息接收进程终止了。
如上文所述,也可以不仅仅使用控制信息产生部件72依照通讯设备本身使用的用户特征分析部件71执行的分析结果而产生的控制信息,而使用控制信息产生部件72依照另一通讯设备使用的用户特征分析部件71执行的分析结果而产生的控制信息。此外,控制信息也可以被拒绝。
从而,由于通讯伙伴所操作的通讯设备也可以被控制,用户和某通讯伙伴可以观看各自的显示屏,这些显示屏具有相同的构成,除了显示屏上的子屏显示彼此不同的图像。结果,更自然的交流可以开展了。
需要注意的是,上面的描述假设每个通讯设备包括了一个数据分析部件28。然而,包含有数据分析部件28的服务器也可以连接到通讯网络2作为一个设备给每个通讯设备提供控制信息设备。作为另一个选择,也可以仅给该服务器提供内容特征分析部件71,这样一来该服务器就能够把分析信息传递给一个通讯设备。
由于如上所述开展远程通讯进程,与相关领域中的设备包括电话机,电视电话机,以及远程通讯设备如视频会议系统相比,可以实现更生动自然的交流。
这就是说,在相关领域中的交流的例子中,使用相关领域的一个电视机来观看和听以实时方式发布的广播内容的用户X利用一个音频电话机将用户X看到和听到的广播内容的印象表达给处在遥远地方的用户A。在这种情况下,没有看到和听到广播内容的用户A难以理解该情景的印象。
然而,通过使用依照本发明具体装置的通讯设备,在彼此相隔遥远的地方的用户A和X能够同时间共享这个内容并且,此外,当他们的声音被对方听见时,用户A和X的图像也可以被复制在子屏或这之类的东西上面。这样的话,尽管事实是用户A和X处在彼此相隔遥远的地方,也可能提供一个高度现实感,归属感,以及亲密感,如同面对面交流开展了一样。
依照内容的实质和特征,如把内容的图像和声响与用户的声音和图像合成起来的进程的处理可以被控制。从而,可以不需花费许多时间和人力就轻松设定通讯设备的参数。结果,更加生动自然的交流可以实现了。
之前描述的由通讯设备1开展的一系列进程可以由硬件和/或执行软件来开展。在这种情况下,图1所示的通讯设备1-1和通讯设备1-2中的每一个一般都是通过类似于如图13所示的个人计算机401来实现的。
图13所示的个人计算机401中,CPU(中央处理单元)411是一个用于通过执行多个预先保存在ROM(只读存储器)412中的或从存储部件418载入到RAM(随机存储器)413中的程序开展多种处理的构件。RAM 413也用于在执行程序时正确保存CPU 411产生的数据。
CPU 411,ROM 412,和RAM 413通过总线414彼此相互连接。总线414也和输入/输出接口415连接。
输入/输出接口415被连接到输入部件416,输出部件417,上文提到的存储部件418,以及通讯部件419。输入部件206用于接收用户输入的命令,它包括输入器件如键盘和鼠标,同时输出部件207包括一个用于显示图像的显示单元以及一个用于输出产生的声响的扬声器。显示单元一般为一个CRT(阴极射线管)显示单元或一个LCD(液晶显示)单元。存储部件418一般是一个硬盘驱动器,包括嵌入的硬盘,用于存储许多程序和多种数据。通讯部件419包括一个调制解调器和一个终端适配器,是一个用于通过网络,与其他设备一起开展无线电或有线通讯处理的单元。
输入/输出接口415也被连接到驱动器420,在驱动器420上架设了一个记录媒体。记录媒体的例子是磁盘421,光盘422,磁光盘423,以及半导体存储器424。如果必要的话,从记录媒体读出的程序被安装在存储部件418里面。
就像上面所解释的,之前描述的由通讯设备1开展的一系列进程可以由硬件和/或执行软件来开展。如果之前描述的一系列进程由执行软件来开展,组成这个软件的程序可以从一些东西,典型的如上文描述的网络或记录媒体,安装到嵌入在专用硬件,多功能个人计算机或者类似物质之中的计算器中。通过将许多程序安装到多功能个人计算机中,个人计算机就能够实现许多功能。
就像上面所解释的,如果必要的话,从记录媒体读出的程序作为上文提到的软件,被安装在存储部件418中。记录媒体本身是从通讯设备1的主要元件分散地分配给用户。如图13所示,记录媒体,也称为成套组合媒体,例如:包括一张软盘的磁盘421,包括CD-ROM(压缩光盘只读存储器)和DVD(数字化通用光盘)的光盘422,包括一个MD(微型光盘[商标])和一个半导体存储器424的磁光盘423。作为把程序从插入式媒体安装到存储部件418中的另一个选择,程序也可以预先保存在ROM 412或嵌入到存储部件418的硬盘中。
值得注意的是,在本说明书中,上述的任何一个由流程图说明的程序的步骤,不仅可以按照与时间轴一致的指定顺序来执行,也可以并行执行或单独执行。
也需要注意到,本说明书中使用的技术术语“系统”指的是一套包括众多设备的配置。
此外,精通这一技术的人应该了解:在附加权利要求的范围内或其等效物的范围内,各种修改,组合,子组合,以及改造可能发生,视设计要求和其他因素的情况而定。
Claims (5)
1. 一个信息处理,设备用于与通过网络和该信息处理设备连接的另一个信息处理设备通讯,其特征在于,所述信息处理设备包含:
用户输入装置,用于将用户的声音和图像输入到所述信息处理设备中;
复制装置,用于和所述另一个信息处理设备同步地复制所述信息处理设备和所述另一个信息处理设备共有的内容数据;
用户信息接收装置,用于接收来自所述另一个信息处理设备的用户的声音和图像;
合成装置,用于把所述用户接收装置接收的声音和图像与由所述复制装置同步复制的所述内容数据的声音和图像进行合成,作为所述另一个用户的所述声音和图像;
特征分析装置用于分析由所述复制装置同步复制的所述内容数据的至少一个声音,所述内容数据的一个图像以及为了辨认所述内容数据特征而添加到所述内容数据的辅助信息;和
参数设置装置,用于在由所述特征分析装置产生的分析结果的基础上,设置用于控制一个由所述合成装置执行来合成声音和图像的进程的控制参数。
2. 如权利要求1所述的信息处理设备,其特征在于,
所述特征分析装置执行所述分析以为了辨认包括在内容数据中的一个场景的特征;和
所述参数设置装置在由所述特征分析装置产生的被认出作为分析结果的所述场景特征的基础上,设置用于控制一个由所述合成装置执行来合成声音和图像的进程的控制参数。
3. 如权利要求1所述的信息处理设备,其特征在于
所述特征分析装置所述执行分析以为了辨认出包括在内容数据中的图像的特征信息位置作为所述图像的特征;
和所述参数设置装置在由所述特征分析装置产生的作为分析结果的所述图象的所述特征信息的所述位置的基础上,设置用于控制一个由所述合成装置执行来合成声音和图像的进程的控制参数。
4. 如权利要求1所述的信息处理设备,其特征在于,
所述参数设置装置在所述特征分析装置产生的分析结果的基础上,设置所述另一个信息处理设备的控制参数;和
还设置送出装置,用于把所述参数设置装置设置的所述控制参数传递给所述另一个信息处理设备。
5. 一种信息处理设备采用的信息处理方法,用于和通过网络与所述信息处理设备连接的另一个信息处理设备通讯的方法,其特征在于,所述信息处理方法包括步骤:
将用户的声音和图像输入到所述信息处理设备中;
和另一个所述信息处理设备同步地复制所述信息处理设备和所述另一个信息处理设备共有的内容数据;
接收来自所述另一个信息处理设备的用户的声音和图像;
把所述用户信息接收步骤执行进程中接收的声音和图像与由所述复制步骤执行进程中同步复制的所述内容数据的声音和图像进行作为所述另一个用户的所述声音和图像;
分析由所述复制步骤执行的进程中同步复制的所述内容数据的至少一个声音,所述内容数据的一个图像以及为了辨认所述内容数据特征而添加到所述内容数据的辅助信息;和
在由所述特征分析步骤执行的进程中产生的分析结果的基础上设置用于控制一个由所述合成步骤执行合成声音和图像的进程的控制参数。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004-218531 | 2004-07-27 | ||
JP2004218531A JP2006041886A (ja) | 2004-07-27 | 2004-07-27 | 情報処理装置および方法、記録媒体、並びにプログラム |
JP2004218531 | 2004-07-27 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1728817A CN1728817A (zh) | 2006-02-01 |
CN100425072C true CN100425072C (zh) | 2008-10-08 |
Family
ID=35733483
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2005100884588A Expired - Fee Related CN100425072C (zh) | 2004-07-27 | 2005-07-27 | 信息处理设备、信息处理方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20060025998A1 (zh) |
JP (1) | JP2006041886A (zh) |
CN (1) | CN100425072C (zh) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4501063B2 (ja) * | 2004-07-27 | 2010-07-14 | ソニー株式会社 | 情報処理装置および方法、記録媒体、並びにプログラム |
JP2006041888A (ja) * | 2004-07-27 | 2006-02-09 | Sony Corp | 情報処理装置および方法、記録媒体、並びにプログラム |
JP2006041884A (ja) | 2004-07-27 | 2006-02-09 | Sony Corp | 情報処理装置および方法、記録媒体、並びにプログラム |
JP4716083B2 (ja) | 2004-07-27 | 2011-07-06 | ソニー株式会社 | 情報処理装置および方法、記録媒体、並びにプログラム |
DE102004046746B4 (de) * | 2004-09-27 | 2007-03-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren zum Synchronisieren von Zusatzdaten und Basisdaten |
JP4775074B2 (ja) * | 2006-03-30 | 2011-09-21 | ソニー株式会社 | 通信システム、情報処理装置、情報処理方法、およびプログラム |
KR20090032702A (ko) * | 2007-09-28 | 2009-04-01 | 한국전자통신연구원 | 네트워크 기반의 맞춤형 콘텐츠 제공을 위한 사용자 장치및 그 방법과 저작 장치 및 그 방법 |
JP2009194577A (ja) * | 2008-02-13 | 2009-08-27 | Konica Minolta Business Technologies Inc | 画像形成装置、音声案内方法及び音声案内プログラム |
US20100257462A1 (en) * | 2009-04-01 | 2010-10-07 | Avaya Inc | Interpretation of gestures to provide visual queues |
JP2011170690A (ja) * | 2010-02-19 | 2011-09-01 | Sony Corp | 情報処理装置、情報処理方法、およびプログラム。 |
WO2012041216A1 (zh) * | 2010-09-30 | 2012-04-05 | 北京联想软件有限公司 | 便携式电子设备、内容发布方法和提示方法 |
CN102221369B (zh) * | 2011-04-29 | 2012-10-10 | 闫文闻 | 一种球类运动的动作识别方法、装置和动作辅助设备 |
US9711182B2 (en) * | 2011-06-07 | 2017-07-18 | In Situ Media Corporation | System and method for identifying and altering images in a digital video |
KR101839406B1 (ko) * | 2011-09-27 | 2018-03-19 | 삼성전자 주식회사 | 디스플레이장치 및 그 제어방법 |
KR101623331B1 (ko) | 2016-03-07 | 2016-05-31 | (주)디지탈라인 | 영상을 활용한 이동객체 검지 및 근접 확대 촬영 방법 |
KR101623332B1 (ko) | 2016-03-07 | 2016-05-23 | (주)디지탈라인 | 영상을 활용한 이동객체 검지 및 근접 확대 촬영 방법 |
CN107305704A (zh) * | 2016-04-21 | 2017-10-31 | 斑马网络技术有限公司 | 图像的处理方法、装置及终端设备 |
US11758216B2 (en) | 2020-10-30 | 2023-09-12 | Google Llc | Non-occluding video overlays |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06197325A (ja) * | 1992-12-22 | 1994-07-15 | Sony Corp | 動画像分析と合成方法およびその装置 |
US5515099A (en) * | 1993-10-20 | 1996-05-07 | Video Conferencing Systems, Inc. | Video conferencing system controlled by menu and pointer |
JPH09106428A (ja) * | 1995-10-11 | 1997-04-22 | Kitsusei Comtec Kk | 所見作成装置 |
CN1278384A (zh) * | 1997-09-04 | 2000-12-27 | 发现通信公司 | 通过计算机网络对包含图象校正的图象访问与控制的装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4847700A (en) * | 1987-07-16 | 1989-07-11 | Actv, Inc. | Interactive television system for providing full motion synched compatible audio/visual displays from transmitted television signals |
US5537141A (en) * | 1994-04-15 | 1996-07-16 | Actv, Inc. | Distance learning system providing individual television participation, audio responses and memory for every student |
US5555441A (en) * | 1994-08-02 | 1996-09-10 | Interim Design Inc. | Interactive audiovisual distribution system |
US6477239B1 (en) * | 1995-08-30 | 2002-11-05 | Hitachi, Ltd. | Sign language telephone device |
US5762552A (en) * | 1995-12-05 | 1998-06-09 | Vt Tech Corp. | Interactive real-time network gaming system |
-
2004
- 2004-07-27 JP JP2004218531A patent/JP2006041886A/ja not_active Abandoned
-
2005
- 2005-07-11 US US11/177,444 patent/US20060025998A1/en not_active Abandoned
- 2005-07-27 CN CNB2005100884588A patent/CN100425072C/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06197325A (ja) * | 1992-12-22 | 1994-07-15 | Sony Corp | 動画像分析と合成方法およびその装置 |
US5515099A (en) * | 1993-10-20 | 1996-05-07 | Video Conferencing Systems, Inc. | Video conferencing system controlled by menu and pointer |
JPH09106428A (ja) * | 1995-10-11 | 1997-04-22 | Kitsusei Comtec Kk | 所見作成装置 |
CN1278384A (zh) * | 1997-09-04 | 2000-12-27 | 发现通信公司 | 通过计算机网络对包含图象校正的图象访问与控制的装置 |
Non-Patent Citations (1)
Title |
---|
多画面合成器在电视台的应用. 北京华利普电子技术有限公司.广播与电视技术,第2000 11期. 2001 * |
Also Published As
Publication number | Publication date |
---|---|
CN1728817A (zh) | 2006-02-01 |
US20060025998A1 (en) | 2006-02-02 |
JP2006041886A (ja) | 2006-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100425072C (zh) | 信息处理设备、信息处理方法 | |
US12041281B2 (en) | Digital jukebox device with karaoke and/or photo booth features, and associated methods | |
KR101377235B1 (ko) | 개별적으로 레코딩된 장면의 순차적인 병렬 배치를 위한 시스템 | |
CN101803336B (zh) | 用于对视频进行选择性音频修改的方法和系统 | |
US11792350B2 (en) | Wireless networked record session device | |
WO2010018429A1 (en) | Music player connection system for enhanced playlist selection | |
CN102419997A (zh) | 声音处理装置、声音数据选择方法和声音数据选择程序 | |
US9305601B1 (en) | System and method for generating a synchronized audiovisual mix | |
JP7159067B2 (ja) | コンピュータプログラムおよび配信サーバ | |
Kasuya et al. | LiVRation: Remote VR live platform with interactive 3D audio-visual service | |
CN106910491A (zh) | 卡拉ok系统 | |
KR101924205B1 (ko) | 노래방 시스템 및 그의 관리 방법 | |
KR101414217B1 (ko) | 실시간 영상합성 장치 및 그 방법 | |
GB2532644A (en) | Digital jukebox device with karaoke and/or photo booth features, and associated methods | |
KR20100055662A (ko) | 클라이언트 단말 장치, 공연 감상 서비스 장치, 공연 감상 서비스 시스템 및 그 방법 | |
Geary | Designing co-located multi-device audio experiences | |
KR20010104829A (ko) | 씨디 제작기 및 씨디 제작기 운용을 위한 웹 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20081008 |