[go: up one dir, main page]

CN102763105A - 用于分段和概括媒体内容的方法和装置 - Google Patents

用于分段和概括媒体内容的方法和装置 Download PDF

Info

Publication number
CN102763105A
CN102763105A CN2011800106369A CN201180010636A CN102763105A CN 102763105 A CN102763105 A CN 102763105A CN 2011800106369 A CN2011800106369 A CN 2011800106369A CN 201180010636 A CN201180010636 A CN 201180010636A CN 102763105 A CN102763105 A CN 102763105A
Authority
CN
China
Prior art keywords
media content
segment
keyword
probability value
content item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011800106369A
Other languages
English (en)
Inventor
M·汉努卡塞拉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Technologies Oy
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Oyj filed Critical Nokia Oyj
Publication of CN102763105A publication Critical patent/CN102763105A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/41Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/487Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/489Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using time information
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Signal Processing (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

提供一种方法,用于通过分段和概括媒体内容来增加对于用户搜索查询的内容相关性。概率标签应用将第一媒体内容项目分段成至少第一段和第二段;将第一关键字与所述第一段关联;向所述第一关键字分配指示所述第一关键字与所述第一段的相关性的第一概率值。之后,概率标签应用响应于包括所述第一关键字的搜索查询,将所述第一段包括在搜索结果中。

Description

用于分段和概括媒体内容的方法和装置
背景技术
服务提供商(例如,无线、蜂窝、因特网、内容、社会网络等)和设备制造商不断受到挑战,以通过例如提供高效的媒体内容搜索服务来向消费者传达价值和便利性。一个感兴趣的领域在于使得媒体内容索引和共享服务自动化,以减少在现有网络上的搜索响应时间,同时位置对于用户可接受的搜索结果相关性的水平。当用户继续增加他们对从网络提取的数据的依赖性时,所发送的搜索查询的次数和搜索查询的结果增加。现有搜索引擎和平台通常基于例如内容分析算法使用关键字,来执行媒体内容搜索查询。然而,这些算法通常生成打乱了的媒体内容和/或对于用户兴趣具有低/差相关性的媒体内容的结果。因此,服务提供商和设备制造商面临着提供对于搜索查询高度相关的媒体内容项目的搜索结果的挑战。
发明内容
因此,需要用于分段和概括媒体内容的方法。
根据一个实施例,一种方法包括:将第一媒体内容项目分段成至少第一段和第二段。该方法还包括:将第一关键字与所述第一段关联。该方法还包括:向所述第一关键字分配指示所述第一关键字与所述第一段的相关性的第一概率值。该方法还包括:响应于包括所述第一关键字的搜索查询,将所述第一段包括在搜索结果中。
根据另一实施例,一种装置,包括:至少一个处理器;以及至少一个存储器,包括用于一个或多个程序的计算机程序代码,所述至少一个存储器以及所述计算机程序代码被配置为利用所述至少一个处理器,致使所述装置至少部分地执行:将第一媒体内容项目分段成至少第一段和第二段。所述装置还被致使:将第一关键字与所述第一段关联。所述装置进一步被致使:向所述第一关键字分配指示所述第一关键字与所述第一段的相关性的第一概率值。所述装置进一步被致使:响应于包括所述第一关键字的搜索查询,将所述第一段包括在搜索结果中。
根据另一实施例,一种计算机可读存储介质,承载一个或多个指令的一个或多个序列,当被一个或多个处理器执行时所述一个或多个指令的一个或多个序列使得装置至少部分地执行:将第一媒体内容项目分段成至少第一段和第二段。所述装置还被致使:将第一关键字与所述第一段关联。所述装置进一步被致使:向所述第一关键字分配指示所述第一关键字与所述第一段的相关性的第一概率值。所述装置进一步被致使:响应于包括所述第一关键字的搜索查询,将所述第一段包括在搜索结果中。
根据另一实施例,一种装置包括:将第一媒体内容项目分段成至少第一段和第二段的部件。所述装置还包括:将第一关键字与所述第一段关联的部件。所述装置还包括:向所述第一关键字分配指示所述第一关键字与所述第一段的相关性的第一概率值的部件。所述装置还包括:响应于包括所述第一关键字的搜索查询,将所述第一段包括在搜索结果中的部件。
此外,对于本发明的各个示例性实施例,以下适用:一种方法,包括:促进以下内容的处理和/或处理:(1)数据和/或(2)信息和/或(3)至少一个信号,(1)数据和/或(2)信息和/或(3)至少一个信号至少部分地基于(或至少部分地导出于)相关于本发明的任意实施例的公开于本申请中的方法(或处理)中的任一个或任意组合。
对于本发明的各个示例性实施例,以下也适用:一种方法,包括:促进访问至少一个接口,所述至少一个接口被配置为允许访问至少一个服务,所述至少一个服务被配置为执行公开于本申请中的网络或服务提供商方法(或处理)中的任一个或任意组合。
对于本发明的各个示例性实施例,以下也适用:一种方法,包括:促进创建和/或促进修改:(1)至少一个设备用户接口元件和/或(2)至少一个设备用户接口功能单元;所述(1)至少一个设备用户接口元件和/或(2)至少一个设备用户接口功能单元至少部分地基于:从公开于本申请中相关于本发明的任意实施例的方法或处理中的一个或任意组合得到的数据和/或信息,和/或从公开于本申请中相关于本发明的任意实施例方法(或处理)中的一个或任意组合得到的至少一个信号。
对于本发明的各个示例性实施例,以下也适用:一种方法,包括:创建和/或修改:(1)至少一个设备用户接口元件和/或(2)至少一个设备用户接口功能单元;所述(1)至少一个设备用户接口元件和/或(2)至少一个设备用户接口功能单元至少部分地基于:从公开于本申请中相关于本发明的任意实施例的方法(或处理)在的一个或任意组合得到的数据和/或信息,和/或从公开于本申请中相关于本发明的任意实施例方法(或处理)中的一个或任意组合得到的至少一个信号。
在各个示例性实施例中,该方法(或处理)可实现于服务提供商侧或移动设备侧,或通过在两侧上都执行动作来在服务提供商和移动设备之间以任意分担方式实现。
通过简单地说明多个特定实施方式和实现方式,包括被构想用于执行本发明的最佳模式,可以通过下面的详细说明容易地了解本发明的其它方面、特征以及优点。在全部不脱离本发明的精神和范围的情况下,本发明还能够实现其它的和不同的实施方式,并且可以在各种明显方面内修改本发明的许多细节。因此,应自然地将附图和说明书考虑为示意性的,并且不是限制性的。
附图说明
在附图的图示中,通过实例的方式并且不是通过限制的方式来说明本发明的实施方式,其中:
图1是根据一个实施例的能够分段和概括媒体内容的系统的视图;
图2是根据一个实施例的概率标签应用的组件的视图;
图3是根据一个实施例用于分段媒体内容的处理的流程图;
图4是根据一个实施例用于概括媒体内容的处理的流程图;
图5A-5B是根据各个实施例的用于概括媒体内容的处理的流程图;
图6A-6J是根据各个实施例的从足球比赛取得的媒体内容项目的视图;
图6K是根据一个实施例的呈现媒体内容项目的用户接口的视图;
图7是根据一个实施例在三个主要功能块中处理概率标签的流程图;
图8是根据一个实施例在三个主要功能块中处理概率标签的流程图;
图9是可用于实现本发明实施方式的硬件的视图;
图10是可用于实现本发明实施方式的芯片集的视图;以及
图11是可用于实现本发明实施方式的移动终端(例如手机)的视图。
具体实施方式
公开了一种用于分段和概括媒体内容的方法和装置,以搜索相关媒体内容项目并自动地创建媒体内容项目的概括。在以下说明中,为了说明的目的,阐述多个具体细节以提供本发明的实施例的全面理解。然而,本领域技术人员清楚,本发明的实施例可在没有这些具体细节或具有等同配置的情况下实现。其他情形下,以框图形式示出公知结构和设备,以避免不必要地模糊本发明的实施例。
这里,术语“实体”是指不同的、单独存在(但是不需要是物理存在)的单元。除了合法的实体,抽象和法律虚构物也看作实体。实体也可用于显示文档的通信和与顺序处理相对的内部处理的系统开发模型中。实体可以是人、法律实体、物理对象或事件、动画或非动画项目、计算机代码、节点等。
这里,术语“媒体内容”包括可在特定上下文中为最终用户/听众提供价值的任意格式的信息。举例而言,媒体内容可以是各种格式(例如,数据、图像/图形、音频和视频文件、web页面/博客、电子邮件消息等)和类型,并经由例如因特网、电视、音频CD等的任意介质传送。媒体内容格式可通过自然的或制造的机构来记录和读取。
这里,术语“概率标签”是关键字和指示关键字的相关性的至少一个参数值的联合。关键字可使用任意字符集来代表,例如16位UCS/统一码转换格式(UTF-16)。UTF-16是用于统一码的可变长度字符编码,能够将整个统一码清单编码。编码格式将每个字符映射至16位字的序列。字符被称为码点,16位字被称为码单元。
图1是根据一个实施例的能够分段和概括媒体内容的系统的视图。如上所述,对于相关的媒体内容的在线搜索的数目正在增长。然而,基于关键字的网页和媒体内容索引和搜索的现有或传统技术没有提供满意的结果。
为了解决这个问题,图1的系统100引入了临时分段并概括媒体内容的功能。图1的系统100递归地将一条媒体内容(即媒体内容项目)分段,基于可用元数据、内容分析、或媒体内容项目和/或段的用户反馈向一个或多个段分配概率标签,从而提供从媒体内容项目自身的一个或多个段汇编的对于媒体内容项目的概括。
在另一实施例中,系统100初始地基于媒体内容项目的可用元数据或内容分析向段分配概率标签,并随后通过用户反馈调整向段分配的概率标签的概率值。在另一实施例中,系统100基于可用元数据、内容分析、或媒体内容项目和/或段的用户反馈向每个段分配概率标签,并同时提供由媒体内容项目自身的一个或多个段组成的对于媒体内容项目的概括。
更具体地,系统100将关键字与至少一个段关联,并向关键字分配指示关键字与段的相关性的概率值,然后将高概率值的一个或多个段汇编成媒体内容项目的概括。举例而言,如果关键字为“足球进球”,则相应的概括可突出媒体内容项目的与足球进球相关的那些段(例如,描述何时进球得分的那些段)。然后,创建这个概括的标准或关键字可应用于其他媒体内容项目(例如,其他足球比赛的片段),以产生其他媒体内容项目的概括,其可突出和/或确定该特定一个关键字或多个关键字对于其他媒体项目的相关性。这样,可使用相同关键字快速和容易地概括不同媒体内容项目。
一个重要的考虑是使用用户反馈方案,以设置和/或调整每个段的概率标签。系统100将概括与相应的媒体内容项目和段一起存储于媒体内容数据库中。当接收对于媒体内容项目的用户/实体查询时,系统100在媒体内容项目和段之间搜索,以寻找相关的媒体内容项目和段,并随后向用户/实体呈现媒体内容项目、搜索的段和相应的概括中的至少一个。为了补充或提高内容分析,将用户的搜索和浏览行为被用作隐含的用户反馈,以用于当用户稍后需要寻找媒体内容项目时识别期望的媒体内容项目和段。
媒体内容项目通过被临时地分段来由系统100分析,并且媒体内容项目的每个段被用关键字来加标签,并根据元数据、分析算法、和用户反馈中的至少一个而被关联于指示关键字的相关性的概率值。用户反馈从对于媒体内容项目的用户的搜索查询来获得,同时搜索查询包含关键字。在搜索结果中的媒体内容项目/段上的点击用于增加关键字对于段的概率值。可基于段的概率值来创建媒体内容项目的概括或对于关键字的若干媒体内容项目的概括。
如图1所示,系统100包括用户设备(UE)101a,其具有经由通信网络105的到个人计算机101b、web服务平台103a和通信平台103b的连通性。UE 101a、个人计算机101b、web服务平台103a和通信平台103b的中每个具有概率标签应用107和用于存储概率标签和概括信息的数据库109。通过示例的方式,系统100的通信网络105包括一个或多个网络,例如数据网络(未示出)、无线网络(未示出)、电话网络(未示出)、或其任意组合。可设想,数据网络可以是任意局域网(LAN)、城域网(MAN)、广域网(WAN)、公共数据网(例如因特网)、或任意其他适合的分组交换网络,例如商业所有、私有分组交换网,例如私有电缆或光纤网络。此外,无线网络可以是例如蜂窝网络,并且可采用各种技术,包括用于全球演进的增强数据率(EDGE)、通用分组无线业务(GPRS)、全球移动通信系统(GSM)、因特网协议多媒体子系统(IMS)、通用移动电信系统(UMTS)等、以及任意其他适合的无线介质,例如全球微波互联接入(WiMAX)、长期演进(LTE)网络、码分多址(CDMA)、宽带码分多址(WCDMA)、无线保真(WiFi)、无线LAN(WLAN)、蓝牙
Figure BDA00002046415200061
因特网协议(IP)数据播送、卫星、移动自组织网络(MANET)等,或其任意组合。
UE 101,是任意类型的移动终端、固定终端、或便携式终端,包括移动手机、站、单元、设备、多媒体计算机、多媒体平板、因特网节点、通信器、桌面计算机、膝上型计算机、个人数字助理(PDA)、或其任意组合。还可设想,UE 101可支持对于用户的任意类型的接口(例如“可佩戴”电路等)。
举例而言,UE 101a、个人计算机101b、web服务平台103a和通信平台103b使用已知的、新的、或仍旧开发中的协议彼此通信以及与通信网络105的其他组件通信。在网络节点之间的通信典型地通过交换数据的离散分组来实现。每个分组典型地包括(1)报头信息,其与特定协议相关联;和(2)有效载荷信息,其在报头信息之后并且包含可独立于该特定协议处理的信息。在一些协议中,分组包括(3)尾信息,其在有效载荷之后并且指示有效载荷信息的结尾。报头信息包括例如分组的源、其目的地、有效载荷的长度、和协议使用的其他属性的信息。通常,用于特定协议的有效载荷中的数据包括与OSI参考模型的不同、更高层相关联的不同协议的报头和有效载荷。特定协议的报头典型地指示在其有效载荷中包含的下一协议的类型。高层协议被认为是封装在低层协议中。贯穿多个异构网络(例如因特网)的分组中包括的报头典型地包括如OSI参考模型所定义的物理(层1)报头、数据链路(层2)报头、网络间(层3)报头和传输(层4)报头、和各个应用报头(层5、层6和层7)。
图2是根据一个实施例的概率标签应用的组件的视图。举例而言,概率标签应用107a包括用于分段和概括媒体内容的一个或多个组件。在一个实施例中,概率标签应用107a是微件(widget)。举例而言,微件是基于标准web技术(例如web运行时间(WRT)-许多浏览器中包括的web应用运行时间环境)的轻量级应用,其用作基于web的前端或客户端或其他内容和功能。此外,微件提供用于呈现信息和访问服务的便利性部件。假设这些组件的功能可组合在一个或多个组件中,或通过等同功能的其他组件来执行。
这个实施例中,概率标签应用107a包括:控制逻辑201,用于控制概率标签应用107a的运行;概率标签模块203,用于基于元数据、分析算法、和用户反馈中的至少一个生成媒体内容项目的概率标签;用户反馈模块205,用于创建或更新概率标签;概括模块207,用于基于概率标签生成一个媒体内容项目的概括或多个媒体内容项目的概括;以及概率标签和概括数据库109a。概率标签应用107b、107c、107d具有概率标签应用107a的相同或类似的特征。
图3是根据一个实施例用于分段媒体内容的处理的流程图。在一个实施例中,概率标签应用107a执行处理300,并在例如包括图10所示的处理器和存储器的芯片集中实现。在步骤301,概率标签应用107a将第一媒体内容项目(例如来自向系统100上传的足球比赛)分段成至少第一段和第二段。媒体内容项目可来源于用户(例如用相机采集)或机器(例如由计算机合成)。媒体内容项目可通过通信网络接收,或可使用相同或不同的机器本地给出。媒体内容项目可包括一个或多个媒体类型,例如音频、视频、文本等。媒体项目可被加标签和/或加时间戳。
在一个实施例中,概率标签应用107a可从媒体内容创建任意数目个段。此外,概率标签应用107a可根据不同标准(例如重叠段)执行多个分段。换句话说,应用107a可基于每个系列根据不同标准来分段,将相同的媒体内容分段成多个、并且潜在重叠的系列的段。媒体内容项目的段可以是以下内容的任一个或任意组合:
·整个媒体内容项目。
·媒体内容项目的任意单独媒体类型(例如,文本、音频、视频等)。
·媒体内容项目的一个媒体类型的空间子集。
·媒体内容项目的时间相关的子集。
·媒体项目的对象,所述对象代表在媒体内容项目中捕获的真实世界的对象(例如,人、树、建筑物等)。
·在由相机视图在媒体项目中(部分地)捕获的真实或虚拟3D世界中定义的空间。例如,覆盖3D世界中的区域的媒体内容项目的空间-时间部分。
之后,概率标签应用107a将第一关键字(例如分数)与第一段关联(步骤303)。两个或更多个关键字(例如,分数、犯规等)可与相同段关联,以向段提供概率标签。步骤303是实现这个优点的示例性手段。可向段增加和应用标签的概率值。另一实施例中,在应用元数据、内容分析、和/或用户输入/反馈时,关键字还与同义词(例如,进球、点、分数等)和对于不同语言(例如西班牙语、汉语等)的翻译关联。存在可用于提取关键字的同义词和翻译的不同语言的现有词汇数据库。关键字还可与在某个词典中指示其语义的特征向量(可代表自然语言)关联或由其表示。例如,根据本体表示法,关键字可通过索引来表示。尽管可以理解多个关键字可与任意一个段关联,以下一个关键字表示为词语,并作为示例与一个段关联以简化讨论。
第一关键字和第一段之间的关联可基于第一媒体内容项目的元数据、关于第一媒体内容项目的内容分析、和/或用户输入/反馈。元数据可嵌入在媒体内容项目中或存储在数据存储库中。数据存储库允许绑定元数据以用于有效搜索。元数据可包括关于何时创建媒体内容项目、谁创建它、它何时进行最后更新、它的大小和它的扩展的信息,并且元数据可通过人(例如拍摄者)或通过机器(例如,相机、移动终端、计算机等)来创建。元数据可通过人(例如,编辑者、馆员、搜索者等)或机器通过高级算法的进一步解释来加强,以包括主题、关键字、摘要等。举例而言,足球比赛媒体项目的可用元数据可指示第一媒体内容系项目的第二段包含得分事件。
作为另一实例,概率标签应用107a对第一媒体内容项目实施内容分析,并得出它具有包含得分事件的一个段。存在特别为足球比赛设计的视频内容分析算法,例如进球检测、裁判检测、受罚席检测。此外,可特别地对于足球比赛应用一般内容分析算法,例如主要颜色区域检测、健壮性拍摄边界检测、和镜头分类(例如对于靠近和远景情景)。视频内容分析算法表征媒体流的各个情景或帧,检测图像中的目标对象或事件,以使用基于电影和对象的特征提供全自动和计算上有效的框架用于足球视频的分析和概括化。一个现有系统可输出比赛中的所有慢动作段、比赛中的所有进球、和根据在不同国家和条件下捕获的实时足球视频的基于对象的小时特征而分类的慢动作段。举例而言,足球视频分析系统可指示第一媒体内容项目的第二段包含得分事件。
对于其他主题,例如音乐,存在特别地为了音频内容项目而设计的不同内容分析算法,例如检测在流行和摇滚音乐中的合唱部分,从而预览流行和摇滚音乐的播放列表。一个现有系统利用启发式得分方案从二进制化的距离矩阵选择初始合音候选,并且使用图像处理滤波器以细化合音候选的最终位置和长度。处理音频采样以提取音频属性。所述分析包括提取音频特征,例如,梅尔频率倒谱系数(MFCC)。也可使用其他音频特征,例如MPEG-7音频特征。音频采样可基于音频属性的相似性被临时地分段成不同段。提取的段的音频属性用作用于段的分类的种子。典型地,使用信号的模型来进行分类,所述模型通过实质与音频属性相同的特征向量来表示。然后,通过从模型寻找对于音频属性的最接近匹配来形成分类。对于音频信号的不同分类(例如基于音频的环境上下文识别、语音识别、语音/音乐区别、发音者性别或年龄识别器、和发音者识别)来提出模型。于是,分类得到指示对于段的最接近匹配的一个或多个关键字。分类算法还典型地得到相比于分类的结果段的匹配有多强的概率。这样的概率可用作用于上述实施例的概率标签的初始概率值。
另一实例中,概率标签应用107a接收指示第三段包含得分事件的用户输入/反馈。存在获取用户的相关性反馈的若干方式。例如,用户的相关性反馈可明确地由用户或机器来指定。或者,用户的相关性反馈可以如经由指示或确认概率标签的用户交互(例如由用户进行的基于关键字的搜索和搜索结果的实际浏览)所监视的那样,是隐含的。
如上所述,系统100的用户可搜索和浏览媒体内容项目。用户可输入文本搜索标准或图像以搜索图像或视频。作为文本搜索标准,用户可输入表征搜索的一个或多个关键字。关键字可通过不同逻辑操作(例如“和”、“或”等)结合。关键字也可通过非直接方式来输入。例如,可给出媒体项目作为相似性搜索的种子,并且与该媒体项目关联的标签可用作要在其他媒体内容项目中搜索的关键字。对于用于搜索的关键字的呈现,存在以上呈现的用于概率标签的相似选项。
搜索查询可额外地包含其他部分,例如,对于某些地理区域(原始创建媒体项目的地方)的搜索的进一步限制、某些日历时间(原始捕获媒体项目的时间)、原始捕获媒体项目的某个人/人们/公司、和某个类型。
对于从图像直接执行的搜索,将目标图像和候选图像按照图像特征(例如元数据、标签、或甚至它们的概率标签)彼此相比较。它们的概率标签可嵌入在元数据中或通过运行中的分析算法来提取。这个处理的至少一部分基于将搜索查询中给出的关键字的组合匹配于与搜索查询的其他限制(例如人、时间、位置等)匹配的媒体内容项目的概率标签的那些。搜索结果应该包含媒体项目的这样的段,该段的概率标签至少部分地匹配搜索查询的关键字与搜索查询中指出的它们的逻辑组合。
关键字的匹配还使用软匹配技术,考虑概率标签或搜索查询的关键字或两者中的潜在拼写错误。此外,可在搜索结果的推导中包括同义词、翻译、和语义上相似的词语。公知的算法(例如潜在的语义分析及其推导)可用于提取关键字的同义词、翻译、和语义上相似的词语。搜索结果中的媒体内容项目的顺序可至少部分地基于指示概率标签的相似性的概率值。搜索结果可通过各个方式来表示,包括概括在搜索结果中包括的每个段的关键帧或预览片段。
用户可选择在搜索结果中提供的所列出的媒体内容项目中的一个或多个。代替或除了作出这样的选择,用户可具有其他手段来指示项目与搜索查询的相关性。例如,用户可基于搜索查询中的媒体内容项目的预览片段给出用于其的“拇指向上”或“拇指向下”。可将用户的选择或其他反馈看作与搜索查询的关键字相关的对于所选的媒体内容项目的隐含相关性反馈。换句话说,如果用户对于媒体内容项目给出“拇指向上”和/或选择搜索结果中的媒体内容项目,则搜索查询的关键帧可能描述搜索结果中的媒体内容项目。因此,可增加各个概率标签的概率值。另一方面,如果用户对于媒体内容项目给出“拇指向下”和/或未选择搜索结果中的媒体内容项目,则搜索查询的关键字不描述搜索结果中的媒体内容项目,或其内容没有更受偏好。因此,可降低各个概率标签的概率值。
除了用户与媒体内容项目搜索结果列表的交互,可记录用户与所选的媒体项目自身的交互。举例而言,媒体内容项目的选择典型地使其在媒体播放器上被回放。媒体播放器通常允许非线性访问媒体内容项目。最终用户例如可以就相对于媒体内容项目的开始的时间而言从任何期望的任意位置访问媒体内容项目,快进、快倒、并播放媒体内容项目的某些部分多次。相比于被跳过或以更快节奏播放的媒体内容项目的那些部分/段来说,对于被多次播放、慢动作播放、或暂停的媒体内容项目的那些部分/段的所代表的搜索查询的关键字的概率可以更高。可增加与被多次播放、慢动作播放、或暂停的媒体内容项目的段相应的概率标签的概率值,同时可降低与被跳过或以更快节奏播放的媒体内容项目的段相应的概率标签的概率值。监视和记录在播放搜索结果中包括的媒体内容项目时的用户行为,以用于创建和/或调整概率标签。应注意,响应于用户动作的记录,可合并或进一步分割段。例如,如果用户播放第一段超过第一段的结尾多次可暗示兴趣事件(例如足球比赛中的得分事件)延长第一段的结尾越过应用关键字的第二段。这个情况下,概率标签应用107a将第一和第二段合并到一个段中,或在第一段和第二段之间再次选择边界。
搜索、浏览和回放行为用作隐含用户反馈,用于识别当用户需要寻找媒体内容项目时稍后期望的媒体内容项目或段。例如,用户可搜索特定足球比赛的得分事件,并概率标签被用于创建搜索结果。每个搜索结果可通过进球得分的临时段的关键帧或预览片段来表示。在搜索结果上的点击被用来增加对于所呈现的段的“分数”标签的概率。基于与足球比赛相关联的视频剪辑的段之间“分数”标签的概率值,来创建足球比赛的“比赛分数”概括。另一实施例中,基于用户的背景将不同用户的反馈加权。例如,将与当前用户相同的对于旅行的社会网络组的用户(例如对于旅行具有与当前用户类似想法的人们)的反馈赋予比不同的那些人更高的权重。
举例而言,由点击第一媒体内容项目的所有用户浏览第一媒体内容项目的第一段。确定第一媒体内容项目的第一段包含比第一媒体内容项目的其他段更多的得分事件,或是包含偏好其他段的内容的至少一个得分事件(可以或可以不包含得分事件)。第一媒体内容项目的第一段可以是媒体内容项目的段中的任一个,而并非时间序列中第一的段。
概率标签应用107a向第一关键字分配指示第一关键字与第一段的相关性的第一概率值(步骤305)。基于第一媒体内容项目的元数据、关于第一媒体内容项目的内容分析、或用户输入/反馈中的至少一个来向第一段分配第一概率值。例如,如果根据内容分析第一段不包含任何得分事件则对于“进球”概率标签的第一概率值接近0;如果根据内容分析第一段包含一个得分事件则对于“进球”概率标签的第一概率值小于1但接近1,等等。备选地或额外地,关于相关性反馈命中的计数可合并到第一概率值中。
举例而言,足球比赛媒体项目的元数据可指示第三段包含得分事件,从而对于第三段的“进球”概率标签的概率值为1。作为另一实例,概率标签应用107a对第一媒体内容项目应用内容分析,并得到对于第三段的“进球”概率标签的概率值接近1。另一实例中,概率标签应用107a接收指示第三段的概率值为1的用户输入/反馈。
响应于包括第一关键字的搜索查询,概率标签应用107a可在第一搜索结果中包括第一段(步骤307)。例如,在感兴趣的足球比赛中搜索得分事件时,概率标签应用107a按概率值的降序呈现足球比赛媒体内容项目的所有段、或呈现具有较高概率值的预定数目个段、或呈现具有等于或大于预定值(例如0.9)的概率值的段。步骤307是实现这些优点的示例性手段。
响应于搜索结果的用户选择,概率标签应用107a增加第一概率值(步骤309)。如上所述,由用户对搜索结果的实际浏览被看作指示段与用户查询的相关性的用户反馈。然后,如反馈路径311指出的那样向步骤305反馈在步骤309中增加的第一概率值,以更新在步骤307中的结果。例如,在用户输入对于感兴趣的足球比赛中得分事件的搜索之后,向用户实际点击和浏览的媒体内容项目分配相比于用户没有点击和浏览的媒体内容项目更高的概率值。由于用户可能未浏览整个点击的媒体内容项目,将向用户实际浏览的媒体内容项目的段分配相比于用户未浏览的所点击的媒体内容项目的另一段更高的概率值。除了用户的隐含相关性反馈,也可基于用户的明显的相关性反馈来调整段的概率值。例如,用户明确地请求编辑段的概率值。
在考虑用户反馈之后,用增加的第一概率值来调整段。可将具有调整的概率值的段提升至足球比赛媒体内容项目的所有段的列表中较高的位置,或插入至通过最小概率值阈值的段的列表。
上述实施例中,概率标签应用107a顺序执行步骤305、307、309。另一实施例中,按例如307->305/309的不同顺序来执行它们。响应于包括第一关键字的搜索查询,概率标签应用107a将第一段包括在搜索结果中。响应于对搜索结果的用户选择,概率标签应用107a设置指示第一关键字与第一段的相关性的第一概率值。
另一实施例中,概率标签应用107a与步骤305并行地执行步骤307和309。例如,概率标签应用107a基于元数据或内容分析向第一关键字分配指示第一关键字与第一段的相关性的第一概率值,同时反复地收集用户搜索项目和选择以调整第一概率值。
另一实施例中,概率标签应用107a如跳过路径313指示的那样,跳过涉及用户反馈的步骤307和步骤309,并直接进行至将详细讨论的随后处理。
另一实施例中,任意数目个概率标签应用107a-107d可协作运行。例如,概率标签应用107a可执行步骤301、303、和305,概率标签应用107c可执行步骤307和309。这个实例中,第一段和第二段,或至少指示第一媒体内容项目的第一段和第二段的第一分段、以及与第一段关联的第一关键字(例如分数)、以及指示第一关键字与第一段的相关性的第一概率值(例如0.9)必须从运行概率标签应用107a的UE 101a传递至运行概率标签应用107c的web服务平台103a。应注意,可存在任意数目个UE 101a、任意数目个个人计算机101b、任意数目个web服务平台103a、和任意数目个通信平台103b,它们的概率标签应用107a-d进行协作。
一些实施例,可对于新插入的媒体内容项目或其段应用相似性搜索,代替基于上述其自身元数据、内容分析、和/或用户输入/反馈分配概率值。可基于一个或多个类似的媒体内容项目的标签向媒体内容项目或其段分配概率标签。可基于元数据,例如相同或类似的文本标签、拍摄图片的类似年、日和位置,和类似相机设置(例如曝光时间和焦点细节),来进行相似性搜索。相似性搜索还可包含内容分析、和/或用户输入/反馈。如果搜索寻找到与新插入的媒体内容项目类似的处理后的媒体内容,则可以由新插入的媒体内容项目和/或其段来继承现有标签和概率值。继承的概率值可通过评估的在媒体内容项目之间的相似性的强度来缩放或加权。一些环境下,相比于根据处理300处理新插入的媒体内容项目,相似性搜索可消耗更多时间和计算容量。
如上所述,UE 101a、个人计算机101b、web服务平台103a和通信平台103b中的每个具有概率标签应用107和用于存储概率标签和概括信息的数据库109。存储的概率标签和概括信息可在UE 101a、个人计算机101b、web服务平台103a和通信平台103b之间传送。举例而言,另一UE(端到端)、个人计算机101b、web服务平台103a或通信平台103b中的概率标签应用107可从UE 101a接收:第一媒体内容项目(例如来自向系统100上传的足球比赛)、至少指示第一媒体内容项目的第一段和第二段的第一分段、与第一段关联的第一关键字(例如分数)、和指示第一关键字与第一段的相关性的第一概率值(例如0.9)。
另一实施例中,接收第一和第二段,代替至少指示第一媒体内容项目的第一段和第二段的第一分段。当接收第一分段时(例如标记对于分段的位置的时间戳),概率标签应用107可使用标签来本地地对第一媒体内容项目分段。当直接接收第一和第二段时,概率标签应用107不需要本地地对第一媒体内容项目分段;然而,第一和第二段的发送消耗网络带宽。
另一实施例中,接收端可能已经具有第一媒体内容项目,从而发送端不必发送第一媒体内容项目。举例而言,用户在足球比赛期间通过UE 101a来取得第一媒体内容,并向个人计算机101b或web服务平台103a上传要分析和分段的第一媒体内容。当个人计算机101b或web服务平台103a完成处理时,不必向UE 101a发送回第一媒体内容。
一个实施例中,用于捕获媒体内容的用户设备、个人计算机、或其他设备不执行任何概率标签应用。相反,捕获媒体内容的设备仅捕获音频、图像、和/或视频,然后通过通信网络上传或向上游传送媒体内容项目,或经由其他手段将媒体内容传送,至运行概率标签应用107a-107d的UE101a、web服务平台103a、通信平台103b、或个人计算机101b。如先前所述,不同设备上的概率标签应用107a-107d也可协作以执行图3中的处理。
响应于包括第一关键字的搜索查询,概率标签应用107将第一段包括在搜索结果中,如图3的步骤307。响应于搜索结果的用户选择,概率标签应用107增加第一概率值,如图3的步骤309。
图4是根据一个实施例用于概括媒体内容的处理的流程图。一个实施例中,概率标签应用107a执行处理400,并在包括如图10所示的处理器和存储器的芯片集中实现。在步骤401,概率标签应用107a向第一关键字分配指示第一关键字与第二段的相关性的第二概率值。继续足球比赛的实例,当第一段不包含任何得分事件时,对于“分数”概率标签的第一概率值为0;以及当第二段包含一个得分事件时,对于“分数”概率标签的第二概率值为1。
概率标签应用107a在第一概率值和第二概率值之间选择较高的概率值(步骤403)。这个实例中,选择具有1的概率值的第二段。概率标签应用107a通过将具有较高概率值的第二段包括在与第一关键字关联的第一媒体内容项目的第一概括中来创建第一概括(步骤405)。第一概括是对于关键字“分数”的足球比赛媒体内容项目的压缩版本,因为它仅包含媒体内容项目的一个段。由于其更短的长度,相比于整个媒体内容项目,第一概括也可更相关于用户对于“分数”的查询。步骤405是实现这个优点的示例性手段。
在一个实施例中,步骤403和405不通过概率标签应用107a来执行,而是在单独应用中执行,该单独应用不需要在与概率标签应用107a相同的设备中执行。
如上所述,基于用户反馈的概率标签的更新是可选的。然而,这样的更新可增加确定内容的相关性的可靠性。另一实施例中,概率标签应用107a比较由在用户搜索和浏览事件的过程中编译和结合的用户反馈调整的段的概率值。从多个用户接收在事件的过程中关于偏好选择的用户反馈统计。然后,概率标签应用107a根据编译的用户反馈统计基于最偏好的段生成第一媒体内容的第一概括。因此,用户反馈将更多语义信息注入至系统100。在足球比赛的情况下,对于包含相同数目的得分事件的两个段,一个段具有相比于其他段较高的所调整的概率值,这是因为“分数”概率标签可以是射门的不同难度、得分球员/队伍的声望的不同程度的结果。
另一实施例中,响应于对于概括的请求,概率标签应用107a直接基于经由处理300创建的数据库中的现有概率标签来创建或更新第一概括。换句话说,概率标签应用107a从存储的概率标签和媒体内容项目启动(jump-start)到创建或更新概括,而不经过处理300。概率标签应用107a将概括请求中的关键字和额外限制用作类似于上述的处理搜索查询的输入。概率标签应用107a创建关键字的逻辑组合,以根据概括的给定需求来与媒体内容项目的现有段匹配。该匹配类似于先前讨论的将搜索查询与概率标签匹配来进行。匹配得到按降匹配概率排序的多个段,从其中选择段的子集以包括在概括中。可通过以下限制的一个或多个来确定段的子集:
·概括的总长度/持续时间。
·是否允许概括中的段在时间、空间、或任意其他维度上重叠。
·对于关键字和它们的逻辑组合的匹配度的阈值。
例如,可通过将它们逐一联合,或通过以画中画方式将一个段包括在另一段的上方,来合并将在概括中包括的段。创建的概括可看作响应于最后搜索查询的一个媒体内容项目(即,与概率标签关联)。
图5A是根据另一实施例的用于概括媒体内容的处理的流程图。一个实施例中,概率标签应用107a执行处理500,并在包括如图10所示的处理器和存储器的芯片集中运行。在步骤501,概率标签应用107a将第二媒体内容项目(例如在与第一媒体内容项目相同的赛季期间相同联赛的另一足球比赛的视频片段等)分段成至少第三段和第四段。第二媒体内容项目按照至少一个共有起源特征与第一媒体内容项目关联。至少一个共有起源特征可包括以下内容的至少一个:起源于相同的事件(例如相同的足球比赛、世界杯等)、大约在相同的位置(例如相同的体育场、相同的城市、相同的国家等)捕获、大约在相同的时间(例如相同的小时、日、星期、月、赛季、年等)捕获、由相同的人或实体(例如相同的摄影师、相同的电视台、相同的公司等)捕获、和语义上近似(例如相同的运动员、相同的队伍、相同的联赛、相同的运动等)。对于除了体育之外的主题,共有起源特征可以是在2009年最流行/重要的歌曲/电影/新闻/事件/发明、世界上最多访问/美丽/危险的城市/网站、美国最昂贵/经济的学校/车辆/住宅/酒店/航线/饭店、欧洲最高工资/最大压力/最高回报的工作等。
另一实施例中,概率标签应用107a还基于例如检测到段是至少在相同位置、朝向相同方向、和在相同时间被捕获的,来进一步识别第一段和第三段基本上代表相同的内容。
类似于步骤303和305,概率标签应用107a将第一关键字(例如分数)与第三段关联(步骤503),并向第一关键字分配指示第一关键字与第三段的相关性的第三概率值(步骤505)。于是,概率标签应用107a在第一概率值和第三概率值之间选择较高的概率(步骤507)。
在处理500中,可与处理300和400中创建的第一媒体内容项目的第一概括顺序地或并行地创建第二媒体内容项目的第一概括。概率标签应用107a将第一段(即第一媒体内容项目的第一概括)和第三段(即第二媒体内容项目的第一概括)中具有较高概率值的一个包括在第二概括中,由此创建第一和第二媒体内容项目的第二概括(步骤509)。
一个实施例中,步骤507和509不通过概率标签应用107a来执行,而是在单独应用中执行,该单独应用不需要在与概率标签应用107a相同的设备中执行。
另一实施例中,概率标签应用107a仅以媒体内容项目的水平来结合在用户搜索和浏览事件的过程中编译和结合的用户反馈。当第一和第二媒体内容项目是从两个不同的足球比赛提取的时,可能因为第一个比赛包含最近一年的冠军队伍所以一个比赛比另一个比赛更加受偏好。当第一和第二媒体内容项目是为相同足球比赛提取的时,它们可能在捕获期间方面部分地重叠。可能因为第一媒体内容项目包含中场休息演出或第一媒体内容项目取自于到活动的中心更近的距离,所以一个媒体内容项目比其他媒体内容项目更加受偏好。在任一情况下,将第一媒体内容项目用比第二媒体内容项目较高的概率值来调整。概率标签应用107a可放弃第二媒体内容项目,并仅使用第一媒体内容项目来生成概括。换句话说,概率标签应用107a生成第一媒体内容项目的第一概括,并将其用作两个媒体内容项目的第二概括。由此,第二概括反映了用户偏好。
另一实施例中,概率标签应用107a仅以媒体内容项目的水平来结合在用户搜索和浏览事件的过程中编译和结合的用户反馈。换句话说,概率标签应用107a分别对于第一和第二媒体内容项目生成第一概括,然后使用具有由用户反馈所调整的较高概率值的第一概括作为两个媒体内容项目的第二概括。由此,第二概括也反映了用户偏好。
另一实施例中,概率标签应用107a以媒体内容项目以及以段水平来结合用户反馈。可能的情形包括在以段水平结合用户反馈之前或之后将所调整的媒体内容项目的概率值因子分解成它们的段。不同的情形可依据执行用户偏好的顺序和因子而导致不同结果。举例而言,由媒体/快讯拍摄的媒体内容项目通常包括比观众拍摄的媒体内容项目更近/更好的事件视图。然而,观众成员可捕获媒体/快讯错过的特殊片段。拍摄视频片段的观众成员可分别将视频片段上传至网站或博客用于共享。例如,包含半场休息演出的这样的用户生成的段可相比于由另一观众成员拍摄的得分事件的段具有较高的调整的概率值。另一方面,如果相比于由观众成员拍摄的半场休息演出的段,得分事件段是由媒体/快讯拍摄在更近处拍摄的,则可将值的排名反向。
图5B是根据一个实施例的用于概括媒体内容的处理的流程图。在一个实施例中,概率标签应用107a执行处理520,并在例如包括图10所示的处理器和存储器的芯片集中实现。在步骤521,概率标签应用107a将第二媒体内容项目分段,如图5A的步骤501那样。类似于步骤503和505,概率标签应用107a将第一关键字(例如分数)关联于第三段和第四段(步骤523),并向第一关键字分配指示第一关键字与第三段的相关性的第三概率值和指示第一关键字与第四段的相关性的第四概率值(步骤525)。于是,概率标签应用107a选择具有在第一、第二、第三、和第四概率值之间最高概率值的段(步骤527)。概率标签应用107a将所选的具有最高概率值的段包括在第三概括中(假设该段没有在更早处理中被选择为第三概括),由此创建第一和第二媒体内容项目的第三概括(步骤529)。
在步骤531,概率标签应用107a检查对于第三概括设置的持续时间(例如3分钟长)或其他标准。如果概率标签应用107a确定可根据所设置的第三概括的持续时间或其他特征将另一段增加至第三概括(步骤533),则处理继续返回至步骤525。否则,认为第三概括完成,并且处理520由此结束。
在一个实施例中,步骤527、529、531和533不通过概率标签应用107a来执行,而是在单独应用中执行,该单独应用不需要在与概率标签应用107a相同的设备中执行。
图6A-6F是根据一个实施例的为足球比赛拍摄的媒体内容项目的视图。举例而言,用户向系统100上传9分钟长的足球比赛媒体内容项目601,如图6A所示。这个实施例中,图6B中,将足球比赛媒体内容项目601分段成3个3分钟长的段611、613等。段611不包含任何得分事件,段613包含两个得分事件,段615包含一个得分事件。3分钟长度可以是浏览者偏好、广播考虑(商业间歇、或新闻片段)等所需。3分钟长的段611、613等的每个可进一步分段成3个1分钟长的段621、623、625、627、627、631、633、635、637,如图6C所示。1分钟长度可以是启发式选择(即基于经验,例如拇指规则),因为大多数足球得分事件持续大约1分钟。由此,概率标签应用107a可直接地将足球比赛媒体内容项目601分段成1分钟长的段,而并非按两个阶段来分段。
分段可按照需要多次递归地发生。举例而言,用户指定使用30秒长的段来自动分段。由此,概率标签应用107a可直接地将足球比赛媒体内容项目601分段成18个30秒长的段,而并非按若干阶段来分段。
另一实施例中,段不是相等长度的。举例而言,概率标签应用107a将媒体内容分段,以确保每个段包含至少一个得分事件。如图6D所示,段641包含1个得分事件并且是4分钟长,段643包含1个得分事件并且是2分钟长,以及段645包含1个得分事件并且是3分钟长。概率标签应用107a通过用户设置的任意方式来将媒体内容项目分段成例如1分钟、2分钟、3分钟等递增长度的段,或者反之亦然。不同设置可能有利于关于感兴趣的关键字的相应内容类型。例如,递减的长度的段可能更好地捕获在越接近于结尾时变得越激烈的烟火事件的精彩场面或选美比赛。所述段不需要以预先确定的粒度的回放时间(例如,媒体内容项目的任意完整的分钟位置)来开始和结束。可对于媒体内容项目执行场景改变检测,以确定场景的改变,例如,从一个相机向另一个的切换、从近拍向远景或相反的拍摄的切换、或从一个稳定相机方向到另一个稳定相机方向的追拍。可设置段边界,以与场景改变位置相一致。
继续图6B中的段的集合,当段611不包含任何得分事件时对于段611的“分数”概率标签的概率值为0或接近0,以及当段613包含两个得分事件时对于“分数”概率标签的段613的概率值为1或接近1。由于段613具有较高的概率值,则选择其包含在媒体内容项目601的第一概括中。图6E中的第一概括651是对于关键字“分数”的足球比赛媒体内容项目601的压缩版本,因为它仅包含媒体内容项目601的3分钟段的一个。由于其更短的长度,第一概括613相比于媒体内容项目601更相关于用户对于“分数”的查询。因此,这些步骤是实现这个额外优点的示例性手段。
在一个实施例中,概率标签包括对匹配标签的关键字的事件的计数和对于这些事件中的每一个的至少一个概率值。例如,对于段613的“分数“概率标签包含等于2的计数和两个概率值,在段613中的每个所检测的得分事件一个概率值,两者都为1或接近1。
另一方面,如图6C所示,对于段621、623、625、629、633、635中的每个的“分数”概率标签的概率值为0或接近0,因为这些段中的每个都不包含任意得分事件。或者,不为段621、623、625、629、633、635中的任意一个创建“分数”概率标签,因为这些段都不包含得分事件。段627、631、637的每个的概率值为1或接近1,因为这些段中的每个包含1个得分事件。由于段627、631、637中的每个具有比剩余段更高的概率值,所以它们被选择为包括在媒体内容项目601的另一第一概括中。图6F中的其他第一概括639是段627、631、637的组合,包含3个得分事件。图6F中的第一概括639相比于媒体内容项目601也是更相关于用户对于“分数”的查询,因为它具有相同数目个得分事件而长度更短。因此,这些步骤是实现这个额外优点的示例性手段。
图6G-6H是根据一个实施例来自足球比赛的另一媒体内容项目的视图。例如,存在来自向系统100上传的不同足球比赛的另一个/第二媒体内容项目651。两个足球比赛共享至少一个共有起源特征。在这个实例中,它们都关联于2008世界杯。在这个实施例中,在图6H中,足球比赛媒体内容项目651被分段成3个3分钟长的段661、663等。段661包含一个得分事件,并被分配有对于“分数”概率标签的为1的事件计数以及为1或接近1的概率值,而段663包含3个得分事件,并分配有对于“分数”概率标签的为3的事件计数以及对于这些事件中的每个的为1或接近1的概率值。由于第二媒体内容项目651的段663对于“分数”概率标签具有为3的事件计数,其大于第二媒体内容项目651的2个其他段对于“分数”概率标签的事件计数,如图6I所示,因此选择段663作为第二媒体内容项目651的第一概括。
图6I-6J是根据一个实施例的两个足球比赛的第二概括的视图。在图6I所示的第一媒体内容项目601的第一概括613和第二媒体内容项目651的第一概括663之间,将第二媒体内容项目651的第一概括663包括在第一和第二媒体内容项目601、651的第二概括中。第一和第二媒体内容项目601、651的第二概括663比第一媒体内容项目601的第一概括613多包含1个得分事件。另一方面,在图6J所示的第一媒体内容项目601的第一概括639和第二媒体内容项目的第一概括663之间,可以将第一概括639或663中的任一个包括在第一和第二媒体内容项目601、651的第二概括中,因为它们都包含3个得分事件。在概括639、663之间的选择可取决于对于足球比赛、运动员等的用户偏好。备选地或额外地,在要包括在第一和第二媒体内容项目601的第二概括663中的第一媒体内容项目601的第一概括613和第二媒体内容项目651的第一概括663之间的选择可基于在第一概括613、663中任意得分事件中的最高概率值和/或在第一概括613、663中得分事件的两个或更多个或所有概率值的总和。
图6K是根据一个实施例的呈现媒体内容项目的用户接口的视图。主题条671指示媒体内容项目673包括在对于“2009世界杯”的搜索结果中。用户可通过移动光标点击期望的媒体内容项目675,来选择在缩略图中提供的所列出的媒体内容项目673的一个或多个,作为图6K的搜索结果。一旦将媒体内容项目675突出和/或放大,如图6K所示,则用户可通过分别点击“拇指向上”按钮677或“拇指向下”按钮679来对于媒体内容项目675给出“拇指向上”或“拇指向下”。另一实施例中,用户可通过上下移动兴趣杆685来将光标指向用户兴趣条683,来指示用户对于媒体内容项目675的兴趣。用户的选择或其他反馈可看作对于所选媒体内容项目的与搜索结果的关键字相关的隐含相关性反馈。如上讨论地,当用户对于媒体内容项目给出“拇指向上”和/或选择搜索结果中的媒体内容项目时,搜索查询的关键字可能描述了在搜索结果中的媒体内容项目。另一方面,如果用户对于媒体内容项目给出“拇指向下”和/或未选择搜索结果中的媒体内容项目,搜索查询的关键字可能未描述在搜索结果中的媒体内容项目或其内容不是受偏好的。
可通过关键帧或临时段的预览片段来代表每个概括,其中每一关键帧或临时段的预览片段中均有目标内容发生。现有视频共享网站在原始的用户生成的视频内容从来没有被编辑过的情况下被泛洪,其中用户可在该网站上面上传和共享视频。通常,浏览者仅在花费时间浏览内容之后才认识到对该内容不感兴趣。尽管这些网站通常禁止上传包含诽谤、色情、盗版、和物质鼓励犯罪行为的视频,在这些网站上的许多片段是诱购(bait andswitch)类型的片段(例如,被宣称和表示成与感兴趣的主题相关(例如免费电影下载),但是实际与感兴趣的主题不相关或相反(例如版权侵犯声明))。上述实施例可被提供作为视频共享网站中的特征,以生成一个视频片段的概括,从而预览视频是否包含所宣称的感兴趣的内容。这提供了通过消除用户浏览不相关的内容并重新导航至他们想要浏览的内容所浪费的时间量,而节省电池寿命和减少UE 101上的资源使用(例如计算资源、带宽等)的手段。
上述实施例也可按需在视频共享网站中触发,以产生视频片段的概括,作为视频片段的集合的压缩版本,以节省浏览时间。例如,用户选择不同相机浏览的相同事件的多个片段,以从不同视频拍摄角度和距离产生相同得分事件的概括。作为另一实例,用户选择不同奥林匹克比赛的多个片段以生成具有用户指定长度的所有得分事件的概括(例如5分钟长的概括)。这些步骤提供了通过限制用户想要浏览片段的时间量而节省UE 101上的电池寿命的手段。
上述实施例还可应用于视频共享网站以监视用户反馈(例如,被用户实际浏览的次数、浏览用户的平均级别等)以及按他们的用户反馈的顺序列出满足搜索查询的视频片段。用户反馈确认片段实际包含感兴趣的目标。通过首先放映实际包含所表示的感兴趣的内容的片段然后按用户反馈列出片段,上述实施例提供了过滤诱购片段并通过用户反馈列出片段的手段,从而呈现具有高相关性内容的片段。
上述实施例包括三个主要功能块:(1)概率标签到媒体内容项目的段的初始关联;(2)基于明显的和/或隐含的用户反馈对概率标签的更新;和(3)基于概率标签的对概括的创建。如上讨论地,这些功能块可顺序地或并行地执行。当顺序地执行时,它们可按不同执行顺序来组织。举例而言,三个功能块可通过按序执行处理300、400、500来顺序执行。这个实例中,可基于从处理300的开始输入的额外媒体内容项目、和/或通过图3中步骤309和反馈路径311输入的额外用户反馈反复地执行功能块。
图7是根据一个实施例在三个主要功能块中处理概率标签的流程图。这个实施例中,初始关联功能块与更新功能块并行地运行。在功能块710中,概率标签应用107a接收不同类型的输入。输入可源自用户或它可以是机器生成的。输入可通过通信网络接收或可使用相同机器本地地给出。
当用户输入包括一个或多个媒体类型(例如音频、视频、文本等)的一个或多个媒体内容项目711时,在功能块720,概率标签应用107a通过将一个或多个媒体内容项目分段并对于段创建概率标签,来将初始概率标签与段关联,如图3的处理300、图4的步骤401、图5A的步骤501、503、505和图5B的步骤521、523、525。另一实施例中,概率标签应用107a可根据不同标准应用多个分段,并且所述段可彼此重叠。
当用户输入直接包括用户反馈713时,在功能块730中,概率标签应用107a基于用户反馈713更新概率标签。基于用户的明显的或隐含的反馈来更新致使关键字与段的相关性的概率值。如上讨论地,用户反馈可以是明显的或隐含的。例如,用户可明显地向媒体项目中的段分配标签。备选地,用户的相关性反馈可以是基于分配或确认在标签和高概率值之间的关联性的用户交互的隐含的。
之后,在功能块740,概率标签应用107a基于在功能块720中创建的概率标签(如步骤403和405)或在功能块730中更新的概率标签(如步骤507和509)创建媒体内容项目的概括。要包括在概括中的段例如通过将它们交替连接或通过将一个段以画中画方式包括在另一段的上方来合并。创建的概括可看作用于响应于随后搜索查询的一个媒体内容项目(与概率标签关联)。
这个实施例中,每次经由功能块720创建或经由功能块730更新(与功能块720并行地运行)媒体内容项目的概率标签时,自动地创建一个媒体内容项目的概括或多个媒体内容项目的概括。这些步骤是实现这个额外优点的示例性手段。
图8是根据一个实施例在三个主要功能块中处理概率标签的流程图。这个实施例中,创建概括,以直接响应于概括请求。概率标签应用107a接收类似于输入711和713的一个或多个媒体内容项目811和用户反馈813,并通过与上述执行功能块710、720、和730相同的方式来执行功能块810、820、和830。然而,概率标签应用107a通过与上述执行功能块740不同的方式执行功能块840。具体地,概率标签应用107a响应于概括请求815基于在经由处理300创建的数据库中的现有概括标签直接创建概括。换句话说,概率标签应用107a从存储的概率标签和媒体内容项目启动到创建或更新概括,而不经过处理300。因此,功能块840是实现这个额外优点的示例性手段。
概率标签应用107a提取关键字、它们的逻辑组合、和额外的限制(例如,概括的总长度/持续时间,段是否重叠等)作为类似于搜索查询的输入。将媒体内容项目的段匹配于概括的给定限制。该匹配类似于将搜索查询到概率标签的匹配那样来进行。还合并将在概括中包括的段,并且将创建的概括看作用于响应于随后搜索查询的一个媒体内容项目,如图7的实施例。
上述实施例改进了关键字到媒体内容项目的匹配精确性,并基于具有高概率值的段创建压缩的概括。通过结合明显的和隐含的用户反馈,上述实施例增加了概括对搜索查询的主观对应性。例如,可请求在摇滚演唱会中吉他独奏的概括,并且上述实施例大大提高了所呈现的概括包含在演唱会期间吉他独奏的最偏好和相关的视图的可能性。
这里所述的用于分段和概括媒体内容的处理可能有利地通过软件、硬件、固件或软件和/或固件和/或硬件的组合来实现。例如,在此描述的处理,包括用于提供与服务的可用性相关联的用户接口导航信息,可以有利地经由处理器、数字信号处理器(DSP)芯片、专用集成电路(ASIC)、现场可编程门阵列(FPGA)等实现。下面详细介绍用于执行上述功能的这种示例性硬件。
图9示出可在上面实现本发明实施例的计算机系统900。尽管关于特定设备或状态示出了计算机系统900,可设想,图9中的其他装置或设备(例如网络元件、服务器等)可部署系统900的图示的硬件和组件。计算机系统900被编程(例如经由计算机程序代码或指令)以如此处介绍的那样分段和概括媒体内容,并且包括例如总线910的通信机构,用于在计算机系统900的其他内部和外部组件之间传递信息。信息(还称为数据)表示成可测量现象的物理表达,典型地为电压,但在其他实施例中包括例如磁、电磁、压力、化学、生物、分子、原子、亚原子和量子交互的现象。例如,南北磁场、或零和非零电压代表二进制数字(比特)的两个状态(0,1)。其他现象可代表较高基数的数字。在测量之前多个同时量子状态的重叠代表量子比特(qubit)。一个或多个数字的序列构成用于代表字符的数目或代码的数字数据。在一些实施例中,称为模拟数据的信息通过特定范围内的可测量值的接近闭联集来表示。计算机系统900,或其一部分,构成用于执行分段和概括媒体内容的一个或多个步骤的部件。
总线910包括一个或多个并行的信息导体,从而在耦合至总线910的设备之间快速传送信息。用于处理信息的一个或多个处理器902与总线910耦合。
处理器(或多处理器)902如与分段和概括媒体内容相关的计算机程序代码指定的那样执行对于信息的一组操作。计算机程序代码是提供用于处理器的操作和/或计算机系统的指令的一组指令或语句,以执行特定功能。代码例如可用计算机编程语言编写,其被编译成处理器的原始指令集。代码还可使用原始指令集(例如机器语言)直接编写。该组操作包括从总线910带入信息并且将信息置于总线910上。该组操作还典型地包括比较两个或更多个信息单元,移动信息单元的位置,并且合并两个或更多个信息单元(例如通过加或乘或逻辑运算,如OR,异OR(XOR)和AND)。可由处理器执行的该组操作的每个操作通过称为指令的信息来向处理器表示,例如一个或多个数字的操作代码。处理器902要执行的操作的序列(例如操作代码的序列)构成处理器指令,还称为计算机系统指令,或简单地计算机指令。处理器可实现为机械、电、磁、光、化学或量子组件,其中可以是单独的或组合的。
计算机系统900还包括耦合至总线910的存储器904。存储器904(例如随机存取存储器(RAM)或其他动态存储装置)存储包括用于分段和概括媒体内容的处理器指令的信息。动态存储器允许其中存储的信息由计算机系统900改变。RAM允许在称为存储器地址的位置存储的信息单元独立于相邻地址被存储和提取。存储器904还由处理器902使用,以存储在处理器指令的执行期间的临时值。计算机系统900还包括只读存储器(ROM)906和耦合至总线910的其他静态存储装置,用于存储不可由计算机系统900改变的静态信息,包括指令。一些存储器包括易失性存储装置,当失去电力时其丢失在上面存储的信息。耦合至总线910的还有非易失性(永久性)存储装置908,例如磁盘、光盘或闪速卡,用于存储即使当计算机系统900关闭或失去电力时仍旧持续的信息,包括指令。
可从外部输入设备912(例如键盘,包含人工用户操作的字母数字键,或传感器)向总线910提供信息(包括用于分段和概括媒体内容的指令)供处理器使用。传感器检测其周围的条件,并且将那些条件转换成物理表达,其兼容于可测量现象以用于代表计算机系统900中的信息。耦合至总线910的其他外部设备(主要用于与人工交互)包括显示器设备914,例如阴极射线管(CRT)或液晶显示器(LCD)、或呈现文本和图像的等离子屏或打印机,以及定点设备916,例如鼠标或跟踪球或指针定向键、或运动传感器,用于控制在显示器914上呈现的小光标图像的位置以及发出与显示器914上呈现的图形元素相关的命令。在一些实施例中,例如,在计算机系统900自动执行所有功能而无需人工输入时,忽略外部输入设备912、显示器设备914和定点设备916中的一个或多个。
在所示实施例中,专用硬件(例如专用集成电路(ASIC)920)耦合至总线910。专用硬件被配置为为了专用目的足够快速地执行并未由处理器902执行的操作。专用IC的实例包括:图形加速器卡,用于生成针对显示器914的图像;密码板,用于加密和解密在网络上发送的消息;语音识别;以及对于特殊外部设备的接口,例如机器臂和医学扫描设备,其重复执行在硬件中更加有效实施的操作的一些复杂序列。
计算机系统900还包括耦合至总线910的通信接口970的一个或多个示例。通信接口970提供对于用他们自身处理器运行的各种外部设备(例如打印机、扫描仪和外部盘)的单向或双向通信耦合。一般地,耦合利用与本地网络980连接的网络链路978,具有他们自身处理器的各种外部设备连接至局部网络980。例如,通信接口970可以是个人计算机上的并行端口或串行端口或通用串行总线(USB)端口。在一些实施例中,通信接口970是向相应类型的电话线路提供信息通信连接的集成服务数字网络(ISDN)卡或数字订户线路(DSL)卡或电话调制解调器。在一些实施例中,通信接口970是将总线910上的信号转换成用于在同轴电缆上通信连接的信号或转换成用于在光纤电缆上通信连接的光学信号的电缆调制解调器。作为另一实例,通信接口970可以是向兼容LAN(例如以太网)提供数据通信连接的局域网(LAN)卡。也可实施无线链路。对于无线链路,通信接口970发送或接收或既发送又接收电、声或电磁信号,包括红外和光学信号,其承载例如数字数据的信息流。例如,在无线手持设备(例如像蜂窝电话的移动电话)中,通信接口970包括无线电带电磁发送器和接收器,称为无线电收发器。某些实施例中,通信接口970使能实现到通信网络105的连接,用于分段和概括媒体内容。
这里使用术语“计算机可读介质”来表示参与到向处理器902提供信息(包括用于执行的指令)的任意介质。这样的介质可采用许多形式,包括但不限于,非易失性介质、易失性介质、和传输介质。非易失性介质包括例如光或磁盘,例如存储装置908。易失性介质包括例如动态存储器904。传输介质包括例如同轴电缆、铜线、光纤电缆、和载波,其在无需布线或电缆的情况下通过空间行进,例如声波和电磁波,包括无线电、光和红外波。信号包括在通过传输介质发送的振幅、频率、相位、极化或其他物理属性的人工瞬间改变。计算机可读介质的通用形式包括例如软盘、灵活盘、硬盘、磁带、任意其他磁介质、CD-ROM、CDRW、DVD、任意其他光学介质、穿孔卡、纸带、光学标记表、具有孔或其他光学可识别特征的模式的任意其他物理介质,RAM、PROM、EPROM、FLASH-EPROM、任意其他存储器芯片或盒、载波、计算机可从中读取的任意其他介质。这里使用术语计算机可读存储介质,以指代除了传输介质的任何计算机可读介质。
在一个或多个有形介质中编码的逻辑包括在计算机可读存储介质上的处理器指令和专用硬件(例如ASIC 920)中的一个或两个。
网络链路978典型地通过一个或多个网络使用传输介质向使用或处理信息的其他设备提供信息通信。例如,网络链路978可向因特网服务提供商(ISP)操作的主机计算机982或设备984提供通过局域网980的连接。ISP设备984随后通过网络的公共、世界分组交换通信网络(现在统称为因特网990)提供数据通信服务。
计算机(称为服务器主机992,连接至因特网)托管响应于因特网上接收的信息提供服务的处理。例如,服务器主机992托管提供表示视频数据的信息,用于在显示器914呈现的处理。可设想,系统900的组件可部署在其他计算机系统,例如主机982和服务器992中的各个配置中。
本发明的至少一些组合涉及用于实现这里所述的一些或全部技术的计算机系统900的使用。根据本发明的一个实施例,通过计算机系统900执行那些技术,以响应于处理器902执行存储器904中包含的一个或多个处理器指令的一个或多个序列。这样的指令(还称为计算机指令、软件和程序代码)可从另一计算机可读介质(例如存储设备908或网络链路978)读入存储器904。存储器904中包含的指令的序列的执行使得处理器902执行这里所述的一个或多个方法步骤。在备选实施例中,可使用硬件(例如ASIC 920)代替或与实现本发明的软件组合。因此,本发明的实施例不限于硬件和软件的任意特定组合,除非这里明确阐述。
通过通信接口970在网络链路978和其他网络上发送的信号向和从计算机系统900承载信息。计算机系统900可通过网络980、990等,通过网络链路978和通信接口970发送和接收包括程序代码的信息。在使用因特网990的实例中,服务器主机992通过因特网990、ISP设备984、本地网络980和通信接口970发送用于特定应用的由从计算机900发送的消息请求的程序代码。接收的代码可,在其被接收时通过处理器902执行,或者可存储于存储器904或存储设备908或其他非易失性存储设备用于随后执行,或两者。这样,计算机系统900可在载波上以信号的形式获得应用程序代码。
各种形式的计算机可读介质可包含于向处理器902承载一个或多个指令或数据或两者中用于执行。例如,指令和数据可初始被承载在例如主机982的远程计算机的磁盘上。远程计算机将指令和数据加载至其动态存储器,并使用调制解调器在电话线上发送指令和数据。对于计算机系统900本地的调制解调器在电话线上接收指令和数据,并使用红外发送器将指令和数据转换成在用作网络链路978的红外载波上的信号。用作通信接口970的红外检测器接收在红外信号中承载的指令和数据,并将表示指令和数据的信息放在总线910上。总线910将信息承载至存储器904,处理器902从存储器904中提取并使用通过指令发送的一些数据执行指令。在处理器902执行之前或之后,存储器904中接收的指令和数据可选地可存储在存储设备908上。
图10示出在上面可实现本发明实施例的芯片集1000。芯片集1000被编程以如这里所述的分段和概括媒体内容,并且包括例如结合在一个或多个物理包(例如芯片)中关于图9所述的处理器和存储器组件。作为示例,物理包包括结构配件(例如基板)上的一个或多个材料、组件、和/或布线的安排,以提供例如物理强度、尺寸的保持、和/或电交互的限制的一个或多个特征。可设想,某些实施例中,芯片集可以在单一芯片中实现。进一步设想,在某个实施例中芯片集或芯片1000可以被实现为单个“芯片上的系统”。进一步设备,在某个实施例中,例如不使用分开的ASIC,并且在此公开的所有相关功能可以由一个或多个处理器执行。芯片集1000、或其一部分构成用于执行用于提供与服务的可用性相关联的用户接口导航信息。芯片集1000、或其一部分构成用于执行用于分段和概括媒体内容的一个或多个步骤的部件。
在一个实施例中,芯片集1000包括在芯片集1000的组件之间传递信息的例如总线1001的通信机构。处理器1003具有到总线1001的连通性,以执行指令和处理例如在存储器1005中存储的信息。处理器1003可包括一个或多个处理核,其每个核被配置为独立执行。多核处理器使得能够在一个物理包中进行多处理。多核处理器的实例包括两个、四个、八个或更大数目个处理核。备选地或额外地,处理器1003可包括一个或多个微处理器,其经由总线1001串联配置为能够独立执行指令、流水线和多线程。处理器1003还可伴随有执行某些处理功能和任务的一个或多个专用组件,例如一个或多个数字信号处理器(DSP)1007、或一个或多个专用集成电路(ASIC)1009。DSP 1007典型地被配置为独立于处理器1003实时处理真实世界的信号(例如声音)。类似地,ASIC 1009可被配置为执行由通用处理器不容易执行的专用功能。辅助执行这里所述的发明功能的其他专用组件包括一个或多个场可编程门阵列(FPGA)(未示出)、一个或多个控制器(未示出)、或一个或多个其他专用计算机芯片。
在一个实施例中,芯片集或芯片1000仅包括一个或多个处理器和支持和/或关于和/或用于该一个或多个处理器的一部分软件和/或固件。
处理器1003和伴随组件具有经由总线1001到存储器1005的连通性。存储器1005包括动态存储器(例如RAM、磁盘、可写光盘等)和静态存储器(例如ROM、CD-ROM等),用于存储可执行指令,其当执行时执行这里所述的发明步骤以分段和概括媒体内容。存储器1005还存储与发明步骤的执行相关的数据或由其生成的数据。
图11是根据本发明示例性实施例的能够在图1的系统中操作的移动终端(例如手机)的示例性组件的视图。一些实施例中,移动终端1100或其一部分构成用于执行用于分段和概括媒体内容的一个或多个步骤的部件。一般地,无线电接收器通常用前端和后端特征方面定义。接收器的前端涵盖所有射频(RF)电路,然而后端涵盖所有基带处理电路。本申请中,术语“电路”表示以下两者:(1)仅硬件实现(例如仅模拟和/或数字电路中实现);(2)电路和软件的组合(和/或固件)(例如,如果适用于特定环境,处理器的组合,其包括数字信号处理器、软件、和存储器,它们在一起工作以使得装置(例如移动电话或服务器)执行各个功能)。“电路”的这个定义应用于本申请中这个方面的所有使用,包括任意权利要求。作为其他实例,如这个应用中使用的那样,如果适用于特定环境,术语“电路”还覆盖仅处理器(或多个处理器)及其(或它们的)伴随软件/固件的实现方式。术语“电路”还覆盖如果适合于特定环境,例如移动电话中的基带集成电路或应用处理器集成电路、或蜂窝网络设备或其他网络设备中的类似集成电路。
电话的持久性内部组件包括主控制单元(MCU)1103、数字信号处理器(DSP)1105、和接收器/发送器单元,其包括麦克风增益控制单元和扬声器增益控制单元。主显示器单元1107在执行或支持分段和概括媒体内容的步骤的各个应用和移动站功能的支持下向用户提供显示。显示器11包括配置为显示移动终端(例如移动电话)的用户界面的至少一部分的显示器电路。此外,显示器1107和显示器电路被配置为便于移动终端的至少一些功能的用户控制。音频功能电路1109包括麦克风1111和麦克风放大器,其放大来自麦克风1111的音频信号输出。放大的来自麦克风1111的音频信号输出被馈送至编码器/解码器(CODEC)1113。
无线电站1115放大功率和转换频率,以经由天线1117与包括在移动通信系统中的基站通信。功率放大器(PA)1119和发送器/调制电路操作地响应于MCU 1103,来自PA 1119的输出耦合至本领域已知的双工器1121或循环器或天线开关。PA 1119还耦合至电池接口和功率控制单元1120。
在使用中,移动终端1101的用户向麦克风1111中说话,并且他或她的语音与任意检测到的背景噪声一起转换成模拟电压。模拟电压然后通过模数转换器(ADC)1123转换成数字信号。控制单元1103将数字信号路由至DSP 1105中用于其中的处理,例如语音编码、信道编码、加密、和交错。在示例性实施例中,通过未单独示出的单元,使用蜂窝传输协议(例如全球演进(EDGE)、通用分组无线业务(GPRS)、全球移动通信系统(GSM)、因特网协议多媒体子系统(IMS)、通用移动电信系统(UMTS)等)以及任意其他适合的无线介质(例如微波接入(WiMAX)、长期演进(LTE)网络、码分多址(CDMA)、宽带码分多址(WCDMA)、无线保真(WiFi)、卫星等)来编码处理后的语音信号。
然后,编码的信号路由至均衡器1125,用于补偿在通过空中接口的传输期间发生的任意频率依赖性的损害(例如相位和振幅失真)。在均衡比特流之后,调制器1127将信号与RF接口1129中生成的RF信号结合。调制器1127通过频率或相位调制生成正弦波。为了准备用于传输的信号,上变频器1131将来自调制器1127的正弦波输出与合成器1133中生成的另一正弦波结合,以实现期望的传输频率。然后,信号通过PA 1119发送,以将信号增加至适当功率水平。在实践性系统中,PA 1119用作可变增益放大器,其增益由DSP 1105根据从网络基站接收的信息来控制。然后,信号在双工器1121中滤波,并且可选地发送至天线耦合器1135,以匹配阻抗,提高最大功率传送。最后,信号经由天线1117发送至本地基站。可提供自动增益控制(AGC),以控制接收器的最后阶段的增益。信号可从那里转发至远程电话,其可以是另一蜂窝电话、其他移动电话或连接至供给交换电话网(PSTN)的陆上线路、或其他电话网络。
向移动站1101发送的语音信号经由天线1117接收,并通过低噪声放大器(LNA)1137立即放大。下变频器1137降低载波频率,同时解调器1141剥离RF,仅留下数字比特流。然后,信号经过均衡器1125,并由DSP1105处理。数模转换器(DAC)1143转换信号,并且得到的输出通过扬声器1145发送至用户,所有都在主控制单元(MCU)1103的控制下——其可作为中央处理单元(CPU)(未示出)来实现。
MCU 1103从键盘1147接收包括输入信号的各个信号。键盘1147和/或MCU 1103与其他用户输入组件(例如麦克风1111)结合,包括用于管理用户输入的用户接口电路。MCU 1103运行用户接口软件以便于对移动终端1101的至少部分功能的用户控制,以分段和概括媒体内容。MCU 1103还将显示命令和切换命令分别传送至显示器1107和语音输出切换控制器。此外,MCU 1103与DSP 1105交换信息,并且可访问可选地并入的SIM卡1149和存储器1151。此外,MCU 1103执行终端的所需的各种控制功能。DSP 1105可依据实现方式,对语音信号执行各种传统数字处理功能中的任一个。此外,DSP 1105从麦克风1111检测的信号确定本地环境的背景噪声电平,并将麦克风1111的增益设置为被选择以补偿移动站1101的用户的自然倾向的电平。
CODEC 1113包括ADC 1123和DAC 1143。存储器1151存储各种数据,包括呼叫输入音调数据,并且能够存储其他数据,包括经由例如全球因特网接收的音乐数据。软件模块可位于RAM存储器、闪存、寄存器、或本领域已知的任意其他形式的可写存储装置中。存储器设备1151可以是但不限于,单存储器、CD、DVD、ROM、RAM、EEPROM、光存储装置、或能够存储数字数据的任意其他非易失性存储介质。
可选地并入的SIM卡1149承载例如重要信息,如蜂窝电话号码、载波提供服务、订购细节、和安全信息。SIM卡1149主要用于在无线电网络上识别移动终端1101。卡1149还包含用于存储个人电话号码登记表、文本消息、和用户特定的移动终端设置的存储器。
尽管结合多个实施例和实施方案描述了本发明,但是本发明不限于此,可覆盖落入所附权利要求范围内的各种明显修改和等同配置。尽管在权利要求中以某些组合表示了本发明的特征,但是可设想,这些特征可按任意组合和顺序安排。

Claims (26)

1.一种方法,包括促进(1)数据和/或(2)信息和/或(3)至少一个信号的处理,和/或处理(1)数据和/或(2)信息和/或(3)至少一个信号,所述(1)数据和/或(2)信息和/或(3)至少一个信号至少部分地基于:
将第一媒体内容项目分段成至少第一段和第二段;
将第一关键字与所述第一段关联;
向所述第一关键字分配指示所述第一关键字与所述第一段的相关性的第一概率值;以及
响应于包括所述第一关键字的搜索查询,将所述第一段包括在搜索结果中。
2.如权利要求1所述的方法,所述(1)数据和/或(2)信息和/或(3)至少一个信号进一步至少部分地基于:
响应于对所述搜索结果的用户选择,增加所述第一概率值。
3.如权利要求1至2中任一项所述的方法,其中所述关联和所述分配中的至少一个基于所述第一媒体内容项目的元数据、关于所述第一媒体内容项目的内容分析、和用户输入中的至少一个。
4.如权利要求1至3中任一项所述的方法,所述(1)数据和/或(2)信息和/或(3)至少一个信号进一步至少部分地基于:
向所述第一关键字分配指示所述第一关键字与所述第二段的相关性的第二概率值;
在所述第一概率值和所述第二概率值之间选择较高的概率;以及
通过将所述第一和第二段中的具有较高的概率值的一个包括在与所述第一关键字关联的第一媒体内容的第一概括中来创建所述第一概括。
5.如权利要求1至4中任一项所述的方法,所述(1)数据和/或(2)信息和/或(3)至少一个信号进一步至少部分地基于:
将第二媒体内容项目分段成至少第三段和第四段,所述第二媒体内容项目通过至少一个共有起源特征与所述第一媒体内容项目关联;
将所述第一关键字与所述第三段关联;
向所述第一关键字分配指示所述第一关键字与所述第三段的相关性的第三概率值;以及
基于所述第一概率值和所述第三概率值,创建与所述第一关键字关联的所述第一媒体内容项目和所述第二媒体内容项目的第二概括。
6.如权利要求5所述的方法,其中所述至少一个共有起源特征包括以下项目的至少一个:源自于相同的事件、大约在相同的位置捕获、大约在相同的时间捕获、由相同的人或实体捕获、和语义上近似。
7.如权利要求5至6中任一项所述的方法,所述(1)数据和/或(2)信息和/或(3)至少一个信号进一步至少部分地基于:
识别所述第一段和所述第三段基本上代表相同的内容;
在所述第一概率值和所述第三概率值之间选择较高的概率;以及
将所述第一和第三段中的具有较高概率值的一个包括在所述第二概括中,从而创建所述第二概括。
8.一种装置,包括:
至少一个处理器;以及
至少一个存储器,包括用于一个或多个程序的计算机程序代码,
所述至少一个存储器以及所述计算机程序代码被配置为利用所述至少一个处理器,致使所述装置至少执行以下:
将第一媒体内容项目分段成至少第一段和第二段;
将第一关键字与所述第一段关联;
向所述第一关键字分配指示所述第一关键字与所述第一段的相关性的第一概率值;以及
响应于包括所述第一关键字的搜索查询,将所述第一段包括在搜索结果中。
9.如权利要求8所述的装置,其中进一步致使所述装置:
响应于对所述搜索结果的用户选择,增加所述第一概率值。
10.如权利要求8至9中任一项所述的装置,其中所述关联和所述分配中的至少一个基于所述第一媒体内容项目的元数据、关于所述第一媒体内容项目的内容分析、和用户输入中的至少一个。
11.如权利要求8至9中任一项所述的装置,其中进一步致使所述装置:
向所述第一关键字分配指示所述第一关键字与所述第二段的相关性的第二概率值;
在所述第一概率值和所述第二概率值之间选择较高的概率;以及
通过将所述第一和第二段中的具有较高的概率值的一个包括在与所述第一关键字关联的第一媒体内容的第一概括中来创建所述第一概括。
12.如权利要求8至11中任一项所述的装置,其中进一步致使所述装置:
将第二媒体内容项目分段成至少第三段和第四段,所述第二媒体内容项目通过至少一个共有起源特征与所述第一媒体内容项目关联;
将所述第一关键字与所述第三段关联;
向所述第一关键字分配指示所述第一关键字与所述第三段的相关性的第三概率值;以及
基于所述第一概率值和所述第三概率值创建与所述第一关键字关联的所述第一媒体内容项目和所述第二媒体内容项目的第二概括。
13.如权利要求12所述的装置,其中所述至少一个共有起源特征包括以下项目的至少一个:源自于相同的事件、大约在相同的位置捕获、大约在相同的时间捕获、由相同的人或实体捕获、和语义上近似。
14.如权利要求12至13中任一项所述的装置,其中进一步致使所述装置:
识别所述第一段和所述第三段基本上代表相同的内容;
在所述第一概率值和所述第三概率值之间选择较高的概率;以及
将所述第一和第三段中的具有较高概率值的一个包括在所述第二概括中,从而创建所述第二概括。
15.如权利要求8至14中任一项所述的装置,其中所述装置在用户终端或服务器中。
16.一种装置,包括:
至少一个处理器;以及
至少一个存储器,存储器包括用于一个或多个程序的计算机程序代码,
其中所述至少一个存储器以及所述计算机程序代码被配置为利用所述至少一个处理器,致使所述装置至少执行以下:
接收第一媒体内容项目、至少指示所述第一媒体内容项目的第一段和第二段的第一分段、与第一段关联的第一关键字、和指示第一关键字与第一段的相关性的第一概率值;
响应于包括所述第一关键字的搜索查询,将所述第一段包括在搜索结果中;以及
响应于对搜索结果的用户选择,增加所述第一概率值。
17.如权利要求16所述的装置,其中所述装置被进一步致使:
向所述第一关键字分配指示所述第一关键字与所述第二段的相关性的第二概率值;
在所述第一概率值和所述第二概率值之间选择较高的概率;以及
通过将所述第一和第二段中的具有较高的概率值的一个包括在与所述第一关键字关联的第一媒体内容的第一概括中来创建所述第一概括。
18.如权利要求16至17中任一项所述的装置,其中所述装置被进一步致使:
将第二媒体内容项目分段成至少第三段和第四段,所述第二媒体内容项目通过至少一个共有起源特征与所述第一媒体内容项目关联;
将所述第一关键字与所述第三段关联;
向所述第一关键字分配指示所述第一关键字与所述第三段的相关性的第三概率值;以及
基于所述第一概率值和所述第三概率值创建与所述第一关键字关联的所述第一媒体内容项目和所述第二媒体内容项目的第二概括。
19.如权利要求18所述的装置,其中所述至少一个共有起源特征包括以下项目的至少一个:源自于相同的事件、大约在相同的位置捕获、大约在相同的时间捕获、由相同的人或实体捕获、和语义上近似。
20.如权利要求18至19中任一项所述的装置,其中所述装置被进一步致使:
识别所述第一段和所述第三段基本上代表相同的内容;
在所述第一概率值和所述第三概率值之间选择较高的概率;以及
将所述第一和第三段中的具有较高概率值的一个包括在所述第二概括中,从而创建所述第二概括。
21.一种计算机可读存储介质,承载一个或多个指令的一个或多个序列,当被一个或多个处理器执行时所述一个或多个指令的一个或多个序列使得装置至少执行根据权利要求1-7中的任一项的方法。
22.一种计算机程序产品,包括一个或多个指令的一个或多个序列,当被一个或多个处理器执行时所述一个或多个指令的一个或多个序列使得装置至少执行根据权利要求1-7中的任一项的方法。
23.一种装置,包括用于执行权利要求1-7中任一项的方法的部件。
24.一种方法,包括:促进访问至少一个接口,所述至少一个接口被配置为允许访问至少一个服务,所述至少一个服务被配置为执行权利要求1-7中的任一项的方法。
25.一种方法,包括:促进创建和/或促进修改(1)至少一个设备用户接口元件和/或(2)至少一个设备用户接口功能单元,所述(1)至少一个设备用户接口元件和/或(2)至少一个设备用户接口功能单元至少部分地基于:
从权利要求1-7中的任一项的方法得到的数据和/或信息;和/或从权利要求1-7中的任一项的方法得到的至少一个信号。
26.一种方法,包括:创建和/或修改(1)至少一个设备用户接口元件和/或(2)至少一个设备用户接口功能单元,所述(1)至少一个设备用户接口元件和/或(2)至少一个设备用户接口功能单元至少部分地基于:
从权利要求1-7中的任一项的方法得到的数据和/或信息;和/或从权利要求1-7中的任一项的方法得到的至少一个信号。
CN2011800106369A 2010-02-23 2011-01-20 用于分段和概括媒体内容的方法和装置 Pending CN102763105A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/710,990 2010-02-23
US12/710,990 US8489600B2 (en) 2010-02-23 2010-02-23 Method and apparatus for segmenting and summarizing media content
PCT/FI2011/050042 WO2011104428A1 (en) 2010-02-23 2011-01-20 Method and apparatus for segmenting and summarizing media content

Publications (1)

Publication Number Publication Date
CN102763105A true CN102763105A (zh) 2012-10-31

Family

ID=44477358

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011800106369A Pending CN102763105A (zh) 2010-02-23 2011-01-20 用于分段和概括媒体内容的方法和装置

Country Status (3)

Country Link
US (1) US8489600B2 (zh)
CN (1) CN102763105A (zh)
WO (1) WO2011104428A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103957433A (zh) * 2014-03-31 2014-07-30 深圳市同洲电子股份有限公司 一种视频数据的处理方法、相关设备及系统
CN105468603A (zh) * 2014-08-22 2016-04-06 腾讯科技(深圳)有限公司 数据选择方法及装置
TWI583191B (zh) * 2013-06-03 2017-05-11 雅虎股份有限公司 相片及視頻搜尋
CN106802946A (zh) * 2017-01-12 2017-06-06 合网络技术(北京)有限公司 视频分析方法及装置
US9875512B2 (en) 2013-06-03 2018-01-23 Yahoo Holdings, Inc. Photo and video sharing

Families Citing this family (66)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8682145B2 (en) 2009-12-04 2014-03-25 Tivo Inc. Recording system based on multimedia content fingerprints
US10116902B2 (en) 2010-02-26 2018-10-30 Comcast Cable Communications, Llc Program segmentation of linear transmission
US8489991B2 (en) * 2010-03-17 2013-07-16 Creative Technology Ltd System and method for video frame marking
WO2011136855A1 (en) * 2010-04-30 2011-11-03 Thomson Licensing Automatic image discovery and recommendation for displayed television content
CN102385861B (zh) * 2010-08-31 2013-07-31 国际商业机器公司 一种用于从语音内容生成文本内容提要的系统和方法
JP2012129979A (ja) * 2010-11-24 2012-07-05 Jvc Kenwood Corp 区間作成装置、区間作成方法、及び区間作成プログラム
US10440402B2 (en) 2011-01-26 2019-10-08 Afterlive.tv Inc Method and system for generating highlights from scored data streams
US9449093B2 (en) * 2011-02-10 2016-09-20 Sri International System and method for improved search experience through implicit user interaction
CA2773924C (en) 2011-04-11 2020-10-27 Evertz Microsystems Ltd. Methods and systems for network based video clip generation and management
US8806002B2 (en) * 2011-05-17 2014-08-12 Verizon Patent And Licensing Inc. P2P activity detection and management
US9529910B2 (en) * 2011-07-13 2016-12-27 Jean Alexandera Munemann Systems and methods for an expert-informed information acquisition engine utilizing an adaptive torrent-based heterogeneous network solution
WO2013068429A1 (en) * 2011-11-08 2013-05-16 Vidinoti Sa Image annotation method and system
US9846696B2 (en) * 2012-02-29 2017-12-19 Telefonaktiebolaget Lm Ericsson (Publ) Apparatus and methods for indexing multimedia content
US8958645B2 (en) 2012-04-19 2015-02-17 Canon Kabushiki Kaisha Systems and methods for topic-specific video presentation
US20150278187A1 (en) * 2012-04-26 2015-10-01 Google Inc. Summary-so-far feature for electronic books
CN103425704B (zh) * 2012-05-24 2017-07-21 阿里巴巴集团控股有限公司 应用界面提供方法及装置
US9633015B2 (en) 2012-07-26 2017-04-25 Telefonaktiebolaget Lm Ericsson (Publ) Apparatus and methods for user generated content indexing
US8948568B2 (en) 2012-07-31 2015-02-03 Google Inc. Customized video
US20140074648A1 (en) * 2012-09-11 2014-03-13 Google Inc. Portion recommendation for electronic books
US9037592B2 (en) 2012-09-12 2015-05-19 Flipboard, Inc. Generating an implied object graph based on user behavior
US10289661B2 (en) * 2012-09-12 2019-05-14 Flipboard, Inc. Generating a cover for a section of a digital magazine
US9712575B2 (en) 2012-09-12 2017-07-18 Flipboard, Inc. Interactions for viewing content in a digital magazine
TWI474200B (zh) * 2012-10-17 2015-02-21 Inst Information Industry Scene clip playback system, method and recording medium thereof
US9124981B2 (en) 2012-11-14 2015-09-01 Qualcomm Incorporated Systems and methods for classification of audio environments
JP5827206B2 (ja) * 2012-11-30 2015-12-02 株式会社Ubic 文書管理システムおよび文書管理方法並びに文書管理プログラム
GB2508602A (en) * 2012-12-04 2014-06-11 Ibm Determining content suitable for inclusion in portals
US9871842B2 (en) * 2012-12-08 2018-01-16 Evertz Microsystems Ltd. Methods and systems for network based video clip processing and management
US9137586B2 (en) * 2012-12-28 2015-09-15 Alticast Corporation Content creation method and media cloud server
US9952742B2 (en) * 2013-03-14 2018-04-24 Google Llc Providing trending information to users
US10068614B2 (en) 2013-04-26 2018-09-04 Microsoft Technology Licensing, Llc Video service with automated video timeline curation
WO2014185834A1 (en) 2013-05-14 2014-11-20 Telefonaktiebolaget L M Ericsson (Publ) Search engine for textual content and non-textual content
WO2014197354A1 (en) 2013-06-05 2014-12-11 Snakt, Inc. Methods and systems for creating, combining, and sharing time-constrained videos
US20160307599A1 (en) * 2013-06-05 2016-10-20 Snakt, Inc. Methods and Systems for Creating, Combining, and Sharing Time-Constrained Videos
US10289810B2 (en) 2013-08-29 2019-05-14 Telefonaktiebolaget Lm Ericsson (Publ) Method, content owner device, computer program, and computer program product for distributing content items to authorized users
US10311038B2 (en) 2013-08-29 2019-06-04 Telefonaktiebolaget Lm Ericsson (Publ) Methods, computer program, computer program product and indexing systems for indexing or updating index
US9830325B1 (en) * 2013-09-11 2017-11-28 Intuit Inc. Determining a likelihood that two entities are the same
US9424345B1 (en) * 2013-09-25 2016-08-23 Google Inc. Contextual content distribution
JPWO2015104780A1 (ja) * 2014-01-07 2017-03-23 パナソニックIpマネジメント株式会社 映像撮像装置
US10037380B2 (en) * 2014-02-14 2018-07-31 Microsoft Technology Licensing, Llc Browsing videos via a segment list
US20150268818A1 (en) * 2014-03-22 2015-09-24 Begether, Inc. Dynamic mechanism for obtaining, utilizing, analyzing, and disseminating user feedback within a social network
TWI514863B (zh) * 2014-04-09 2015-12-21 Gemtek Technology Co Ltd 多媒體資訊處理方法、多媒體裝置與多媒體網路系統
EP3155542A4 (en) * 2014-06-11 2017-10-18 Hewlett-Packard Development Company, L.P. Functional summarization of non-textual content based on a meta-algorithmic pattern
EP2960812A1 (en) * 2014-06-27 2015-12-30 Thomson Licensing Method and apparatus for creating a summary video
US10552684B2 (en) * 2014-07-11 2020-02-04 Iomniscient Pty Ltd Image management system
US11281716B2 (en) * 2014-07-29 2022-03-22 DISH Technologies L.L.C. Apparatus, systems and methods for media content searching
WO2016189348A1 (en) * 2015-05-22 2016-12-01 Playsight Interactive Ltd. Crowd-sourced video generation
CN105187936B (zh) * 2015-06-15 2018-08-21 福建星网视易信息系统有限公司 基于演唱音频评分的多媒体文件播放方法和装置
US10090020B1 (en) * 2015-06-30 2018-10-02 Amazon Technologies, Inc. Content summarization
KR101656245B1 (ko) * 2015-09-09 2016-09-09 주식회사 위버플 문장 추출 방법 및 시스템
US20170076752A1 (en) * 2015-09-10 2017-03-16 Laura Steward System and method for automatic media compilation
US10032208B2 (en) * 2015-12-15 2018-07-24 International Business Machines Corporation Identifying recommended electronic books with detailed comparisons
US10136185B2 (en) 2016-10-25 2018-11-20 Alphonso Inc. System and method for detecting unknown TV commercials from a live TV stream
US10108718B2 (en) * 2016-11-02 2018-10-23 Alphonso Inc. System and method for detecting repeating content, including commercials, in a video data stream
US10909378B2 (en) * 2017-11-07 2021-02-02 Comcast Cable Communications, Llc Processing content based on natural language queries
US10813169B2 (en) 2018-03-22 2020-10-20 GoTenna, Inc. Mesh network deployment kit
US10346474B1 (en) 2018-03-30 2019-07-09 Alphonso Inc. System and method for detecting repeating content, including commercials, in a video data stream using audio-based and video-based automated content recognition
EP3550834A1 (en) * 2018-04-06 2019-10-09 Comcast Cable Communications LLC Encoding of video cross-fades using weighted inter-prediction
US10860797B2 (en) * 2018-06-13 2020-12-08 Cisco Technology, Inc. Generating summaries and insights from meeting recordings
US10638180B1 (en) * 2018-07-20 2020-04-28 Amazon Technologies, Inc. Media timeline management
US11574476B2 (en) * 2018-11-11 2023-02-07 Netspark Ltd. On-line video filtering
IL279336B2 (en) 2018-11-11 2024-08-01 Netspark Ltd On-line video filtering
US11151191B2 (en) * 2019-04-09 2021-10-19 International Business Machines Corporation Video content segmentation and search
US11019402B2 (en) * 2019-09-26 2021-05-25 Dish Network L.L.C. Method and system for implementing an elastic cloud-based voice search utilized by set-top box (STB) clients
WO2021171099A2 (en) * 2020-02-28 2021-09-02 Lomotif Private Limited Method for atomically tracking and storing video segments in multi-segment audio-video compositions
US20240394305A1 (en) * 2021-09-19 2024-11-28 Glossai Ltd. Systems and methods for indexing media content using dynamic domain-specific corpus and model generation
CN115620722B (zh) * 2022-12-15 2023-03-31 广州小鹏汽车科技有限公司 语音交互方法、服务器及计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030212666A1 (en) * 2002-05-10 2003-11-13 Sankar Basu Adaptive probabilistic query expansion
US20060047701A1 (en) * 2004-08-30 2006-03-02 The Mitre Corporation Personalized broadcast news navigator
US20090077137A1 (en) * 2006-05-05 2009-03-19 Koninklijke Philips Electronics N.V. Method of updating a video summary by user relevance feedback

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPP340798A0 (en) 1998-05-07 1998-05-28 Canon Kabushiki Kaisha Automated video interpretation system
US7028325B1 (en) * 1999-09-13 2006-04-11 Microsoft Corporation Annotating programs for automatic summary generation
WO2002008948A2 (en) 2000-07-24 2002-01-31 Vivcom, Inc. System and method for indexing, searching, identifying, and editing portions of electronic multimedia files
US20030217052A1 (en) * 2000-08-24 2003-11-20 Celebros Ltd. Search engine method and apparatus
US6970860B1 (en) * 2000-10-30 2005-11-29 Microsoft Corporation Semi-automatic annotation of multimedia objects
US7231381B2 (en) 2001-03-13 2007-06-12 Microsoft Corporation Media content search engine incorporating text content and user log mining
US20020159750A1 (en) 2001-04-26 2002-10-31 Koninklijke Philips Electronics N.V. Method for segmenting and indexing TV programs using multi-media cues
US20040199494A1 (en) 2003-04-04 2004-10-07 Nikhil Bhatt Method and apparatus for tagging and locating audio data
US8150824B2 (en) * 2003-12-31 2012-04-03 Google Inc. Systems and methods for direct navigation to specific portion of target document
US7587101B1 (en) 2005-02-28 2009-09-08 Adobe Systems Incorporated Facilitating computer-assisted tagging of object instances in digital images
US7720773B2 (en) 2005-12-29 2010-05-18 Microsoft Corporation Partitioning data elements of a visual display of a tree using weights obtained during the training state and a maximum a posteriori solution for optimum labeling and probability
US7680853B2 (en) 2006-04-10 2010-03-16 Microsoft Corporation Clickable snippets in audio/video search results
WO2010014067A1 (en) 2008-07-31 2010-02-04 Hewlett-Packard Development Company, L.P. Perceptual segmentation of images
US20100088726A1 (en) * 2008-10-08 2010-04-08 Concert Technology Corporation Automatic one-click bookmarks and bookmark headings for user-generated videos
JP5587908B2 (ja) 2008-12-22 2014-09-10 コーニンクレッカ フィリップス エヌ ヴェ データオブジェクトのセグメントに関する関連性フィードバック

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030212666A1 (en) * 2002-05-10 2003-11-13 Sankar Basu Adaptive probabilistic query expansion
US20060047701A1 (en) * 2004-08-30 2006-03-02 The Mitre Corporation Personalized broadcast news navigator
US20090077137A1 (en) * 2006-05-05 2009-03-19 Koninklijke Philips Electronics N.V. Method of updating a video summary by user relevance feedback

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI583191B (zh) * 2013-06-03 2017-05-11 雅虎股份有限公司 相片及視頻搜尋
US9727565B2 (en) 2013-06-03 2017-08-08 Yahoo Holdings, Inc. Photo and video search
US9875512B2 (en) 2013-06-03 2018-01-23 Yahoo Holdings, Inc. Photo and video sharing
CN103957433A (zh) * 2014-03-31 2014-07-30 深圳市同洲电子股份有限公司 一种视频数据的处理方法、相关设备及系统
CN105468603A (zh) * 2014-08-22 2016-04-06 腾讯科技(深圳)有限公司 数据选择方法及装置
CN105468603B (zh) * 2014-08-22 2019-04-02 腾讯科技(深圳)有限公司 数据选择方法及装置
CN106802946A (zh) * 2017-01-12 2017-06-06 合网络技术(北京)有限公司 视频分析方法及装置
CN106802946B (zh) * 2017-01-12 2020-03-27 合一网络技术(北京)有限公司 视频分析方法及装置

Also Published As

Publication number Publication date
US8489600B2 (en) 2013-07-16
WO2011104428A1 (en) 2011-09-01
US20110208722A1 (en) 2011-08-25

Similar Documents

Publication Publication Date Title
US8489600B2 (en) Method and apparatus for segmenting and summarizing media content
US20230325431A1 (en) System And Method For Labeling Objects For Use In Vehicle Movement
CN109155136B (zh) 从视频自动检测和渲染精彩场面的计算机化系统和方法
US8687946B2 (en) Method and apparatus for enriching media with meta-information
US9251532B2 (en) Method and apparatus for providing search capability and targeted advertising for audio, image, and video content over the internet
CN107784059B (zh) 用于搜索和选择图像的方法和系统以及机器可读媒体
US8341185B2 (en) Method and apparatus for context-indexed network resources
CN111279709B (zh) 提供视频推荐
US20100082653A1 (en) Event media search
US20130262467A1 (en) Method and apparatus for providing token-based classification of device information
US11188603B2 (en) Annotation of videos using aggregated user session data
WO2021249249A1 (zh) 内容推荐方法、装置及系统
US20100251094A1 (en) Method and apparatus for providing comments during content rendering
US10390085B2 (en) Video channel categorization schema
CN102939774A (zh) 用于上下文索引的网络资源分段的方法和装置
US9170712B2 (en) Presenting content related to current media consumption
CN104636448A (zh) 一种音乐推荐方法及装置
US20170185690A1 (en) System and method for providing content recommendations based on personalized multimedia content element clusters
CN114329117A (zh) 信息推荐方法、介质、装置和计算设备
US20130110841A1 (en) Method and apparatus for querying media based on media characteristics
US20170270195A1 (en) Providing token-based classification of device information
WO2015000433A1 (zh) 一种多媒体查找方法、终端、服务器及系统
KR102156912B1 (ko) 동영상 내 포함된 음원에 대한 검색 서비스 제공 방법 및 이를 이용하는 서버
JP2008225584A (ja) 物品推薦装置、物品推薦システム、物品推薦方法及び物品推薦プログラム
KR20240089234A (ko) 비디오 콘텐츠의 팟캐스트 에피소드들에 대한 매칭

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20151231

Address after: Espoo, Finland

Applicant after: Technology Co., Ltd. of Nokia

Address before: Espoo, Finland

Applicant before: Nokia Oyj

WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20121031