CN105190618A - 用于自动文件检测的对来自基于文件的媒体的特有信息的获取、恢复和匹配 - Google Patents
用于自动文件检测的对来自基于文件的媒体的特有信息的获取、恢复和匹配 Download PDFInfo
- Publication number
- CN105190618A CN105190618A CN201480020129.7A CN201480020129A CN105190618A CN 105190618 A CN105190618 A CN 105190618A CN 201480020129 A CN201480020129 A CN 201480020129A CN 105190618 A CN105190618 A CN 105190618A
- Authority
- CN
- China
- Prior art keywords
- media
- fingerprints
- media content
- fingerprint
- content portion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
- H04N21/44008—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/48—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/483—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
- H04N21/23418—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4394—Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/442—Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/812—Monomedia components thereof involving advertisement data
Abstract
媒体指纹档案系统根据诸如商业广告的次要媒体内容部分生成媒体指纹并且将来自诸如商业广告的次要媒体内容部分的媒体指纹存档。下游媒体测量系统能够从传入的信号提取/导出查询指纹,并且向媒体指纹档案系统查询指纹中的任一个查询指纹是否与任一存档的指纹匹配。如果匹配,则媒体测量系统能够对导出匹配的查询指纹的特定次要媒体内容部分执行媒体测量。如果不匹配,则媒体测量系统能够对媒体内容部分的媒体特征进行分析,以确定媒体内容部分是否是次要媒体内容部分,并且如果需要则执行媒体测量。媒体测量系统可以向媒体指纹档案系统发送来自所识别的次要媒体内容部分的指纹以存储。
Description
相关申请的交叉引用
本申请要求于2013年4月5日提交的第61/809,001号美国临时专利申请的优先权,其整体通过引用合并到本文中。
技术领域
本发明一般地涉及媒体处理系统,具体地涉及用于自动文件检测的对来自基于文件的媒体的特有信息的获取、恢复和匹配。
背景技术
对于收益,广播网络和运营商的收入依赖于商业广告(commercial)。然而,商业广告由许多不同的单位和个人生产和提供。嵌入非商业性的普通节目素材内的商业广告对于许多观众/听众而言可能具有诸如响度不合理的讨厌的特征。假设广播网络或运营商的节目潜在地有大量的听众,则广播网络或广播运营商可能收到对具有讨厌的特征的商业广告的大量投诉(complaint),其中这些讨厌的特征在节目中。
如法律所要求的为了应对这些投诉并且遵守相关的观众保护规定,广播网络或运营商在监视广播网络或运营商的广播频道或者广播网络或运营商接收或发送/广播的媒体数据比特流中可能需要部署相当数量的人力资源。通过监视收集的信息可以用于响应于投诉或审计来确定这些频道或比特流是否包括具有讨厌的特征的商业广告。即使当广播网络或运营商在监视其节目上花费大量资源时,是否能够有效地识别这些商业广告的问题也还是成问题的。
在本部分中描述的方法是能够被执行的方法,但是不一定是先前已经被构思或执行的方法。因此,除非另有说明,否则不应该假定:在该部分中描述的任何方法仅因其被包括在该部分中而被认为是现有技术。类似地,除非另有说明,否则不应该假定关于一种或更多种方法而识别出的问题在基于该部分的任何现有技术中已经被意识到。
附图说明
在附图的图中以示例性方式而非限制性方式来说明本发明,其中,相同的附图标记指代相同的要素,并且其中:
图1图示了媒体指纹档案系统;
图2图示了媒体测量系统;
图3图示了搜索媒体数据中的次要媒体内容部分以及对媒体数据中的次要媒体内容部分执行测量的示例算法或处理流程;
图4A和图4B图示了示例处理流程;以及
图5图示了可以在其上实现如本文中所描述的计算机或计算设备的示例硬件平台。
具体实施方式
本文中描述了涉及用于自动文件检测的对来自基于文件的媒体的特有信息的获取、恢复和匹配的示例实施方式。在下面的描述中,出于说明的目的,阐述了大量特定细节以提供对本发明的全面理解。然而,明显地,在没有这些特定细节的情况下,仍然可以实践本发明。在其他实例中,并不会无遗漏地详细描述已知的结构和装置,以避免不必要地封闭本发明、使本发明含糊不清或者混淆本发明。
在本文中根据以下概要来描述示例实施方式:
1.总体概述
2.媒体数据和媒体内容部分
3.媒体指纹档案系统
4.媒体测量系统
5.检测次要内容部分的算法
6.示例处理流程
7.实现机构——硬件概述
8.等同、扩展、替代和其他
1.总体概述
本概述提供本发明的实施方式的一些方面的基本描述。应当注意,该概述并不是实施方式的各方面的广泛的或穷尽的概括。此外,应当注意,此概述不意在被理解为识别实施方式的任何特别显著的方面或要素,也并不意在被理解为具体地叙述实施方式的任何范围,也并不意在被理解为一般地叙述本发明。此概述仅以简述和简化的形式提供与示例实施方式有关的一些概念,并且此概述应当仅被理解为下面紧接着的示例实施方式的更详细描述的概念性序言。
在一些实施方式中,如由商业广告整合者(commercialaggregator)、媒体网络、广播公司、大网络运营商等操作的具有指纹引擎或服务器侧指纹导出单元的媒体指纹档案系统对要与下游媒体系统中的媒体数据中的主要媒体内容部分嵌入在一起的次要媒体内容部分进行处理;根据次要媒体内容部分的媒体数据单元生成媒体指纹;并且将媒体指纹存储在指纹档案库中。
如本文中所用,指纹档案库可以是在线的基于云的数据库、专有数据库等。“媒体数据单元”可以包括持续某时间单位的媒体样本数据。媒体数据单元的示例可以是32毫秒、64毫秒等的时间单位的多个连续的媒体样本或帧。“次要媒体内容部分”可以是各种类型的媒体中的商业广告、促销广告(promotionaladvertisement)等。“主要媒体内容部分”可以是各种类型的媒体中的节目、表演、比赛广播、音乐会、电影等。“媒体数据”可以包括例如在分配的广告时间间隙中嵌入有次要媒体内容部分的主要媒体内容部分。媒体的示例包括但不限于:纯音频、纯视频、音频视频、媒体文件、媒体比特流等。除了媒体指纹以外,包括但不限于除了媒体指纹,针对相应次要媒体内容部分顺序分配的标识符,针对相应次要媒体内容部分的特有字母数字标记等以外的其他特有标识符的其他信息也可以被存储、被存档并且可以使用指纹档案库中的媒体指纹使这些其他信息可访问。
媒体指纹档案系统可以被配置成支持一个或多个(下游)媒体测量系统。在一些实施方式中,指纹引擎或下游媒体测量系统的客户端侧指纹导出单元能够实时地、近实时地、离线地、非实时地等从传入的信号、比特流、文件等提取/导出/生成媒体指纹。
在示例实施方式中,如由网络运营商或网站等操作的媒体测量系统对要被广播、下载或以其他方式分发给观众/听众的媒体数据进行处理;从媒体数据的媒体数据单元生成查询指纹;将指纹识别查询发送至媒体指纹档案系统;以及从媒体指纹档案系统接收指纹识别响应,以确定查询指纹中的任一查询指纹是否与媒体数据中的次要媒体内容部分相对应。
响应于指示存在特定的次要媒体内容部分的肯定指纹识别响应,针对特定次要媒体内容部分能够执行包括但不限于响度测量等的一组媒体测量。
如果未容易地发现查询指纹和存档的指纹之间的指纹匹配,则能够对媒体数据内的媒体特征和其他识别信息进行分析。例如,下游媒体测量系统能够对媒体数据中的日期(timeofday)、持续时间、场景变换的频率、面部识别、图/表(figure/form)识别、语音存在、音乐存在、音频瞬态的识别、视觉频谱内容、音频频谱内容、视频效果、备忘录(tickler)、预先存在的次要节目标识符、网络水印、等级水印、加字幕的/嵌入的文本、掌声、节目和场景变换、响度等进行分析。能够使用分类器或分类算法并使用基于这样的分类器的存在或出现的加权来确定特定媒体内容部分或媒体数据单元是否为次要媒体内容部分。出于本发明的目的,应当注意,除了那些本文中列举的以外,分类器或分类算法可以使用其他媒体特征来确定媒体内容类型。能够对大量“次要媒体内容”(例如,训练数据、标记数据等)的分析进行分析,以确定应该使用什么样的分类器或者应该为它们相应的分类器分配什么权重值,以便对媒体内容类型进行分类。另外,能够对多个分类器进行组合以增强它们对媒体内容类型进行正确分类的实力。例如,能够在组合的分类器中将面部识别与语音的存在进行组合,以识别画外音(voice-over)(例如,在屏幕上没有一个人的语音等),画外音可以用作确定特定内容部分是否为次要媒体内容部分的因素。
在一些实施方式中,如果媒体内容部分被确定为次要媒体内容部分(例如,商业广告等),则次要媒体内容部分的(例如,多音频频道)音量水平或响度设置可以被确定、被加标签或者甚至被调整成符合法律和/或商业要求。如果确定媒体内容部分不是次要媒体内容部分(例如,不是商业广告等),则媒体内容部分可以保持例如如由电影制作人、广播公司、媒体艺术家等期望的原始音量水平或响度设置。
在一些实施方式中,媒体指纹档案系统和媒体测量系统可以被部署在同一地理位置处。在一些其他实施方式中,媒体指纹档案系统和媒体测量系统可以被部署在不同的地理位置处。这些系统可以通过网络云进行通信或者访问媒体指纹识别服务。在示例实施方式中,媒体测量系统可以位于运营商设施处,而支持在线访问并且向媒体测量系统提供在线指纹识别服务的媒体指纹档案系统可以位于商业广告整合设施处。
作为一个可能的非限制性应用,如由降低商业广告响度(CALM)法案要求的,如本文中描述的技术能够用于对媒体节目进行抽查。能够使用这些技术对媒体网络或在具有大量(例如,50兆,200兆等)任一时长的潜在商业广告的运营商的所有频道上的运营商的媒体节目执行抽查。
代替对数小时的、包括混合有商业广告内容的大量主要节目素材的节目安排进行捕获,人工地监视/识别节目安排中的广告内容时段,以及如在其他方法中对具有显著用户介入/牵连的商业广告内容进行测量,如本文中描述的技术提供对媒体网络或运营商的媒体节目中的广告内容的自动且可靠的检测、测量和控制,而无需携带识别次要媒体内容部分的带内数据。尽管如本文中描述的技术能够在存在带内数据的情况下工作,但是通常携带这样的带内数据能够给编码的媒体信号增加比特开销要求。另外,可以容易地使用这样的带内数据来识别商业广告,从而方便了于在家庭观看环境中绕过那些商业广告的商业广告绕过技术(这对内容提供者来说是糟糕的)。
如本文中描述的技术可以被部署在广泛的媒体系统中:从很大的媒体网络/媒体运营商/媒体站的媒体系统到本地有线网络中的前端的媒体系统或者到小的停播的广播电台的媒体系统。如本文中描述的媒体测量系统可以被设置为专用系统或除了媒体测量以外还具有其他功能或具有在一个或多个计算设备上运行的媒体测量应用程序的媒体系统中包括的模块。技术可以被实现和/或发布为软件、硬件、固件或前述中的两个或更多个的组合。还能够为第三方系统提供者提供工具包(例如,系统开发工具包或SDK等),以在他们相应的系统中实现如本文中描述的技术。
在一些实施方式中,如本文中描述的机构形成媒体处理系统的一部分,包括但不限于:整合系统、分发系统、接收系统、广播网络系统、广播站系统、广播运营商系统、有线广播系统、卫星广播系统、无线(over-the-air)广播系统、有线分发系统、卫星分发系统、无线收发器系统、有线接收系统、卫星接收系统、无线接收系统、前端、台式计算机、计算机工作站、各种其他类型的设备和媒体处理模块等。
对于本领域的技术人员而言,对本文中描述的优选实施方式和一般原理以及特征的各种修改会很明显。因此,本公开内容并不意在受限于所示的实施方式,而是要符合与本文中描述的原理和特征一致的最宽的范围。2.媒体数据和媒体内容部分
如本文中描述的媒体数据包括表示媒体内容部分的媒体样本数据(例如,包括媒体内容的PCM音频样本、视频帧或音频帧等)。在本文中,可以参考包括静止图像、视频媒体和/或音频媒体的一个或多个示例媒体来描述媒体内容部分。为了简化和简明统一,在本描述中可以进行对示例媒体的选择,但是除非清楚地声明了相反内容,否则不应该被解读为将实施方式限制于特定媒体,原因是:本发明的实施方式非常适合于与静止图像、音频媒体或视频媒体发生作用。此外,本发明的实施方式非常适于与对应于音频媒体和/或视频媒体图像发生作用,音频媒体和/或视频媒体可以表示两个或三个空间维度。
在一些实施方式中,媒体数据包括由普通节目素材(例如,流行电视节目、新闻节目、现场比赛广播、非商业广告等)表示的一个或多个主要媒体内容部分,其中主要媒体内容部分嵌入有由商业广告(commercialadvertisement)(或简化为“商业广告”(“commercials”))表示的一个或多个次要媒体内容部分。包括主要媒体内容部分和次要媒体内容部分的媒体数据可以以一个或多个媒体信号、一个或多个媒体频道或从媒体数据提供者系统到下游系统的媒体比特流的形式被广播、分发、下载等。例如,在支付的交易中,媒体数据提供者系统可以在主要媒体内容部分中的商业广告停顿内将次要媒体内容部分(例如,商业广告等)插入或放置在主要媒体内容部分(例如,普通节目素材等)中。在一些实施方式中,媒体数据还包括与媒体样本数据(例如,包括媒体内容的PCM音频样本、视频帧或音频帧等)分开的媒体元数据(例如,隐藏式字幕数据(closedcaptiondata)等),该媒体样本数据表示主要和次要媒体内容部分。在一些实施方式中,如本文中描述的媒体数据中的媒体元数据可以携带以下信息,该信息可以连同媒体数据中的媒体样本数据一起被分析以便对媒体内容进行分类;然而,在一些实施方式中,媒体元数据不包括肯定地识别任一嵌入的次要媒体内容部分的内容类型标记、位、属性等。因此,接收设备不能使用这样的内容类型标记、二进制位、属性等,以在广播操作、回放操作或分发操作中跳过或替换次要媒体内容部分。
提供或分发如本文中描述的媒体数据的媒体数据提供者系统和接收媒体数据的下游系统的示例包括但不限于仅下列项中的任一项:广播网络系统、广播站系统、广播运营商系统、有线广播系统、卫星广播系统、无线广播系统、有线分发系统、卫星分发系统、无线收发器系统、有线接收系统、卫星接收系统、无线接收系统、前端等。
3.媒体指纹档案系统
图1示出了根据一个或多个实施方式的媒体指纹档案系统(100)。如图1中所示,系统(100)包括服务器侧指纹导出单元(108)、指纹存储单元(110)、指纹搜索单元(112)和数据仓库(114),数据仓库(114)是要在媒体数据中与主要媒体内容部分嵌入在一起的次要媒体内容部分的媒体指纹档案库。
下面描述这些部件中的每个部件,这些部件中的每个部件可以位于同一设备(例如,服务器、大型主机(mainframe)、机顶盒、计算机、客户端系统等)上或者可以位于通过具有有线部分和/或无线部分的网络(例如,因特网、内联网、外联网、局域网(LAN)、广域网(WAN)等)耦接的分开的设备上。在一个或多个实施方式中,使用客户端-服务器拓扑来实现系统100。系统(100)自身可以是在一个或多个服务器上运行的企业应用,而在一些实施方式中系统(100)自身可以是对等系统,或者驻留在单个计算系统上。另外,使用一个或多个接口、门户网站或访问系统100的任何其他工具来从其他机器能够访问系统(100)。在一个或多个实施方式中,通过诸如因特网的网络连接能够访问系统(100)。还可以存储由系统(100)提供的信息和/或服务以及通过网络连接访问由系统(100)提供的信息和/或服务。
在实施方式中,服务器侧指纹导出单元108与被配置成接收次要媒体内容部分102并且从要被嵌入到媒体数据中的一个或多个主要媒体内容部分内的次要媒体内容部分导出(例如,提取、生成、确定、计算等)一个或多个媒体指纹(本文中的“指纹”与“签名”能够交换使用)的软件和/或硬件相对应。
媒体指纹可以与在数据仓库(114)中已经存档的指纹或者要被存储在数据仓库(114)中的指纹、在数据仓库(114)中要被搜索的查询指纹等相对应。媒体指纹的示例包括但不限于:视频指纹、音频指纹等。视频指纹可以从图像或视频剪辑(其是媒体内容部分)的帧导出。在一些实施方式中,视频指纹包括视频内容的低比特率呈现,从该视频内容导出视频指纹,视频指纹与视频内容唯一对应,并且能够根据视频内容的特征分量计算视频指纹,视频指纹与视频内容的特征分量相对应;特征分量包括亮度、色度或视频内容的运动描述符中的一个或多个。音频指纹可以从媒体内容部分中的音频数据或从媒体内容部分中的具有嵌入的音频信息(例如,光谱图等)的图像导出。在一些实施方式中,能够根据特定音频波形生成作为与特定的音频波形唯一对应的编码的音频指纹。媒体指纹不是逻辑上分配的诸如序号的独特标识符而是内容相关的,并且是基于媒体数据单元中的特定媒体内容而被导出的。在一些实施方式中,基于同一指纹导出算法,不同系统可以从媒体数据单元的媒体内容独立地获得在媒体数据的不同流中存在的媒体数据单元的同一媒体指纹。在一些实施方式中,基于同一指纹导出算法,不同系统可以从媒体数据单元的媒体内容独立地获得在媒体数据的不同流中存在的媒体数据单元的基本相同的媒体指纹(例如,其中,媒体指纹的一小部分是不同的,大量最显著二进制位匹配,仅几个最不显著二进制位不匹配等)。
服务器侧指纹导出单元108可以被配置成:(例如,通过使用具有变化的鲁棒性等级或对改化的敏感性的等级的指纹导出技术)从次要媒体内容部分(102)中的单个次要媒体内容部分导出多个指纹。此外,服务器侧指纹导出单元108还可以被配置成:分开地导出次要媒体内容部分(102)中的次要媒体内容部分的不同的分量的指纹。例如,可以使用多路信号分离器将次要媒体内容部分中的音频/视频数据分成分开的分量(例如,音频分量和视频分量等),并且可以针对次要媒体内容分量的每个分量分开地导出指纹。
在实施方式中,指纹存储单元(110)与被配置成从一个或多个指纹源接收从次要媒体内容部分导出的媒体指纹并且将媒体指纹存储在数据仓库(114)中的软件和/或硬件相对应。在示例中,指纹存储单元(110)能够从服务器侧指纹导出单元(108)接收从次要媒体内容部分(102)导出的媒体指纹。在另一示例中,指纹存储单元(110)能够从除了服务器侧指纹导出单元(108)以外的不同指纹源接收从次要媒体内容部分导出的媒体指纹。在一些实施方式中,系统(100)的客户端(例如,图2的200等)能够检测其指纹先前尚未在数据仓库(114)中被存档的次要媒体内容部分。客户端能够向系统(100)或系统100中的服务器侧指纹导出单元(108)提供检测到的次要媒体内容部分;或者,导出所检测到的次要媒体内容部分的媒体指纹(104)并且向系统(100)或指纹存储装置(110)提交导出的媒体指纹(104),以在数据仓库(114)中存档。大量其他实现(例如,数据结构、关系表、查找表、哈希表等)可以用于在数据仓库(114)中组织指纹和/或存储指纹。
在实施方式中,指纹搜索单元(112)与下述软件和/或硬件相对应,所述软件和/或硬件被配置成:基于查询指纹(106)从系统(100)的客户端接收一个或多个指纹识别查询中的一个或多个查询指纹(106)并且对从次要媒体内容部分导出并且在数据仓库(114)中被存档的存档的指纹进行搜索。例如,指纹搜索单元(112)可以查找数据仓库(114)中的存档的指纹和/或将存档的指纹与查询指纹(106)中的每个查询指纹进行比较,以识别查询指纹是否与存档的指纹匹配。响应于查询指纹与存档的指纹匹配(例如,找到完全匹配,找到下述近似匹配:查询指纹和匹配的存档的指纹的一小部分不同,找到下述近似匹配:大量最显著的二进制位匹配,找到下述近似匹配:仅几个最显著的二进制位不匹配等)的识别,可以由指纹搜索单元(112)向发送具有查询指纹的指纹识别查询的客户端发送查询指纹的肯定指纹识别响应。响应于查询指纹与任一存档的指纹不匹配(例如,没有完全匹配,没有找到近似匹配(查询指纹和进行匹配的存档指纹的一小部分不同),没有找到近似匹配(大量最显著的二进制位匹配),没有找到近似匹配(仅几个最不显著的二进制位不匹配等))的识别,可以由指纹搜索单元(112)向发送具有查询指纹的指纹识别查询的客户端发送查询指纹的否定指纹识别响应。在一些实施方式中,除了查询指纹以外,指纹识别查询可以包括附加查询信息,附加查询信息包括但不限于从其获得查询指纹的媒体数据的识别信息等。在一些实施方式中,除了响应是肯定的还是否定的的指示以外,指纹识别响应可以包括附加响应信息,附加响应信息包括但不限于从其导出匹配的存档的指纹的次要媒体内容部分的识别信息。
在本发明的一个或多个实施方式中,数据仓库(114)与任一数据存储设备(例如,客户端机器上的本地存储器、通过因特网连接的多个服务器、局域网内的系统、移动设备上的存储器等)或数据库相对应,可以在该数据存储设备或数据库中存储和/或基于从媒体指纹档案系统(100)的客户端接收的查询指纹来查询从次要媒体内容部分导出的媒体内容指纹。在本发明的一个或多个实施方式中,对数据仓库(114)的访问可以是受限制的和/或安全的。这样,对数据仓库(114)的访问可以要求使用密码、秘密问题、个人识别号码(PIN)、生物特征识别和/或任何其他认证机制的认证。在数据仓库(114)中存储的要素或各种数据部分可以被分发并且被存储在多个数据仓库(例如,世界各地的服务器等)中。在本发明的一个或多个实施方式中,数据仓库(114)包括平的、层次的、基于网络的、关系的、维度的、对象建模的或以其他方式结构化的数据文件。例如,数据仓库(114)可以被保持为SQL数据库的表。另外,可以对照其他数据仓库中存储的数据验证数据仓库(114)中的数据。
4.媒体测量系统
图2示出了根据一个或多个实施方式的媒体测量系统(200)。如图1中所示,系统(200)包括客户端侧指纹导出单元(208)、媒体内容确定单元(210)、指纹查询单元(212)和媒体测量单元(214)。
下面描述这些部件中的每个部件,这些部件中的每个部件可以位于同一设备(例如,服务器、大写的主机、机顶盒、计算机、客户端系统等)上或者可以位于由具有有线部分和/或无线部分的网络(例如,因特网、内联网、外联网、LAN、WAN等)耦接的分开的设备上。在一个或多个实施方式中,使用客户端-服务器拓扑实现系统200。系统(200)自身可以是在一个或多个服务器上运行的企业应用,在一些实施方式中能够是对等系统或驻留在单个计算系统上。另外,使用一个或多个接口、门户网站或访问系统200的任何其他工具来从其他机器能够访问系统(200)。在一个或多个实施方式中,通过诸如因特网的网络连接能够访问系统(200)。还可以通过网络连接存储并访问由系统(200)提供的信息和/或服务。
在实施方式中,客户端侧指纹导出单元208与被配置成接收媒体数据202并且从包括嵌入有次要媒体内容部分的主要媒体内容部分的媒体数据(202)导出(例如,提取、生成、确定、计算等)一个或多个媒体查询指纹(或者简称“查询指纹”)的软件和/或硬件相对应。
由客户端侧指纹导出单元(208)生成的查询指纹能够被发送至媒体指纹档案系统(例如,图1的100)并且在数据库(114)中被搜索。从次要媒体内容部分或主要媒体内容部分可以导出查询指纹。客户端侧导出单元108可以被配置成:从媒体数据(202)中的单个媒体内容部分导出多个指纹(例如,通过使用具有对改变的鲁棒性或敏感度的变化的等级的指纹导出技术)。此外,客户端侧指纹导出单元208还可以配置成:分开地导出媒体数据(202)中的媒体内容部分的不同分量的指纹。例如,可以使用多路信号分离器将媒体数据(202)中的音频/视频数据分成分开的分量(例如,音频分量和视频分量),并且可以分开地导出媒体数据(202)的每个分量的查询指纹。
在实施方式中,指纹查询单元(212)与下述软件和/或硬件相对应,该软件和/或硬件配置成:向媒体指纹档案系统(例如,图1的100等)发送具有一个或多个查询指纹(例如,图1的106等)的一个或多个指纹识别查询(206)并且从媒体指纹档案系统(100)接收对一个或多个指纹识别查询(206)的一个或多个指纹识别响应。
在实施方式中,指纹内容确定单元(210)与下述软件和/或硬件相对应,该软件和/或硬件被配置成:对媒体数据(202)中的媒体数据单元进行分析,以识别媒体数据单元的媒体特征,并且基于所识别的媒体数据单元的媒体特征确定媒体数据单元是否与媒体数据(202)内嵌入的次要媒体内容部分相对应。在一些实施方式中,指纹内容确定单元(210)被配置成:响应于接收关于从媒体数据单元提取的或导出的查询指纹的否定指纹识别响应的指纹查询单元(212),确定媒体数据单元是否与媒体数据(202)内嵌入的次要媒体内容部分相对应。在一些实施方式中,指纹内容确定单元(210)被配置成:不管指纹查询单元(212)是否接收关于从媒体数据单元提取的或导出的查询指纹的否定指纹识别响应,都确定媒体数据单元是否与媒体数据(202)内嵌入的次要媒体内容部分相对应。在一些实施方式中,媒体指纹测量系统(200)被配置成:使用指纹查询单元(212)和指纹内容确定单元(210)中的一个或两者来确定媒体数据单元是否与媒体数据(202)内嵌入的次要媒体内容部分相对应。
通常,媒体指纹表示可以使用任一音频/视频分析方法来检测的媒体内容的任一特征。媒体特征可以包括可以被检测的媒体内容内的视觉上可感知的特征。可以识别媒体内容的这样的视觉上可感知的特征的示例包括:网络水印、等级水印、加字幕的/嵌入文本、掌声、节目和场景变换、响度等。媒体特征还可以包括诸如地理位置、日期等的可以被检测的媒体内容的其他特征。
在一些实施方式中,媒体内容确定单元(210)还包括下述一个或多个分类器和/或一个或多个分类算法,前述一个或多个分类器和/或一个或多个分类算法被配置成:基于媒体数据单元中识别的媒体特征,对从媒体数据(202)提取的/解码的媒体数据单元进行分类。在实施方式中,分类器或分类算法向不同的媒体特征分配不同的权重因子。假定存在媒体特征,则媒体特征的权重因子可以用媒体数据单元是次要媒体内容部分的一部分的可能性来衡量。在实施方式中,媒体内容确定单元(210)使用多个分类器或分类算法。媒体内容确定单元(210)可以向不同的分类器或分类算法分配不同的权重因子。
在一些实施方式中,从媒体数据单元的训练集识别的媒体特征可以形成一组向量,以确定在预测媒体数据单元的正确的内容类型中分类器是具有高误差率还是低误差率,并且相应地分配权重因子。在一些实施方式中,可以基于从使用“Adaboost”算法的训练集获得的这组向量,创建强大的分类器。此后,可以将强大的分类器应用于媒体数据(202)的每个媒体数据单元,以确定媒体数据单元是与次要媒体内容部分相对应还是与主要媒体内容部分相对应,和/或以确定媒体数据单元与新的次要媒体内容部分相对应还是与现有次要媒体内容部分相对应。在实施方式中,作为分类器或分类算法的一部分或者除了分类器或分类算法以外的部分,媒体内容确定单元(210)还基于(时间相关的)所识别的媒体特征使用算法以检测媒体数据(202)中的场景变化。
在一些实施方式中,媒体内容确定单元(210)还包括被配置成向媒体指纹档案系统(例如,图1的100等)提供所检测的次要媒体内容部分的一个或多个分类器和/或一个或多个分类算法;或者替代地,导出所检测的次要媒体内容部分的媒体指纹并且向媒体指纹档案系统(例如,图1的100等)提交所导出的媒体指纹(例如,图1的104等),以在指纹档案库(例如,图1的数据仓库114等)中存档。包括诸如响度等的特征的次要媒体内容部分的附加信息可以被提供至媒体指纹档案系统。
在示例中,媒体测量单元(214)与被配置成在媒体数据(202)中的次要媒体内容部分上执行一个或多个测量的软件和/或硬件相对应。在一些实施方式中,媒体测量单元(214)还被配置成:输出在媒体数据(202)中的次要媒体内容部分上执行的测量,使得用于测量的数据或媒体测量数据(204)能够被存储,例如持久地被存储在媒体测量数据仓库(未示出)中。用于在次要媒体内容部分(或者简称“媒体测量数据”)上执行的测量的数据包括但不限于以下项中的任一项:一个或多个响度、长度、次要媒体内容部分的标识符、日期、频道、网络地址等。在一些实施方式中,媒体测量数据可以被存储在与媒体测量系统(210)一起搭配的媒体测量数据仓库处。在一些实施方式中,媒体测量数据可以被存储在远离媒体测量系统(210)的媒体测量数据仓库处。在一些实施方式中,媒体测量数据可以被存储在与媒体指纹档案系统(例如,图1的100等)一起搭配的媒体测量数据仓库处。一个或多个秘钥可以被生成和/或连同媒体测量数据一起被存储,以允许基于一个或多个秘钥的给定值对媒体测量数据进行快速地读访问和/或写访问。
5.检测次要内容部分的算法
图3图示了搜索媒体数据中的次要媒体内容部分并对媒体数据中的次要媒体内容部分执行测量的示例算法或处理流程。在一些示例实施方式中,一个或多个计算设备或部件可以执行该处理流程。
执行示例算法的媒体测量系统(例如,图2的200等)可以实时地、非实时地或者部分实时地且部分非实时地接收和/或处理媒体数据(例如,图2的200等)。在一些实施方式中,媒体测量系统(200)被配置成逻辑上将媒体数据(202)划分成媒体数据单元的序列。在以实时广播方式接收媒体数据(202)的一些实施方式中,媒体测量系统(200)被配置成以与在媒体数据(202)中接收这些数据单元的顺序相同的顺序处理媒体数据单元。在通过媒体缓冲器等以非实时媒体信号、媒体数据比特流、媒体文件方式接收媒体数据(202)的一些实施方式中,媒体测量系统能够被配置成:以与接收这些媒体数据单元的顺序相同或不同的顺序对媒体数据(202)中的媒体数据单元进行处理。
在块302中,仅出于说明的目的,媒体测量系统(200)从媒体数据(202)中的媒体数据单元的序列中的媒体数据单元导出查询指纹。在一些实施方式中,可以从同一媒体数据单元导出多个查询指纹而不是仅一个查询指纹。媒体测量系统(200)向媒体指纹档案系统(例如,图1的100等)发送具有所导出的查询指纹的指纹识别查询,以确定查询指纹与媒体指纹档案系统(100)中的次要媒体内容部分的任一存档的指纹是否匹配。
在块304中,媒体测量系统(200)接收例如由媒体指纹档案系统(100)发送的对指纹识别查询的指纹识别响应。
在块306中,媒体测量系统(200)确定指纹识别响应是指示发现查询指纹和存档的指纹之间匹配的肯定指纹识别响应还是指示没有这样的匹配的否定指纹识别响应。
响应于接收肯定指纹识别响应,处理流程进行至块308,在块308中,媒体测量系统(200)进一步确定从其导出查询指纹的媒体数据单元是否表示媒体数据(202)中的新的次要媒体内容部分。媒体数据单元可以表示新的次要媒体内容部分的媒体样本数据的一部分,该新的次要媒体内容部分在主要媒体内容部分或不同次要媒体内容部分之后。替代地,媒体数据单元可以表示现有次要媒体内容部分的媒体样本数据的一部分,其中为该现有次要媒体内容部分正在执行现有的一组媒体测量。
在一些实施方式中,来自媒体指纹档案系统(100)的肯定指纹识别响应可以包括次要媒体内容部分的独特标识符,从所述标识符导出与查询指纹匹配的存档的指纹并且将所述标识符存档。媒体测量系统(200)能够对在来自媒体指纹档案系统(100)的肯定指纹识别响应中接收的独特标识符进行跟踪,并且至少部分地基于(当前)肯定指纹识别响应中的独特标识符来确定从其导出查询指纹的媒体数据单元是否是新的次要媒体内容部分(的开始),或者媒体数据单元是否是新的次要媒体内容部分(的开始)。
在一些实施方式中,媒体测量系统(200)可以对媒体数据(202)中的媒体数据单元进行分析,以识别媒体数据单元的媒体特征,并且基于所识别的媒体数据单元的媒体特征来确定媒体数据单元是否与媒体数据(202)内嵌入的新的次要媒体内容部分相对应。
响应于确定媒体数据单元是新的次要媒体内容部分(的开始),处理流程进行至块310,在块310中,媒体测量系统(200)针对新的次要媒体内容部分开始新的一组媒体测量。
另一方面,响应于确定媒体数据单元不是新的次要媒体内容部分而是针对其已经开始了现有一组媒体测量的现有媒体内容部分(的开始),在块312中,媒体测量系统(200)继续针对现有媒体内容部分的现有一组媒体测量。随后,处理流程从块310或块312进行至块314。
响应于接收否定指纹识别响应,如在块306中确定的,处理流程进行至块316,在块316中,媒体测量系统(200)识别媒体数据单元的媒体特征。随后,在块318中,媒体测量系统(200)至少部分地基于在块316中识别的媒体数据单元的媒体特征来确定媒体数据单元是否与媒体数据(202)内嵌入的次要媒体内容部分相对应。
响应于在块318中确定媒体数据单元与次要媒体内容部分相对应,处理流程进行至块308,在块308中,媒体测量系统(200)进一步确定媒体数据单元是否表示媒体数据(202)中的新的次要媒体内容部分。
如先前所所注意到的,在一些实施方式中,媒体测量系统(200)能够对媒体数据(202)中的媒体数据单元进行分析,以识别媒体数据单元的媒体特征,并且基于所识别的媒体数据单元的媒体特征来确定媒体数据单元是否与媒体数据(202)内嵌入的新的次要媒体内容部分相对应。在一些实施方式中,如果可以获得并且适用,则可以在块308中使用块316中识别的一些或所有特征,来确定媒体数据单元是否表示媒体数据(202)中的新的次要媒体内容部分。
响应于在块318中确定媒体数据单元不与次要媒体内容部分相对应,处理流程进行至块320。例如,媒体数据单元可以与主要媒体内容部分(例如,不是商业广告等)相对应。在块320中,媒体测量系统(200)不执行从其导出查询指纹的媒体数据单元的媒体测量。随后,处理流程进行至块314。
在块314中,媒体测量系统(200)确定媒体数据单元是否表示媒体数据(202)中的最后一个媒体数据。如果是,则处理流程结束。否则,处理流程进行至块302以继续对媒体数据(202)中的随后的媒体数据单元进行处理。
6.示例处理流程
图4A和图4B图示了示例处理流程。在一些实施方式中,一个或多个计算设备或单元可以执行处理流程。
在图4A的块402中,媒体测量系统(例如,图2的200等)从包括嵌入有一个或多个次要媒体内容部分的一个或多个主要媒体内容部分的媒体数据提取多个查询指纹。
在块404中,媒体测量系统(200)向媒体指纹档案系统发送多个指纹识别查询。多个指纹识别查询的中每个指纹识别查询包括多个查询指纹中的至少一个查询指纹。
在块406中,媒体测量系统(200)从媒体指纹档案系统接收多个指纹识别响应。多个指纹识别响应中的每个指纹识别响应是对多个指纹识别查询中的相应的指纹查询的响应,并且指示肯定指纹识别或否定指纹识别。
在块408中,媒体测量系统(200)响应于从媒体指纹档案系统接收多个指纹识别响应中的至少一个肯定指纹识别响应:对一个或多个主要媒体内容部分内嵌入的一个或多个次要媒体内容部分的第一次要媒体内容部分进行识别;并且对一个或多个主要媒体内容部分内嵌入的一个或多个次要媒体内容部分的第一次要媒体内容部分执行第一组媒体测量。
在实施方式中,媒体测量系统(200)还被配置成:响应于从媒体指纹档案系统接收多个指纹识别响应中的至少一个否定识别响应,确定媒体数据中的媒体数据部分是否包括一个或多个特定特征;并且响应于确定媒体数据中的媒体数据部分包括一个或多个特定特征,(a)将媒体数据部分识别为一个或多个主要媒体内容部分内嵌入的一个或多个次要媒体内容部分中的次要媒体内容部分,并且(b)对一个或多个主要媒体内容部分内嵌入的一个或多个次要媒体内容部分中的次要媒体内容部分执行第二组媒体测量。
在实施方式中,媒体测量系统(200)还被配置成:响应于确定媒体数据中的媒体数据部分包括一个或多个特定特征,对次要媒体内容部分的至少一个媒体特征进行控制。在其他方法下,“实时”响度控制设备(例如由广播公司使用的那些响度控制设备)不能对商业广告和伴随的节目进行区分,并且通常对商业广告和伴随的节目两者使用相同的配置(例如,积极性、操作参数)。与之相比,在如本文中描述的技术下,实时响度控制器可以被配置成使用指纹识别系统来实时地或近实时地区分商业广告和节目,然后:(a)针对每个内容类型对它们自身不同地重新配置(例如,对广告使用积极的响度控制,对节目使用轻微的响度控制等);和/或(b)对伴随的节目完全切断响度控制,同时仍然纠正商业广告。
在实施方式中,如上面提到的至少一个媒体特征包括响度。
在实施方式中,一个或多个特定特征包括日期、持续时间、场景改变的频率、面部识别、图/表识别、语音存在、音乐存在、音频瞬态的识别、视觉频谱内容、音频频谱内容、视频效果、备忘录、预先存在的次要节目标识符、网络水印、等级水印、加字幕的/嵌入文本、掌声、节目的场景变换、响度等中的至少一个。
在实施方式中,媒体测量系统(200)还被配置成:向媒体指纹档案库发送从次要媒体内容部分识别的一个或多个特定特征和从次要媒体内容部分导出的一个或多个指纹以存储。
在实施方式中,多个媒体指纹包括一个或多个(a)视频指纹,每个视频指纹从图像或帧导出,每个媒体指纹包括视频内容的低比特率呈现,从该视频内容导出该低比特率呈现,并且低比特率呈现与视频内容唯一对应,并且每个视频指纹是根据与该视频内容对应的视频内容的特征分量计算的,或者(b)音频指纹,每个音频指纹是作为与特定音频波形唯一对应的编码而根据特定音频波形生成。
在实施方式中,媒体数据包括以下中的一个或多个纯音频内容、纯视频内容、音频内容和视频内容两者。
在实施方式中,以无线广播信号、有线广播信号、卫星广播信号、媒体数据比特流或媒体数据文件中的一种方式来接收媒体数据。
在图4B的块452中,媒体指纹档案系统(例如,图1的100等)保持要主要媒体内容部分内嵌入在一起的次要媒体内容部分的媒体指纹档案。
在块454中,媒体指纹档案系统(100)从客户端接收具有从包括主要媒体内容部分和次要媒体内容部分两者的媒体数据导出的查询指纹的指纹识别查询。
在块456中,媒体指纹档案系统(100)响应于接收具有查询指纹的指纹识别查询,确定查询指纹是否与媒体指纹档案库中存档的任一指纹是否匹配。
在块458中,媒体指纹档案系统(100)响应于确定查询指纹与媒体指纹档案中存档的指纹匹配,返回对指纹识别查询的肯定指纹识别响应,其中,从伴随的次要媒体内容部分导出媒体指纹档案库中存档的指纹。
在实施方式中,媒体指纹档案系统(100)还被配置成:响应于确定查询指纹与媒体指纹档案中存档的任一指纹不匹配,返回对指纹识别查询的否定指纹识别响应。
在实施方式中,媒体指纹档案系统(100)还被配置成:接收带有一个或多个媒体指纹的媒体指纹存储请求,其中,一个或多个媒体指纹是为次要媒体内容生成的,该次要媒体内容的指纹先前未被存档;并且将媒体指纹存储在媒体指纹档案库中。
在实施方式中,公开了一种媒体处理系统,被配置成执行如本文中描述的方法中的任一方法。
在实施方式中,公开了一种设备,包括处理器并且被配置成执行如本文中描述的方法中的任一方法。
在实施方式中,公开了一种非暂态计算机可读存储介质,包括软件指令,当由一个或多个处理器执行这些软件指令时,这些软件指令使如本文中描述的方法中的任一方法被执行。
7.实现机制——硬件概述
根据一种实施方式,本文中描述的技术由一个或多个专用计算设备来实现。专用计算设备可以是硬连线的以执行前述技术,或者可以包括诸如永久地被编程成执行前述技术的一个或多个专用集成电路(ASIC)或现场可编程门阵列(FPGA)的数字电子设备,或者可以包括被编程成根据固件、存储器、其他存储装置或其组合中的程序指令执行前述技术的一个或多个通用硬件处理器。这样的专用计算设备还可以将定制的硬连线逻辑、ASIC或FPGA与定制的编程组合以实现前述技术。专用计算设备可以是台式计算机系统、便携式计算机系统、手持式设备、连网设备或包括硬连线和/或程序逻辑以实现前述技术的任何其他设备。
例如,图5是图示了可以在其上实现本发明的实施方式的计算机系统500的框图。计算机系统500包括总线502或用于传送信息的其他通信机构,以及用于处理信息的与总线502耦接的硬件处理器504。硬件处理器504例如可以是通用微处理器。
计算机系统500还包括用于存储要由处理器504执行的信息和指令的与总线502耦接的诸如随机存取存储器(RAM)或其他动态存储设备的主存储器506,。主存储器506还可以用于在执行要由处理器504执行的指令期间存储临时变量或其他中间信息。当这样的指令被存储在处理器504能够访问的非暂态存储介质中时,这样的指令使计算机系统500成为专用机器,该专用机器是执行上述指令指定的操作的特定设备。
计算机系统500还包括与总线502耦接的只读存储器(ROM)508或其他静态存储设备,以存储用于处理器504的静态信息和指令。向总线502提供诸如磁盘或光盘的存储设备510并且存储设备510耦接至总线502以存储信息和指令。
计算机系统500可以经由总线502耦接至诸如液晶显示器(LCD)的显示器512以向计算机用户显示信息。包括字母数字和其他键的输入设备514耦接至总线502,以向处理器504传送信息和命令选择。另一类型的用户输入设备是用于向处理器504传送方向信息和命令选择并且用于控制显示器512上的光标运动的诸如鼠标、跟踪球或光标方向键的光标控制器516。该输入设备通常具有在两个轴第一轴(例如,x)和第二轴(例如,y)上的两个自由度,,这允许设备指定平面中的位置。
计算机系统500可以使用设备特定硬连线逻辑、一个或多个ASIC或FPGA、固件和/或程序逻辑来实现本文中描述的技术,设备特定硬连线逻辑、一个或多个ASIC或FPGA、固件和/或程序逻辑与计算机系统500结合使或编程计算机系统500成为专用机器,计算机系统500可以。根据一种实施方式,响应于处理器504执行主存储器506中包括的一个或多个指令的一个或多个序列,由计算机系统500执行本文中的技术。这样的指令可以从诸如存储设备510的另一存储介质被读入主存储器506中。主存储器506中包括的指令序列的执行使处理器504执行本文中描述的处理步骤。在替代实施方式中,可以使用硬连线电路代替软件指令或者可以将硬连线电路与软件指令结合使用。
如本文中使用的术语“存储介质”指代存储使机器能够以特定方式进行操作的数据和/或指令的任一非暂态介质。这样的存储介质可以包括非易失性介质和/或易失性介质。非易失性介质包括例如诸如存储设备510的光盘或磁盘。易失性介质包括诸如主存储器506的动态存储器。存储介质的常见形式包括例如软盘、软磁盘、硬盘、固态驱动器、磁带或任何其他磁的数据存储介质、CD-ROM、任何其他光数据存储介质、具有孔图案的任何物理介质、RAM、PROM和EPROM、FLASH-EPROM、NVRAM、任何其他存储器芯片或盒式磁带。
存储介质与传输介质不同,但是可以与传输介质结合使用。传输介质参与在存储介质之间传输信息。例如,传输介质包括同轴电缆、铜线和光纤,包括包含总线502的线。传输介质还能够采用诸如在无线电波和红外线数据通信期间生成的那些声波或光波的声波或光波的形式,。
各种形式的介质可以涉及:向处理器504传送一个或多个指令的一个或多个序列以执行。例如,最初可以将指令携带在远程计算机的磁盘或固态驱动器上。远程计算机能够将指令加载至其动态存储器中并且使用调制解调器在电话线上发送指令。计算机系统500本地的调制解调器能够接收电话线上的数据并且使用红外线发送器将数据转换成红外线信号。红外线检测器能够接收红外线信号中携带的数据,并且适当的电路可以将数据放置在总线502上。总线502将数据携带至主存储器506,处理器504从主存储器检索指令并执行指令。可选地,在由处理器504执行指令之前或在由处理器504执行指令之后,由主存储器506接收的指令可以被存储在存储设备510上。
计算机系统500还包括与总线502耦接的通信接口518。通信接口518提供与和本地网络522连接的网络链路520耦接的双向数据通信。例如,通信接口518可以是综合业务数字网(ISDN)卡、有线调制解调器、卫星调制解调器或向相应类型的电话线提供数据通信连接的调制解调器。作为另一示例,通信接口518可以是提供至兼容的LAN的数据通信连接的局域网(LAN)卡。还可以实现无线链路。在任何这样的实现中,通信接口518发送并接收携带表示各种类型的信息的数字数据流的电子信号、电磁信号或光信号。
网络链路520通常通过一个或多个网络向其他数据设备提供数据通信。例如,网络链路520可以通过本地网络522向由因特网服务提供商(ISP)526操作的主计算机524或数据设备提供连接。ISP526又通过现在通常称为“因特网”528的全球分组数据通信网络提供数据通信服务。本地网络522和因特网528都使用携带数字数据流的电子信号、电磁信号或光信号。向计算机系统500携带数字数据的或从计算机系统500携带数字数据的通过各种网络的信号以及网络链路520上信号以及通过通信接口518的信号是传输介质的示例形式。
计算机系统500可以通过网络、网络链路520和通信接口518发送消息并且接收包括程序代码的数据。在因特网示例中,服务器530可以通过因特网528、ISP526、本地网络522和通信接口518来传输应用程序的所请求的代码。
当代码被接收和/或被存储在存储设备510或其他非易失性存储设备中以便稍后执行时,所接收的代码可以由处理器504执行。
8.等同、扩展、替代和其他
在前面的说明中,已经参考从实现到实现可以变化的许多特定细节描述了本发明的实施方式。因此,本发明是什么以及申请人的期望的唯一且排他的指示是以这样的权利要求发布的特定形式从本申请发布的权利要求的集合,包括任何随后的修正。针对在这样的权利要求中包括的术语,本文中明确阐述的任何定义应该约束权利要求中使用的这样的术语的意义。因此,权利要求中未明确记载的限制、要素、特性、特征、优点或属性不应该以任何方式对这样的权利要求的范围进行限制。因此,说明书和附图要被视为说明性意义而不是限制性意义。
Claims (17)
1.一种方法,包括:
从媒体数据提取多个查询指纹,所述媒体数据包括嵌入有一个或多个次要媒体内容部分的一个或多个主要媒体内容部分;
向媒体指纹档案系统发送多个指纹识别查询,所述多个指纹识别查询中的每个指纹识别查询包括所述多个查询指纹中的至少一个查询指纹;
从所述媒体指纹档案系统接收多个指纹识别响应,所述多个指纹识别响应中的每个指纹识别响应是对所述多个指纹识别查询中的相应的指纹查询的响应,并且所述多个指纹识别响应中的每个指纹识别响应指示肯定指纹识别或否定指纹识别;
响应于从所述媒体指纹档案系统接收所述多个指纹识别响应中的至少一个肯定指纹识别响应而进行下述操作:
对在所述一个或多个主要媒体内容部分内嵌入的所述一个或多个次要媒体内容部分中的第一次要媒体内容部分进行识别;
对在所述一个或多个主要媒体内容部分内嵌入的所述一个或多个次要媒体内容部分中的所述第一次要媒体内容部分执行第一组媒体测量;
其中,所述方法由一个或多个计算设备来执行。
2.根据权利要求1所述的方法,还包括:
响应于从所述媒体指纹档案系统接收所述多个指纹识别响应中的至少一个否定指纹识别而进行下述操作:
确定所述媒体数据中的媒体数据部分是否包括一个或多个特定特征;
响应于确定所述媒体数据中的媒体数据部分包括所述一个或多个特定特征而进行下述操作:
将所述媒体数据部分识别为所述一个或多个主要媒体内容部分内嵌入的所述一个或多个次要媒体内容部分中的次要媒体内容部分;
对所述一个或多个主要媒体内容部分内嵌入的所述一个或多个次要媒体内容部分中的次要媒体内容部分执行第二组媒体测量。
3.根据权利要求2所述的方法,还包括:响应于确定所述媒体数据中的所述媒体数据部分包括所述一个或多个特定特征而对所述次要媒体内容部分中的至少一个媒体特征进行控制。
4.根据权利要求3所述的方法,其中,所述至少一个媒体特征包括响度。
5.根据权利要求2所述的方法,其中,所述一个或多个特定特征包括日期、持续时间、场景改变的频率、面部识别、图/表识别、语音存在、音乐存在、音频瞬态的识别、视觉频谱内容、音频频谱内容、视频效果、预先存在的次要节目标识符、网络水印、等级水印、加字幕的/嵌入的文本、掌声、节目和场景变换或响度中的至少一个。
6.根据权利要求2所述的方法,还包括:向媒体指纹档案库发送从所述次要媒体内容部分识别的所述一个或多个特定特征以及从所述次要媒体内容部分导出的一个或多个指纹以存储。
7.根据权利要求1所述的方法,还包括:响应于从所述媒体指纹档案系统接收所述多个指纹识别响应中的至少一个肯定指纹识别,对所述第一次要媒体内容部分的至少一个媒体特征进行控制。
8.根据权利要求7所述的方法,其中,所述至少一个媒体特征包括响度。
9.根据权利要求1所述的方法,其中,所述多个媒体指纹包括以下中的一个或多个:(a)视频指纹,每个所述视频指纹是从图像或帧获得的,每个所述视频指纹包括视频内容的低比特率呈现,所述低比特率呈现是从所述视频内容导出的并且与所述视频内容唯一对应,并且每个所述视频指纹是根据与所述视频指纹对应的所述视频内容的特征分量计算的;或者(b)音频指纹,每个所述音频指纹是作为与特定音频波形唯一对应的编码而根据所述特定音频波形生成的。
10.根据权利要求1所述的方法,其中,所述媒体数据包括以下中的一个或多个:纯音频内容、纯视频内容、或者音频内容和视频内容两者。
11.根据权利要求1所述的方法,其中,以无线广播信号、有线广播信号、卫星广播信号、媒体数据比特流或媒体数据文件中的一种方式来接收所述媒体数据。
12.一种方法,包括:
保持针对要与主要媒体内容部分嵌入在一起的次要媒体内容部分的媒体指纹档案;
从客户端接收具有从包括主要媒体内容部分和次要媒体内容部分两者的媒体数据导出的查询指纹的指纹识别查询;
响应于接收具有所述查询指纹的所述指纹识别查询而确定所述查询指纹是否与在所述媒体指纹档案中存档的任一指纹匹配;
响应于确定所述查询指纹与在所述媒体指纹档案中存档的指纹匹配而向所述指纹识别查询返回肯定指纹识别响应,其中所述媒体指纹档案中存档的所述指纹是从相应的次要媒体内容部分导出的;
其中,所述方法由一个或多个计算设备来执行。
13.根据权利要求12所述的方法,还包括:响应于确定所述查询指纹与所述媒体指纹档案中存档的任一指纹不匹配而向所述指纹识别查询返回否定指纹识别响应。
14.根据权利要求12所述的方法,还包括:
接收具有针对次要媒体内容部分生成的一个或多个媒体指纹的媒体指纹存储请求,所述次要媒体内容部分的指纹先前尚未被存档;以及
将所述媒体指纹存入所述媒体指纹档案中。
15.一种被配置成执行根据权利要求1至14所述的方法中的任一方法的媒体处理系统。
16.一种包括处理器并且被配置成执行根据权利要求1至14所述的方法中的任一方法的设备。
17.一种非暂态计算机可读存储介质,包括软件指令,当由一个或多个处理器执行时,所述软件指令使根据权利要求1至14所述的方法中的任一方法被执行。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811622170.8A CN110083714B (zh) | 2013-04-05 | 2014-03-13 | 用于自动文件检测的对来自基于文件的媒体的特有信息的获取、恢复和匹配 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361809001P | 2013-04-05 | 2013-04-05 | |
US61/809,001 | 2013-04-05 | ||
PCT/US2014/025979 WO2014165304A1 (en) | 2013-04-05 | 2014-03-13 | Acquisition, recovery, and matching of unique information from file-based media for automated file detection |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811622170.8A Division CN110083714B (zh) | 2013-04-05 | 2014-03-13 | 用于自动文件检测的对来自基于文件的媒体的特有信息的获取、恢复和匹配 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105190618A true CN105190618A (zh) | 2015-12-23 |
CN105190618B CN105190618B (zh) | 2019-01-25 |
Family
ID=50478947
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480020129.7A Active CN105190618B (zh) | 2013-04-05 | 2014-03-13 | 用于自动文件检测的对来自基于文件的媒体的特有信息的获取、恢复和匹配 |
CN201811622170.8A Active CN110083714B (zh) | 2013-04-05 | 2014-03-13 | 用于自动文件检测的对来自基于文件的媒体的特有信息的获取、恢复和匹配 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811622170.8A Active CN110083714B (zh) | 2013-04-05 | 2014-03-13 | 用于自动文件检测的对来自基于文件的媒体的特有信息的获取、恢复和匹配 |
Country Status (4)
Country | Link |
---|---|
US (3) | US9635417B2 (zh) |
EP (1) | EP2981910A1 (zh) |
CN (2) | CN105190618B (zh) |
WO (1) | WO2014165304A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108171151A (zh) * | 2017-12-26 | 2018-06-15 | 上海亿动信息技术有限公司 | 一种对视频广告进行识别统计的控制方法及装置 |
CN108885629A (zh) * | 2016-02-29 | 2018-11-23 | 格雷斯诺特公司 | 利用基于与差分参考指纹特征匹配的多匹配检测和消歧的媒体信道标识和动作 |
CN111095940A (zh) * | 2017-09-13 | 2020-05-01 | 尼尔森(美国)有限公司 | 用于自动内容识别的标记广告帧 |
CN114501063A (zh) * | 2017-03-29 | 2022-05-13 | 六科股份有限公司 | 使用覆盖的定向内容放置 |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10410643B2 (en) * | 2014-07-15 | 2019-09-10 | The Nielson Company (Us), Llc | Audio watermarking for people monitoring |
JP5887446B1 (ja) * | 2014-07-29 | 2016-03-16 | ヤマハ株式会社 | 情報管理システム、情報管理方法およびプログラム |
JP5871088B1 (ja) * | 2014-07-29 | 2016-03-01 | ヤマハ株式会社 | 端末装置、情報提供システム、情報提供方法およびプログラム |
US9565456B2 (en) * | 2014-09-29 | 2017-02-07 | Spotify Ab | System and method for commercial detection in digital media environments |
US9836535B2 (en) * | 2015-08-25 | 2017-12-05 | TCL Research America Inc. | Method and system for content retrieval based on rate-coverage optimization |
US9930406B2 (en) | 2016-02-29 | 2018-03-27 | Gracenote, Inc. | Media channel identification with video multi-match detection and disambiguation based on audio fingerprint |
US10063918B2 (en) | 2016-02-29 | 2018-08-28 | Gracenote, Inc. | Media channel identification with multi-match detection and disambiguation based on single-match |
US10223172B2 (en) * | 2016-05-10 | 2019-03-05 | International Business Machines Corporation | Object storage workflow optimization leveraging storage area network value adds |
US10225343B2 (en) * | 2016-05-10 | 2019-03-05 | International Business Machines Corporation | Object storage workflow optimization leveraging underlying hardware, operating system, and virtualization value adds |
US10623800B2 (en) * | 2018-07-16 | 2020-04-14 | Gracenote, Inc. | Dynamic control of fingerprinting rate to facilitate time-accurate revision of media content |
WO2020142426A1 (en) | 2019-01-04 | 2020-07-09 | Gracenote, Inc. | Generation of media station previews using a secondary tuner |
US10860692B1 (en) * | 2019-06-16 | 2020-12-08 | Shmuel Ur Innovation Ltd. | Digital media verification |
KR102155743B1 (ko) * | 2019-10-07 | 2020-09-14 | 견두헌 | 대표음량을 적용한 컨텐츠 음량 조절 시스템 및 그 방법 |
KR20210107480A (ko) * | 2020-02-24 | 2021-09-01 | 삼성전자주식회사 | 전자장치 및 그 제어방법 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101981574A (zh) * | 2008-03-31 | 2011-02-23 | 杜比实验室特许公司 | 分布式媒体指纹储存库 |
CN102132574A (zh) * | 2008-08-22 | 2011-07-20 | 杜比实验室特许公司 | 内容识别和质量监测 |
Family Cites Families (58)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2373975B (en) | 2001-03-30 | 2005-04-13 | Sony Uk Ltd | Digital audio signal processing |
US7072477B1 (en) | 2002-07-09 | 2006-07-04 | Apple Computer, Inc. | Method and apparatus for automatically normalizing a perceived volume level in a digitally encoded file |
US8130928B2 (en) | 2002-11-07 | 2012-03-06 | Blake Bookstaff | Method and system for number indexing for advertising |
US20040237102A1 (en) | 2003-03-07 | 2004-11-25 | Richard Konig | Advertisement substitution |
US7672337B2 (en) * | 2004-05-14 | 2010-03-02 | Google Inc. | System and method for providing a digital watermark |
US7729673B2 (en) | 2004-12-30 | 2010-06-01 | Sony Ericsson Mobile Communications Ab | Method and apparatus for multichannel signal limiting |
US20070157235A1 (en) * | 2006-01-04 | 2007-07-05 | Lucent Technologies Inc. | Method and apparatus for reverting to a preferred program at the end of a commercial interruption |
US20080025530A1 (en) | 2006-07-26 | 2008-01-31 | Sony Ericsson Mobile Communications Ab | Method and apparatus for normalizing sound playback loudness |
US20080080722A1 (en) * | 2006-09-29 | 2008-04-03 | Carroll Tim J | Loudness controller with remote and local control |
JP2010541415A (ja) * | 2007-09-28 | 2010-12-24 | グレースノート インコーポレイテッド | マルチメディアイベントのプレゼンテーションの合成 |
US20090253457A1 (en) | 2008-04-04 | 2009-10-08 | Apple Inc. | Audio signal processing for certification enhancement in a handheld wireless communications device |
GB2460844B (en) | 2008-06-10 | 2012-06-06 | Half Minute Media Ltd | Automatic detection of repeating video sequences |
EP2146522A1 (en) | 2008-07-17 | 2010-01-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating audio output signals using object based metadata |
WO2010027847A1 (en) * | 2008-08-26 | 2010-03-11 | Dolby Laboratories Licensing Corporation | Robust media fingerprints |
JP2010135906A (ja) | 2008-12-02 | 2010-06-17 | Sony Corp | クリップ防止装置及びクリップ防止方法 |
US8437617B2 (en) * | 2009-06-17 | 2013-05-07 | Echostar Technologies L.L.C. | Method and apparatus for modifying the presentation of content |
CN101635810B (zh) * | 2009-08-14 | 2011-05-11 | 四川虹微技术有限公司 | 防止电视广告干扰的方法及系统 |
US8682145B2 (en) * | 2009-12-04 | 2014-03-25 | Tivo Inc. | Recording system based on multimedia content fingerprints |
US8947595B1 (en) * | 2010-01-26 | 2015-02-03 | Google Inc. | Fingerprinting to match videos having varying aspect ratios |
PL2381574T3 (pl) | 2010-04-22 | 2015-05-29 | Fraunhofer Ges Forschung | Urządzenie i sposób do modyfikacji wejściowego sygnału audio |
JP5903758B2 (ja) | 2010-09-08 | 2016-04-13 | ソニー株式会社 | 信号処理装置および方法、プログラム、並びにデータ記録媒体 |
US20120136701A1 (en) | 2010-11-26 | 2012-05-31 | Rohan Relan | Method and system for faciliating interactive commercials in real time |
US8989884B2 (en) | 2011-01-11 | 2015-03-24 | Apple Inc. | Automatic audio configuration based on an audio output device |
JP2012235310A (ja) | 2011-04-28 | 2012-11-29 | Sony Corp | 信号処理装置および方法、プログラム、並びにデータ記録媒体 |
US8965774B2 (en) | 2011-08-23 | 2015-02-24 | Apple Inc. | Automatic detection of audio compression parameters |
JP5845760B2 (ja) | 2011-09-15 | 2016-01-20 | ソニー株式会社 | 音声処理装置および方法、並びにプログラム |
JP2013102411A (ja) | 2011-10-14 | 2013-05-23 | Sony Corp | 音声信号処理装置、および音声信号処理方法、並びにプログラム |
RU2586874C1 (ru) | 2011-12-15 | 2016-06-10 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство, способ и компьютерная программа для устранения артефактов амплитудного ограничения |
GB2485694B (en) | 2012-01-27 | 2013-02-20 | Half Minute Media Ltd | Automatic detection and replacement of commercial spots |
TWI517142B (zh) | 2012-07-02 | 2016-01-11 | Sony Corp | Audio decoding apparatus and method, audio coding apparatus and method, and program |
US9661361B2 (en) * | 2012-09-19 | 2017-05-23 | Google Inc. | Systems and methods for live media content matching |
CN103021440B (zh) * | 2012-11-22 | 2015-04-22 | 腾讯科技(深圳)有限公司 | 一种音频流媒体的跟踪方法及系统 |
EP2757558A1 (en) | 2013-01-18 | 2014-07-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain level adjustment for audio signal decoding or encoding |
KR102056589B1 (ko) * | 2013-01-21 | 2019-12-18 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 상이한 재생 디바이스들에 걸친 라우드니스 및 동적 범위의 최적화 |
CN105190750B (zh) | 2013-01-28 | 2019-10-25 | 弗劳恩霍夫应用研究促进协会 | 解码器设备以及解码比特流的方法 |
US9559651B2 (en) | 2013-03-29 | 2017-01-31 | Apple Inc. | Metadata for loudness and dynamic range control |
US9607624B2 (en) | 2013-03-29 | 2017-03-28 | Apple Inc. | Metadata driven dynamic range control |
JP2015050685A (ja) | 2013-09-03 | 2015-03-16 | ソニー株式会社 | オーディオ信号処理装置および方法、並びにプログラム |
CN105531762B (zh) | 2013-09-19 | 2019-10-01 | 索尼公司 | 编码装置和方法、解码装置和方法以及程序 |
US9300268B2 (en) | 2013-10-18 | 2016-03-29 | Apple Inc. | Content aware audio ducking |
SG11201603116XA (en) | 2013-10-22 | 2016-05-30 | Fraunhofer Ges Forschung | Concept for combined dynamic range compression and guided clipping prevention for audio devices |
US9240763B2 (en) | 2013-11-25 | 2016-01-19 | Apple Inc. | Loudness normalization based on user feedback |
US9276544B2 (en) | 2013-12-10 | 2016-03-01 | Apple Inc. | Dynamic range control gain encoding |
KR102356012B1 (ko) | 2013-12-27 | 2022-01-27 | 소니그룹주식회사 | 복호화 장치 및 방법, 및 프로그램 |
US9608588B2 (en) | 2014-01-22 | 2017-03-28 | Apple Inc. | Dynamic range control with large look-ahead |
US9654076B2 (en) | 2014-03-25 | 2017-05-16 | Apple Inc. | Metadata for ducking control |
EP3123469B1 (en) | 2014-03-25 | 2018-04-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control |
MX359385B (es) | 2014-05-28 | 2018-09-25 | Fraunhofer Ges Forschung | Procesador de datos y transporte de datos de control del usuario a decodificadores de audio y renderizadores. |
KR20170012229A (ko) | 2014-05-30 | 2017-02-02 | 소니 주식회사 | 정보 처리 장치 및 정보 처리 방법 |
SG11201610951UA (en) | 2014-06-30 | 2017-02-27 | Sony Corp | Information processing apparatus and information processing method |
TWI631835B (zh) | 2014-11-12 | 2018-08-01 | 弗勞恩霍夫爾協會 | 用以解碼媒體信號之解碼器、及用以編碼包含用於主要媒體資料之元資料或控制資料的次要媒體資料之編碼器 |
US20160315722A1 (en) | 2015-04-22 | 2016-10-27 | Apple Inc. | Audio stem delivery and control |
US10109288B2 (en) | 2015-05-27 | 2018-10-23 | Apple Inc. | Dynamic range and peak control in audio using nonlinear filters |
RU2703973C2 (ru) | 2015-05-29 | 2019-10-22 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ регулировки уровня громкости |
ES2936089T3 (es) | 2015-06-17 | 2023-03-14 | Fraunhofer Ges Forschung | Control de intensidad del sonido para interacción del usuario en sistemas de codificación de audio |
US9934790B2 (en) | 2015-07-31 | 2018-04-03 | Apple Inc. | Encoded audio metadata-based equalization |
US9837086B2 (en) | 2015-07-31 | 2017-12-05 | Apple Inc. | Encoded audio extended metadata-based dynamic range control |
US10341770B2 (en) | 2015-09-30 | 2019-07-02 | Apple Inc. | Encoded audio metadata-based loudness equalization and dynamic equalization during DRC |
-
2014
- 2014-03-13 CN CN201480020129.7A patent/CN105190618B/zh active Active
- 2014-03-13 CN CN201811622170.8A patent/CN110083714B/zh active Active
- 2014-03-13 US US14/781,549 patent/US9635417B2/en active Active
- 2014-03-13 WO PCT/US2014/025979 patent/WO2014165304A1/en active Application Filing
- 2014-03-13 EP EP14717015.3A patent/EP2981910A1/en not_active Withdrawn
-
2017
- 2017-03-22 US US15/466,685 patent/US10349125B2/en active Active
-
2019
- 2019-06-13 US US16/440,123 patent/US20190297379A1/en not_active Abandoned
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101981574A (zh) * | 2008-03-31 | 2011-02-23 | 杜比实验室特许公司 | 分布式媒体指纹储存库 |
CN102132574A (zh) * | 2008-08-22 | 2011-07-20 | 杜比实验室特许公司 | 内容识别和质量监测 |
Non-Patent Citations (1)
Title |
---|
OGLE J P 等: "Fingerprinting to identify repeated sound events in long-duration on personal audio recordings", 《2007 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108885629A (zh) * | 2016-02-29 | 2018-11-23 | 格雷斯诺特公司 | 利用基于与差分参考指纹特征匹配的多匹配检测和消歧的媒体信道标识和动作 |
CN108885629B (zh) * | 2016-02-29 | 2019-11-01 | 格雷斯诺特公司 | 利用基于与差分参考指纹特征匹配的多匹配检测和消歧的媒体信道标识和动作 |
CN110891186A (zh) * | 2016-02-29 | 2020-03-17 | 格雷斯诺特公司 | 媒体呈现设备 |
US11617009B2 (en) | 2016-02-29 | 2023-03-28 | Roku, Inc. | Media channel identification and action with multi-match detection and disambiguation based on matching with differential reference-fingerprint feature |
CN114501063A (zh) * | 2017-03-29 | 2022-05-13 | 六科股份有限公司 | 使用覆盖的定向内容放置 |
CN111095940A (zh) * | 2017-09-13 | 2020-05-01 | 尼尔森(美国)有限公司 | 用于自动内容识别的标记广告帧 |
CN111095940B (zh) * | 2017-09-13 | 2021-05-25 | 尼尔森(美国)有限公司 | 用于自动内容识别的标记广告帧的方法和系统 |
CN113283321A (zh) * | 2017-09-13 | 2021-08-20 | 尼尔森(美国)有限公司 | 用于自动内容识别的标记广告帧的方法和系统 |
CN108171151A (zh) * | 2017-12-26 | 2018-06-15 | 上海亿动信息技术有限公司 | 一种对视频广告进行识别统计的控制方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110083714B (zh) | 2024-02-13 |
WO2014165304A1 (en) | 2014-10-09 |
CN110083714A (zh) | 2019-08-02 |
CN105190618B (zh) | 2019-01-25 |
US20160066032A1 (en) | 2016-03-03 |
US20190297379A1 (en) | 2019-09-26 |
US20170195721A1 (en) | 2017-07-06 |
US10349125B2 (en) | 2019-07-09 |
US9635417B2 (en) | 2017-04-25 |
EP2981910A1 (en) | 2016-02-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105190618A (zh) | 用于自动文件检测的对来自基于文件的媒体的特有信息的获取、恢复和匹配 | |
JP4298513B2 (ja) | 高速ハッシュに基づくマルチメディアオブジェクトのメタデータ検索 | |
US10922355B2 (en) | Method and apparatus for recommending news | |
JP5368319B2 (ja) | 放送データを監視および認識するためのシステムおよび方法 | |
CN103797482A (zh) | 进行接收到的数据的比较并基于比较提供后续服务的方法和系统 | |
US20210142363A1 (en) | Managing content delivery via audio cues | |
US10178365B1 (en) | System and method for combining audio tracks with video files | |
CN102084358A (zh) | 将信息与媒体内容关联 | |
KR20050117558A (ko) | 개선된 데이터 검색 방법 및 시스템 | |
WO2017080173A1 (zh) | 基于自然信息识别的推送系统和方法及一种客户端 | |
TWI408562B (zh) | 媒體評等 | |
US11818428B2 (en) | Identifying viewing characteristics of an audience of a content channel | |
CN108134951A (zh) | 用于推荐播放内容的方法和装置 | |
US20230247255A1 (en) | Methods and apparatus to identify streaming media sources | |
CN105912650A (zh) | 推荐歌曲的方法和装置 | |
US20120017231A1 (en) | Behavior monitoring system | |
JP2004185456A (ja) | カスタマイズされたコンテンツの配信システム | |
KR20140038374A (ko) | 클라이언트 장치에 의해 데이터 스트림 내 콘텐트를 식별하는 방법 및 시스템 | |
KR101181732B1 (ko) | 동영상 핑거프린트 정보에 기반한 동영상 마크업 데이터 생성 방법 및 이를 이용한 정보 제공 방법 및 시스템 | |
KR102297362B1 (ko) | 콘텐츠 재생 장치를 이용한 사용자 특성 기반의 광고 제공 장치 및 방법 | |
RU2754199C1 (ru) | Способ электронной коммерции через общественную вещательную среду | |
CN114329063A (zh) | 视频片段检测方法、装置以及设备 | |
KR100965817B1 (ko) | 인터넷 라디오 청취율 조사 방법 및 시스템 | |
CN116127207A (zh) | 一种基于目标时空匹配的情报文件处理方法及装置 | |
CN116701673A (zh) | 多媒体数据分类方法、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |