CN109120245B - 基于混合模型的软削波检测 - Google Patents
基于混合模型的软削波检测 Download PDFInfo
- Publication number
- CN109120245B CN109120245B CN201711337854.9A CN201711337854A CN109120245B CN 109120245 B CN109120245 B CN 109120245B CN 201711337854 A CN201711337854 A CN 201711337854A CN 109120245 B CN109120245 B CN 109120245B
- Authority
- CN
- China
- Prior art keywords
- soft clipping
- input audio
- mixture model
- soft
- fitted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000001514 detection method Methods 0.000 title abstract description 34
- 239000000203 mixture Substances 0.000 claims abstract description 94
- 238000009826 distribution Methods 0.000 claims description 94
- 230000005236 sound signal Effects 0.000 claims description 62
- 238000000034 method Methods 0.000 claims description 41
- 238000012545 processing Methods 0.000 claims description 13
- 238000010801 machine learning Methods 0.000 claims description 6
- 230000004044 response Effects 0.000 claims description 3
- 238000004891 communication Methods 0.000 description 112
- 238000010586 diagram Methods 0.000 description 12
- 238000013500 data storage Methods 0.000 description 8
- 230000003287 optical effect Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 229910001416 lithium ion Inorganic materials 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- QELJHCBNGDEXLD-UHFFFAOYSA-N nickel zinc Chemical compound [Ni].[Zn] QELJHCBNGDEXLD-UHFFFAOYSA-N 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- HBBGRARXTFLTSG-UHFFFAOYSA-N Lithium ion Chemical compound [Li+] HBBGRARXTFLTSG-UHFFFAOYSA-N 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- OJIJEKBXJYRIBZ-UHFFFAOYSA-N cadmium nickel Chemical compound [Ni].[Cd] OJIJEKBXJYRIBZ-UHFFFAOYSA-N 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 229910052987 metal hydride Inorganic materials 0.000 description 1
- 229910052759 nickel Inorganic materials 0.000 description 1
- PXHVJJICTQNCMI-UHFFFAOYSA-N nickel Substances [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 1
- -1 nickel metal hydride Chemical class 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
- H03G7/007—Volume compression or expansion in amplifiers of digital or coded signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03K—PULSE TECHNIQUE
- H03K5/00—Manipulating of pulses not covered by one of the other main groups of this subclass
- H03K5/01—Shaping pulses
- H03K5/08—Shaping pulses by limiting; by thresholding; by slicing, i.e. combined limiting and thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/165—Management of the audio stream, e.g. setting of volume, audio stream path
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/69—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/02—Preprocessing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L1/00—Arrangements for detecting or preventing errors in the information received
- H04L1/20—Arrangements for detecting or preventing errors in the information received using signal quality detector
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Nonlinear Science (AREA)
- Telephonic Communication Services (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
Abstract
本申请涉及基于混合模型的软削波检测。基于混合模型的软削波检测包括接收输入音频样本,生成指示所述输入音频样本是否包括软削波失真的软削波信息,以及输出所述软削波信息。生成所述软削波信息包括将混合模型拟合至所述输入音频样本,其中将所述混合模型拟合至所述输入音频样本包括生成拟合混合模型,使得拟合混合模型具有拟合参数,以及基于所述拟合混合模型的参数评估软削波失真量度,其中评估软削波失真量度包括识别软削波失真值。
Description
技术领域
本申请涉及基于混合模型的软削波检测。
背景技术
数字音频例如能够被用于经由音频或音视频的商业会谈、会议、高清音频或音视频、娱乐、或者用户所生成的音频或音视频内容的共享。诸如数字音频处理的数字信号处理可以包括对音频信号进行处理以使质量和编码效率最大化。因此,提供包括基于混合模型的软削波检测的数字信号处理将会是有利的。
发明内容
本申请涉及到处理音频数据。本文公开了用于使用基于混合模型的软削波检测处理音频数据的系统、方法和装置的多个方面。
所公开实施方式的一个方面是一种用于基于混合模型的软削波检测的方法,所述方法包括接收输入音频样本,生成指示所述输入音频样本是否包括软削波失真的软削波信息,以及输出所述软削波信息。生成所述软削波信息包括将混合模型拟合至所述输入音频样本,其中将所述混合模型拟合至所述输入音频样本包括生成拟合混合模型使得所述拟合混合模型具有拟合参数,以及基于所述拟合混合模型的参数评估软削波失真量度,其中评估所述软削波失真量度包括识别软削波失真值。
另一个方面是一种用于基于混合模型的软削波检测的方法,所述方法包括接收输入数据信号,其中所述输入数据信号包括输入音频样本,生成指示所述输入音频样本是否包括软削波失真的软削波信息,以及输出所述软削波信息。生成所述软削波信息包括将混合模型拟合至所述输入音频样本。
另一个方面是一种用于基于混合模型的软削波检测的方法,所述方法包括接收输入数据信号,其中所述输入数据信号包括输入音频样本,以及针对所述输入数据信号生成软削波信息。生成所述软削波信息包括识别包括具有零均值的拉普拉斯(Laplacian)失真、第一高斯分布、和第二高斯分布的混合模型,其中所述第一高斯分布和第二高斯分布是对称的。生成所述软削波信息包括识别所述输入音频样本的时间部分序列,以及针对来自所述时间部分序列的每个时间部分,通过使用期望最大化将所述混合模型拟合至来自该时间部分的相应输入音频样本从而生成相应拟合混合模型,通过基于所述相应拟合混合模型的参数评估软削波失真量度而生成指示该时间部分是否包括软削波失真的相应软削波信息,其中响应于确定该时间部分包括软削波失真,生成所述相应软削波信息包括识别针对来自该时间部分的相应输入音频样本指示软削波失真的严重性的相应软削波失真值,以及将针对该时间部分的相应软削波信息包括在针对所述输入数据信号的软削波信息中。生成所述软削波信息包括针对所述输入数据信号生成平均软削波失真值,将针对所述输入数据信号的平均软削波值包括在针对所述输入数据信号的软削波信息中,针对所述输入数据信号识别最大软削波失真值,以及将针对所述输入数据信号的最大软削波失真值包括在针对所述输入数据信号的软削波信息中。所述方法包括输出针对所述输入数据信号的软削波信息。
本文诸如在以下详细描述、所附权利要求、和附图中描述了这些和其它方面的变化。
附图说明
本文的描述参考附图,其中同样的附图标记贯穿若干视图而指代同样的部分。
图1是根据本公开实施方式的计算设备的图。
图2是根据本公开实施方式的计算和通信系统的图。
图3是根据本公开实施方式的基于混合模型的软削波检测的示例的流程图。
图4是根据本公开实施方式的用于省略软削波的输入音频信号的拟合混合模型的示例的示图。
图5是根据本公开实施方式的用于包括软削波且省略硬削波的输入音频信号的拟合混合模型的示例的图。
图6是根据本公开实施方式的用于包括软削波和硬削波的输入音频信号的拟合混合模型的示例的图。
具体实施方式
音频信号可以通过定期采样或测量所述音频信号的一个或多个特征,诸如音频信号的振幅,以及存储或以其它方式输出表示所述音频信号的数字样本的序列而被数字表示。数字样本可以具有可用值的有限的范围。例如,数字音频样本可以使用16位带符号整数来表示,其可以具有从-32768到32767的可用值范围。音频信号的一个或多个部分可以被削波或者可以包括削波失真,这可以使由音频信号所表示的音频内容发生失真。例如,数字音频信号可以包括硬削波、软削波,或者其二者。
硬削波可以包括其中诸如一个或多个样本的输入音频信号的部分的、诸如振幅的值超出代表性值的可用范围的失真,并且通过所捕捉的音频信号中(诸如在数字音频信号中)的最大或最小值不准确地表示,或者以其它方式被截取为处于所述可用范围之内。硬削波可以通过识别数字音频信号中的由处于可用范围极限处的值所表示的部分或部分序列来检测。
软削波可以包括其中诸如样本或样本序列的部分的、诸如振幅的值被压缩的失真,所述部分可以是相对高的振幅的部分。由软削波而失真的音频信号可以处于代表性值的可用范围之内。基于直方图的软削波检测可以包括计算信号样本的直方图,以及确定最远点距直方图中心的距离,使得所述最远点的值大于所述直方图中的其它值作为软削波的指示。基于直方图的软削波检测可能不准确或低效地检测软削波。
基于混合模型的软削波检测可以包括诸如使用期望最大化将混合模型拟合至输入音频信号的音频样本,以识别拟合模型参数,所述混合模型诸如具有零均值的拉普拉斯分布和两个对称高斯分布的混合,以及可以包括对所述拟合模型参数进行评估以检测并测量软削波失真。所述拟合模型参数可以基于所定义的量度进行评估,或者可以使用在训练数据上进行过训练的机器学习算法来评估,所述训练数据诸如手工标记的输入信号。输入音频信号中的诸如一秒钟部分的时间部分可以相对于输入音频信号进行独立评估,或者二者都被评估。
图1是根据本公开实施方式的计算设备100的图。所示出的计算设备100包括存储器110、处理器120、用户接口(UI)130、电子通信单元140、传感器150、电源160、和总线170。如本文所使用的是,术语“计算设备”包括能够执行本文所公开的任何方法或者其任何一个或多个部分的任何单元或单元的组合。
计算设备100可以是静态计算设备,诸如个人计算机(PC)、服务器、工作站、小型计算机、或大型计算机;或者是移动计算设备,诸如移动电话、个人数字助理(PDA)、膝上计算机、或平板PC。虽然被示为单个单元,但是计算设备100中的任何一个或多个元件能够被集成到任何数量的单独物理单元中。例如,用户接口130和处理器120能够被集成在第一物理单元中,存储器110则能够被集成在第二物理单元中。
存储器110能够包括任何的非瞬态计算机可用介质或计算机可读介质,诸如例如能够包含、存储、通信、或传输与之相关联的数据112、指令116、操作系统116、或任何信息,以由计算设备100的其它组件使用或结合计算设备100的其它组件使用的任何的有形设备。所述非瞬态计算机可用介质或计算机可读介质例如能够是适于存储信息的固态驱动器、存储卡、可移除介质、只读存储器(ROM)、随机存取存储器(RAM),包括硬盘、软盘、光盘的任何类型的盘,磁性或光学卡、专用集成电路(ASIC),或者任何类型的非瞬态介质,或者其的任何组合。
虽然示出了单个单元,但是存储器110可以包括多个物理单元,诸如一个或多个主存储器单元(诸如随机存取存储器单元)、一个或多个辅助数据存储单元(诸如磁盘)、或者其的组合。例如,数据112或其部分、指令114或其部分,或者二者可以被存储在辅助存储单元中,并且可以结合对相应数据112的处理、对相应指令114的执行、或者二者而被加载或以其它方式传输至主存储单元。在一些实施方式中,存储器110或者其部分可以是可移除存储器。
数据112能够包括诸如输入音频数据、编码音频数据、解码音频数据等的信息。指令114能够包括诸如代码的指示,所述代码用于执行本文所公开的任何方法或者其任何一个或多个部分。指令114能够在硬件、软件、或者其任何组合中实现。例如,指令114可以被实施为在存储器110中存储的诸如计算机程序的信息,其可以由处理器120所执行,以实行如本文所描述的任何的相应方法、算法、方面、或者其的组合。
虽然被示为被包括在存储器110中,但是在一些实施方式中,指令114或者其部分可以被实施为能够包括用于实行如本文所描述的任何方法、算法、方面、或者其的组合的特殊硬件的专用处理器、或电路。指令114的部分能够跨相同机器或不同机器上的多个处理器或者诸如局域网、广域网、互联网或者其的组合的跨网络进行分布。
处理器120能够包括能够操控或处理现有或以后开发的数字信号或其它电子信息的任何设备或系统,包括光学处理器、量子处理器、分子处理器,或者其的组合。例如,处理器120能够包括专用内处理器、中央处理器(CPU)、数字信号处理器(DSP)、多个微处理器、与DSP核心相关联的一个或多个微处理器、控制器、微控制器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、可编程逻辑阵列、可编程逻辑控制器、微代码、固件、任何类型的集成电路(IC)、状态机,或者其的任何组合。如本文所使用的是,术语“处理器”包括单个处理器或多个处理器。
用户接口130能够包括能够与用户接口连接(interfacing)的任何单元,诸如虚拟或物理键盘、触摸板、显示器、触摸显示器、扬声器、麦克风、视频相机、传感器,或者其的任何组合。例如,用户接口130可以是音频-视觉显示设备,并且计算设备100可以使用音频-视觉显示设备的用户接口130(诸如结合显示诸如解码视频的视频)来呈现诸如解码音频的音频。虽然被示为单个单元,用户接口130可以包括一个或多个物理单元。例如,用户接口130可以包括用于执行与用户的音频通信的音频接口,用于执行与用户的基于视觉和触摸的通信的触摸显示器。
电子通信单元140能够经由有线或无线电子通信介质180发送、接收、或者发送及接收信号,所述电子通信介质180诸如射频(RF)通信介质、紫外(UV)通信介质、可见光通信介质、光纤通信介质、有线通信介质,或者其的组合。例如,如所示出的是,电子通信单元140被操作地连接至被配置为经由无线信号进行通信的电子通信接口142,诸如天线。
虽然电子通信接口142在图1中被示为无线天线,但是电子通信接口142能够是如所示出的无线天线,诸如以太网端口、红外端口、串行端口的有线通信端口,或者能够与有线或无线电子通信介质180进行接口连接的任何其它有线或无线单元。虽然图1示出了单个电子通信单元140以及单个电子通信接口142,但是能够使用任何数量的电子通信单元和任何数量的电子通信接口。
传感器150例如可以包括音频感应设备、可见光感应设备、运动感应设备,或者其的组合。例如,传感器150可以包括诸如麦克风的声音感应设备,或者现有或以后开发的能够感应接近计算设备100的声音的任何其它声音感应设备,所述声音诸如操作计算设备100的用户所进行的语音或其它话语。在另一个示例中,传感器150可以包括相机,或者现有或以后开发的能够感应诸如操作计算设备的用户的图像的图像的任何其它图像感应设备。虽然示出了单个传感器150,但是计算设备100可以包括数个传感器150。例如,计算设备100可以包括以指示朝向计算设备100的用户的视场进行定向的第一相机以及以指示远离计算设备100的用户的视场进行定向的第二相机。
电源160能够是用于为计算设备100供电的任何适当设备。例如,电源160能够包括能够为计算设备100供电的有线外部电源接口;一个或多个干电池,诸如镍镉(NiCd)、镍锌(NiZn)、镍氢(NiMH)、锂离子(Li-ion);太阳能电池;燃料电池;或者任何其它设备。虽然图1中示出了单个电源160,但是计算设备100可以包括多个电源160,诸如电池和有线外部电源接口。
虽然被示为分离的单元,但是电子通信单元140、电子通信接口142、用户接口130、电源160、或者其的部分可以被配置为组合单元。例如,电子通信单元140、电子通信接口142、用户接口130和电源160可以被实施为能够与外部显示设备接口连接、提供通信、电力或其二者的通信端口。
存储器110、处理器120、用户接口130、电子通信单元140、传感器150、或电源160中的一个或多个可以经由总线170操作耦合。虽然图1中示出了单个总线170,但是计算设备100可以包括多个总线。例如,存储器110、处理器120、用户接口130、电子通信单元140、传感器150、和总线170可以经由总线170从电源160接收电力。在另一个示例中,存储器110、处理器120、用户接口130、电子通信单元140、传感器150、电源160、或者其的组合可以诸如通过经由总线170发送和接收电子信号来通信数据。
虽然图1中并未单独示出,但是处理器120、用户接口130、电子通信单元140、传感器150、或电源160中的一个或多个可以包括内部存储器,诸如内部缓冲器或寄存器。例如,处理器120可以包括内部存储器(未示出)并且可以将数据112从存储器110读取到内部存储器(未示出)中用于处理。
虽然被示为单独的元件,但是存储器110、处理器120、用户接口130、电子通信单元140、传感器150、电源160、和总线170、或者其的组合可以被集成在一个或多个电子单元、电路或芯片中。
图2是根据本公开实施方式的计算和通信系统200的图。所示出的计算和通信系统200包括计算和通信设备100A、100B、100C,接入点210A、210B,以及网络220。例如,计算和通信系统200可以是向诸如计算和通信设备100A、100B、100C的一个或多个有线或无线通信设备提供诸如语音、音频、数据、视频、消息、广播、或其的组合的通信的多个接入系统。虽然图2为了简明而示出了三个计算和通信设备100A、100B、100C,两个接入点210A、210B,以及一个网络220,但是能够使用任何数量的计算和通信设备、接入点、和网络。
例如,计算和通信设备100A、100B、100C能够是诸如图1中示出的计算设备100的计算设备。例如,计算和通信设备100A、100B可以是用户设备,诸如移动计算设备、膝上计算机、瘦客户端、或智能电话,以及计算设备100C可以是服务器,诸如大型机或集群。虽然计算和通信设备100A与计算和通信设备100B被描述为用户设备,以及计算和通信设备100C被描述为服务器,但是任何计算和通信设备可以执行服务器的功能中的一些或全部、用户设备的功能中的一些或全部,或者服务器和用户设备的功能中的一些或全部。例如,服务器计算和通信设备100C可以对音频数据进行接收、编码、处理、存储、发送、或者其的组合,并且计算和通信设备100A和计算和通信设备100B中的一个或二个可以对音频数据进行接收、编码、处理、存储、呈现或者其的组合。
可以包括用户设备(UE)、移动站点、固定或移动订户单元、蜂窝电话、个人计算机、平板计算机、服务器、消费者电器、或者任何类似设备的每个计算和通信设备100A、100B、100C能够被配置为诸如经由网络220来执行有线或无线通信。例如,计算和通信设备100A、100B、100C能够被配置为发送或接收有线或无线通信信号。虽然每个计算和通信设备100A、100B、100C被示为单个单元,但是计算和通信设备能够包括任何数量的互连元件。
每个接入点210A、210B能够是被配置为经由有线或无线通信链路180A、180B、180C与计算和通信设备100A、100B、100C,网络220或者二者进行通信的任何类型的设备。例如,接入点210A、210B能够包括基站、收发器基站(BTS)、Node-B、增强型Node-B(eNode-B)、HomeNode-B(HNode-B)、无线路由器、有线路由器、集线器、中继器、交换机,或者任何的类似有线或无线设备。虽然每个接入点210A、210B被示出为单个单元,但是接入点能够包括任何数量的互连元件。
网络220能够是被配置为通过有线或无线通信链路提供诸如语音、数据、应用、互联网语音协议(VoIP)或者任何其它通信协议或通信协议的组合的服务的任何类型的网络。例如,网络220能够是局域网(LAN)、广域网(WAN)、虚拟私人网络(VPN)、移动或蜂窝电话网络、互联网,或者的电子通信任何其它装置。所述网络能够使用诸如传输控制协议(TCP)、用户数据报协议(UDP)、互联网协议(IP)、实时传输协议(RTP)、超文本传输协议(HTTP)、或者其的组合的通信协议。
计算和通信设备100A、100B、100C能够使用一个或多个有线或无线通信链路经由网络220,或者经由有线和无线通信链路的组合互相通信。例如,如所示出的是,计算和通信设备100A、100B能够经由无线通信链路180A、180B进行通信,并且计算和通信设备100C能够经由有线通信链路180C进行通信。计算和通信设备100A、100B、100C中的任何可以使用任何有线或无线通信链路进行通信。例如,第一计算和通信设备100A能够使用第一类型的通信链路经由第一接入点210A进行通信,第二计算和通信设备100B能够使用第二类型的通信链路经由第二接入点210B进行通信,以及第三计算和通信设备100C能够使用第三类型的通信链路经由第三接入点(未示出)进行通信。类似地,接入点210A、210B能够经由一种或多种类型的有线或无线通信链路230A、230B与网络220进行通信。虽然图2示出了经由网络220进行通信的计算和通信设备100A、100B、100C,但是计算和通信设备100A、100B、100C能够经由诸如直接有线或无线通信链路的任何数量的通信链路互相通信。
在一些实施方式中,计算和通信设备100A、100B、100C中的一个或多个之间的通信可以省略经由网络220的通信,并且可以包括经由诸如数据存储设备的另一种介质(未示出)传输数据。例如,服务器计算和通信设备100C可以将诸如编码音频数据的音频数据存储在诸如便携式数据存储单元的数据存储设备中,并且计算和通信设备100A或计算和通信设备100B中的一个或两个可以诸如通过将数据存储设备从服务器计算和通信设备100C物理断开连接并且将所述数据存储设备物理连接至计算和通信设备100A或计算和通信设备100B中的一个或两个,从数据存储单元接入、读取、或检索所存储的音频数据。
计算和通信系统200的其它实施方式是可能的。例如,在一种实施方式中,网络220能够是自组织网络并且能够省略接入点210A、210B中的一个或多个。计算和通信系统200可以包括图2中并未示出的设备、单元、或元件。例如,计算和通信系统200可以包括许多另外的通信设备、网络和接入点。
图3是根据本公开实施方式的基于混合模型的软削波检测300的示例的流程图。基于混合模型的软削波检测300可以被实施在软削波检测单元中,所述软削波检测单元可以是计算设备或者被包括在其中,所述计算设备诸如图1中示出的计算设备100或者图2中示出的计算和通信设备100A、100B、100C中的一个。例如,软削波检测单元可以是数字信号处理器的单元。
基于混合模型的软削波检测300可以包括在310识别输入音频,在320生成软削波信息,在330生成所述软削波信息,或者其的任何组合。
在310处,输入音频可以被识别,诸如被接收或以其它方式被接入。例如,可以由软削波检测单元接收或以其它方式接入包括输入音频的输入数据信号,诸如输入音频信号或输入视频信号的音频分量。所述输入音频可以包括音频样本。所述输入音频可以具有持续时段。
在一些实施方式中,所述输入数据信号可以是编码输入数据信号,并且在310处识别输入音频可以包括对所述输入音频进行解码,或者以其它方式从所述输入数据信号接入输入音频样本。在一些实施方式中,在310处识别输入音频可以包括识别所述输入音频的部分。
在320处,可以生成软削波信息。例如,所述软削波检测单元可以通过执行基于混合模型的软削波检测来处理、分析、或评估在310处所识别的输入音频,以在320处生成软削波信息。在320处所生成的软削波信息可以指示在310识别的输入音频或其部分是否包括软削波失真。
在320处生成软削波信息可以包括在322处识别混合模型,在324处将所述混合模型拟合至输入音频,在326处评估软削波失真量度,或者其的组合。
在322处可以识别混合模型。用于软削波检测的混合模型可以包括表示概率分布的概率模型,所述概率分布可以指示用于数据信号的每个可用值(诸如音频信号振幅值)出现的相应概率。用于软削波检测的混合模型可以在统计上表示输入数据信号的数据或群体的可相关的部分或子群体,其中数据的相应样本或观察省略了明确指示子群体关联的信息。
在322处识别混合模型可以包括识别混合的组合,诸如加权组合,所述混合可以是受限混合。所述混合模型的每种混合可以由相应的概率分布来表示。例如,识别混合模型可以包括识别拉普拉斯分布和两个高斯分布的加权组合。所述混合模型可以具有可变参数或特征,诸如相应混合的权重(W)、相应混合的标准偏差(σ)、相应混合的均值(μ),或者其的组合。
拉普拉斯分布可以被限制为具有零的定义均值(零均值)。拉普拉斯分布的标准偏差(σL)、拉普拉斯分布的权重(WL)、或者二者可以是所述混合模型的可变参数或特征。拉普拉斯分布可以表示或与音频信号中的可听语音的分布相对应。
高斯分布可以被限制为是对称的。高斯分布的相应标准偏差可以是相等的,高斯分布的相应权重可以是相等的,并且高斯分布的相应均值可以是相反的。例如,高斯分布的相应均值可以具有相等的量值、或绝对值、以及相反的符号。为了简明,对称高斯分布在本文可以使用单数形式来描述,除非以其它方式被明确指示或者被上下文以其它方式明白地加以区分。高斯分布的权重(WG)、高斯分布的均值(μG)、高斯分布的标准偏差(σG)、或者其的组合可以是混合模型的可变参数或特征。高斯分布可以表示或与音频信号中的软削波样本的分布相对应。
虽然所述混合模型在本文中被描述为拉普拉斯分布和两个高斯分布的加权组合,但是可以使用其它组合。例如,零均值拉普拉斯分布可以与加法零均值高斯分布进行组合,其可以具有独立的权重和偏差并且可以在分布的中心或原点对非语音音频进行建模。在另一个示例中,拉普拉斯分布可以被省略,并且音频分布的中心可以使用一般化的高斯分布进行建模。
在一些实施方式中,在322处识别混合模型可以包括识别候选混合模型,诸如包括受限的、零均值拉普拉斯分布以如本文所描述的对音频分布的中心进行建模的第一候选混合模型,以及包括受限的、零均值高斯分布以对音频分布的中心进行建模的第二候选混合模型。
在322处识别混合模型可以包括识别混合模型的相应参数的所定义、诸如先前所定义或存储的值。例如,在322处识别混合模型可以包括识别拉普拉斯分布的所定义权重以及高斯分布相对应的所定义权重,识别拉普拉斯分布的所定义标准偏差,识别高斯分布的所定义标准偏差,识别高斯分布的所定义均值,或者其的组合。
在一些实施方式中,用于混合模型的相应参数的所定义值诸如可以随机或伪随机地从所定义参数范围进行识别。例如,高斯权重的所定义值可以从范围0.1至0.2随机识别,高斯均值的所定义值可以从范围0.3至0.7随机识别,高斯标准偏差的所定义值可以从范围0.1至0.2随机识别,以及拉普拉斯标准偏差的所定义值可以从范围0.1至0.5随机识别。
在324处,所述混合模型可以拟合至输入音频。在324处将混合模型拟合至输入音频可以包括通过调节或修改所述混合模型的参数生成具有拟合参数的拟合混合模型,以识别最大化所述混合模型的预测在310处所识别的输入音频的样本的分布的概率的参数,所述参数诸如拟合混合模型的高斯分布的权重、拟合混合模型的高斯分布的均值、拟合混合模型的高斯分布的标准偏差、拟合混合模型的拉普拉斯分布的标准偏差、或者其的组合。
例如,所述拟合混合模型可以使用混合模型拟合的期望值最大化或者另一种可应用方法来生成。使用期望值最大化将混合模型拟合至输入音频可以包括基于当前参数预测概率分布以及基于所预测的概率分布修正当前参数的重复迭代。
在一些实施例中,混合模型可以包括用于对中心分布进行建模的一般化高斯分布,并且拟合所述混合模型可以包括以迭代方式使用伽马(gamma)函数对所述一般化高斯分布的形状参数进行估计。
在一些实施方式中,候选混合模型可以被拟合至输入音频,并且使预测误差最小化的拟合候选混合模型可以被识别为针对所述输入音频的拟合混合模型。
在一些实施方式中,在324处拟合混合模型可以包括从输入音频信号识别目标样本以及将所述混合拟合至所述目标样本。例如,输入音频信号可以包括硬削波样本、表示背景噪声的样本或者二者,并且目标样本可以被识别为来自输入音频信号的所述硬削波样本或表示背景噪声的样本以外的样本。
在一些实施方式中,在324处拟合混合模型可以包括从输入音频样本识别输入音频分位数的所定义基数、数量、或计数,以及将所述混合模型拟合至输入音频分位数。
在326处,可以诸如基于在324处所识别的拟合混合模型的参数来评估软削波失真量度。例如,软削波失真量度可以指示与软削波失真相对应的相应拟合参数之间的所定义关系。评估软削波失真量度可以包括生成指示输入数据信号是否包括软削波失真的软削波信息,生成包括指示软削波失真的严重性或粗糙度的软削波失真值的软削波信息,或者二者。
在示例中,拟合混合模型的高斯分布的均值可以超过,诸如大于,拟合混合模型的高斯分布的标准偏差的倍数,诸如拟合混合模型的高斯分布的标准偏差的三倍,这可以被表达为(μG>3σG);拟合混合模型的高斯分布的均值可以超过拟合混合模型的拉普拉斯分布的标准偏差的倍数,诸如拟合混合模型的拉普拉斯分布的标准偏差的两倍,这可以被表达为(μG>2σL),以及输入音频信号可以被识别为包括软削波失真。
对于包括软削波失真的输入音频信号,评估软削波失真量度可以包括识别软削波失真值。例如,高斯分布的权重的倍数,诸如高斯分布的权重的两倍,可以被识别为软削波失真值,其可以表示输入音频信号的软削波样本的比率。对于被识别为省略软削波失真的输入音频信号,识别软削波失真可以被省略。
在一些实施方式中,在326处评估软削波失真可以包括使用机器学习模型或算法来评估拟合混合模型参数,这可以包括将训练数据聚类在混合模型特征的四维空间中。例如,诸如线性逻辑回归模型或支撑矢量机(SVM)模型的机器学习模型可以在被拟合至训练音频信号的混合模型上进行训练。在一些实施方式中,训练音频信号可以被人工标记以指示包括软削波失真以及其严重性,或者指示所述软削波失真不存在。所述机器学习模型可以基于相对应的拟合混合模型的参数进行训练以预测输入音频信号中包括软削波失真以及其严重性。
虽然并未在图3中被单独示出,但是基于混合模型的软削波检测300可以包括从输入音频信号识别时间部分的序列,诸如一秒钟的部分,在320处针对输入音频信号的每个相应时间部分识别软削波信息,并且基于混合模型的软削波检测300可以包括聚集软削波信息、相对软削波信息、或者二者。聚集软削波信息可以包括输入音频信号的基于针对所述输入音频信号的相应时间部分所生成的相应软削波信息的信息,诸如平均软削波失真值或最大软削波失真值。相对软削波信息可以指示所述输入音频信号的时间部分的相对于输入音频信号的相对应聚集软削波信息或者相对于输入音频信号的相对应软削波信息的软削波信息。
在330处,可以输出所述软削波信息。例如,所述软削波信息可以被发送至另一个设备或者被存储与在输入音频信号相关联的数据存储单元中。
在一些实施方式中,在330处输出软削波信息可以包括生成并向与输入音频信号相关联的账户或用户发送诸如消息的信息,所述消息指示所述输入音频信号包括软削波失真,这可以包括指示所述软削波失真的严重性。
在一些实施方式中,可以针对多个输入音频信号生成软削波信息。例如,可以针对来自输入音频信号的集合的的一个或多个输入音频信号生成相应的软削波信息,以及可以识别包括软削波失真的输入音频信号的比例或数量的百分比或其它量度。
在一些实施方式中,在330处输出软削波信息可以包括将所述软削波信息输出至去削波滤波器,用于在最小化或减小软削波失真中使用。
基于混合模型的软削波检测的其它实施方式是可用的。在实施方式中,能够添加基于混合模型的软削波检测的附加要素,能够省略某些要素,和/或能够去除某些要素。
图4是根据本公开实施方式的用于省略软削波的输入音频信号的拟合混合模型的示例的图。例如,图4中示出的拟合混合模型可以使用基于混合模型的软削波检测,诸如图3中示出的基于混合模型的软削波检测300,基于输入音频信号而生成,这可以包括识别指示所述输入音频信号中不存在软削波失真的软削波信息。
图4中示出的图包括使用点状虚线示出的输入音频信号的直方图410,使用细实线示出的拟合混合模型的拉普拉斯分布420分量,使用短线条虚线示出的拟合混合模型的第一高斯分布430分量,使用长线条虚线示出的拟合混合模型的第二高斯分布440分量,以及使用粗实线示出的拟合混合模型450。
高斯分布430、440相当接近输入分布的中心并且具有相对宽的标准偏差。
图5是根据本公开实施方式的用于包括软削波且省略硬削波的输入音频信号的拟合混合模型的示例的图。例如,图5中示出的拟合混合模型可以使用基于混合模型的软削波检测,诸如图3中示出的基于混合模型的软削波检测300,基于输入音频信号而生成,这可以包括识别指示所述输入音频信号中包括软削波失真以及指示相对低的软削波失真严重性的软削波信息。
图5中示出的图包括使用点状虚线示出的输入音频信号的直方图510,使用细实线示出的拟合混合模型的拉普拉斯分布520分量,使用短线条虚线示出的拟合混合模型的第一高斯分布530分量,使用长线条虚线示出的拟合混合模型的第二高斯分布540分量,以及使用粗实线示出的拟合混合模型550。
高斯分布530、540的峰值以及拟合混合模型550的近似局部峰值与软削波失真相对应。虽然图5中示出的直方图包括接近于高斯分布530、540的峰值的局部峰值,但是包括软削波失真的输入音频信号的直方图可以省略与软削波失真相对应的局部峰值。
图6是根据本公开实施方式的用于包括软削波和硬削波的输入音频信号的拟合混合模型的示例的图。例如,图6中示出的拟合混合模型可以使用基于混合模型的软削波检测,诸如图3中示出的基于混合模型的软削波检测300,基于输入音频信号而生成,这可以包括识别指示所述输入音频信号中包括软削波失真以及指示相对高的软削波失真严重性的软削波信息。
图6中示出的图包括使用点状虚线示出的输入音频信号的直方图610,使用细实线示出的拟合混合模型的拉普拉斯分布620分量,使用短线条虚线示出的拟合混合模型的第一高斯分布630分量,使用长线条虚线示出的拟合混合模型的第二高斯分布640分量,以及使用粗实线示出的拟合混合模型650。
直方图610在左侧和右侧端点处分别包括指示硬削波失真的相对高的峰值。高斯分布630、640的峰值以及拟合混合模型650的近似局部峰值与软削波失真相对应。拟合混合模型650省略了与硬削波失真相对应的峰值。
词语“示例”或“示例性”在这里被用来意旨用作示例、实例、或说明。在本文中被描述为“示例”或“示例性”的任何方面或设计并非必然被解释为相对于其它方面或设计是优选或有利的。相反,使用词语“示例”或“示例性”旨在以具体方式呈现概念。如本申请中所使用的是,术语“或”旨在意旨包含“或”而非排除“或”。也就是说,除非另外指出或者从上下文所明确,否则“X包括A或B”旨在表示任何的自然包含置换形式。也就是说,如果X包括A;X包括B;或者X包括A和B二者,则“X包括A或B”就在任何上述实例下得到满足。此外,除非另外指出或者从上下文所明确为指示单数形式,否则本申请和所附权利要求聚集使用的冠词“一个”(“a”和“an”)一般应当被理解为表示“一个或多个”。此外,术语“实施例”或“一个实施例”或者“实施方式”或“一种实施方式”的使用始终都并非旨在意旨相同的实施例或实施方式。如本文所使用的是,术语“确定”和“识别”或者其任何变化形式包括选择、确认、计算、查找、接收、确定、建立、获得,或者另外地使用图1中示出的一个或多个设备以无论任何方式进行识别或确定。
另外,为了解释的简明性,虽然本文的示图和描述可以包括步骤或阶段的序列或系列,但是本文所公开的方法的要素可以以各种顺序发生和/或同时发生。此外,本文所公开的方法的要素可以随本文并未呈现并描述的其它要素一起进行。此外,可以从根据所公开主题的方法的实施方式中省略本文所描述方法的一个或多个要素。
进行发送的计算和通信设备100A和/或进行接收的计算和通信设备100B的实施方式(以及在其上存储和/或由此被执行的算法、方法、指令等)能够以硬件、软件或者其的任何组合来实现。所述硬件例如能够包括计算机、知识产权(IP)核心、专用集成电路(ASIC)、可编程逻辑阵列、光学处理器、可编程逻辑控制器、微代码、微控制器、服务器、微处理器、数字信号处理器,或者任何其它适当电路。在权利要求中,术语“处理器”应当被理解为以单独或以组合方式涵盖任何的上述硬件。术语“信号”和“数据”可互换使用。另外,发送的计算和通信设备100A与接收的计算和通信设备100B并非必然要以相同方式来实施。
另外,在一种实施方式中,例如,发送的计算和通信设备100A或接收的计算和通信设备100B能够使用计算机程序来实施,所述计算机程序在被执行时实行本文所描述的任何的相应方法、算法和/或指令。除此之外或可替换地,例如,能够采用专用计算机/处理器,其能够包含用于实行本文所描述的任何的相应方法、算法或指令的专用硬件。
发送的计算和通信设备100A与接收的计算和通信设备100B例如能够在实时通信系统中的计算机上实施。可替换地,发送的计算和通信设备100A能够在与服务器分离的设备上实施,所述设备诸如手持通信设备。其它适当的发送的计算和通信设备100A与接收的计算和通信设备100B的实施方案是可行的。例如,接收的计算和通信设备100B通常能够是静止的个人计算机而不是便携式通信设备。
另外,全部或部分的实施方式能够采用例如可从有形的计算机可用介质或计算机可读介质接入的计算机程序产品的形式。计算机可用介质或计算机可读介质能够是例如能够以有形方式包含、存储、通信、或传输程序,用于由任何处理器使用或结合其使用的任何设备。所述介质例如能够是电子、磁性、光学、电磁或半导体设备。其它适当介质也是可用的。
已经对上述实施方式进行了描述,以便允许容易地理解本申请而并非作为限制。相反地,本申请覆盖了包括在所附权利要求范围之内的各种修改和等同部署形式,其范围与最宽泛的解释相符从而包含法律所允许的所有这样的修改和等同结构。
Claims (18)
1.一种用于处理音频数据的方法,包括:
接收输入音频样本;
生成指示所述输入音频样本是否包括软削波失真的软削波信息,其中生成所述软削波信息包括:
将混合模型拟合至所述输入音频样本,其中将所述混合模型拟合至所述输入音频样本包括生成拟合混合模型,使得所述拟合混合模型具有拟合的参数;以及
基于所述拟合混合模型的所述参数评估软削波失真量度,其中,评估所述软削波失真量度包括确定软削波失真值;以及
输出所述软削波信息;
其中,所述拟合混合模型包括:
拉普拉斯分布,所述拉普拉斯分布具有零均值;
第一高斯分布;以及
第二高斯分布,其中,所述第一高斯分布和第二高斯分布是对称的。
2.根据权利要求1所述的方法,其中,评估所述软削波失真量度包括:
使用经训练的机器学习模型评估所述软削波失真量度以用于确定所述软削波失真值。
3.根据权利要求1所述的方法,其中,生成所述软削波信息包括:
确定所述输入音频样本的时间部分序列;以及
通过以下操作来将所述混合模型拟合至所述输入音频样本:
针对来自所述时间部分序列的每个时间部分:
将所述混合模型拟合至相应时间部分;以及
针对每个相应时间部分生成相应软削波信息。
4.一种用于处理音频数据的方法,包括:
接收输入数据信号,其中,所述输入数据信号包括输入音频样本;
生成指示所述输入音频样本是否包括软削波失真的软削波信息,其中,生成所述软削波信息包括将混合模型拟合至所述输入音频样本;并且
输出所述软削波信息;
其中,所述混合模型是受限混合模型;
其中,所述受限混合模型包括:
拉普拉斯分布,所述拉普拉斯分布具有零均值;
第一高斯分布;以及
第二高斯分布,其中,所述第一高斯分布和第二高斯分布是对称的。
5.根据权利要求4所述的方法,其中,将所述混合模型拟合至所述输入音频样本包括:
使用期望最大化将所述混合模型拟合至所述输入音频样本。
6.根据权利要求4所述的方法,其中,将所述混合模型拟合至所述输入音频样本包括:
生成拟合混合模型,使得所述拟合混合模型的参数包括:
所述拟合混合模型的高斯分布的权重;
所述拟合混合模型的高斯分布的均值;
所述拟合混合模型的高斯分布的标准偏差;以及
所述拟合混合模型的拉普拉斯分布的标准偏差。
7.根据权利要求6所述的方法,其中,生成所述软削波信息包括:
基于所述拟合混合模型的参数评估软削波失真量度以用于生成所述软削波信息。
8.根据权利要求7所述的方法,其中,评估所述软削波失真量度包括:
响应于确定所述拟合混合模型的高斯分布的均值超过所述拟合混合模型的高斯分布的标准偏差的第一倍数以及所述拟合混合模型的高斯分布的均值超过所述拟合混合模型的拉普拉斯分布的标准偏差的第二倍数而生成所述输入音频样本包括软削波失真的指示。
9.根据权利要求8所述的方法,其中,所述第一倍数是3,以及所述第二倍数是2。
10.根据权利要求7所述的方法,其中,评估所述软削波失真量度包括:
确定指示所述软削波失真的严重性的软削波失真值。
11.根据权利要求10所述的方法,其中,确定所述软削波失真值包括:
将所述拟合混合模型的高斯分布的权重的第三倍数确定为所述软削波失真值。
12.根据权利要求11所述的方法,其中,所述第三倍数是2。
13.根据权利要求10所述的方法,其中,确定所述软削波失真值包括:
将使用机器学习模型确定评估所述拟合混合模型的参数的结果,作为所述软削波失真值。
14.根据权利要求4所述的方法,其中,将所述混合模型拟合至所述输入音频样本包括:
从所述输入音频样本确定输入音频分位数的定义的基数;
将所述混合模型拟合至所述输入音频分位数。
15.根据权利要求4所述的方法,其中,将所述混合模型拟合至所述输入音频样本包括:
从所述输入音频样本确定硬削波音频样本;
从所述输入音频样本确定背景音频样本;
确定包括除所述硬削波音频样本和背景音频样本以外的所述输入音频样本的目标音频样本;以及
将所述混合模型拟合至所述目标音频样本。
16.根据权利要求4所述的方法,其中,生成所述软削波信息包括:
确定所述输入音频样本的时间部分序列;以及
通过以下操作将所述混合模型拟合至所述输入音频样本;
针对来自所述时间部分序列的每个时间部分:
将所述混合模型拟合至相应时间部分;以及
生成指示该相应时间部分是否包括软削波失真的软削波信息。
17.根据权利要求4所述的方法,其中,所述输入数据信号是音频信号或者视频信号的音频信号分量。
18.一种用于处理音频数据的方法,包括:
接收输入数据信号,其中,所述输入数据信号包括输入音频样本;
针对所述输入数据信号生成软削波信息,其中生成所述软削波信息包括:
确定混合模型,所述混合模型包括:
具有零均值的拉普拉斯分布;
第一高斯分布;和
第二高斯分布,其中所述第一高斯分布和第二高斯分布是对称的;
确定所述输入音频样本的时间部分序列;
针对来自所述时间部分序列的每个时间部分:
通过使用期望最大化将所述混合模型拟合至来自该时间部分的相应输入音频样本而生成相应拟合混合模型;
通过基于所述相应拟合混合模型的参数评估软削波失真量度而生成指示该时间部分是否包括软削波失真的相应软削波信息,其中,响应于确定该时间部分包括软削波失真,生成所述相应软削波信息包括确定针对来自该时间部分的所述相应输入音频样本指示所述软削波失真的严重性的相应软削波失真值;以及
将该时间部分的所述相应软削波信息包括在针对所述输入数据信号的所述软削波信息中;
针对所述输入数据信号生成平均软削波失真值;
将针对所述输入数据信号的平均软削波值包括在针对所述输入数据信号的软削波信息中;
针对所述输入数据信号确定最大软削波失真值;以及
将针对所述输入数据信号的所述最大软削波失真值包括在针对所述输入数据信号的软削波信息中;以及
输出针对所述输入数据信号的软削波信息。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/632,498 | 2017-06-26 | ||
US15/632,498 US10110187B1 (en) | 2017-06-26 | 2017-06-26 | Mixture model based soft-clipping detection |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109120245A CN109120245A (zh) | 2019-01-01 |
CN109120245B true CN109120245B (zh) | 2021-08-10 |
Family
ID=61899378
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711337854.9A Expired - Fee Related CN109120245B (zh) | 2017-06-26 | 2017-12-14 | 基于混合模型的软削波检测 |
Country Status (4)
Country | Link |
---|---|
US (1) | US10110187B1 (zh) |
EP (1) | EP3542363B1 (zh) |
CN (1) | CN109120245B (zh) |
WO (1) | WO2019005232A1 (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109893163B (zh) * | 2019-01-23 | 2021-07-02 | 苏州美糯爱医疗科技有限公司 | 一种自动定位并修复电子听诊器削波失真波形的方法 |
CN109903784B (zh) * | 2019-03-01 | 2021-03-26 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种拟合失真音频数据的方法及装置 |
CN112671376B (zh) * | 2020-12-16 | 2022-12-06 | Oppo(重庆)智能科技有限公司 | 信号的削波检测方法、装置、终端和计算机可读存储介质 |
CN114510599A (zh) * | 2022-01-14 | 2022-05-17 | 北京有竹居网络技术有限公司 | 特征编码模型生成方法、音频确定方法以及相关装置 |
WO2023249939A1 (en) * | 2022-06-21 | 2023-12-28 | Immersion Networks, Inc. | System and method for digital signal processing using adaptive soft clipping with lookahead |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1531293A (zh) * | 2003-03-11 | 2004-09-22 | ���Ͽع�����˾ | 减小峰均功率比的方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1999053612A1 (en) * | 1998-04-14 | 1999-10-21 | Hearing Enhancement Company, Llc | User adjustable volume control that accommodates hearing |
US6801895B1 (en) | 1998-12-07 | 2004-10-05 | At&T Corp. | Method and apparatus for segmenting a multi-media program based upon audio events |
JP5239594B2 (ja) | 2008-07-30 | 2013-07-17 | 富士通株式会社 | クリップ検出装置及び方法 |
US9426592B2 (en) | 2013-02-14 | 2016-08-23 | Google Inc. | Audio clipping detection |
-
2017
- 2017-06-26 US US15/632,498 patent/US10110187B1/en active Active
- 2017-12-14 CN CN201711337854.9A patent/CN109120245B/zh not_active Expired - Fee Related
-
2018
- 2018-03-15 WO PCT/US2018/022623 patent/WO2019005232A1/en unknown
- 2018-03-15 EP EP18715866.2A patent/EP3542363B1/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1531293A (zh) * | 2003-03-11 | 2004-09-22 | ���Ͽع�����˾ | 减小峰均功率比的方法 |
Also Published As
Publication number | Publication date |
---|---|
EP3542363B1 (en) | 2020-02-05 |
EP3542363A1 (en) | 2019-09-25 |
CN109120245A (zh) | 2019-01-01 |
US10110187B1 (en) | 2018-10-23 |
WO2019005232A1 (en) | 2019-01-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109120245B (zh) | 基于混合模型的软削波检测 | |
US9769190B2 (en) | Methods and apparatus to identify malicious activity in a network | |
US11928583B2 (en) | Adaptation of deep learning models to resource constrained edge devices | |
US9554203B1 (en) | Sound source characterization apparatuses, methods and systems | |
US8271278B2 (en) | Quantizing feature vectors in decision-making applications | |
CN108828570B (zh) | 一种基于路径损耗因子动态估计的测距方法及测距装置 | |
CN104333530A (zh) | 信息可信度验证方法及装置 | |
CN113869533A (zh) | 联邦学习建模优化方法、设备、可读存储介质及程序产品 | |
CN104348655A (zh) | 系统安全健康度判定方法及装置 | |
Zhang et al. | A light-weight and quality-aware online adaptive sampling approach for streaming social sensing in cloud computing | |
Shafiq et al. | Effective feature selection for 5G IM applications traffic classification | |
Dahanayaka et al. | Robust open-set classification for encrypted traffic fingerprinting | |
US20230004776A1 (en) | Moderator for identifying deficient nodes in federated learning | |
US20220129767A1 (en) | Transmitter identifying apparatus, transmitter identifying method, and program | |
CN111047049A (zh) | 基于机器学习模型处理多媒体数据的方法、装置及介质 | |
US20230328528A1 (en) | Security in communication networks | |
CN114339252A (zh) | 一种数据压缩方法及装置 | |
US9479372B2 (en) | Methods, systems, and media for determining whether a signal of interest is present | |
CN116980300A (zh) | 带宽估计方法、装置、电子设备及存储介质 | |
CN115174237A (zh) | 一种物联网系统恶意流量的检测方法、装置和电子设备 | |
CN110163761B (zh) | 基于图像处理的可疑项目成员识别方法及装置 | |
CN114202758A (zh) | 食品信息生成方法、装置、电子设备和介质 | |
US20230015049A1 (en) | System and method for determining authenticity of a mobile device | |
US8942535B1 (en) | Implicit video location augmentation | |
WO2024051364A1 (zh) | 活体检测模型训练方法、装置、存储介质以及终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210810 |
|
CF01 | Termination of patent right due to non-payment of annual fee |