0% found this document useful (0 votes)

27 views48 pages

13 Density Estimation Note

Uploaded by

jt5nsvbbff

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

27 views48 pages

13 Density Estimation Note

Uploaded by

jt5nsvbbff

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 48

Machine Learning CS 4641-7641

Density Estimation
Mahdi Roozbahani
Georgia Tech

The slides are inspired from Le Song.

Why we love exponential terms?
Outline

• Overview
• Parametric Density Estimation
• Nonparametric Density Estimation

4
Continuous variable
Continuous probability distribution
Probability density function
න 𝑓𝑋 𝑥 𝑑𝑥 = 1
Density value
Temperature (real number)
Gaussian Distribution

Discrete variable
Discrete probability distribution
Probability mass function
Probability value ෍ 𝑓𝑋 𝑥 = 1
Coin flip (integer) 𝑥𝜖𝐴
Bernoulli distribution
Why Density Estimation?

Access the density of seeing a particular data point

6
Example: Test Scores

Histogram is an estimate of the probability distribution of a continuous

variable
7
Example: Test Scores

8
Parametric Density Estimation

1 → 𝐻𝑒𝑎𝑑
0 → 𝑇𝑎𝑖𝑙𝑠
x
x 𝜃 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑡𝑦 𝑜𝑓 𝑝𝑜𝑠𝑠𝑖𝑏𝑙𝑒 𝑜𝑢𝑡𝑐𝑜𝑚𝑒

𝑑 𝑑×𝑑

9
Nonparametric Density Estimation

10
Parametric v.s. Nonparametric Density Estimation

11
Parametric v.s. Nonparametric Density Estimation

12
Outline

• Overview
• Parametric Density Estimation
• Nonparametric Density Estimation

13
Estimating Parametric Models

n
n 𝑋 = 𝑥1 , 𝑥2 , … , 𝑥𝑛

Using the parameters, we can estimate each data point

N
𝑋 𝑥𝑖 |

14
Example Problem

𝑋 = 𝑥1 , 𝑥2 , … , 𝑥n𝑛 = 1,0,1, … , 0 , 𝑥𝑖 ∈ {0,1}

𝐿 𝜃 𝑥𝑖 = 𝑝 𝑥𝑖 𝜃 = 𝜃 𝑥𝑖 1 − 𝜃 1−𝑥𝑖

15
MLE for Biased Coin

𝑖 𝑖
𝑖

16
Estimating Gaussian Distributions

n
n
𝑋 = 𝑥1 , 𝑥2 , … , 𝑥𝑛 , 𝑥𝑖 ∈ 𝑅

Density of a data point:

𝑥𝑖 𝑥𝑖

17
Estimating Gaussian Distributions

n
𝑥𝑖
n

n
𝑥𝑖
n
18
MLE for Gaussian Distribution
N

𝑙 𝜃 𝑋 =𝑙(𝜇, 𝜎|𝑋) 𝑥𝑖
N
n n 𝑥𝑖

19
MLE for Gaussian Distribution

N
n n 𝑥𝑖
𝑙(𝜇, 𝜎|𝑋)
𝑋
n
N
𝑥𝑖
n
N n
N
𝑥𝑖 n 𝑥𝑖
n

n
N
n
𝑥𝑖
n
N n
N
𝑥𝑖 n 𝑥𝑖
n

20
Example

21
Outline

• Overview
• Parametric Density Estimation
• Nonparametric Density Estimation

Can be used for:

• Visualization
• Classification
• Regression

22
Example: Test Scores

23
1-D Histogram

N 𝑋 = 𝑥1 , 𝑥2 , … , 𝑥n𝑛 = 𝑥𝑖 ∈ [0,1)

M
1 1 2 𝑙−1 𝑙 M 𝑀−1
𝐵1 = ൥0, ቇ , 𝐵2 = ቈ , ቇ , … , 𝐵𝑙 = ቈ , ቇ , … , 𝐵𝑀 = ൤ , 1)
𝑀 M𝑀 𝑀 M M 𝑀 M 𝑀 𝑀

1
For a new test data point x which belongs to 𝐵𝑙
𝑀
m 𝑁
𝑀 M 𝑛𝑢𝑚𝑏𝑒𝑟 𝑜𝑓 𝑝𝑜𝑖𝑛𝑡𝑠 𝑖𝑛 𝑏𝑖𝑛 𝐵𝑙 (𝑐𝑙 )
The probability that point x is 𝑝 𝑥 = 𝑒(𝑥
෍ 1(𝑥𝑖 𝜖𝜖𝐵
𝐵𝑙𝑗)) =
drawn from a distribution p(x) 𝑁 N 𝑡𝑜𝑡𝑎𝑙 𝑛𝑢𝑚𝑏𝑒𝑟 𝑜𝑓 𝑑𝑎𝑡𝑎 𝑝𝑜𝑖𝑛𝑡𝑠 × 𝑏𝑖𝑛 𝑤𝑖𝑑𝑡ℎ
𝑖=1

‫? 𝑥𝑑 𝑥 𝑝 ׬‬
24
Why is Histogram Valid?

1 𝑁
𝑀
න ෍ 1 𝑥𝑖 𝜖 𝐵𝑙 𝑑𝑥
0 𝑁 𝑖=1
1 2 𝑙
𝑀 𝑁 𝑀 𝑁 𝑀 𝑁
𝑀 𝑀 𝑀
= න ෍ 1 𝑥𝑖 𝜖 𝐵𝑙 𝑑𝑥 + න ෍ 1 𝑥𝑖 𝜖 𝐵𝑙 𝑑𝑥 + … + න ෍ 1 𝑥𝑖 𝜖 𝐵𝑙 𝑑𝑥 =
𝑁 𝑁 𝑁
0 𝑖=1 1 𝑖=1 𝑙−1 𝑖=1
𝑀 𝑀
1 2 𝑙
𝑀 𝑀 𝑀 1
𝑀
= න 𝑐1 𝑑𝑥 + න 𝑐2 𝑑𝑥 + ⋯ + න 𝑐𝑙 𝑑𝑥 + ⋯ + න 𝑐𝑀 𝑑𝑥 =
𝑁
0 1 𝑙−1 𝑀−1
𝑀 𝑀 𝑀
𝑀 𝑙 𝑀 𝑀
𝑀 𝑀
𝑀 𝑙 𝑙−1 𝑐𝑙
= ෍ න 𝑐𝑙 𝑑𝑥 = ෍ 𝑐𝑙 − = ෍ = 1
𝑁 𝑙−1 𝑁 𝑀 𝑀 𝑁
𝑙=1 𝑀 𝑗=1 𝑙=1
27
Higher-Dimensional Histogram

𝑛 𝑋 = 𝑥1 , 𝑥2 , … , 𝑛𝑥𝑛 , 𝑥𝑖 ∈ [0,1)𝑑

𝑀𝑑

1
𝑀

𝑇𝑤𝑜 𝐷𝑖𝑚𝑒𝑛𝑠𝑖𝑜𝑛𝑎𝑙 𝑑𝑎𝑡𝑎:

𝑀 = 10 (number of bins in each dimension)

𝑀2 = 100 ( total number of bins for two dimensional data)

28
29
Output Depends on Where You Put the Bins

0.5

30
Output Depends on Where You Put the Bins

0.25

31
Kernel Density Estimation

𝑁
𝑁 𝑥𝑔 𝑥𝑖
1 1 𝑥𝑙 − 𝑥𝑖 𝑥𝑙 = 𝑥𝑔𝑟𝑖𝑑𝑙𝑖𝑛𝑒
𝑝 𝑥 =𝑁 ෍ 𝐾
𝑁 ℎ ℎ
𝑖

32
Smoothing Kernel Functions

33
Example
𝑝 𝑥
𝑁𝑁 𝑥𝑖
1 1 𝑥𝑙 − 𝑥𝑖
= 𝑁𝑛෍ 𝐾
𝑁 ℎ ℎ
𝑖

34
Effect of the Kernel Bandwidth (h)
𝑁
1 𝑁 1 𝑥𝑙 − 𝑥𝑖
𝑝 𝑥 = 𝑥
෍ 𝐾 𝑖
𝑁 ℎ ℎ
𝑛𝑁 𝑖

35
Visual Example
50 datapoints are given to us

-15 -10 -5 0 5 10 15
Visual Example
Let’s implement 20 bins histogram
Frequency

-15 -10 -5 0 5 10 15
Visual Example
Let’s create 200 uniform gridlines (𝑥𝑙 ) to have a smoother density function
OR simply you can just implement this on each datapoint

0
-15 -10 -5 0 5 10 15
𝑁
For each linearly spaced 1 1
gridline 𝑥𝑙 , let’s calculate the 𝑝 𝑥 = ෍ 𝐾(𝑢𝑖 )
Gaussian kernel value over 𝑁 ℎ
𝑖 𝑥𝑙 − 𝑥𝑖
the given 50 points 1 −𝑢𝑖2 /2
𝑢𝑖 = 𝐾(𝑢𝑖 ) = 𝑒
ℎ 2𝜋

0
-15 -10 -5 0 5 10 15
Density value
As an example of kernel heights for line at 0

𝑥𝑙 = −15
Linearly spaced lines

𝑥𝑙 = 0 0.000 0.0001 0.0002 0.0003 0.0004………………0.0 0.0 0.0 0.0………….……… 0.0004 0.0003 0.0002 0.0001 0.0000

𝑥𝑙 = 15

200X50
Density value

𝑥𝑙 = −15
Linearly spaced lines

𝑥𝑙 = 0 0.000 0.0001 0.0002 0.0003 0.0004……………….……0 0 0 0…………….……… 0.0004 0.0003 0.0002 0.0001 0.0000

Density at L = 0
⋮ 𝑃 𝑥𝑙 = 0 = 𝑚𝑒𝑎𝑛 𝑳𝟎

𝑥𝑙 = 15
𝑁
1 1 𝑥𝑙 − 𝑥𝑖
𝑝 𝑥 = ෍ 𝐾 200X50
𝑁 ℎ ℎ
𝑖
Visual Example
Based on Gaussian kernel estimator Interactive Example

-15 -10 -5 0 5 10 15
𝐹𝑜𝑟 𝜎 = 1; Numerical Example

% Data ; There are 200 data points (-13~<data<~13)

randn('seed',1) % Used for reproducibility
x = [randn(100,1)-10; randn(100,1)+10]; % Two Normals mixed (GROUND TRUTH)

1
4𝜎ො 2 5 −
1
ℎ= ≈ 1.06𝜎𝑁
ො 5
3𝑁
h = std(x)*(4/3/numel(x))^(1/5); % Bandwidth estimated by Silverman's Rule of Thumb

% Let’s create apply density estimation over 1000 linearly spaced points (𝑥𝑙 )
xl = linspace(-25,+25,1000); % gridlines
% Let’s generate a “TRUE” density over all the bins given the “Ground Truth” information.

truepdf_firstnormal = exp(-.5*(xl-10).^2)/sqrt(2*pi);
truepdf_secondnormal = exp(-.5*(xl+10).^2)/sqrt(2*pi);
truepdf = truepdf_firstnormal/2 + truepdf_secondnormal/2;
% divided down by 2, because we are adding density value two times
plot(x,truepdf) % Plot True Density
% Let’s calculate Gaussian kernel density for each linearly spaced
point over 200 Given data points

𝑁
1 1 𝑥𝑙 − 𝑥𝑖
𝑝 𝑥 = ෍ 𝐾(𝑢𝑖 ) 𝑢𝑖 =
𝑁 ℎ ℎ
𝑖

1 −𝑢𝑖2 /2
Gaussian kernel 𝐾(𝑢𝑖 ) = 𝑒
2𝜋

for l=1:size(xl,1) % let’s loop over grid lines (𝑥𝑙 )

u = (xl(l) - x)./h; % length of u is 200
Ku = exp(-.5*u.^2)/sqrt(2*pi);
Ku = Ku./h;
px(l) = mean(Ku);
end
plot(x,truepdf)
plot(x,px)

truepdf

px
Two-Dimensional Examples

47
Choosing the Kernel Bandwidth

1
−
≈ 1.06𝜎𝑁
ො 5

48
Non-parametric vs parametric
Summary

• Parametric density estimation

Maximum likelihood estimation
Different parametric forms

• Nonparametric density estimation

Histogram
Kernel density estimation

05 Density Estimation
No ratings yet
05 Density Estimation
29 pages
Ast Part1 PDF
No ratings yet
Ast Part1 PDF
20 pages
U4 ProbabilityDensityEstimation
No ratings yet
U4 ProbabilityDensityEstimation
6 pages
TEAA - Memory Based Tecniques
No ratings yet
TEAA - Memory Based Tecniques
23 pages
Estimating PDF'S, Means, Variances: 1 Exp 1: Estimated PDF/CDF Plots From Data
No ratings yet
Estimating PDF'S, Means, Variances: 1 Exp 1: Estimated PDF/CDF Plots From Data
12 pages
Non-Parametric Methods
No ratings yet
Non-Parametric Methods
51 pages
Non Parametric Density Estimation
No ratings yet
Non Parametric Density Estimation
4 pages
Towardsdatascience Com The Math Behind Kernel Density Estimation 5deca75cba38 ...
No ratings yet
Towardsdatascience Com The Math Behind Kernel Density Estimation 5deca75cba38 ...
26 pages
Articulo Sheather
No ratings yet
Articulo Sheather
11 pages
Non-Parametric Density Estimation
No ratings yet
Non-Parametric Density Estimation
3 pages
Density Estimation
No ratings yet
Density Estimation
17 pages
Kernel Density Estimation - Wikipedia
No ratings yet
Kernel Density Estimation - Wikipedia
11 pages
The Study of Different Types of Kernel Density Estimators: Minge Sha, Yonggang Xie
No ratings yet
The Study of Different Types of Kernel Density Estimators: Minge Sha, Yonggang Xie
5 pages
Empirical Finance1
No ratings yet
Empirical Finance1
31 pages
Mean-Shift Tracking: R.Collins, CSE, PSU CSE598G Spring 2006
No ratings yet
Mean-Shift Tracking: R.Collins, CSE, PSU CSE598G Spring 2006
93 pages
Econometricians' Guide to KDE
No ratings yet
Econometricians' Guide to KDE
35 pages
Kernel Density Estimation and Its Application
No ratings yet
Kernel Density Estimation and Its Application
8 pages
Comprehensiv Questions Solved
No ratings yet
Comprehensiv Questions Solved
28 pages
Advanced Data Analysis Techniques
No ratings yet
Advanced Data Analysis Techniques
20 pages
Tabak Turner
No ratings yet
Tabak Turner
20 pages
Kde Slides
No ratings yet
Kde Slides
29 pages
Nonparametric Methods: Jason Corso
No ratings yet
Nonparametric Methods: Jason Corso
49 pages
(Bernard. W. Silverman) Density Estimation For Sta
No ratings yet
(Bernard. W. Silverman) Density Estimation For Sta
92 pages
Nonparametric Statistics Epiphany 2024-25
No ratings yet
Nonparametric Statistics Epiphany 2024-25
102 pages
Intro To Kernel Density Estimation
No ratings yet
Intro To Kernel Density Estimation
4 pages
A Review of Kernel Density Estimation With Applications To Econometrics (#278024) - 259389
No ratings yet
A Review of Kernel Density Estimation With Applications To Econometrics (#278024) - 259389
23 pages
Merged Exercises
No ratings yet
Merged Exercises
238 pages
CH Density Estimation
No ratings yet
CH Density Estimation
15 pages
Tensor Density Estimator by Convolution-Deconvolution
No ratings yet
Tensor Density Estimator by Convolution-Deconvolution
57 pages
Advanced Density Estimation Guide
No ratings yet
Advanced Density Estimation Guide
32 pages
Non-Parametric Methods Using Kernel Density Estimation
No ratings yet
Non-Parametric Methods Using Kernel Density Estimation
1 page
Simon Sheather 2004 PDF
No ratings yet
Simon Sheather 2004 PDF
10 pages
On Density Estimation
No ratings yet
On Density Estimation
4 pages
Kernel Density Estimation
No ratings yet
Kernel Density Estimation
10 pages
Chap 4
No ratings yet
Chap 4
21 pages
MT2023 Sol
No ratings yet
MT2023 Sol
8 pages
M3 DensityEstimation v1
No ratings yet
M3 DensityEstimation v1
65 pages
Pa 01 Density Estimation
No ratings yet
Pa 01 Density Estimation
25 pages
Slides3part1 mrbm2324
No ratings yet
Slides3part1 mrbm2324
29 pages
Pattern Recognition 21BR551 MODULE 03 NOTES
No ratings yet
Pattern Recognition 21BR551 MODULE 03 NOTES
16 pages
Densityestimation
No ratings yet
Densityestimation
28 pages
Chapter One
100% (1)
Chapter One
46 pages
Getdist: Kernel Density Estimation: Url: Http://Cosmologist - Info
No ratings yet
Getdist: Kernel Density Estimation: Url: Http://Cosmologist - Info
11 pages
Lec 10 NN
No ratings yet
Lec 10 NN
10 pages
CrimeStatChapter 8
No ratings yet
CrimeStatChapter 8
43 pages
Parameter Estimation - PR
No ratings yet
Parameter Estimation - PR
66 pages
Day 3
No ratings yet
Day 3
19 pages
Lecture 12
No ratings yet
Lecture 12
4 pages
C15 Cis2033
No ratings yet
C15 Cis2033
16 pages
Lecture 5: Let's Look at Some Data: Exploratory Data Analysis
No ratings yet
Lecture 5: Let's Look at Some Data: Exploratory Data Analysis
29 pages
Histogram: Nonparametric Kernel Density Estimation
No ratings yet
Histogram: Nonparametric Kernel Density Estimation
19 pages
Introduction
No ratings yet
Introduction
3 pages
Jinuntuya 2025 J. Phys.: Conf. Ser. 2934 012002
No ratings yet
Jinuntuya 2025 J. Phys.: Conf. Ser. 2934 012002
6 pages
Chapter 02 Understanding of Data
No ratings yet
Chapter 02 Understanding of Data
63 pages
Lecture 8
No ratings yet
Lecture 8
76 pages
Normal vs. Exponential Distributions
No ratings yet
Normal vs. Exponential Distributions
9 pages
How To Create Sales Order Using BAPI
No ratings yet
How To Create Sales Order Using BAPI
5 pages
XC420 GB PDF
No ratings yet
XC420 GB PDF
4 pages
First Attempt Final Exam - Quality Management
No ratings yet
First Attempt Final Exam - Quality Management
10 pages
Inferential Measurement of Sag Mill Parameters : Parameter
No ratings yet
Inferential Measurement of Sag Mill Parameters : Parameter
17 pages
As Cfe Interop 101 Slave en PDF
No ratings yet
As Cfe Interop 101 Slave en PDF
10 pages
maxVUE Parameterization
No ratings yet
maxVUE Parameterization
6 pages
HBV Manual 2005 PDF
No ratings yet
HBV Manual 2005 PDF
32 pages
Manual - Cabinet Builder 12
No ratings yet
Manual - Cabinet Builder 12
16 pages
Module 1
0% (2)
Module 1
3 pages
Identification of Parameter Correlations For Parameter Estimation in Dynamic Biological Models
No ratings yet
Identification of Parameter Correlations For Parameter Estimation in Dynamic Biological Models
12 pages
FEA Assembly Optimization Guide
No ratings yet
FEA Assembly Optimization Guide
8 pages
ACT Customization Guide For Mechanical
No ratings yet
ACT Customization Guide For Mechanical
58 pages
Advanced Risk Model Applications
No ratings yet
Advanced Risk Model Applications
67 pages
Analysis of Grinding in A Spiral Jet Mill. Part 1 Batch Grinding
No ratings yet
Analysis of Grinding in A Spiral Jet Mill. Part 1 Batch Grinding
12 pages
IPS (Points and Interval Estimate)
No ratings yet
IPS (Points and Interval Estimate)
23 pages
Polymath 5 Overview
No ratings yet
Polymath 5 Overview
15 pages
Ifoa Syllabus Mapping Template
No ratings yet
Ifoa Syllabus Mapping Template
132 pages
Statistical Science Guide
No ratings yet
Statistical Science Guide
37 pages
Umberto Pelizzari - Specific Training For Freediving - Deep, Static and Dynamic Apnea (2019, Independently Published) PDF
83% (6)
Umberto Pelizzari - Specific Training For Freediving - Deep, Static and Dynamic Apnea (2019, Independently Published) PDF
254 pages
ICICI API Specification V1.2
No ratings yet
ICICI API Specification V1.2
42 pages
White Paper On Otl Archive and Purge
No ratings yet
White Paper On Otl Archive and Purge
20 pages
Acceptance Sampling in Quality Control 2017
100% (1)
Acceptance Sampling in Quality Control 2017
883 pages
DMGR Programmer's Reference Manual
No ratings yet
DMGR Programmer's Reference Manual
9 pages
Manual 2 For Datamine Studio RM
100% (1)
Manual 2 For Datamine Studio RM
14 pages
MSEP - Mintec
No ratings yet
MSEP - Mintec
158 pages
Statistical Inference
No ratings yet
Statistical Inference
148 pages
Prediction of Pavement Remaining Life: T. S. V, K. P. G, A. R S
No ratings yet
Prediction of Pavement Remaining Life: T. S. V, K. P. G, A. R S
8 pages
Bayesian-Statistics Final 20140416 3
No ratings yet
Bayesian-Statistics Final 20140416 3
38 pages
Simulation of Insurance Data With Actuar
No ratings yet
Simulation of Insurance Data With Actuar
14 pages

13 Density Estimation Note

Uploaded by

13 Density Estimation Note

Uploaded by

Machine Learning CS 4641-7641

The slides are inspired from Le Song.

Access the density of seeing a particular data point

Histogram is an estimate of the probability distribution of a continuous

Using the parameters, we can estimate each data point

𝑋 = 𝑥1 , 𝑥2 , … , 𝑥n𝑛 = 1,0,1, … , 0 , 𝑥𝑖 ∈ {0,1}

Density of a data point:

Can be used for:

𝑇𝑤𝑜 𝐷𝑖𝑚𝑒𝑛𝑠𝑖𝑜𝑛𝑎𝑙 𝑑𝑎𝑡𝑎:

𝑀 = 10 (number of bins in each dimension)

𝑀2 = 100 ( total number of bins for two dimensional data)

% Data ; There are 200 data points (-13~<data<~13)

for l=1:size(xl,1) % let’s loop over grid lines (𝑥𝑙 )

• Parametric density estimation

• Nonparametric density estimation

You might also like