0% found this document useful (0 votes)

106 views3 pages

Normalization and Calibration

The document discusses normalization and calibration in the context of feature scaling for machine learning. Normalization adjusts the scale of features without target labels using methods like Z-score, Robust, and Min-Max normalization, while calibration adjusts scaling using target labels to enhance model performance in binary classification. Both techniques ensure that features contribute effectively to model training and improve the handling of categorical and ordinal data.

Uploaded by

Mahesh veera

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

106 views3 pages

Normalization and Calibration

Uploaded by

Mahesh veera

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

Normalization and Calibration

Normalization (Unsupervised Scaling)

Normalization is used to adjust the scale of quantitative features without using target labels.

Purpose:

• Ensures all features contribute equally during model training.

• Useful when features are on different scales.

Methods of Normalization:

1. Z-score Normalization (Standardization)

• Best for normally distributed data.

• Formula:
$$z = \frac{x - \text{mean}}{\text{std deviation}}$$

2. Robust Normalization

• Best for non-normal data.

• Formula:
$$\frac{x - \text{median}}{\text{IQR}}$$
(IQR - interquartile range)

3. Min-Max Normalization

• Scales values to the [0, 1] range.

• Formula:
$$\frac{x - \text{min}}{\text{max} - \text{min}}$$

o Truncation may be used if exact min/max aren't known.

Calibration (Supervised Scaling)

Calibration adjusts feature scaling using target labels, often in binary classification.

Purpose:

• Adds meaningful class information to features.

• Helps models (e.g., linear classifiers) handle categorical/ordinal features more effectively.

How Calibration Works:

For a feature value ( v = F(x) ), create a calibrated feature ( Fc(x) ) that estimates:
( P(\text{positive class} | v) ) → ( Fc: X → [0, 1] )

Benefits:
✔ Makes features suitable for models that depend on probability (e.g., Naive Bayes).
✔ No further training needed after calibration.
✔ Helps the algorithm decide how to use the feature (numerical, categorical, or ordinal).

Examples

Normalization (Unsupervised)

Dataset with "Age" Feature:

Person Age

A 20

B 25

C 30

D 35

Using Min-Max Normalization:

• Min (l) = 20

• Max (h) = 35

• Formula:
$$\frac{\text{Age} - 20}{35 - 20}$$

Normalized Values:

Person Age Normalized Age

A 20 0.00

B 25 0.33

C 30 0.67

D 35 1.00

Calibration (Supervised)

Binary Classification Example - Product Purchase

Age Group Bought Product (1 = Yes, 0 = No)

20–29 2 Yes, 8 No

30–39 7 Yes, 3 No

Probability Estimation for Calibration:

• For 20–29:
$$P(\text{Yes}) = \frac{2}{2+8} = 0.2$$

• For 30–39:
$$P(\text{Yes}) = \frac{7}{7+3} = 0.7$$

Calibrated Feature Table:

Person Age Group Calibrated Value (P(Yes))

A 20–29 0.2

B 30–39 0.7

Final Steps

Now, you can:

1. Copy & paste this into a Word or Google Doc.

2. Add diagrams if needed.

3. Save or export as PDF.

Want me to improve the formatting further or add more details? I'm happy to help!

Data Normalization Machine Learning
No ratings yet
Data Normalization Machine Learning
5 pages
Data Preprocessing: Essential Steps For Preparing Data Before Modeling
No ratings yet
Data Preprocessing: Essential Steps For Preparing Data Before Modeling
111 pages
Feature Scaling (Standardization & Normalization)
No ratings yet
Feature Scaling (Standardization & Normalization)
35 pages
ML - Week 04
No ratings yet
ML - Week 04
33 pages
Feature Engineering
No ratings yet
Feature Engineering
18 pages
Normalization Vs Standardization
No ratings yet
Normalization Vs Standardization
2 pages
Data Preprocessing: Normalize vs. Standardize
No ratings yet
Data Preprocessing: Normalize vs. Standardize
10 pages
5.feauture Engineering
No ratings yet
5.feauture Engineering
34 pages
ML Unit 2
No ratings yet
ML Unit 2
90 pages
Practical 6
No ratings yet
Practical 6
6 pages
3 - AML - Lecture 3 - Feature Engg
No ratings yet
3 - AML - Lecture 3 - Feature Engg
39 pages
Unit 4
No ratings yet
Unit 4
33 pages
Normalization: Normalization Techniques at A Glance
No ratings yet
Normalization: Normalization Techniques at A Glance
5 pages
Standardization Campusx
No ratings yet
Standardization Campusx
4 pages
Week 10
No ratings yet
Week 10
50 pages
Data Normalization
No ratings yet
Data Normalization
7 pages
Smai Lecture 04 Perf Measures Classification
No ratings yet
Smai Lecture 04 Perf Measures Classification
42 pages
Feature Scaling in Machine Learning
No ratings yet
Feature Scaling in Machine Learning
4 pages
ML Lab Exam Document
No ratings yet
ML Lab Exam Document
14 pages
Standar Ization
No ratings yet
Standar Ization
7 pages
4 - Finding and Fixing Data Quality Issues
No ratings yet
4 - Finding and Fixing Data Quality Issues
48 pages
Data Normalization in Data Mining
No ratings yet
Data Normalization in Data Mining
8 pages
Presentation #1 Data Mining Minahel Khan BSIT (E) 22!11!1
No ratings yet
Presentation #1 Data Mining Minahel Khan BSIT (E) 22!11!1
7 pages
Example Data Mining
No ratings yet
Example Data Mining
4 pages
Scaling Techniques
No ratings yet
Scaling Techniques
30 pages
Investigating The Impact of Data Normalization On Classification Performance
No ratings yet
Investigating The Impact of Data Normalization On Classification Performance
23 pages
Seven Lab Instruction
No ratings yet
Seven Lab Instruction
38 pages
Data Preprocessing PT 2
No ratings yet
Data Preprocessing PT 2
7 pages
Data Preprocessing
No ratings yet
Data Preprocessing
49 pages
ML Normalization Techniques - Overview & Practical Guide
No ratings yet
ML Normalization Techniques - Overview & Practical Guide
5 pages
04 - Data Normalization in Python - en
No ratings yet
04 - Data Normalization in Python - en
1 page
Machine Learning Feature Scaling
No ratings yet
Machine Learning Feature Scaling
26 pages
8 Normalization Methods
No ratings yet
8 Normalization Methods
10 pages
Session 7 Feature Selection & Dimensionality Reduction
No ratings yet
Session 7 Feature Selection & Dimensionality Reduction
20 pages
Lecture1-Introduction To Data Mining
No ratings yet
Lecture1-Introduction To Data Mining
46 pages
Feature Engineering
No ratings yet
Feature Engineering
15 pages
Lab Sheet 02
No ratings yet
Lab Sheet 02
8 pages
Normalization Techniques
No ratings yet
Normalization Techniques
2 pages
Machine Learning - Lec4 - 5
No ratings yet
Machine Learning - Lec4 - 5
41 pages
5 Preprocessing
No ratings yet
5 Preprocessing
44 pages
Lecture 7 Data Transformation and Dimensionality Reduction
No ratings yet
Lecture 7 Data Transformation and Dimensionality Reduction
22 pages
TOPIC 3 Pima Indian
No ratings yet
TOPIC 3 Pima Indian
16 pages
On Calibration of Modern Neural Networks
No ratings yet
On Calibration of Modern Neural Networks
14 pages
Data Preprocessing and Feature Engineering
No ratings yet
Data Preprocessing and Feature Engineering
32 pages
Data Preparation.2
No ratings yet
Data Preparation.2
18 pages
Data Processing
No ratings yet
Data Processing
19 pages
Data Mining
No ratings yet
Data Mining
11 pages
dmdw2 2
No ratings yet
dmdw2 2
24 pages
3 1 Chapter 3 Normalization
No ratings yet
3 1 Chapter 3 Normalization
22 pages
ML Notes
No ratings yet
ML Notes
44 pages
Lecture 5
No ratings yet
Lecture 5
26 pages
Model Selection and Feature Engineering
No ratings yet
Model Selection and Feature Engineering
64 pages
Feature Scaling
No ratings yet
Feature Scaling
13 pages
Unit 3-2
No ratings yet
Unit 3-2
15 pages
Feature Engineering for BE Students
No ratings yet
Feature Engineering for BE Students
91 pages
Feature Scaling Techniques: Machine Learning
No ratings yet
Feature Scaling Techniques: Machine Learning
27 pages
Standardization Vs Normalization in Pattern Recognition
No ratings yet
Standardization Vs Normalization in Pattern Recognition
1 page
AIPPTMaker - Data Preprocessing and Feature Engineering - Key To Improving AI Algorithm Performance
No ratings yet
AIPPTMaker - Data Preprocessing and Feature Engineering - Key To Improving AI Algorithm Performance
35 pages
Reinforcement Learning Enhanced
No ratings yet
Reinforcement Learning Enhanced
3 pages
Reinforcement Learning Overview
No ratings yet
Reinforcement Learning Overview
2 pages
Non Parametric Tests R Examples
No ratings yet
Non Parametric Tests R Examples
4 pages
Firewalls
No ratings yet
Firewalls
2 pages
Tds - Emaco Cp20
No ratings yet
Tds - Emaco Cp20
3 pages
216, 226, 236 and 246 Hydraulic System Skid Steer Loaders: 4NZ1-3399 5FZ1-6699 4YZ1-3999 5SZ1-3999
0% (1)
216, 226, 236 and 246 Hydraulic System Skid Steer Loaders: 4NZ1-3399 5FZ1-6699 4YZ1-3999 5SZ1-3999
2 pages
Mobile Phone Monitor Software User's Manual Symbian OS-2010-01
No ratings yet
Mobile Phone Monitor Software User's Manual Symbian OS-2010-01
11 pages
Kinesics
No ratings yet
Kinesics
12 pages
Model Confederation
No ratings yet
Model Confederation
5 pages
Group 5 Understanding The Lived Experiences of Single Parents Balancing Work and
No ratings yet
Group 5 Understanding The Lived Experiences of Single Parents Balancing Work and
15 pages
OpenVas Vulnerability Scanning
No ratings yet
OpenVas Vulnerability Scanning
7 pages
The Book of (PLC & SCADA) Dosing System by HMI
No ratings yet
The Book of (PLC & SCADA) Dosing System by HMI
102 pages
Electrical Engineering Exam Prep
80% (5)
Electrical Engineering Exam Prep
3 pages
Various Retrofitting Methods For Repair and Rehabilitation For Concrete Failure
No ratings yet
Various Retrofitting Methods For Repair and Rehabilitation For Concrete Failure
10 pages
QB Grammar
No ratings yet
QB Grammar
13 pages
Horoscope Report for Astrologers
No ratings yet
Horoscope Report for Astrologers
46 pages
Sullivan Et Al-2001
No ratings yet
Sullivan Et Al-2001
4 pages
Aircraft Icing: Impact & Safety Measures
No ratings yet
Aircraft Icing: Impact & Safety Measures
11 pages
Project Arsh
No ratings yet
Project Arsh
21 pages
Certificado de Origen Nov 01-08
No ratings yet
Certificado de Origen Nov 01-08
12 pages
TQM Supplier Selection
No ratings yet
TQM Supplier Selection
13 pages
Safety in Chemical Engineering
100% (2)
Safety in Chemical Engineering
16 pages
Triumphant College
No ratings yet
Triumphant College
5 pages
FT Online
No ratings yet
FT Online
8 pages
Entrepreneurship Ut 1 Reviewer
No ratings yet
Entrepreneurship Ut 1 Reviewer
10 pages
F Pace 19my MB Ge V9a Dx-6
No ratings yet
F Pace 19my MB Ge V9a Dx-6
112 pages
Python CheatSheet - CodeWithHarry
No ratings yet
Python CheatSheet - CodeWithHarry
29 pages
A33 Si - Kitchen Ventilation
No ratings yet
A33 Si - Kitchen Ventilation
1 page
Advertisement Ffsfinal MTech AY 2016-17
No ratings yet
Advertisement Ffsfinal MTech AY 2016-17
2 pages
Lab 20 Report Ohms Lawnew
No ratings yet
Lab 20 Report Ohms Lawnew
5 pages
Measurement of Horizontal Distances 2
No ratings yet
Measurement of Horizontal Distances 2
7 pages
Advances in Hearing Loss Treatment and Technology
No ratings yet
Advances in Hearing Loss Treatment and Technology
3 pages
AC Circuit Analysis Basics
No ratings yet
AC Circuit Analysis Basics
9 pages
Determination of Sugars in Molasses by HPLC Following Solid-Phase Extraction
No ratings yet
Determination of Sugars in Molasses by HPLC Following Solid-Phase Extraction
12 pages