0% found this document useful (0 votes)

75 views24 pages

Introduction To Object Detection

This document introduces object detection in computer vision. It discusses classification and localization tasks, and how object detection combines these by outputting class labels and bounding boxes. Evaluation metrics for object detection include intersection over union (IoU) for localization accuracy and mean average precision (mAP) across classes based on the precision-recall curve. Popular datasets that have driven progress are also presented, from Pascal VOC to ImageNet to MS COCO. State-of-the-art models and evaluation metrics continue to evolve for robust object detection.

Uploaded by

i not

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

75 views24 pages

Introduction To Object Detection

Uploaded by

i not

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 24

Introduction to Object Detection

Computer Vision Tasks

Source: CS231n Object detection http://cs231n.stanford.edu/slides/2016/winter1516_lecture8.pdf

Computer Vision Tasks

Source: CS231n Object detection http://cs231n.stanford.edu/slides/2016/winter1516_lecture8.pdf

Classification + Localization

● Classification:
○ Input: Image
○ Output: Class label
○ Loss: Cross entropy (Softmaxlog)
○ Evaluation metric: Accuracy
● Localization:
○ Input: Image
○ Output: Box in the image (x, y, w, h)
○ Loss: L2 Loss (Euclidean distance)
○ Evaluation metric: Intersection over Union
● Classification + Localization:
○ Input: Image
○ Output: Class label + box in the image
○ Loss: Sum of both losses
Classification + Localization: ImageNet Challenge
● Dataset
○ 1000 Classes.
○ Each image has 1 class with at least one
bounding box.
○ ~800 Training images per class.
● Evaluation
○ Algorithm produces 5 (class + bounding box)
guesses.
○ Example is correct if at least one of guess has
correct class AND bounding box at least 50%
intersection over union.
Intersection Over Union (IoU)

● Important measurement for object localization.

● Used in both training and evaluation.

Intersection(A,B)
IoU(A,B)
= Union(A,B)
Classification + Localization: Model

Classification Head:
● C Scores for C
classes

Localization Head:
● Class agnostic:
(x,y,w,h)
● Class specific:
(x,y,w,h) X C
Computer Vision Tasks

Source: CS231n Object detection http://cs231n.stanford.edu/slides/2016/winter1516_lecture8.pdf

Object Detection 2001-2007
● Rapid Object Detection using a Boosted Cascade of
Simple Features (2001)
○ Viola & Jones
● Histograms of Oriented Gradients for Human
Detection (2005)
○ Dalal & Triggs
● Object Detection with Discriminatively Trained Part
Based Models (2010)
○ Felzenszwalb, Girshick, Ramanan
● Fast Feature Pyramids for Object Detection (2014)
○ Dollar
Object Detection 2007-2012

Source: Ross Girshick’s CVPR 2017 Tutorial http://deeplearning.csail.mit.edu/instance_ross.pptx

Object Detection Today

Source: Ross Girshick’s CVPR 2017 Tutorial http://deeplearning.csail.mit.edu/instance_ross.pptx

Object Detection: Datasets
2007 2013 2015
Pascal VOC ImageNet ILSVRC MS COCO
● 20 Classes ● 200 Classes ● 80 Classes
● 11K Training images ● 476K Training images ● 200K Training images
● 27K Training objects ● 534K Training objects ● 1.5M Training objects

Was de-facto standard, Essentially scaled up version More categories and more
currently used as quick of PASCAL VOC, similar object object instances in every
benchmark to evaluate new statistics. image. Only 10% of images
detection algorithms. contain a single object
category, 60% in Pascal. More
small objects than large
objects.
Pascal Examples
COCO Examples
Object Detection
● Input: Image
● Output: For each object class c and each
image i, an algorithm returns predicted
detections: locations with
confidence scores .
Object Detection: Evaluation

● True positive: correct class prediction AND IoU > 50%.

● False positive: wrong class or IoU < 50%.
● False negative: missed (not detected) object
● Only one detection can be matched to an object.

●
Object Detection: Evaluation

● Mean Average Precision (mAP) across all classes, based on Average Precision
(AP) per class, based on Precision and Recall.
Precision And Recall For a Threshold
Precision-Recall Curve

Source: Drawing by Prof. William H. Press, the University of Texas at Austin

Average Precision (AP)

● [In the vision community] AP is the estimated area under the PR curve

Mean Average Precision (mAP)

● The winner of each object class is the team with the highest average precision
● The winner of the challenge is the team with the highest mean Average
Precision (mAP) across all classes.
Object Detection: Evaluation

● Mean Average Precision (mAP) across all classes, based on Average Precision
(AP) per class, based on Precision and Recall.
Object Detection: Evaluation

● Today new metrics are emerging

○ Averaging precision over all IoU thresholds: 0.5:0.05:0.95
○ Averaging precision for different object sizes (small, medium, big)
○ Averaging recall as a metric to measure object proposal quality.
Looking for brilliant researchers

cv@brodmann17.com

Group-5 (Image Segmentation) - PPT
100% (1)
Group-5 (Image Segmentation) - PPT
108 pages
IoT Unit 5-1
No ratings yet
IoT Unit 5-1
30 pages
Object Oriented Analysis and Design (OOAD)
No ratings yet
Object Oriented Analysis and Design (OOAD)
79 pages
Object Detection Using Yolo
No ratings yet
Object Detection Using Yolo
42 pages
4-Data Cleaning, Data Integration, Data Transformation, Data Reduction-03-02-2024
No ratings yet
4-Data Cleaning, Data Integration, Data Transformation, Data Reduction-03-02-2024
22 pages
Image Analysis - Pattern Recognition - Pattern Patterns Represent Knowledge
No ratings yet
Image Analysis - Pattern Recognition - Pattern Patterns Represent Knowledge
22 pages
Computer Organization & Architecture
No ratings yet
Computer Organization & Architecture
49 pages
Python and Machine Learning: A Practical Training Report On
No ratings yet
Python and Machine Learning: A Practical Training Report On
65 pages
Beyond Binary Classification
No ratings yet
Beyond Binary Classification
34 pages
Plant Disease Detection Presentation FINAL2
No ratings yet
Plant Disease Detection Presentation FINAL2
15 pages
IA Ethique 15-04
No ratings yet
IA Ethique 15-04
22 pages
W5HH Principle
0% (1)
W5HH Principle
28 pages
Data Science Techniques Classification Regression and Clustering
No ratings yet
Data Science Techniques Classification Regression and Clustering
5 pages
Smart Camera As Embedded Systems: M.Tech
No ratings yet
Smart Camera As Embedded Systems: M.Tech
21 pages
Particle Swarm Optimization
No ratings yet
Particle Swarm Optimization
18 pages
Uninformed Search: Some Material Adopted From Notes and Slides by Marie Desjardins and Charles R. Dyer
No ratings yet
Uninformed Search: Some Material Adopted From Notes and Slides by Marie Desjardins and Charles R. Dyer
56 pages
DataMining Course Handout PDF
No ratings yet
DataMining Course Handout PDF
5 pages
Introduction To UML: Lawrence Chung CS6358.OT1: Module 2 1
No ratings yet
Introduction To UML: Lawrence Chung CS6358.OT1: Module 2 1
60 pages
Motion Detection
No ratings yet
Motion Detection
33 pages
General Framework For Object Detection
No ratings yet
General Framework For Object Detection
9 pages
Drone Detection Through Live Camera Using YOLOv3
No ratings yet
Drone Detection Through Live Camera Using YOLOv3
8 pages
Face Recognisation Technology
No ratings yet
Face Recognisation Technology
31 pages
Autonomous Robotic Systems
No ratings yet
Autonomous Robotic Systems
22 pages
Image Classification Using Pre-Trained Convolutional Neural Network in COLAB
No ratings yet
Image Classification Using Pre-Trained Convolutional Neural Network in COLAB
6 pages
Vehicle Detection and Tracking
No ratings yet
Vehicle Detection and Tracking
11 pages
WORKBOOK
No ratings yet
WORKBOOK
13 pages
Building Recommendation System Using Movielens Data
No ratings yet
Building Recommendation System Using Movielens Data
6 pages
Data Visualization For Industry 4
No ratings yet
Data Visualization For Industry 4
3 pages
Object Detection Tutorial
No ratings yet
Object Detection Tutorial
9 pages
CNN RNN Assignment Set 4
0% (1)
CNN RNN Assignment Set 4
2 pages
Design and Analysis of Algorithms: III Year II-sem (CSE)
No ratings yet
Design and Analysis of Algorithms: III Year II-sem (CSE)
79 pages
IPCV Unit 04
No ratings yet
IPCV Unit 04
12 pages
Vision Systems Applications PDF
No ratings yet
Vision Systems Applications PDF
618 pages
Mc9280 Data Mining and Data Warehousing
No ratings yet
Mc9280 Data Mining and Data Warehousing
1 page
Decision Making & Looping
No ratings yet
Decision Making & Looping
32 pages
IOT Mod-4
No ratings yet
IOT Mod-4
42 pages
Improved YOLOv4 Tiny Network For Real-Time Electronic Component Detection
No ratings yet
Improved YOLOv4 Tiny Network For Real-Time Electronic Component Detection
13 pages
Chapter 8. Software Prototyping
No ratings yet
Chapter 8. Software Prototyping
2 pages
Ethical Consideration in Artificial Intelligence Development and Deployment
No ratings yet
Ethical Consideration in Artificial Intelligence Development and Deployment
6 pages
Stress Distribution in A Soil Mass
No ratings yet
Stress Distribution in A Soil Mass
22 pages
Data Preprocessing
No ratings yet
Data Preprocessing
22 pages
Unit-2 IoT
100% (1)
Unit-2 IoT
45 pages
PPT1
No ratings yet
PPT1
93 pages
01 Naiv Bayes
No ratings yet
01 Naiv Bayes
25 pages
Support Vector Machine SVM For Medical I
No ratings yet
Support Vector Machine SVM For Medical I
9 pages
Capstone
No ratings yet
Capstone
8 pages
Dialogue Notations and Design
No ratings yet
Dialogue Notations and Design
52 pages
Yolov3: An Incremental Improvement: Joseph Redmon, Ali Farhadi
No ratings yet
Yolov3: An Incremental Improvement: Joseph Redmon, Ali Farhadi
6 pages
Unit 2 - Lecture 1 - Multidimensional Arrays - Applications of Arrays
No ratings yet
Unit 2 - Lecture 1 - Multidimensional Arrays - Applications of Arrays
19 pages
STD 4 Syllabus 23 24 1 1
100% (1)
STD 4 Syllabus 23 24 1 1
17 pages
ML Lesson Plan (21AI63)
No ratings yet
ML Lesson Plan (21AI63)
8 pages
Data Structures and Algorithms
No ratings yet
Data Structures and Algorithms
3 pages
BBS of Staircase
100% (1)
BBS of Staircase
232 pages
What Is Deep Learning?: Artificial Intelligence Machine Learning
No ratings yet
What Is Deep Learning?: Artificial Intelligence Machine Learning
3 pages
Eddu Current Testing Reference From LP Project
No ratings yet
Eddu Current Testing Reference From LP Project
34 pages
GCLUTO - An Interactive Clustering, Visualization, and Analysis System
No ratings yet
GCLUTO - An Interactive Clustering, Visualization, and Analysis System
10 pages
01 Introduction
No ratings yet
01 Introduction
24 pages
Goodwill and Dynamic Advertising Strateg
No ratings yet
Goodwill and Dynamic Advertising Strateg
38 pages
Data Science Introduction
No ratings yet
Data Science Introduction
82 pages
Day 01 Lect 1 Part 3 Introduction To UML
No ratings yet
Day 01 Lect 1 Part 3 Introduction To UML
39 pages
Introduction To Computer Vision
No ratings yet
Introduction To Computer Vision
10 pages
Object Detector For Blind Person
No ratings yet
Object Detector For Blind Person
20 pages
Lab Program
100% (1)
Lab Program
15 pages
Jee Mains
No ratings yet
Jee Mains
61 pages
Bài 4 - Longitudinal Motion (Stick Fixed) (2008)
No ratings yet
Bài 4 - Longitudinal Motion (Stick Fixed) (2008)
32 pages
The Nature of Inferior Inputs
No ratings yet
The Nature of Inferior Inputs
22 pages
Math 11 - GenMath - Q1Wk8 ABCDKey V.nov12020
No ratings yet
Math 11 - GenMath - Q1Wk8 ABCDKey V.nov12020
10 pages
Digital Signal Processing
No ratings yet
Digital Signal Processing
24 pages
Unit 1 MCQ: Questions
No ratings yet
Unit 1 MCQ: Questions
16 pages
Mastering WebGL: Crafting Advanced 3D Web Experiences: WebGL Wizadry
From Everand
Mastering WebGL: Crafting Advanced 3D Web Experiences: WebGL Wizadry
Kameron Hussain
No ratings yet
Summative Stat Prob Q3 W1 26
No ratings yet
Summative Stat Prob Q3 W1 26
5 pages
Volume Cyclicality
No ratings yet
Volume Cyclicality
15 pages
Resiliensi Kemampuan Diri: Statistics
No ratings yet
Resiliensi Kemampuan Diri: Statistics
15 pages
OU - 1603 OU - 1603: Facuty of Engineering
No ratings yet
OU - 1603 OU - 1603: Facuty of Engineering
9 pages
Project Detecto!: A Real-Time Object Detection Model
No ratings yet
Project Detecto!: A Real-Time Object Detection Model
3 pages
1.4. Support Vector Machines - Scikit-Learn
No ratings yet
1.4. Support Vector Machines - Scikit-Learn
6 pages
PW2 - Convolution Integral and Convolution Sum PSA
No ratings yet
PW2 - Convolution Integral and Convolution Sum PSA
5 pages
EASE Module 1 Polynomial Functions
No ratings yet
EASE Module 1 Polynomial Functions
29 pages
Indian Territorial Army 2022 Paper 01 1
No ratings yet
Indian Territorial Army 2022 Paper 01 1
19 pages
Ajib 19 (Q3)
No ratings yet
Ajib 19 (Q3)
9 pages
SSS Congruence Postulate
100% (1)
SSS Congruence Postulate
6 pages
Closeness: A New Privacy Measure For Data Publishing
No ratings yet
Closeness: A New Privacy Measure For Data Publishing
14 pages
CH-11 Gyroscopic Couple
No ratings yet
CH-11 Gyroscopic Couple
4 pages
Eigenvalue and Eigenvector Worksheet: Ivany (18523081) October 2019
No ratings yet
Eigenvalue and Eigenvector Worksheet: Ivany (18523081) October 2019
4 pages
Keep The Heat Answers
No ratings yet
Keep The Heat Answers
6 pages
Sones and Phones
No ratings yet
Sones and Phones
4 pages
Connectivity Prediction in Mobile Ad Hoc Networks for Real-Time Control
From Everand
Connectivity Prediction in Mobile Ad Hoc Networks for Real-Time Control
Sebastian Thelen
5/5 (1)
Tips For Setting Questions Based On Bloom's Taxonomy: Cognitive Level Useful Verbs Sample Question Stems
No ratings yet
Tips For Setting Questions Based On Bloom's Taxonomy: Cognitive Level Useful Verbs Sample Question Stems
2 pages
Trackpad Pro Ver. 5.0 Class 6
From Everand
Trackpad Pro Ver. 5.0 Class 6
Nidhi Arora
No ratings yet
The Datadog Handbook: A Guide to Monitoring, Metrics, and Tracing
From Everand
The Datadog Handbook: A Guide to Monitoring, Metrics, and Tracing
Robert Johnson
No ratings yet

Introduction To Object Detection

Uploaded by

Introduction To Object Detection

Uploaded by

Introduction to Object Detection

Computer Vision Tasks

Source: CS231n Object detection http://cs231n.stanford.edu/slides/2016/winter1516_lecture8.pdf

Source: CS231n Object detection http://cs231n.stanford.edu/slides/2016/winter1516_lecture8.pdf

● Important measurement for object localization.

Source: CS231n Object detection http://cs231n.stanford.edu/slides/2016/winter1516_lecture8.pdf

Source: Ross Girshick’s CVPR 2017 Tutorial http://deeplearning.csail.mit.edu/instance_ross.pptx

Source: Ross Girshick’s CVPR 2017 Tutorial http://deeplearning.csail.mit.edu/instance_ross.pptx

● True positive: correct class prediction AND IoU > 50%.

Source: Drawing by Prof. William H. Press, the University of Texas at Austin

● Today new metrics are emerging

You might also like