Data Science for Professionals

Data science is a collection of techniques used to extract value from data. It relies on finding patterns, connections, and relationships within data. Data science uses techniques from statistics, machine learning, experimentation, and database theories. It applies learning algorithms like decision trees and neural networks to automate extracting useful patterns from data for tasks like classification, clustering, and regression.

Uploaded by

baglostar786

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

27 views15 pages

Data Science for Professionals

Uploaded by

baglostar786

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

You are on page 1/ 15

Chapter 1

Data Science (Introduction)

Data Science
◦ Data science is a collection of techniques used to extract value from data.
◦ It has become an essential tool for any organization that collects, stores, and
◦ processes data as part of its operations.
◦ Data science techniques rely on finding useful patterns, connections, and
relationships within data.

◦ Data science is also commonly referred to as:

◦ knowledge discovery,
◦ machine learning,
◦ predictive analytics, and
◦ data mining.
AI, MACHINE LEARNING,
AND DATA SCIENCE
◦ Artificial intelligence, Machine learning, and data science are all related to each
other.

◦ Artificial intelligence,
Machine learning, and
data science are all related
to each other.
Data Science
Traditional program and machine learning.
Data Science models

• Data science is the business application of:

• machine learning, artificial intelligence,

• and other quantitative fields like:

• statistics, visualization, and mathematics.
Traditional program and
machine learning.
• It is an interdisciplinary field that extracts
value from data.

• In the context of how data science is used

today, it relies heavily on machine learning
and is sometimes called data mining.

Data Science models

Combination of Statistics, Machine
Learning, and Computing
◦ In the pursuit of extracting useful and relevant information from large datasets,
data science uses computational techniques from the disciplines of
◦ statistics,
◦ machine learning,
◦ experimentation, and
◦ database theories.
Learning Algorithms
◦ data science as a process of discovering previously unknown patterns in data using
automatic iterative methods.
◦ The application of sophisticated learning algorithms for extracting useful patterns from
data differentiates data science from traditional data analysis techniques.
◦ These iterative algorithms automate
the process of searching for an optimal solution for a given data problem.
Based on the problem, data science is classified into tasks such as classification, association
analysis, clustering, and regression.
◦ Each data science task uses specific learning algorithms like decision trees, neural
networks, k-nearest neighbors (k-NN), and k-means clustering, among others.
Combination of Statistics, Machine
Learning, and Computing
Associated Fields
◦ The techniques used in the steps of a data science process and in
conjunction with the term “data science” are:
◦ Descriptive statistics:
◦ Computing mean, standard deviation, correlation, and other descriptive statistics, quantify
the aggregate structure of a dataset.

◦ Dimensional slicing:
◦ Online analytical processing (OLAP) applications, which are prevalent in organizations, mainly provide
information on the data through dimensional slicing, filtering, and pivoting.
◦ OLAP analysis is enabled by a unique database schema design where the data are
organized as dimensions (e.g., products, regions, dates) and quantitative facts or measures
(e.g., revenue, quantity).
Combination of Statistics, Machine
Learning, and Computing
Associated Fields
Hypothesis testing:
◦ In confirmatory data analysis, experimental data are collected to evaluate whether a
hypothesis has enough evidence to be supported or not.

Data engineering:
◦ Data engineering is the process of sourcing,
◦ organizing, assembling, storing, and distributing data for effective analysis and usage.
Database engineering, distributed storage, and computing frameworks (e.g., Apache
Hadoop, Spark, Kafka), parallel computing, extraction transformation and loading
processing, and data warehousing constitute data engineering techniques.
Business intelligence:
◦ Business intelligence helps organizations consume data effectively. It helps query the ad
hoc data without the need to write the technical query command or use dashboards or
visualizations to communicate the facts and trends.
DATA SCIENCE
CLASSIFICATION
◦ Data science problems can be
broadly categorized into supervised
or unsupervised learning models.
◦ Supervised or directed data science
tries to infer a function or
relationship based on labeled
training data and uses this function
to map new unlabeled data.
◦ Supervised techniques predict the
value of the output variables based
on a set of input variables.
◦ To do this, a model is developed from
a training dataset where the values
of input and output are previously
known.
(Local outlier Factor)
Data Preparation
Data Science
◦ Data science is a collection of techniques used to extract value from
data.
◦ It has become an essential tool for any organization that collects,
stores, and
◦ processes data as part of its operations.
◦ Data science techniques rely on finding useful patterns, connections,
and relationships within data.

02 Introduction - Fall 23-24
No ratings yet
02 Introduction - Fall 23-24
29 pages
Lecture 1 - Introduction To Data Science
No ratings yet
Lecture 1 - Introduction To Data Science
14 pages
Data Science Ppt1 Update
No ratings yet
Data Science Ppt1 Update
67 pages
Introduction
No ratings yet
Introduction
20 pages
Seminar On Data Science
100% (7)
Seminar On Data Science
25 pages
M1.1 DS
No ratings yet
M1.1 DS
57 pages
Introduction Am
No ratings yet
Introduction Am
74 pages
Himadev
No ratings yet
Himadev
37 pages
00 Introduction To Data Science
No ratings yet
00 Introduction To Data Science
4 pages
Chapter 1
No ratings yet
Chapter 1
85 pages
Data Science Introduction
No ratings yet
Data Science Introduction
35 pages
ADS SEM 8 Unit 1
No ratings yet
ADS SEM 8 Unit 1
75 pages
Introduction of Data Science
No ratings yet
Introduction of Data Science
28 pages
DS Notes
No ratings yet
DS Notes
159 pages
Unit 1
No ratings yet
Unit 1
28 pages
Data-Science - Introduction
No ratings yet
Data-Science - Introduction
35 pages
? What Is Data Science
No ratings yet
? What Is Data Science
31 pages
DSF 1-2
No ratings yet
DSF 1-2
28 pages
Data Science Introduction
No ratings yet
Data Science Introduction
24 pages
Introduction To Data Science
No ratings yet
Introduction To Data Science
16 pages
Data Science - AD1102-1
No ratings yet
Data Science - AD1102-1
53 pages
IDS Complete Notes
No ratings yet
IDS Complete Notes
126 pages
Science
No ratings yet
Science
8 pages
File
No ratings yet
File
27 pages
The Field of Data Science
No ratings yet
The Field of Data Science
4 pages
Data Science Lecture 1 Introduction
No ratings yet
Data Science Lecture 1 Introduction
27 pages
Data Science Unit 1st
No ratings yet
Data Science Unit 1st
25 pages
Data Science Components
No ratings yet
Data Science Components
7 pages
Class X Data Science
No ratings yet
Class X Data Science
29 pages
Data Science Chacha
No ratings yet
Data Science Chacha
150 pages
Selected Topics - Datascience
No ratings yet
Selected Topics - Datascience
17 pages
Ch7-Overview of Data Science-Part 1
No ratings yet
Ch7-Overview of Data Science-Part 1
37 pages
Introduction To Data Science - 23CSH-283
100% (1)
Introduction To Data Science - 23CSH-283
48 pages
DS 1
No ratings yet
DS 1
85 pages
Data Science for Business Insights
No ratings yet
Data Science for Business Insights
24 pages
Applied - Data - Science MODULE 1 SEM8
No ratings yet
Applied - Data - Science MODULE 1 SEM8
16 pages
Basics of Data Science KPK
No ratings yet
Basics of Data Science KPK
38 pages
Intro to Data Science Basics
No ratings yet
Intro to Data Science Basics
171 pages
Data Science
No ratings yet
Data Science
59 pages
Data Science Unit-1 Notes
No ratings yet
Data Science Unit-1 Notes
19 pages
Introduction To Data Science What Is Data Science?
No ratings yet
Introduction To Data Science What Is Data Science?
11 pages
DataScience Intro
No ratings yet
DataScience Intro
36 pages
Introduction To Data Science L1
No ratings yet
Introduction To Data Science L1
28 pages
IDS Lecture 1.1.1
No ratings yet
IDS Lecture 1.1.1
13 pages
Data Science
No ratings yet
Data Science
11 pages
Introduction To Data Science
No ratings yet
Introduction To Data Science
8 pages
TLMweek 1 Intro Ds
No ratings yet
TLMweek 1 Intro Ds
11 pages
Lecture 1 What Is Data Science Prerequisites, Lifecycle and Applications Simplilearn
No ratings yet
Lecture 1 What Is Data Science Prerequisites, Lifecycle and Applications Simplilearn
5 pages
Datascience Presentation
No ratings yet
Datascience Presentation
94 pages
OceanofPDF - Com DATA SCIENCE Simple and Effective Tips An - Benjamin Smith
100% (1)
OceanofPDF - Com DATA SCIENCE Simple and Effective Tips An - Benjamin Smith
122 pages
Class 2 - Lifecycle ML Concepts in Ds
No ratings yet
Class 2 - Lifecycle ML Concepts in Ds
22 pages
Unit-1 Data Science
No ratings yet
Unit-1 Data Science
74 pages
Lecture 1 Introduction Tools An - Chniques For Data Science
No ratings yet
Lecture 1 Introduction Tools An - Chniques For Data Science
16 pages
Data Science Unit 1
No ratings yet
Data Science Unit 1
85 pages
Summary Business Analytics
No ratings yet
Summary Business Analytics
24 pages
Bi Unit 2 PDF
No ratings yet
Bi Unit 2 PDF
33 pages
Data Science Lifecycle Explained
No ratings yet
Data Science Lifecycle Explained
9 pages
Unit 2 Data Science
No ratings yet
Unit 2 Data Science
53 pages
Ids Mod1
No ratings yet
Ids Mod1
21 pages
Delay budget-IAP
No ratings yet
Delay budget-IAP
2 pages
DPC Latency Assignment
No ratings yet
DPC Latency Assignment
2 pages
Layering Protocols
No ratings yet
Layering Protocols
13 pages
#1 Basic Electronics
No ratings yet
#1 Basic Electronics
37 pages
#4 Types of Diodes (Basic Electronics)
No ratings yet
#4 Types of Diodes (Basic Electronics)
31 pages
Empowerment Technologies Quarter 1, Module 1
No ratings yet
Empowerment Technologies Quarter 1, Module 1
10 pages
Lab 2: Doubly LL + Stack + Queue + Sorting
No ratings yet
Lab 2: Doubly LL + Stack + Queue + Sorting
33 pages
ICC Problem Statement
No ratings yet
ICC Problem Statement
14 pages
Module 01.2 - Command Line Skills
No ratings yet
Module 01.2 - Command Line Skills
28 pages
Data Base Revolutions First Second and Third Generations
100% (1)
Data Base Revolutions First Second and Third Generations
10 pages
ZDM GG Performance
No ratings yet
ZDM GG Performance
15 pages
XPG SX950 3D NAND SSD for Gaming
No ratings yet
XPG SX950 3D NAND SSD for Gaming
2 pages
Practical 1
No ratings yet
Practical 1
12 pages
CNIP Assignment 12 JanApr2024
No ratings yet
CNIP Assignment 12 JanApr2024
3 pages
Unnormalized Database of Library
No ratings yet
Unnormalized Database of Library
4 pages
BGP - Border Gateway Protocol Explained
No ratings yet
BGP - Border Gateway Protocol Explained
2 pages
Driver Booster Export List
No ratings yet
Driver Booster Export List
23 pages
Gayathri Machine Learning
No ratings yet
Gayathri Machine Learning
1 page
4 - Networks and Cloud Computing
No ratings yet
4 - Networks and Cloud Computing
4 pages
Wireless & Mobile Security
No ratings yet
Wireless & Mobile Security
6 pages
AES - Troubleshooting A Recording Application Using DMCC and TSAPI
No ratings yet
AES - Troubleshooting A Recording Application Using DMCC and TSAPI
16 pages
Cloud Computing Technical Security Standard 1.6
No ratings yet
Cloud Computing Technical Security Standard 1.6
6 pages
How To Install Windows 7 Operating System
No ratings yet
How To Install Windows 7 Operating System
17 pages
Fco Imp Questions by Prince Singhhehsjsjsjw
No ratings yet
Fco Imp Questions by Prince Singhhehsjsjsjw
2 pages
Pagasys Manual English
No ratings yet
Pagasys Manual English
602 pages
Final Gazette A18 12
0% (1)
Final Gazette A18 12
919 pages
Syllabus Excel 2013 Advance
No ratings yet
Syllabus Excel 2013 Advance
2 pages
Applications of Internet of Things (IoT) - An Overview
No ratings yet
Applications of Internet of Things (IoT) - An Overview
5 pages
Madurai Kamaraj University: JAVA Programming
No ratings yet
Madurai Kamaraj University: JAVA Programming
36 pages
391 - Information Technology Concepts (Open) - R - 2018
No ratings yet
391 - Information Technology Concepts (Open) - R - 2018
12 pages
Robotics Physics Simulators Review
No ratings yet
Robotics Physics Simulators Review
16 pages
How To Run Node - Js Server With Nginx
No ratings yet
How To Run Node - Js Server With Nginx
8 pages
Lecture 13 - Software Project Documentation
No ratings yet
Lecture 13 - Software Project Documentation
41 pages
Bluenrg-1, Bluenrg-2 Ble Stack V2.X Programming Guidelines
No ratings yet
Bluenrg-1, Bluenrg-2 Ble Stack V2.X Programming Guidelines
77 pages
Network and Link Configuration Details
No ratings yet
Network and Link Configuration Details
11 pages

Data Science for Professionals

Uploaded by

Data Science for Professionals

Uploaded by

Chapter 1

Data Science (Introduction)

◦ Data science is also commonly referred to as:

• Data science is the business application of:

• and other quantitative fields like:

• In the context of how data science is used

Data Science models

You might also like