Unit 3 Python B.SC IT

Uploaded by

devilnithi79

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

19 views18 pages

Unit 3 Python B.SC IT

Uploaded by

devilnithi79

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPT, PDF, TXT or read online on Scribd

You are on page 1/ 18

Prepared by

Senthil Kumar S
Assistant Professor,
Department of Information Technology,
Sri Ramakrishna Mission Vidyalaya
College of Arts and Science
(Autonomous), Coimbatore
Pandas:
Introduction to pandas
- Data manipulation with pandas

- Operating on null values,

- hierarchical indexing

- Combining Datasets

- Aggregation and Grouping.

- Manipulation of data with combined datasets using Pandas.
 Pandas is a Python library.
 Pandas is used to analyze data.
 Pandas is a Python library used for working with data sets.
 A data frame is a import pandas as pd
structured d = {'col1':
representation of [1, 2, 3, 4, 7], 'col2':
data. [4, 5, 6, 9, 5], 'col3':
 Data frame with 3 [7, 8, 12, 1, 11]}
rows and 5 columns df =
pd.DataFrame(data=d)
print(df)
import pandas as pd
df = pd.DataFrame( {'name':
['Akshay','Mukesh','Deepak']
, 'age':[22,23,21], 'country':
['india','india','us']})
print(df)

Output:
name age country 0 Akshay
22 india 1 Mukesh 23 india 2
Deepak 21 us
regno name mark
0 1 senthil 76
1 2 jamuna 67
2 3 rakki 88
import pandas 3 4 kavi 90
df = pandas.read_csv("D:\SRMV 4 5 karthi 89
CAS\ssk\csv\sdata.csv") 5 6 mahes 66
print(df) 6 7 seetha 54
print(df.loc[2,:]) regno 3
name rakki
mark 88
Name: 2, dtype: object
# importing pandas as pd Output:
import pandas as pd First Score Second Score Third
# importing numpy as np Score
import numpy as np 0 100.0 30.0 NaN
# dictionary of lists 1 90.0 45.0 40.0
dict = {'First Score':[100, 90, np.nan, 2 NaN 56.0 80.0
95], 3 95.0 NaN 98.0
'Second Score': [30, 45, 56, np.nan],
'Third Score':[np.nan, 40, 80, 98]}
First Score Second Score Third Score
# creating a dataframe from
dictionary 1 90.0 45.0 40.0
df = pd.DataFrame(dict)
print(df)
# Remove Blank Rows using dropna()
function
df.dropna(axis=0,inplace=True)
print(df)
# importing pandas as pd
import pandas as pd Output
# importing numpy as np
import numpy as np First Score Second Score Third Score
# dictionary of lists 0 100.0 30.0 NaN
dict = {'First Score':[100, 90, np.nan, 1 90.0 45.0 40.0
95], 2 NaN 56.0 80.0
3 95.0 NaN 98.0
'Second Score': [30, 45, 56, np.nan], First Score Second Score Third Score
'Third Score':[np.nan, 40, 80, 98]} 0 100.0 30.0 0.0
# creating a dataframe from 1 90.0 45.0 40.0
dictionary 2 0.0 56.0 80.0
3 95.0 0.0 98.0
df = pd.DataFrame(dict)
print(df)
# filling missing value using zero
print(df.fillna(0))
use the describe() function in Python to First Score Second Score Third Score
0 100 30.0 NaN
summarize data 1 90 45.0 40.0
2 87 56.0 80.0
# importing pandas as pd 3 95 NaN 98.0
import pandas as pd First Score Second Score Third Score
count 4.000000 3.000000 3.000000
# importing numpy as np mean 93.000000 43.666667
72.666667
import numpy as np std 5.715476 13.051181 29.687259
min 87.000000 30.000000
# dictionary of lists 40.000000
dict = {'First Score':[100, 90, 87, 95], 25% 89.250000 37.500000
60.000000
'Second Score': [30, 45, 56, np.nan], 50% 92.500000 45.000000
80.000000
'Third Score':[np.nan, 40, 80, 98]} 75% 96.250000 50.500000
89.000000
# creating a dataframe from dictionary max 100.000000 56.000000
df = pd.DataFrame(dict) 98.000000

print(df)
print(df.describe())
 Primarily we focus on one-
dimensional and two
dimensional data
 Often, it is useful to go
beyond this and store
higher-dimensional data—
that is, data indexed by
more than one or two
keys.
 To handle three-
dimensional and four-
dimensional data, common
Hierarchical Indexes are also known
pattern in practice is to as multi-indexing is setting more
make use of hierarchical than one column name as the index.
indexing (also known as
multi-indexing)
# importing pandas as pd
import pandas as pd
df1 = pd.DataFrame({'employee': ['Bob',
'Jake', 'Lisa', 'Sue'], 'group':
['Accounting', 'Engineering',
'Engineering', 'HR']})

df2 = pd.DataFrame({'employee': ['Lisa',

'Bob', 'Jake', 'Sue'], 'hire_date': [2004,
2008, 2012, 2014]})
display (df1,df2)
# importing pandas as pd
import pandas as pd
df1 = pd.DataFrame({'employee': ['Bob',
'Jake', 'Lisa', 'Sue'], 'group':
['Accounting', 'Engineering',
'Engineering', 'HR']})

df2 = pd.DataFrame({'employee': ['Lisa',

'Bob', 'Jake', 'Sue'], 'hire_date': [2004,
2008, 2012, 2014]})
display(df1,df2)
df3= pd.merge(df1,df2)
display(df3)
use the describe() function in Python to First Score Second Score Third Score
0 100 30.0 NaN
summarize data 1 90 45.0 40.0
# importing pandas as pd 2 87 56.0 80.0
3 95 NaN 98.0
import pandas as pd
# importing numpy as np
import numpy as np First Score Second Score Third Score
count 4.000000 3.000000 3.000000
# dictionary of lists mean 93.000000 43.666667 72.666667
std 5.715476 13.051181 29.687259
dict = {'First Score':[100, 90, 87, 95], min 87.000000 30.000000 40.000000
'Second Score': [30, 45, 56, np.nan], 25% 89.250000 37.500000 60.000000
50% 92.500000 45.000000 80.000000
'Third Score':[np.nan, 40, 80, 98]} 75% 96.250000 50.500000 89.000000
max 100.000000 56.000000 98.000000
# creating a dataframe from dictionary
df = pd.DataFrame(dict)
print(df)
print(df.describe())
 The groupby() method
allows you to group
your data and execute
functions

Dsbda Assignment 1
No ratings yet
Dsbda Assignment 1
5 pages
Pandas Series and DataFrame Guide
No ratings yet
Pandas Series and DataFrame Guide
98 pages
Pandas
No ratings yet
Pandas
44 pages
12 Pandas
100% (1)
12 Pandas
21 pages
Unit3 - 3) Pandas - Ipynb - Colab
No ratings yet
Unit3 - 3) Pandas - Ipynb - Colab
11 pages
Series and Pandas Methods
No ratings yet
Series and Pandas Methods
5 pages
4 PythonPandas
No ratings yet
4 PythonPandas
8 pages
Pandas, Numpy, Matplotlib
No ratings yet
Pandas, Numpy, Matplotlib
11 pages
Data Frame Demo
No ratings yet
Data Frame Demo
73 pages
Pandas Plots
No ratings yet
Pandas Plots
14 pages
Pandas
No ratings yet
Pandas
5 pages
Exp 3
No ratings yet
Exp 3
10 pages
Commands SQL, Python (BASICS)
No ratings yet
Commands SQL, Python (BASICS)
7 pages
Lab Record IP
No ratings yet
Lab Record IP
13 pages
Xii Record (Dataframe & CSV)
No ratings yet
Xii Record (Dataframe & CSV)
11 pages
Unit 4 Part Two
No ratings yet
Unit 4 Part Two
12 pages
EDA Lab Manual
100% (2)
EDA Lab Manual
93 pages
EDA Lab Manual
No ratings yet
EDA Lab Manual
93 pages
Chapter-2 Python Pandas
100% (2)
Chapter-2 Python Pandas
33 pages
Ip Practical File
No ratings yet
Ip Practical File
20 pages
Revision Notes DataFrame XII IP
No ratings yet
Revision Notes DataFrame XII IP
8 pages
Even Students
No ratings yet
Even Students
36 pages
Pandas
No ratings yet
Pandas
8 pages
Data Aggregation and Group Operations
No ratings yet
Data Aggregation and Group Operations
70 pages
Python & Pandas Cheat Sheet Guide
100% (2)
Python & Pandas Cheat Sheet Guide
5 pages
Fundamental - Python
No ratings yet
Fundamental - Python
3 pages
Numpy Boolean Indexing: Filter
No ratings yet
Numpy Boolean Indexing: Filter
39 pages
Oddstudents
No ratings yet
Oddstudents
35 pages
GR12 Record Programs 6TH Onwards
No ratings yet
GR12 Record Programs 6TH Onwards
18 pages
Chapter 2 Python Pandas - II
No ratings yet
Chapter 2 Python Pandas - II
19 pages
DS Manual 1
No ratings yet
DS Manual 1
96 pages
Pandas Data Analytics
No ratings yet
Pandas Data Analytics
61 pages
Data Aggregation and Group Operations
No ratings yet
Data Aggregation and Group Operations
34 pages
B "Hello, World!" Print (B (2:5) ) Llo
No ratings yet
B "Hello, World!" Print (B (2:5) ) Llo
52 pages
Pandas - Ipynb - Colab
No ratings yet
Pandas - Ipynb - Colab
8 pages
Creation of Series Using List, Dictionary & Ndarray
No ratings yet
Creation of Series Using List, Dictionary & Ndarray
65 pages
Pandas 2 Complete Notes Class XII
No ratings yet
Pandas 2 Complete Notes Class XII
18 pages
12 Pandas
No ratings yet
12 Pandas
9 pages
Pandas Library
No ratings yet
Pandas Library
5 pages
Pandas
No ratings yet
Pandas
20 pages
JJKJK
No ratings yet
JJKJK
10 pages
Pandas Introduction: What Is Python Pandas Used For?
No ratings yet
Pandas Introduction: What Is Python Pandas Used For?
28 pages
Cheat Sheet: The Pandas Dataframe Object: Preliminaries Get Your Data Into A Dataframe
100% (1)
Cheat Sheet: The Pandas Dataframe Object: Preliminaries Get Your Data Into A Dataframe
12 pages
Block 1-Data Handling Using Pandas DataFrame
No ratings yet
Block 1-Data Handling Using Pandas DataFrame
17 pages
Chapter 2 - Python Pandas II
No ratings yet
Chapter 2 - Python Pandas II
71 pages
10) Merging Dataframes: # Detecting Duplicates
No ratings yet
10) Merging Dataframes: # Detecting Duplicates
7 pages
Acknowledgement
No ratings yet
Acknowledgement
25 pages
Data Analysis - 5th Unit
No ratings yet
Data Analysis - 5th Unit
14 pages
Answers Practical File
No ratings yet
Answers Practical File
19 pages
Python Cheat Sheet: Pandas - Numpy - Sklearn Matplotlib - Seaborn BS4 - Selenium - Scrapy
100% (3)
Python Cheat Sheet: Pandas - Numpy - Sklearn Matplotlib - Seaborn BS4 - Selenium - Scrapy
9 pages
Pandas DataFrame Cheat Sheet
100% (1)
Pandas DataFrame Cheat Sheet
10 pages
Pandas DataFrame Cheat Sheet
No ratings yet
Pandas DataFrame Cheat Sheet
4 pages
PDF&Rendition 1
No ratings yet
PDF&Rendition 1
47 pages
Pandas Cheat Sheet........
No ratings yet
Pandas Cheat Sheet........
11 pages
Practical File Questions With Answers
No ratings yet
Practical File Questions With Answers
7 pages
Ip Project
No ratings yet
Ip Project
27 pages
Statistics Project 1
No ratings yet
Statistics Project 1
14 pages
A Review of Machine Learning and Deep Learning Applications
No ratings yet
A Review of Machine Learning and Deep Learning Applications
6 pages
Basic Statistics-Concepts and Applications
No ratings yet
Basic Statistics-Concepts and Applications
45 pages
Enhancing Science Skills in Students
No ratings yet
Enhancing Science Skills in Students
82 pages
Regression Analysis Project
100% (1)
Regression Analysis Project
4 pages
Timeseries v5 Unannotated
No ratings yet
Timeseries v5 Unannotated
22 pages
Unit 3 Probability Distributions - 21MA41
No ratings yet
Unit 3 Probability Distributions - 21MA41
17 pages
Facebook in Education: A Study
No ratings yet
Facebook in Education: A Study
42 pages
Literature Review On Organisational Structure
100% (2)
Literature Review On Organisational Structure
4 pages
ZGJKH SXD Y3 Arc ZYWVNus
No ratings yet
ZGJKH SXD Y3 Arc ZYWVNus
48 pages
Introduction To Statistics
No ratings yet
Introduction To Statistics
39 pages
Cours 1 - Intro To Deep Learning
100% (1)
Cours 1 - Intro To Deep Learning
38 pages
Topic 01 - Introduction To Econometrics
No ratings yet
Topic 01 - Introduction To Econometrics
63 pages
Ackerman 1963 Where Is A Research Frontier
No ratings yet
Ackerman 1963 Where Is A Research Frontier
13 pages
Tablefor Determining Minimum Returned Sample Sizefora Given Population Sizefor Continuousand Categorical Databy Adam
No ratings yet
Tablefor Determining Minimum Returned Sample Sizefora Given Population Sizefor Continuousand Categorical Databy Adam
3 pages
2nd Sem Final Exam in Statistics
No ratings yet
2nd Sem Final Exam in Statistics
12 pages
2.4 Worksheet
No ratings yet
2.4 Worksheet
3 pages
Marx S Capital Philosophy and Political Economy 1st Ed Edition Pilling Download
No ratings yet
Marx S Capital Philosophy and Political Economy 1st Ed Edition Pilling Download
167 pages
QueuingTheory Matlab Assignment
No ratings yet
QueuingTheory Matlab Assignment
3 pages
IBM SPSS Statistics Brief Guide
No ratings yet
IBM SPSS Statistics Brief Guide
60 pages
Syllabus - App Lab
No ratings yet
Syllabus - App Lab
1 page
Lindley (2001) The Philosophy of Statistics
No ratings yet
Lindley (2001) The Philosophy of Statistics
45 pages
Unit - 4 Subject: Business Research Methods: What Is Sampling?
No ratings yet
Unit - 4 Subject: Business Research Methods: What Is Sampling?
10 pages
Fundamental Simulation Concepts: Sie 431/531 Young-Jun Son, PHD Systems and Industrial Engineering Son@Sie - Arizona.Edu
No ratings yet
Fundamental Simulation Concepts: Sie 431/531 Young-Jun Son, PHD Systems and Industrial Engineering Son@Sie - Arizona.Edu
21 pages
Movie Sales Analysis
No ratings yet
Movie Sales Analysis
16 pages
BPSO Performance in Buguey Barangays
No ratings yet
BPSO Performance in Buguey Barangays
19 pages
Measure of Central Tendency of Ungrouped Data Exemplar
No ratings yet
Measure of Central Tendency of Ungrouped Data Exemplar
7 pages
Tahoe Salt
100% (1)
Tahoe Salt
12 pages
MOPS Slides
No ratings yet
MOPS Slides
323 pages
Chi Square
No ratings yet
Chi Square
28 pages

Unit 3 Python B.SC IT

Uploaded by

Unit 3 Python B.SC IT

Uploaded by

Prepared by

- Operating on null values,

- Aggregation and Grouping.

df2 = pd.DataFrame({'employee': ['Lisa',

df2 = pd.DataFrame({'employee': ['Lisa',

You might also like