0% found this document useful (0 votes)

3 views3 pages

Mypnotes

Uploaded by

Niranjan Patidar

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

3 views3 pages

Mypnotes

Uploaded by

Niranjan Patidar

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 3

Certainly!

I'll include more detailed explanations for each topic along with some basic code
examples. Here's a comprehensive outline of the Pandas Notes:

1. Introduction to Pandas

 What is Pandas?
Pandas is an open-source data manipulation and analysis library for Python. It provides
high-performance data structures and data analysis tools, making it easier to manipulate
large datasets, particularly in tabular form (like Excel spreadsheets, SQL tables, etc.).
 Key Components:
o Series: A one-dimensional labeled array.
o DataFrame: A two-dimensional labeled data structure with columns of
potentially different types.

2. Basic Data Structures in Pandas

 Series:
o A Series is similar to a list or an array but comes with labels (called index).
o Code Example:
o import pandas as pd
o s = pd.Series([10, 20, 30, 40])
o print(s)
 DataFrame:
o A DataFrame is like a table with rows and columns, where each column can have
different types of data (e.g., integer, float, string).
o Code Example:
o data = {'Name': ['John', 'Alice', 'Bob'],
o 'Age': [23, 35, 30],
o 'City': ['New York', 'Los Angeles', 'Chicago']}
o df = pd.DataFrame(data)
o print(df)

3. Data Import and Export

 Importing Data: Pandas can read from various file formats like CSV, Excel, JSON, and
SQL databases.
o CSV:
o df = pd.read_csv('file.csv')
o Excel:
o df = pd.read_excel('file.xlsx')
o SQL:
o import sqlite3
o conn = sqlite3.connect('database.db')
o df = pd.read_sql_query('SELECT * FROM table_name', conn)
 Exporting Data: You can export data back into CSV, Excel, etc.
o CSV:
o df.to_csv('output.csv')

4. Data Manipulation

 Indexing and Selecting Data:

o Accessing rows by index:
o df.iloc[0] # Row 0 (index-based selection)
o df.loc[0] # Row with index label 0 (label-based selection)
 Filtering Data: You can filter data based on conditions.
 df[df['Age'] > 30]
 Sorting Data:
o Sorting by a specific column:
o df.sort_values(by='Age', ascending=False)
 Adding/Removing Columns:
o Adding a column:
o df['Gender'] = ['Male', 'Female', 'Male']
o Removing a column:
o df.drop('Gender', axis=1)

5. Data Cleaning

 Handling Missing Data: Pandas provides functions to detect and handle missing data.
o Detect missing values:
o df.isnull()
o Fill missing values with a specific value:
o df.fillna(0)
o Drop rows with missing values:
o df.dropna()
 Removing Duplicates: You can remove duplicates based on one or more columns:
 df.drop_duplicates(subset=['Name'])

6. Grouping and Aggregation

 GroupBy: The groupby() function allows you to group data based on one or more
columns and then perform aggregation operations.
o Example:
o grouped = df.groupby('City')
o print(grouped['Age'].mean()) # Calculate mean age per city
 Aggregation: You can use functions like sum(), mean(), count(), etc., on grouped data.
 df.groupby('City').agg({'Age': 'mean', 'Name': 'count'})
7. Merging and Joining Data

 Merging DataFrames: Pandas provides a merge() function similar to SQL joins.

o Example:
o df1 = pd.DataFrame({'ID': [1, 2, 3], 'Name': ['John', 'Alice',
'Bob']})
o df2 = pd.DataFrame({'ID': [1, 2, 3], 'Age': [23, 35, 30]})
o merged = pd.merge(df1, df2, on='ID')
 Concatenating DataFrames: Concatenate two or more DataFrames either by rows or
columns.
 df = pd.concat([df1, df2], axis=0) # Concatenate rows

8. Time Series Data

 Datetime Objects: Handling and converting dates is an important feature.

 df['Date'] = pd.to_datetime(df['Date'])
 Resampling: For time series data, you can resample by date or time intervals.
 df.resample('M').sum() # Resample data by month
 Shifting: Shifting data is useful for calculating moving averages or comparing values
over time.
 df['Previous Month'] = df['Sales'].shift(1)

9. Visualization

 Plotting: Pandas integrates with Matplotlib for quick data visualizations. It has built-in
plotting capabilities.
o Example:
o df.plot(x='Date', y='Sales', kind='line')

10. Performance Optimization

 Vectorization: Use vectorized operations to speed up calculations instead of looping

over rows.
 df['Age'] = df['Age'] + 1 # Vectorized addition
 Avoiding Common Pitfalls:
o Avoid using .apply() on DataFrames or Series when possible as it is often
slower than vectorized operations.
o Use inplace=True for operations that modify the original DataFrame to avoid
creating unnecessary copies.

Python For Analytics - 2025 - 2020
No ratings yet
Python For Analytics - 2025 - 2020
28 pages
Unit-05 SSB DBMS
No ratings yet
Unit-05 SSB DBMS
174 pages
Phan1 Pandas Numpy Matplotlib
No ratings yet
Phan1 Pandas Numpy Matplotlib
158 pages
04 Getting Started With Pandas
No ratings yet
04 Getting Started With Pandas
85 pages
Practical Guide To Pandas For Data Science
100% (1)
Practical Guide To Pandas For Data Science
26 pages
Python Pandas Tutorial For Beginners
No ratings yet
Python Pandas Tutorial For Beginners
203 pages
Pandas
No ratings yet
Pandas
7 pages
Chapter 6 Structured Query Language (SQL)
No ratings yet
Chapter 6 Structured Query Language (SQL)
64 pages
Dav 2 Unit
No ratings yet
Dav 2 Unit
55 pages
DAP 3 Module
No ratings yet
DAP 3 Module
62 pages
Unit V Pandas AIML A B Lastupdated 18-06-2024
No ratings yet
Unit V Pandas AIML A B Lastupdated 18-06-2024
33 pages
Pandas Definitions Summary
No ratings yet
Pandas Definitions Summary
2 pages
Practical Questions Mysql For Record 2023-24
0% (1)
Practical Questions Mysql For Record 2023-24
4 pages
CHP 8 Pandas
No ratings yet
CHP 8 Pandas
49 pages
Nit Kurukshetra: Database Systems (LAB)
No ratings yet
Nit Kurukshetra: Database Systems (LAB)
20 pages
Pandas Tutorial
No ratings yet
Pandas Tutorial
7 pages
Ii Unit Pandas
No ratings yet
Ii Unit Pandas
30 pages
Class Xii Information Practices PPT On Data Handling Using Pandas-I
No ratings yet
Class Xii Information Practices PPT On Data Handling Using Pandas-I
64 pages
DBMS Mini Project Movies Database GARVIT
No ratings yet
DBMS Mini Project Movies Database GARVIT
12 pages
Pandas Basics
No ratings yet
Pandas Basics
84 pages
Pandas 1702216043
No ratings yet
Pandas 1702216043
86 pages
Python Programming For Data Science
No ratings yet
Python Programming For Data Science
36 pages
Usage of NumPy For Numerical Data in Detail
No ratings yet
Usage of NumPy For Numerical Data in Detail
52 pages
SQL Assignment 1
No ratings yet
SQL Assignment 1
4 pages
Dbms
100% (1)
Dbms
44 pages
Python Pandas
No ratings yet
Python Pandas
21 pages
04-Data Manipulation With Pandas
No ratings yet
04-Data Manipulation With Pandas
28 pages
06 MGMT 590 Fall 2019 Data Handling With Pandas
No ratings yet
06 MGMT 590 Fall 2019 Data Handling With Pandas
14 pages
DBMS Module 4 (Chap 1)
No ratings yet
DBMS Module 4 (Chap 1)
37 pages
1 Data Handling Using Pandas 1
No ratings yet
1 Data Handling Using Pandas 1
63 pages
Pandas
No ratings yet
Pandas
25 pages
UNIT II Notes
No ratings yet
UNIT II Notes
23 pages
Unit 4 Fod
100% (1)
Unit 4 Fod
21 pages
FDS Notes Unit-4
No ratings yet
FDS Notes Unit-4
30 pages
Pandas
No ratings yet
Pandas
29 pages
Data Handling Module
No ratings yet
Data Handling Module
10 pages
Pandas
No ratings yet
Pandas
94 pages
Current Log
No ratings yet
Current Log
21 pages
JOINS
No ratings yet
JOINS
10 pages
Pandas For Data Science
No ratings yet
Pandas For Data Science
42 pages
Pandas Tutorial
No ratings yet
Pandas Tutorial
9 pages
Pandas
No ratings yet
Pandas
13 pages
DevOps Session 3 Pandas
No ratings yet
DevOps Session 3 Pandas
33 pages
Unit6 - Working With Data
No ratings yet
Unit6 - Working With Data
29 pages
Unit 3 (FODS)
No ratings yet
Unit 3 (FODS)
34 pages
Pandas
No ratings yet
Pandas
25 pages
Full Stack Development
No ratings yet
Full Stack Development
12 pages
13.2 - Chapter 7 - Triggers
No ratings yet
13.2 - Chapter 7 - Triggers
17 pages
Order Database PDF
No ratings yet
Order Database PDF
7 pages
NumPy and Pandas
No ratings yet
NumPy and Pandas
12 pages
Content Pandas Cheat Sheet
No ratings yet
Content Pandas Cheat Sheet
9 pages
Introduction To Pandas in Data Analytics
No ratings yet
Introduction To Pandas in Data Analytics
12 pages
Pandas
No ratings yet
Pandas
13 pages
Database Programming With SQL Section 5 Quiz
No ratings yet
Database Programming With SQL Section 5 Quiz
16 pages
14oct Pandas 2024
No ratings yet
14oct Pandas 2024
13 pages
Pandas - Digitalocean
No ratings yet
Pandas - Digitalocean
15 pages
QB - Answers (PHP) Unit - V
No ratings yet
QB - Answers (PHP) Unit - V
10 pages
Dataset y DataTable en VISUAL STUDIO 2010-1
No ratings yet
Dataset y DataTable en VISUAL STUDIO 2010-1
19 pages
Interview Questions
No ratings yet
Interview Questions
7 pages
Loki Temp PPT Pandas 2
No ratings yet
Loki Temp PPT Pandas 2
31 pages
Pandas CheatSheet
No ratings yet
Pandas CheatSheet
18 pages
Inventory Management System With Berkeley DB
No ratings yet
Inventory Management System With Berkeley DB
16 pages
Python Data Frame New
No ratings yet
Python Data Frame New
32 pages
Introduction To Pandas Programming 2
No ratings yet
Introduction To Pandas Programming 2
3 pages
CSC 220 DBMS Assignment01 (10marks)
0% (1)
CSC 220 DBMS Assignment01 (10marks)
3 pages
Practical Assignment No 6
No ratings yet
Practical Assignment No 6
5 pages
SBMs
No ratings yet
SBMs
4 pages
Pandas Notes
No ratings yet
Pandas Notes
6 pages
What Is Pandas
No ratings yet
What Is Pandas
9 pages
Python Pandas Tutorial
No ratings yet
Python Pandas Tutorial
6 pages
FDS Module 2 Notes
No ratings yet
FDS Module 2 Notes
24 pages
Pandas
No ratings yet
Pandas
12 pages
Videos Saved in Database
No ratings yet
Videos Saved in Database
2 pages
SQL Case Study 1 Corrected
No ratings yet
SQL Case Study 1 Corrected
3 pages
SQL Plus: A Command Line DOS-like Interface Which Can Provide Users An Environment To Execute
No ratings yet
SQL Plus: A Command Line DOS-like Interface Which Can Provide Users An Environment To Execute
5 pages
Solucion Error Cargue Mediante OPENROWSE
No ratings yet
Solucion Error Cargue Mediante OPENROWSE
4 pages
Pandas
No ratings yet
Pandas
9 pages
Unit - 1 - Part3 - DBMS Architecture
No ratings yet
Unit - 1 - Part3 - DBMS Architecture
4 pages
Data Catalog Fundamentals - Google Cloud Skills Boost
No ratings yet
Data Catalog Fundamentals - Google Cloud Skills Boost
1 page
Introduction To Pandas For Data Analysis
No ratings yet
Introduction To Pandas For Data Analysis
6 pages
How To Start
No ratings yet
How To Start
3 pages
All Document Reader 1715619870900
No ratings yet
All Document Reader 1715619870900
6 pages
Unit 3 Relational Database Management Systems
No ratings yet
Unit 3 Relational Database Management Systems
5 pages
Pandas Notes
No ratings yet
Pandas Notes
3 pages
Pandas Notes
No ratings yet
Pandas Notes
4 pages
Algorithm For C Programs
No ratings yet
Algorithm For C Programs
10 pages
Pandas
No ratings yet
Pandas
4 pages
Stop-Start DB2 On HADR
No ratings yet
Stop-Start DB2 On HADR
3 pages
Data Wrangling With Python and Pandas
No ratings yet
Data Wrangling With Python and Pandas
7 pages
The Essential R Reference
From Everand
The Essential R Reference
Mark Gardener
No ratings yet

Mypnotes

Uploaded by

Mypnotes

Uploaded by

Certainly!

2. Basic Data Structures in Pandas

3. Data Import and Export

 Indexing and Selecting Data:

6. Grouping and Aggregation

 Merging DataFrames: Pandas provides a merge() function similar to SQL joins.

8. Time Series Data

 Datetime Objects: Handling and converting dates is an important feature.

10. Performance Optimization

 Vectorization: Use vectorized operations to speed up calculations instead of looping

You might also like