0% found this document useful (0 votes)

14 views3 pages

Assignment 30 3

The document outlines an exploratory data analysis (EDA) assignment using the Titanic dataset, focusing on missing values, data cleaning, and various visualizations. Key analyses include univariate distributions of age and fare, passenger counts by sex, survival rates by gender, and fare distributions across passenger classes. Observations highlight that females had higher survival rates and first-class passengers paid more and survived at higher rates.

Uploaded by

tatikondadhanush

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

14 views3 pages

Assignment 30 3

Uploaded by

tatikondadhanush

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 3

Aim: EDA Assignment

Source Code:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

# Load Titanic dataset

df = sns.load_dataset('titanic')

# Q1: Display the number of missing values in each column

print("Missing values in each column:\n")
print(df.isnull().sum())

# Q2: Fill missing values

df['age'] = df['age'].fillna(df['age'].mean())
df['embarked'] = df['embarked'].fillna(df['embarked'].mode()[0])

# Q3: Drop the 'deck' column

df.drop(columns=['deck'], inplace=True)

# Q4: Univariate Analysis - Distribution of age and fare

plt.figure(figsize=(14, 5))

plt.subplot(1, 2, 1)
sns.histplot(df['age'], kde=True, bins=30)
plt.title('Age Distribution')

plt.subplot(1, 2, 2)
sns.histplot(df['fare'], kde=True, bins=30)
plt.title('Fare Distribution')

plt.tight_layout()
plt.show()

# Q5: Count plot - Number of passengers by sex

plt.figure(figsize=(6, 4))
sns.countplot(data=df, x='sex')
plt.title("Passenger Count by Sex")
plt.show()

# Q6: Count plot - Survival count by gender (hue = survived)

plt.figure(figsize=(6, 4))
sns.countplot(data=df, x='sex', hue='survived')
plt.title("Survival Count by Gender")
plt.show()

# Q7: Box plot - Fare across Pclass categories

plt.figure(figsize=(6, 4))
sns.boxplot(data=df, x='pclass', y='fare')
plt.title("Fare Distribution by Pclass")
plt.show()

# Q8: Create new feature 'family_size'

df['family_size'] = df['sibsp'] + df['parch'] + 1
print("\nQ8. Sample of new 'family_size' feature:\n")
print(df[['sibsp', 'parch', 'family_size']].head())

# Q9: Correlation heatmap

plt.figure(figsize=(10, 6))
sns.heatmap(df.corr(numeric_only=True), annot=True, cmap='coolwarm',
fmt='.2f')
plt.title("Correlation Heatmap")
plt.show()

# Q10: Observations
print("\nObservations:")
print("1. Females had a significantly higher survival rate than males.")
print("2. Passengers in 1st class paid higher fares and had a higher survival
rate.")

Output:

Pythion Assigment
No ratings yet
Pythion Assigment
3 pages
Assignment
No ratings yet
Assignment
14 pages
Pandas Data Imputation Guide
No ratings yet
Pandas Data Imputation Guide
12 pages
Titanic
No ratings yet
Titanic
22 pages
Dsbda 8
No ratings yet
Dsbda 8
8 pages
Project Report
No ratings yet
Project Report
7 pages
AE II Simulation File PDF
No ratings yet
AE II Simulation File PDF
32 pages
Assignment ML
No ratings yet
Assignment ML
4 pages
Pyt Manual 1
No ratings yet
Pyt Manual 1
85 pages
Assignment 2
No ratings yet
Assignment 2
2 pages
AI Lab5
No ratings yet
AI Lab5
5 pages
Python-12-Unit Summary Project
No ratings yet
Python-12-Unit Summary Project
3 pages
Titanic ML for Data Scientists
No ratings yet
Titanic ML for Data Scientists
36 pages
Class 12 AI Practical File
No ratings yet
Class 12 AI Practical File
5 pages
Titanic Data Preprocessing Guide
No ratings yet
Titanic Data Preprocessing Guide
2 pages
3 Practical
No ratings yet
3 Practical
2 pages
Assignment 2
No ratings yet
Assignment 2
5 pages
Dataset Visualization Basic Ml-1
No ratings yet
Dataset Visualization Basic Ml-1
12 pages
Titanic Prediction
No ratings yet
Titanic Prediction
53 pages
ML Dataset Performance
No ratings yet
ML Dataset Performance
11 pages
Dsbda 9
No ratings yet
Dsbda 9
7 pages
Lab 1 - Data, Frequency Tables and Histograms (20042023) - Picture
No ratings yet
Lab 1 - Data, Frequency Tables and Histograms (20042023) - Picture
14 pages
Titanic Dataset Analysis Insights
No ratings yet
Titanic Dataset Analysis Insights
4 pages
Titanic Survival Prediction Guide
No ratings yet
Titanic Survival Prediction Guide
16 pages
BD WPS2
No ratings yet
BD WPS2
11 pages
Dspracticalexternak 23 Aug
No ratings yet
Dspracticalexternak 23 Aug
8 pages
Titanic Dataset
No ratings yet
Titanic Dataset
9 pages
Titanic PuneethRegonda
No ratings yet
Titanic PuneethRegonda
8 pages
Unit 5 Analysis With Pandas in Python
No ratings yet
Unit 5 Analysis With Pandas in Python
26 pages
Seaborn Ploting in Titanic
No ratings yet
Seaborn Ploting in Titanic
18 pages
LOGISTIC - REGRESSION - Jupyter Notebook
No ratings yet
LOGISTIC - REGRESSION - Jupyter Notebook
18 pages
Exploring The Titanic Dataset With Python
No ratings yet
Exploring The Titanic Dataset With Python
6 pages
Python For Data Analysis
No ratings yet
Python For Data Analysis
28 pages
Data Cleaning and Manipulation in Python
No ratings yet
Data Cleaning and Manipulation in Python
33 pages
CKCS149 - Lab 10 Completed
No ratings yet
CKCS149 - Lab 10 Completed
6 pages
EDA On Titanic Dataset
100% (1)
EDA On Titanic Dataset
39 pages
Lab 5.ipynb - Colab
No ratings yet
Lab 5.ipynb - Colab
6 pages
Titanic Logistic Regression Project
No ratings yet
Titanic Logistic Regression Project
35 pages
Experiment 1
No ratings yet
Experiment 1
2 pages
Titanic Eda
No ratings yet
Titanic Eda
17 pages
Ahamed 123
100% (1)
Ahamed 123
7 pages
Titanic Data Cleaning & Analysis
No ratings yet
Titanic Data Cleaning & Analysis
4 pages
Titanic Data Analysis
No ratings yet
Titanic Data Analysis
14 pages
Homework 1
No ratings yet
Homework 1
17 pages
Python For Machine Learning
No ratings yet
Python For Machine Learning
33 pages
Assignment2 DMS672
No ratings yet
Assignment2 DMS672
15 pages
Titanic Data Analysis & Modeling
No ratings yet
Titanic Data Analysis & Modeling
12 pages
Ai Tools and Applications-Lab
No ratings yet
Ai Tools and Applications-Lab
33 pages
9914 ML Lab3
No ratings yet
9914 ML Lab3
6 pages
Titanic Survival Prediction 1692609491
No ratings yet
Titanic Survival Prediction 1692609491
15 pages
Aim: Predicting The Survival of Titanic Passengers
No ratings yet
Aim: Predicting The Survival of Titanic Passengers
20 pages
Titanic Survival Prediction
No ratings yet
Titanic Survival Prediction
5 pages
Data Preprocessing - 241024 - 215531
No ratings yet
Data Preprocessing - 241024 - 215531
40 pages
7 8 - Missing Value Handling
No ratings yet
7 8 - Missing Value Handling
4 pages
ML 3
No ratings yet
ML 3
9 pages
23L-2589 Lab 10
No ratings yet
23L-2589 Lab 10
17 pages
Untitled26 1
No ratings yet
Untitled26 1
15 pages
DVA Practical
No ratings yet
DVA Practical
19 pages
Assignment 29 3
No ratings yet
Assignment 29 3
3 pages
Assignment 31 3
No ratings yet
Assignment 31 3
2 pages
Assignment 28 3
No ratings yet
Assignment 28 3
1 page
Assaignment 6
No ratings yet
Assaignment 6
5 pages
Assaignment 3 1
No ratings yet
Assaignment 3 1
5 pages
Assaignment 4 1
No ratings yet
Assaignment 4 1
4 pages

Assignment 30 3

Uploaded by

Assignment 30 3

Uploaded by

Aim: EDA Assignment

# Load Titanic dataset

# Q1: Display the number of missing values in each column

# Q2: Fill missing values

# Q3: Drop the 'deck' column

# Q4: Univariate Analysis - Distribution of age and fare

# Q5: Count plot - Number of passengers by sex

# Q6: Count plot - Survival count by gender (hue = survived)

# Q7: Box plot - Fare across Pclass categories

# Q8: Create new feature 'family_size'

# Q9: Correlation heatmap

You might also like