0% found this document useful (0 votes)

9 views18 pages

Experimenting With Data Analysis Packages and Statistical Operations

The document outlines an experiment utilizing data analysis packages including NumPy, SciPy, Jupyter, Statsmodels, and Pandas for data manipulation and statistical analysis. It details various coding examples demonstrating descriptive statistics, linear and logistic regression, data handling, and visualization techniques. The experiment successfully explores these packages, calculating key statistical measures and deriving insights from the dataset.

Uploaded by

ithikashr97516

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

9 views18 pages

Experimenting With Data Analysis Packages and Statistical Operations

Uploaded by

ithikashr97516

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 18

EX: 1 Reg No: 2022510023

Date: 7/8/2024

Experimenting with Data Analysis Packages and Statistical

Operations
Aim:

To explore and utilize data analysis packages like NumPy, SciPy, Jupyter, Statsmodels, and Pandas for
data manipulation and statistical analysis on a chosen dataset, focusing on descriptive analytics and key
statistical measures.

1.Exploring NumPY:

Numpy module
The numpy module in python is created for performing faster mathematical operations such as
matrix multiplication, inversion by storing the features into arrays known as numpy arrays.

Code:

import numpy as np
#Creating an array
arr = np.array([12,26,27,28,30])
print(arr)
print(arr.dtype)

Output:

Code:

#Creating Multidimensional Arrays

arr1 = np.array([[[1, 2, 3], [4, 5, 6]], [[1, 2, 3], [4, 5, 6]]])
print(arr1)
print("Dimension of the Array:",arr1.ndim)

Output:

Code:
# Example array
array = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])

# Descriptive statistics
sum_value = np.sum(array)
min_value = np.min(array)
max_value = np.max(array)
range_value = np.ptp(array)
cumsum_value = np.cumsum(array)
cumprod_value = np.cumprod(array)

# Print results
print("Sum:", sum_value)
print("Min:", min_value)
print("Max:", max_value)
print("Range:", range_value)
print("Cumulative Sum:", cumsum_value)
print("Cumulative Product:", cumprod_value)

Output:

Code:

# Mean
data = np.array([10, 20, 30, 40, 50])
mean = np.mean(data)
print("Mean:", mean)

# Median
median = np.median(data)
print("Median:", median)

# Standard Deviation
std_dev = np.std(data)
print("Standard Deviation:", std_dev)

# Variance
variance = np.var(data)
print("Variance:", variance)
2
# Percentile
percentile_25 = np.percentile(data, 25)
print("25th Percentile:", percentile_25)

# Correlation Coefficient Matrix

x = np.array([1, 2, 3, 4, 5])
y = np.array([5, 4, 3, 2, 1])
correlation_matrix = np.corrcoef(x, y)
print("Correlation Coefficient Matrix:\n", correlation_matrix)

# Covariance Matrix
cov_matrix = np.cov(x, y)
print("Covariance Matrix:\n", cov_matrix)

# Histogram
hist, bin_edges = np.histogram(data, bins=5)
print("Histogram:", hist)
print("Bin Edges:", bin_edges)

# Unique Elements
unique_elements = np.unique(data)
print("Unique Elements:", unique_elements)

# Check for NaN values

nan_data = np.array([1, np.nan, 3, 4])
nan_check = np.isnan(nan_data)
print("NaN Check:", nan_check)

# Check for Finite Values

finite_data = np.array([1, np.inf, -np.inf, 3])
finite_check = np.isfinite(finite_data)
print("Finite Check:", finite_check)

# Dot Product
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])
dot_product = np.dot(a, b)
print("Dot Product:", dot_product)

# Random Data
np.random.seed(0)
random_data = np.random.rand(5)
print("Random Data:", random_data)

Output:

3
Code:

# Example matrix
matrix = np.array([[1, 2, 3],
[4, 5, 6],
[7, 8, 9]])

# Transpose
transpose_matrix = np.transpose(matrix)
# or using matrix.T
transpose_matrix_alt = matrix.T

# Inverse
# Note: Matrix must be square and non-singular for inversion
try:
inverse_matrix = np.linalg.inv(matrix)
except np.linalg.LinAlgError:
inverse_matrix = "Matrix is singular or not square"

# Determinant
determinant = np.linalg.det(matrix)

# Eigenvalues and Eigenvectors

eigenvalues, eigenvectors = np.linalg.eig(matrix)

print("Transpose:\n", transpose_matrix)
print("Transpose (alternative method):\n", transpose_matrix_alt)
print("Inverse:\n", inverse_matrix)
print("Determinant:", determinant)
4
print("Eigenvalues:", eigenvalues)
print("Eigenvectors:\n", eigenvectors)
print("SVD U:\n", U)
print("SVD S:", S)
print("SVD Vt:\n", Vt)
print("Matrix Product:\n", matrix_product)
print("Matrix Product (alternative method):\n", matrix_product_alt)
print("Trace:", trace)

Output:

2.Exploring SciPY:

Scipy module
5
Scipy module provides mathematical algorithm functions for numpy array features for faster
computation.

Code:

from scipy import stats, integrate, linalg, interpolate, optimize

# Creating data
data = np.array([1, 2, 2, 3, 4, 5])
x = np.linspace(0, 10, 10)
y = np.sin(x)

# Mean and Standard Deviation

mean = stats.tmean(data)
std_dev = stats.tstd(data)
print("Mean (scipy.stats):", mean)
print("Standard Deviation (scipy.stats):", std_dev)

# Pearson Correlation Coefficient

corr_coefficient, _ = stats.pearsonr(x, y)
print("Pearson Correlation Coefficient:", corr_coefficient)

# Spearman Rank Correlation Coefficient

spearman_corr, _ = stats.spearmanr(x, y)
print("Spearman Rank Correlation Coefficient:", spearman_corr)

# Linear Regression
slope, intercept, r_value, p_value, std_err = stats.linregress(x, y)
print("Linear Regression - Slope:", slope)
print("Linear Regression - Intercept:", intercept)

# Integration
integral, error = integrate.quad(lambda x: x**2, 0, 1)
print("Integral of x^2 from 0 to 1:", integral)

# Solve Linear System

A = np.array([[3, 2], [1, 2]])
b = np.array([5, 6])
solution = linalg.solve(A, b)
print("Solution of linear system:", solution)

# Eigenvalues and Eigenvectors

A = np.array([[1, 2], [3, 4]])
eigenvalues, eigenvectors = linalg.eig(A)
print("Eigenvalues:", eigenvalues)
print("Eigenvectors:\n", eigenvectors)

# Optimization
def objective_function(params):
6
return np.sum((y - (params[0] * x + params[1]))**2)

initial_guess = [1, 0]
result = optimize.minimize(objective_function, initial_guess)
print("Optimization result:", result.x)

# Descriptive Statistics
desc_stats = stats.describe(data)
print("Descriptive Statistics:", desc_stats)

# Interquartile Range
iqr = stats.iqr(data)
print("Interquartile Range:", iqr)

# Z-score
z_scores = stats.zscore(data)
print("Z-scores:", z_scores)

Output:

3.Exploring Statsmodels:

Statsmodel module
The statsmodel module provides the function of summarizing or providing the final result of the
trained model.

Code:
import statsmodels.api as sm
import statsmodels.formula.api as smf
from sklearn.datasets import load_iris
import pandas as pd
# Load Iris dataset
iris = load_iris()
iris_df = pd.DataFrame(data=iris.data, columns=iris.feature_names)
iris_df['species'] = iris.target

7
iris_df['species'] = iris_df['species'].map({i: species for i, species in enumerate(iris.target_names)})

# Linear Regression (predicting petal length from sepal length)

X = iris_df[['sepal length (cm)']]
X = sm.add_constant(X) # Adds a constant term to the predictor
y = iris_df['petal length (cm)']
linear_model = sm.OLS(y, X).fit()
print("Linear Regression Summary:\n", linear_model.summary())

# Logistic Regression (predicting species from sepal length and petal length)
# Converting species to a binary outcome for simplicity
iris_df['species_binary'] = (iris_df['species'] == 'versicolor').astype(int)

# Logistic Regression Model

X_logit = sm.add_constant(iris_df[['sepal length (cm)', 'petal length (cm)']])
logit_model = sm.Logit(iris_df['species_binary'], X_logit).fit()
print("Logistic Regression Summary:\n", logit_model.summary())

Output:

4.Exploring Pandas:

Pandas module

8
This module provides basic functions to work with datasets which are really helpful for data
scientist for analysing the data.

Code:

import pandas as pd
import numpy as np

# Sample DataFrame creation

data = {
'A': [1, 2, np.nan, 4, 5],
'B': ['a', 'b', 'a', 'b', 'a'],
'C': [10, 20, 10, 20, 10],
'D': [100, 200, 100, 200, 100]
}
df = pd.DataFrame(data)

# Display the DataFrame

print("Original DataFrame:")
print(df)

# 1. DataFrame Creation
df_created = pd.DataFrame(data)
print("\nDataFrame Created from Dictionary:")
print(df_created)

# 2. Display First and Last Rows

print("\nFirst 3 Rows of DataFrame:")
print(df.head(3))
print("\nLast 3 Rows of DataFrame:")
print(df.tail(3))

# 3. Summary Information
print("\nDataFrame Info:")
print(df.info())

# 4. Sampling
print("\nRandom Sample of 2 Rows:")
print(df.sample(2))

# 5. Handling Missing Values

numeric_cols = df.select_dtypes(include=[np.number]).columns
df_filled = df.fillna(df[numeric_cols].mean())
print("\nDataFrame with Missing Values Filled:")
print(df_filled)

df_dropped = df.dropna()

9
print("\nDataFrame with Missing Values Dropped:")
print(df_dropped)

# 6. Data Aggregation
mean_values = df.groupby('B').mean()
print("\nMean Values Grouped by 'B':")
print(mean_values)

# 7. Merging DataFrames
df2 = pd.DataFrame({'B': ['a', 'b'], 'E': [1, 2]})
merged_df = pd.merge(df, df2, on='B', how='left')
print("\nMerged DataFrame:")
print(merged_df)

# 8. Sorting
sorted_df = df.sort_values(by='A', ascending=False)
print("\nDataFrame Sorted by 'A':")
print(sorted_df)

# 9. Filtering
filtered_df = df[df['A'] > 2]
print("\nFiltered DataFrame (A > 2):")
print(filtered_df)

# 10. Applying Functions

df['A_squared'] = df['A'].apply(lambda x: x**2)
print("\nDataFrame with 'A_squared':")
print(df)

# 11. Pivot Tables

pivot_table = pd.pivot_table(df, values='D', index='B', columns='C', aggfunc=np.mean)
print("\nPivot Table:")
print(pivot_table)

# 12. Statistical Summary

summary = df.describe()
print("\nStatistical Summary:")
print(summary)

# 14. Exporting and Importing Data

df.to_csv('example.csv', index=False)
print("\nDataFrame saved to 'example.csv'")
df_read = pd.read_csv('example.csv')
print("\nDataFrame read from 'example.csv':")
print(df_read)

# 15. Renaming Columns

10
df_renamed = df.rename(columns={'A': 'Column_A', 'B': 'Column_B'})
print("\nDataFrame with Renamed Columns:")
print(df_renamed)

# 16. DataFrame Shape

shape = df.shape
print("\nDataFrame Shape:")
print(shape)

# 17. Dropping Columns

df_dropped_col = df.drop(columns=['D'])
print("\nDataFrame with Column 'D' Dropped:")
print(df_dropped_col)

# 18. Value Counts

value_counts = df['B'].value_counts()
print("\nValue Counts in Column 'B':")
print(value_counts)

# 19. Reshaping Data

pivot_table = pd.pivot_table(df, values='D', index='B', columns='C', aggfunc=np.mean)
print("\nPivot Table (Reshaped DataFrame):")
print(pivot_table)

melted_df = pd.melt(df, id_vars=['B'], value_vars=['A', 'D'])

print("\nMelted DataFrame:")
print(melted_df)

# 20. Querying Data

query_result = df.query('A > 2')
print("\nQuery Result (A > 2):")
print(query_result)

Output:

11
Reading from Text File, CSV File, Excel File and Web File:
12
example1 = "/content/Data Analytic Lab.txt"
file = open(example1, "r")
FileContent = file.read()
FileContent
print(FileContent)

Output:

Code:

import pandas as pd
df = pd.read_csv("/content/mxmh_survey_results.csv")
df.head()
df.info()

Output:

Code:

13
#EXCEL
df1 = pd.read_excel("/content/DAEX1.xlsx")
df1.head()

Output:

Code:

#WEB FILE
url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/blood-transfusion/transfusion.data'
df2 = pd.read_csv(url)
df2.head()

Output:

Code:

import pandas as pd
file_path = '/content/mxmh_survey_results.csv'
df = pd.read_csv(file_path)
df.head()

Output:

Code:

df.describe()
14
Output:

Code:

print("\nDescriptive Statistics (Categorical):")

print(df.describe(include=[object]))

Output:

Code:

# Check for missing values in the dataset

missing_values = df.isnull().sum()

15
# Columns with missing values
missing_values[missing_values > 0]
Output:

Code:

# Age Distribution
plt.figure(figsize=(10, 6))
sns.histplot(df['Age'].dropna(), kde=True, bins=20)
plt.title('Age Distribution')
plt.xlabel('Age')
plt.ylabel('Frequency')
plt.show()

# Distribution of Primary Streaming Service

plt.figure(figsize=(12, 6))
sns.countplot(data=df, x='Primary streaming service', order=df['Primary streaming
service'].value_counts().index)
plt.title('Primary Streaming Service Distribution')
plt.xlabel('Streaming Service')
plt.ylabel('Count')
plt.xticks(rotation=45)
plt.show()

Output:

16
Code:

# Frequency of Listening to Music Genres

freq_cols = [col for col in df.columns if 'Frequency' in col]
df_melted = df.melt(id_vars=[], value_vars=freq_cols, var_name='Genre', value_name='Frequency')
plt.figure(figsize=(14, 8))
sns.countplot(data=df_melted, x='Genre', hue='Frequency', order=freq_cols)
plt.title('Frequency of Listening to Various Music Genres')
plt.xticks(rotation=45)
plt.ylabel('Count')
plt.xlabel('Music Genre')
plt.show()

Output:

Code:
17
import seaborn as sns
import matplotlib.pyplot as plt
numeric_df = df.select_dtypes(include=['float64', 'int64'])
correlation_matrix = numeric_df.corr()
plt.figure(figsize=(12, 8))
sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm', center=0)
plt.show()

Output:

Result:

Successfully explored data analysis packages and applied statistical operations on the chosen dataset,
calculating descriptive measures such as mean, median, and standard deviation. Identified data insights
through interpretation of variance, skewness, and kurtosis.

Python Course Cheat Sheet
No ratings yet
Python Course Cheat Sheet
30 pages
Data Science Using Python Lab Week8
No ratings yet
Data Science Using Python Lab Week8
23 pages
Datascience Lab
No ratings yet
Datascience Lab
24 pages
Statistical Analysis With Scipy?
No ratings yet
Statistical Analysis With Scipy?
9 pages
Mayank Chaudhary DEV Practicals
No ratings yet
Mayank Chaudhary DEV Practicals
14 pages
DSC Lab Programs
No ratings yet
DSC Lab Programs
24 pages
Fdsa Record Ai&Ds
No ratings yet
Fdsa Record Ai&Ds
26 pages
ML Lab Manual
No ratings yet
ML Lab Manual
23 pages
Dsa Lab
No ratings yet
Dsa Lab
28 pages
ML Programs
No ratings yet
ML Programs
41 pages
Averages and The Range AQA
No ratings yet
Averages and The Range AQA
10 pages
Chapter 10 Data Analysis-Quantitative
No ratings yet
Chapter 10 Data Analysis-Quantitative
93 pages
Dav Lab Manual
No ratings yet
Dav Lab Manual
28 pages
Gec Practicals
No ratings yet
Gec Practicals
31 pages
Vanshika Goyal Gec Practicals
No ratings yet
Vanshika Goyal Gec Practicals
31 pages
Fds Lab Record
No ratings yet
Fds Lab Record
84 pages
Ap Stat Exam Rev ch1-13
No ratings yet
Ap Stat Exam Rev ch1-13
120 pages
ML Labmanual
No ratings yet
ML Labmanual
33 pages
AD3411 DATA SCIENCE AND ANALYTICS LAB (2) - Removed
No ratings yet
AD3411 DATA SCIENCE AND ANALYTICS LAB (2) - Removed
24 pages
Ankit Python
No ratings yet
Ankit Python
26 pages
Bda Prac 1 - Merged
No ratings yet
Bda Prac 1 - Merged
28 pages
Data Analytics Lab Manual
No ratings yet
Data Analytics Lab Manual
26 pages
DVA Lab Manual
No ratings yet
DVA Lab Manual
20 pages
Ad3411 - Data Science and Analytics Laboratory
No ratings yet
Ad3411 - Data Science and Analytics Laboratory
26 pages
ML (Sudhanshu)
No ratings yet
ML (Sudhanshu)
24 pages
FDSA Lab Manual
No ratings yet
FDSA Lab Manual
27 pages
AD3411
No ratings yet
AD3411
28 pages
Central Limit Theorem
No ratings yet
Central Limit Theorem
3 pages
FDSA Lab Manual
No ratings yet
FDSA Lab Manual
31 pages
Data Science and Analtics Laboratory
No ratings yet
Data Science and Analtics Laboratory
21 pages
Ad3411-Data Science and Analytics Laboratory
No ratings yet
Ad3411-Data Science and Analytics Laboratory
27 pages
Data Science Lab Manual
No ratings yet
Data Science Lab Manual
32 pages
Machine Learning Lab Word 12-1-2025. Document
No ratings yet
Machine Learning Lab Word 12-1-2025. Document
68 pages
Fda Batch2program
No ratings yet
Fda Batch2program
18 pages
ML File Syllabus
No ratings yet
ML File Syllabus
43 pages
Time Series Analysis Group 9
No ratings yet
Time Series Analysis Group 9
16 pages
Dsa Lab Manual
No ratings yet
Dsa Lab Manual
17 pages
ML Lab Manual
No ratings yet
ML Lab Manual
28 pages
Srivastava DistributionCorrelationCoefficient 1984
No ratings yet
Srivastava DistributionCorrelationCoefficient 1984
16 pages
Data Science and Analtics Laboratory
No ratings yet
Data Science and Analtics Laboratory
21 pages
PP DWDM 4 5
No ratings yet
PP DWDM 4 5
26 pages
DA Manual - Part B
No ratings yet
DA Manual - Part B
13 pages
MMW Chap 4 Data Management Part 2
No ratings yet
MMW Chap 4 Data Management Part 2
29 pages
Edexcel IGCSE Higher Tier Mathematics 4H June 2017
No ratings yet
Edexcel IGCSE Higher Tier Mathematics 4H June 2017
7 pages
s2 CRV
No ratings yet
s2 CRV
61 pages
ML Final Prac
No ratings yet
ML Final Prac
47 pages
Answer of Quiz (1) - Investment - Risk & Return
No ratings yet
Answer of Quiz (1) - Investment - Risk & Return
6 pages
HW 1
No ratings yet
HW 1
15 pages
Batch2 FDS Printout
No ratings yet
Batch2 FDS Printout
38 pages
L - AND - T - Project - Naveen 24cs002895
No ratings yet
L - AND - T - Project - Naveen 24cs002895
7 pages
ModuleAr Merged
No ratings yet
ModuleAr Merged
42 pages
ML Prac 1
No ratings yet
ML Prac 1
17 pages
Linear Regression
100% (2)
Linear Regression
28 pages
KRAI LabManual
No ratings yet
KRAI LabManual
77 pages
Trial Questions 2
No ratings yet
Trial Questions 2
13 pages
DS1-Lec1 2
No ratings yet
DS1-Lec1 2
114 pages
Business Statistics 3rd Year PDF
No ratings yet
Business Statistics 3rd Year PDF
2 pages
Unec 1711787818
No ratings yet
Unec 1711787818
6 pages
DAV Practical
No ratings yet
DAV Practical
12 pages
Data Kelompok 4 Statistik
No ratings yet
Data Kelompok 4 Statistik
5 pages
Python Code - Summary Statistics
No ratings yet
Python Code - Summary Statistics
6 pages
Data Science Manual
No ratings yet
Data Science Manual
16 pages
DP Prog
No ratings yet
DP Prog
10 pages
CS3362 Data Science Laboratory Manual 2022-23
No ratings yet
CS3362 Data Science Laboratory Manual 2022-23
54 pages
FDS Lab 1 Manuel .1..1new
No ratings yet
FDS Lab 1 Manuel .1..1new
38 pages
Dal Programs With Output
No ratings yet
Dal Programs With Output
11 pages
Jurnal Stem
No ratings yet
Jurnal Stem
6 pages
Uji Validitas Dan Reliabilitas (Lubis)
No ratings yet
Uji Validitas Dan Reliabilitas (Lubis)
5 pages
FDS Lab 1 Manuel .1..1new
No ratings yet
FDS Lab 1 Manuel .1..1new
34 pages
External
No ratings yet
External
11 pages
ML Shristi File
No ratings yet
ML Shristi File
49 pages
Print Print Print Print: Import As
No ratings yet
Print Print Print Print: Import As
6 pages
Business Mathematics Formulae
No ratings yet
Business Mathematics Formulae
5 pages
Data Science Practical Book - Ipynb
No ratings yet
Data Science Practical Book - Ipynb
21 pages
Roll NO 2020
No ratings yet
Roll NO 2020
8 pages
S1 - Chapter Review 2
No ratings yet
S1 - Chapter Review 2
5 pages
Materi Pert 6 Jawaban Latihan Soal
No ratings yet
Materi Pert 6 Jawaban Latihan Soal
9 pages
Stats Formula Book CAPRANAV June 2023
No ratings yet
Stats Formula Book CAPRANAV June 2023
8 pages
CBSE Class 10 Maths Worksheet - Statistics (9) - 0
No ratings yet
CBSE Class 10 Maths Worksheet - Statistics (9) - 0
3 pages
1.05 Portfolio Mathematics - Answers
No ratings yet
1.05 Portfolio Mathematics - Answers
7 pages
Mathematics: Quarter 4 - Module 6
100% (2)
Mathematics: Quarter 4 - Module 6
21 pages
Data Science
No ratings yet
Data Science
18 pages
Measures of Central Tendency: Mean Median Mode
No ratings yet
Measures of Central Tendency: Mean Median Mode
20 pages
Data Analysis Lab - Final - 23-24
No ratings yet
Data Analysis Lab - Final - 23-24
11 pages
4-Moving Averages
No ratings yet
4-Moving Averages
20 pages
Assessing Learning in A Classroom Environment
No ratings yet
Assessing Learning in A Classroom Environment
6 pages
Mathematics: Quarter 4 - Module 4 Solving Problems Involving Measures of Position
No ratings yet
Mathematics: Quarter 4 - Module 4 Solving Problems Involving Measures of Position
20 pages
Ad3411 - Student
No ratings yet
Ad3411 - Student
27 pages
Grade 7 4th Quarter 7-9th Week
No ratings yet
Grade 7 4th Quarter 7-9th Week
9 pages
Profound Python Data Science
From Everand
Profound Python Data Science
Onder Teker
No ratings yet

Experimenting With Data Analysis Packages and Statistical Operations

Uploaded by

Experimenting With Data Analysis Packages and Statistical Operations

Uploaded by

EX: 1 Reg No: 2022510023

Experimenting with Data Analysis Packages and Statistical

#Creating Multidimensional Arrays

# Correlation Coefficient Matrix

# Check for NaN values

# Check for Finite Values

# Eigenvalues and Eigenvectors

from scipy import stats, integrate, linalg, interpolate, optimize

# Mean and Standard Deviation

# Pearson Correlation Coefficient

# Spearman Rank Correlation Coefficient

# Solve Linear System

# Eigenvalues and Eigenvectors

# Linear Regression (predicting petal length from sepal length)

# Logistic Regression Model

# Sample DataFrame creation

# Display the DataFrame

# 2. Display First and Last Rows

# 5. Handling Missing Values

# 10. Applying Functions

# 11. Pivot Tables

# 12. Statistical Summary

# 14. Exporting and Importing Data

# 15. Renaming Columns

# 16. DataFrame Shape

# 17. Dropping Columns

# 18. Value Counts

# 19. Reshaping Data

melted_df = pd.melt(df, id_vars=['B'], value_vars=['A', 'D'])

# 20. Querying Data

print("\nDescriptive Statistics (Categorical):")

# Check for missing values in the dataset

# Distribution of Primary Streaming Service

# Frequency of Listening to Music Genres

You might also like