0% found this document useful (0 votes)

37 views23 pages

Machine Learning Lab Assignment 1

The document outlines various machine learning assignments, including Linear Regression, Logistic Regression, Random Forest Classification, Decision Tree, Clustering, and Support Vector Machine (SVM). Each section provides code snippets for data preprocessing, model training, and evaluation using different datasets. Key metrics such as accuracy, mean absolute error, and silhouette score are used to assess model performance.

Uploaded by

tarlanavikas12

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

37 views23 pages

Machine Learning Lab Assignment 1

Uploaded by

tarlanavikas12

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 23

ASSIGNMENT

1.Linear Regression
Code:
# Import required libraries
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_absolute_error, mean_squared_error,
r2_score
from sklearn.preprocessing import LabelEncoder, StandardScaler

# Load dataset
data = pd.read_csv('dataset.csv')

# Display basic info

print(data.head())
print(data.info())

# Handle missing values (example: drop rows with missing values)

data = data.dropna()
data = data[data['Production'] != '=']

# Verify the rows are removed

print(data[data['Production'] == '='])

# Encode categorical features

categorical_cols = ['State_Name', 'District_Name', 'Crop', 'Season']
label_encoders = {}
for col in categorical_cols:
le = LabelEncoder()
data[col] = le.fit_transform(data[col])
label_encoders[col] = le

# Define features and target variable

X = data[['Area', 'Season', 'Crop', 'Crop_Year']] # Example features
y = data['Production']
# Split the dataset
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2,
random_state=42)

# Scale the features

scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)
# Train the model
model = LinearRegression()
model.fit(X_train, y_train)

# Predict on test data

y_pred = model.predict(X_test)

# Evaluate the model

mae = mean_absolute_error(y_test, y_pred)
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)
print(f"Mean Absolute Error: {mae}")
print(f"Mean Squared Error: {mse}")
print(f"R-squared: {r2}")
Dataset:

Input:
Output:
2.Logistic Regression
Code:
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score,confusion_matrix
#Read the dataset using pandas (replace 'your_dataset.csv' with your actual file
path)
data = pd.read_csv('studyhours.csv')
print(data)
#Assuming the target column is 'target' and all other coulmnss are features
X = data.drop(columns=['status']) #Drop the target column to get features
y = data['status'] #Target variable
#Split the data into training and testing sets
X_train,X_test,y_train,y_test =
train_test_split(X,y,test_size=0.4,random_state=20)
#Initialize the Logistic Regression model
model = LogisticRegression()
#Train the model
model.fit(X_train,y_train)
#Make predictions on the test data
y_pred = model.predict(X_test)
#Evaluate the model
accuracy = accuracy_score(y_test,y_pred)
conf_matrix = confusion_matrix(y_test,y_pred)
#Print results
print("Accuracy.",accuracy)
print("Confusion Matrix.")
print(conf_matrix)
Dataset:
Input:

Output:
3.Random Forest Classification
Code:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, confusion_matrix,
classification_report
from sklearn.preprocessing import LabelEncoder
# Load the Titanic dataset
file_path = 'titanic.csv' # Replace with your Titanic dataset file path
data = pd.read_csv(file_path)
# Display the first few rows of the dataset
print("Dataset Preview:")
print(data.head())
# Drop columns not relevant for the model
data = data.drop(['PassengerId', 'Name', 'Ticket', 'Cabin'], axis=1,
errors='ignore')
# Fill missing values
data['Age'].fillna(data['Age'].median(), inplace=True)
data['Embarked'].fillna(data['Embarked'].mode()[0], inplace=True)

# Encode categorical features

categorical_cols = ['Sex', 'Embarked']
label_encoders = {}
for col in categorical_cols:
le = LabelEncoder()
data[col] = le.fit_transform(data[col])
label_encoders[col] = le

# Define features and target variable

X = data.drop(['Survived'], axis=1)
y = data['Survived']

# Split the dataset into training and testing sets

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2,
random_state=42)

# Initialize the Random Forest Classifier

model = RandomForestClassifier(n_estimators=100, random_state=42)
# Train the model
model.fit(X_train, y_train)

# Make predictions
y_pred = model.predict(X_test)

# Evaluate the model

accuracy = accuracy_score(y_test, y_pred)
conf_matrix = confusion_matrix(y_test, y_pred)
class_report = classification_report(y_test, y_pred)

# Display results
print("\nModel Evaluation:")
print(f"Accuracy: {accuracy:.2f}")
print("\nConfusion Matrix:")
print(conf_matrix)
print("\nClassification Report:")
print(class_report)
Dataset:
Input:
Output:
4. Decision Tree id3
Code:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.tree import DecisionTreeClassifier, plot_tree
from sklearn.preprocessing import LabelEncoder
from sklearn.model_selection import train_test_split

# Load the weather dataset

filename = "weather.csv" # Update this path to your CSV file
df = pd.read_csv(filename)
print(df)

# Remove the 'Day' feature if present

df = df.drop(columns=['Day'], errors='ignore')

# Display the first few rows of the dataset

df.head()

# Encode categorical features using LabelEncoder

label_encoders = {}
for column in df.columns:
if df[column].dtype == 'object': # Apply encoding only to categorical columns
le = LabelEncoder()
df[column] = le.fit_transform(df[column])
label_encoders[column] = le
print("----------------------------After fit and
transform------------------------------------------")
print(df)
# Define features and target
X = df.iloc[:, :-1] # All columns except the last as features
y = df.iloc[:, -1] # Last column as target

# Split the data into training and testing sets

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2,
random_state=42)

# Build the decision tree classifier using the entropy criterion

model = DecisionTreeClassifier(criterion='entropy', random_state=42)
model.fit(X_train, y_train)

# Visualize the decision tree

plt.figure(figsize=(10, 6))
plot_tree(model, feature_names=X.columns,
class_names=label_encoders[df.columns[-1]].classes_,
filled=True, rounded=True, fontsize=10)
plt.title("Simple ID3 Decision Tree for Weather Dataset")
plt.show()
Dataset:
Input:
Output:
5.Clustering
Code:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import silhouette_score, davies_bouldin_score
# Load dataset from CSV file
df = pd.read_csv('student_marks.csv') # Ensure the file exists
# Selecting relevant features
marks = df[['Subject1', 'Subject2']].values
# Standardizing the data
scaler = StandardScaler()
marks_scaled = scaler.fit_transform(marks)
# Applying K-Means Clustering
k = 2 # Number of clusters
kmeans = KMeans(n_clusters=k, random_state=42, n_init=10)
df['Cluster'] = kmeans.fit_predict(marks_scaled)
# Get centroids
centroids = kmeans.cluster_centers_
# Assign cluster names based on performance
cluster_names = {0: 'High Performers', 1: 'Low Performers'} # Modify as
needed
df['Cluster Name'] = df['Cluster'].map(cluster_names)
# Save clustered data to CSV
df.to_csv('student_marks_clustered.csv', index=False)
# Performance Metrics
inertia = kmeans.inertia_ # SSE
silhouette_avg = silhouette_score(marks_scaled, df['Cluster'])
db_index = davies_bouldin_score(marks_scaled, df['Cluster'])
print(f"Inertia (SSE): {inertia:.2f}")
print(f"Silhouette Score: {silhouette_avg:.2f}")
print(f"Davies-Bouldin Index: {db_index:.2f}")
# Display cluster-wise information
print("\nCluster Information:")
print(df.groupby('Cluster Name')[['Subject1', 'Subject2']].mean())
# Plot the clusters
plt.figure(figsize=(8, 6))
plt.scatter(marks_scaled[:, 0], marks_scaled[:, 1], c=df['Cluster'], cmap='viridis',
marker='o', edgecolors='k', label='Students')
plt.scatter(centroids[:, 0], centroids[:, 1], s=200, c='red', marker='X',
label='Centroids')
plt.xlabel('Subject 1 (Scaled)')
plt.ylabel('Subject 2 (Scaled)')
plt.title('K-Means Clustering of Student Marks')
plt.legend()
plt.show()
Dataset:
Input:
Output:
6. Support Vector Machine SVM
Code:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.svm import SVC
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score

# Read the dataset from CSV

df = pd.read_csv('Crop_recommendation.csv')
X = df.iloc[:, :-1].values
y = df.iloc[:, -1].values
print(X)
print(y)
# Split the data into training and testing sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2,
random_state=42)

# Standardize the features

scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

# Train and evaluate Support Vector Machine

svm_model = SVC(kernel='linear', random_state=42)
svm_model.fit(X_train, y_train)
y_pred_svm = svm_model.predict(X_test)
svm_accuracy = accuracy_score(y_test, y_pred_svm)

# Train and evaluate Logistic Regression

logreg_model = LogisticRegression(random_state=42)
logreg_model.fit(X_train, y_train)
y_pred_logreg = logreg_model.predict(X_test)
logreg_accuracy = accuracy_score(y_test, y_pred_logreg)

# Print the accuracy scores

print(f'SVM Accuracy: {svm_accuracy:.4f}')
print(f'Logistic Regression Accuracy: {logreg_accuracy:.4f}')
Dataset:
Input:

Output:

23BCE7092 ML Lab Assignment
No ratings yet
23BCE7092 ML Lab Assignment
14 pages
23BCE7199 ML Lab Assignment
No ratings yet
23BCE7199 ML Lab Assignment
15 pages
ML Codes
No ratings yet
ML Codes
9 pages
AIML Project
No ratings yet
AIML Project
4 pages
Iii Aid - ML
No ratings yet
Iii Aid - ML
30 pages
Import Pandas As PD DF PD - Read - CSV ("Titanic - Train - CSV") DF - Head
No ratings yet
Import Pandas As PD DF PD - Read - CSV ("Titanic - Train - CSV") DF - Head
20 pages
1
No ratings yet
1
13 pages
ML Assignment
No ratings yet
ML Assignment
34 pages
Train
No ratings yet
Train
17 pages
Titanic Akshaya
No ratings yet
Titanic Akshaya
12 pages
Da 012307
No ratings yet
Da 012307
8 pages
Aiml Ex 4-7
No ratings yet
Aiml Ex 4-7
8 pages
AI&ML
No ratings yet
AI&ML
9 pages
Data Analytics
No ratings yet
Data Analytics
10 pages
ML PDF
No ratings yet
ML PDF
30 pages
ML Lab
No ratings yet
ML Lab
29 pages
Final-12-Lab Programs
No ratings yet
Final-12-Lab Programs
30 pages
Basic ML Algo
No ratings yet
Basic ML Algo
10 pages
Practicalpgm ML
No ratings yet
Practicalpgm ML
33 pages
Slip
No ratings yet
Slip
5 pages
ML Functions
No ratings yet
ML Functions
12 pages
Medical Data ML
No ratings yet
Medical Data ML
6 pages
ML Lab
No ratings yet
ML Lab
10 pages
Titanic Survival Prediction Report
No ratings yet
Titanic Survival Prediction Report
4 pages
ML Shristi File
No ratings yet
ML Shristi File
49 pages
ML5 Implementation
No ratings yet
ML5 Implementation
32 pages
This Study Resource Was
No ratings yet
This Study Resource Was
5 pages
Home Work
No ratings yet
Home Work
12 pages
Prathamesh KRAI
No ratings yet
Prathamesh KRAI
38 pages
CP4252 Lab Manual
No ratings yet
CP4252 Lab Manual
13 pages
Machine Learning Lab: Raheel Aslam (74-FET/BSEE/F16)
No ratings yet
Machine Learning Lab: Raheel Aslam (74-FET/BSEE/F16)
3 pages
Car Evaluation Data Analysis & Random Forest Model
No ratings yet
Car Evaluation Data Analysis & Random Forest Model
12 pages
221IT027 DA Lab3
No ratings yet
221IT027 DA Lab3
5 pages
Assignment 3
No ratings yet
Assignment 3
8 pages
Machine Learning Model Building
No ratings yet
Machine Learning Model Building
6 pages
3 Classification
No ratings yet
3 Classification
16 pages
ML Lab1
No ratings yet
ML Lab1
11 pages
ML Minimized Programs
No ratings yet
ML Minimized Programs
9 pages
CR Lab
No ratings yet
CR Lab
5 pages
Bacdeaf 23032025 115708 Split 1
No ratings yet
Bacdeaf 23032025 115708 Split 1
37 pages
ML Internal Questions
No ratings yet
ML Internal Questions
15 pages
Da Lab Mannual
No ratings yet
Da Lab Mannual
25 pages
22K61A0654 2 Sasi Auto
No ratings yet
22K61A0654 2 Sasi Auto
24 pages
AI ML - Cycle 2 Programs
No ratings yet
AI ML - Cycle 2 Programs
15 pages
Regression Analysis - Cheatsheet
No ratings yet
Regression Analysis - Cheatsheet
9 pages
Machine Learning Algorithms Guide
No ratings yet
Machine Learning Algorithms Guide
34 pages
Aiml Practical
No ratings yet
Aiml Practical
17 pages
Final ML Programs 075005
No ratings yet
Final ML Programs 075005
15 pages
ML Journal External
No ratings yet
ML Journal External
14 pages
ML Lab Manual
No ratings yet
ML Lab Manual
17 pages
ML 1-10
No ratings yet
ML 1-10
53 pages
Data Preprocessing Example Programs1
No ratings yet
Data Preprocessing Example Programs1
9 pages
AI
No ratings yet
AI
16 pages
ML Experiment WithDataset
No ratings yet
ML Experiment WithDataset
23 pages
ML - Other Pracs
No ratings yet
ML - Other Pracs
7 pages
Multi Classification - Py (For 1 Class TP, TN, FP, FN)
No ratings yet
Multi Classification - Py (For 1 Class TP, TN, FP, FN)
25 pages
AML Code For m2
No ratings yet
AML Code For m2
7 pages
Dav Lab Manual
No ratings yet
Dav Lab Manual
28 pages
Binary Search and Time Complexity
No ratings yet
Binary Search and Time Complexity
4 pages
Modern Physics Lab 10 Experiments
No ratings yet
Modern Physics Lab 10 Experiments
75 pages
Digital Logic Design Lab 1
No ratings yet
Digital Logic Design Lab 1
7 pages
Supply Chain Management System Documentation
No ratings yet
Supply Chain Management System Documentation
31 pages
Calculus For Engineers Lab Report
No ratings yet
Calculus For Engineers Lab Report
39 pages
Air Drawing App Using Computer Vision Documentation
No ratings yet
Air Drawing App Using Computer Vision Documentation
25 pages
Air Drawing App Using Computer Vision Presentation
No ratings yet
Air Drawing App Using Computer Vision Presentation
12 pages
C CPP Language Complete Practice Assignment
No ratings yet
C CPP Language Complete Practice Assignment
63 pages
Umbrella Rental Vending Machine Documentation
No ratings yet
Umbrella Rental Vending Machine Documentation
23 pages
E Ticketing System UML SRS Document
No ratings yet
E Ticketing System UML SRS Document
11 pages
Empower Illiterate UML SRS Document
No ratings yet
Empower Illiterate UML SRS Document
14 pages
Online Exam Registration System UML SRS Document
No ratings yet
Online Exam Registration System UML SRS Document
14 pages
Basic Block and Flow Graph
No ratings yet
Basic Block and Flow Graph
11 pages
Aiml Lab Manual
No ratings yet
Aiml Lab Manual
38 pages
Fire Station Space Requirements
No ratings yet
Fire Station Space Requirements
2 pages
Microprocessor Lab Guide
No ratings yet
Microprocessor Lab Guide
5 pages
SERVICE TV PHILIPS
100% (2)
SERVICE TV PHILIPS
145 pages
FRANC3D V7.4 Reference
No ratings yet
FRANC3D V7.4 Reference
235 pages
ANSYS Tutorial Mode Superposition
No ratings yet
ANSYS Tutorial Mode Superposition
16 pages
Transportation Problem LCM
No ratings yet
Transportation Problem LCM
15 pages
PHD Thesis Diagram
100% (1)
PHD Thesis Diagram
7 pages
Photoshop
No ratings yet
Photoshop
9 pages
Ad 9142
No ratings yet
Ad 9142
64 pages
Копия 50 Free HTML & CSS Coding Templates - HubSpot
100% (1)
Копия 50 Free HTML & CSS Coding Templates - HubSpot
132 pages
Tehkan World Cup
No ratings yet
Tehkan World Cup
26 pages
Anatomy of Window Win 7
No ratings yet
Anatomy of Window Win 7
5 pages
5 Simple Ways To Increase Page Views
No ratings yet
5 Simple Ways To Increase Page Views
5 pages
Bluetooth Stack Initialization Log
No ratings yet
Bluetooth Stack Initialization Log
49 pages
Unit - I
No ratings yet
Unit - I
28 pages
Ste S 24 Ste 22518 Summer 2024 Model Answer Paper Ste 22518 Model Answer Paper Summer Removed Organized
No ratings yet
Ste S 24 Ste 22518 Summer 2024 Model Answer Paper Ste 22518 Model Answer Paper Summer Removed Organized
24 pages
TC3160en-Ed05 Release Note and Installation Procedure OmniPCX Enterprise R101.1 Version N4.205.38
No ratings yet
TC3160en-Ed05 Release Note and Installation Procedure OmniPCX Enterprise R101.1 Version N4.205.38
95 pages
Al Saif Company Profile Final 2021.1 v1
No ratings yet
Al Saif Company Profile Final 2021.1 v1
131 pages
3G - DUW - Configuration - With - RBS6201 - 6102 - Using RRUs-1
No ratings yet
3G - DUW - Configuration - With - RBS6201 - 6102 - Using RRUs-1
16 pages
Embedded C Programming Guide
0% (1)
Embedded C Programming Guide
2 pages
Zurabi-Papiashvili 2024
No ratings yet
Zurabi-Papiashvili 2024
3 pages
PTZ Camera Installation Guide
No ratings yet
PTZ Camera Installation Guide
44 pages
Sample Proposal of Implementing Odoo
100% (1)
Sample Proposal of Implementing Odoo
45 pages
How To Downgrade and Install Older Versions of Firefox On The Computer
No ratings yet
How To Downgrade and Install Older Versions of Firefox On The Computer
11 pages
Chapter 2-Let's Move, Maqueen!
No ratings yet
Chapter 2-Let's Move, Maqueen!
6 pages
Practice Worksheet - Class 5 (CH 2, CH 3)
No ratings yet
Practice Worksheet - Class 5 (CH 2, CH 3)
2 pages
AEDT Icepak Intro 2019R1 L5 Solving and PostProcessing
No ratings yet
AEDT Icepak Intro 2019R1 L5 Solving and PostProcessing
18 pages
John Doe Resume
No ratings yet
John Doe Resume
2 pages