0% found this document useful (0 votes)

13 views12 pages

ML - Lab Manual With Woad File

The document contains implementations of various machine learning algorithms including Candidate-Elimination, ID3 Decision Tree, Backpropagation, Naive Bayesian Classifier, Document Classification with Naive Bayes, Bayesian Network for COVID-19 Diagnosis, EM and K-Means Clustering, k-Nearest Neighbors, and Locally Weighted Regression. Each algorithm is demonstrated with Python code and utilizes different datasets for training and testing. The document serves as a comprehensive guide for understanding and applying these algorithms in practical scenarios.

Uploaded by

babypriya6543

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

13 views12 pages

ML - Lab Manual With Woad File

Uploaded by

babypriya6543

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 12

Ex.

No: 1 - Candidate-Elimination Algorithm\

import numpy as np

import pandas as pd

data = pd.read_csv('Ex1_data.csv')

concepts = np.array(data.iloc[:, :-1])

target = np.array(data.iloc[:, -1])

def candidate_elimination(concepts, target):

n_features = concepts.shape[1]

specific_h = concepts[0].copy()

general_h = [['?' for _ in range(n_features)]]

for i, instance in enumerate(concepts):

if target[i] == "yes":

for x in range(n_features):

if instance[x] != specific_h[x]:

specific_h[x] = '?'

general_h = [g for g in general_h if all(

(feature == '?' or feature == specific_h[x])

for x, feature in enumerate(g)

)]

else:

general_h_new = []

for g in general_h:

for x in range(n_features):

if g[x] == "?":

for val in np.unique(concepts[:, x]):

if instance[x] != val:
g_new = g.copy()

g_new[x] = val

if g_new not in general_h_new:

general_h_new.append(g_new)

elif g[x] != instance[x]:

if g not in general_h_new:

general_h_new.append(g.copy())

general_h = general_h_new.copy()

general_h = [g for g in general_h if g != ['?' for _ in range(n_features)]]

return specific_h, general_h

s_final, g_final = candidate_elimination(concepts, target)

print("Final Specific Hypothesis:", s_final)

print("Final General Hypotheses:", g_final)

Ex.No: 2 - ID3 Decision Tree Algorithm

import math

import csv

class Node:

def init(self, attribute):

self.attribute = attribute

self.children = []

self.answer = ""

def load_csv(filename):
with open(filename, "r") as file:

lines = csv.reader(file)

dataset = list(lines)

headers = dataset.pop(0)

return dataset, headers

def subtables(data, col, delete):

dic = {}

coldata = [row[col] for row in data]

attr = list(set(coldata))

counts = [0] * len(attr)

for x in range(len(attr)):

for y in range(len(data)):

if data[y][col] == attr[x]:

counts[x] += 1

for x in range(len(attr)):

dic[attr[x]] = []

pos = 0

for y in range(len(data)):

if data[y][col] == attr[x]:

new_row = data[y][:col] + data[y][col+1:] if delete else data[y]

dic[attr[x]].append(new_row)

return attr, dic

def entropy(S):

if not S:

return 0
counts = {}

for item in S:

counts[item[-1]] = counts.get(item[-1], 0) + 1

entropy = 0

for key in counts:

prob = counts[key] / len(S)

entropy -= prob * math.log(prob, 2)

return entropy

def compute_gain(data, col):

attr, dic = subtables(data, col, delete=False)

total_entropy = entropy(data)

weighted_entropy = 0

total_size = len(data)

for x in range(len(attr)):

subset = dic[attr[x]]

weighted_entropy += (len(subset) / total_size) * entropy(subset)

return total_entropy - weighted_entropy

def build_tree(data, features):

last_col = [row[-1] for row in data]

if len(set(last_col)) == 1:

node = Node("")

node.answer = last_col[0]

return node

n = len(data[0]) - 1
gains = [compute_gain(data, col) for col in range(n)]

split = gains.index(max(gains))

node = Node(features[split])

fea = features[:split] + features[split+1:]

attr, dic = subtables(data, split, delete=True)

for x in range(len(attr)):

child = build_tree(dic[attr[x]], fea)

node.children.append((attr[x], child))

return node

def print_tree(node, level):

if node.answer != "":

print(" " * level, node.answer)

return

print(" " * level, node.attribute)

for value, child in node.children:

print(" " * (level + 1), value)

print_tree(child, level + 2)

dataset, features = load_csv("Ex2_data.csv")

node = build_tree(dataset, features)

print("Decision Tree:")

print_tree(node, 0)

Ex.No: 3 - Backpropagation Algorithm

import numpy as np

def sigmoid(x):
return 1 / (1 + np.exp(-x))

def sigmoid_derivative(x):

return x * (1 - x)

epoch = 7000

lr = 0.1

input_neurons = 2

hidden_neurons = 3

output_neurons = 1

wh = np.random.uniform(size=(input_neurons, hidden_neurons))

bh = np.random.uniform(size=(1, hidden_neurons))

wout = np.random.uniform(size=(hidden_neurons, output_neurons))

bout = np.random.uniform(size=(1, output_neurons))

X = np.array([[2, 9], [1, 5], [3, 6]], dtype=float)

y = np.array([[92], [86], [89]], dtype=float)

X = X / np.max(X, axis=0)

y = y / 100

for _ in range(epoch):

# Forward pass

hidden_input = np.dot(X, wh) + bh

hidden_output = sigmoid(hidden_input)

output = sigmoid(np.dot(hidden_output, wout) + bout)

# Backpropagation

error = y - output
d_output = error * sigmoid_derivative(output)

error_hidden = d_output.dot(wout.T)

d_hidden = error_hidden * sigmoid_derivative(hidden_output)

# Update weights

wout += hidden_output.T.dot(d_output) * lr

wh += X.T.dot(d_hidden) * lr

print("Predicted Output:\n", output)

Ex.No: 4 - Naive Bayesian Classifier

import csv

import random

import math

from sklearn.metrics import confusion_matrix, classification_report

def load_csv(filename):

with open(filename, "r") as file:

lines = csv.reader(file)

dataset = [list(map(float, row)) for row in lines]

return dataset

def split_dataset(dataset, split_ratio):

train_size = int(len(dataset) * split_ratio)

random.shuffle(dataset)

return dataset[:train_size], dataset[train_size:]

def separate_by_class(dataset):

separated = {}

for row in dataset:

class_val = row[-1]

if class_val not in separated:

separated[class_val] = []

separated[class_val].append(row[:-1])

return separated

def summarize(dataset):

summaries = [(np.mean(attr), np.std(attr)) for attr in zip(*dataset)]

return summaries

def calculate_probability(x, mean, stdev):

if stdev == 0:

return 1.0 if x == mean else 0.0

exponent = math.exp(-(math.pow(x - mean, 2) / (2 * math.pow(stdev, 2))))

return (1 / (math.sqrt(2 * math.pi) * stdev)) * exponent

def predict(summaries, input_vector):

probabilities = {}

for class_val, class_summaries in summaries.items():

probabilities[class_val] = 1

for i in range(len(class_summaries)):

mean, stdev = class_summaries[i]

x = input_vector[i]

probabilities[class_val] *= calculate_probability(x, mean, stdev)

return max(probabilities, key=probabilities.get)

dataset = load_csv('Ex4_data.csv')

train, test = split_dataset(dataset, 0.67)

summaries = separate_by_class(train)
summaries = {k: summarize(v) for k, v in summaries.items()}

predictions = [predict(summaries, row) for row in test]

accuracy = sum(1 for i in range(len(test)) if test[i][-1] == predictions[i]) / len(test)

print(f"Accuracy: {accuracy * 100}%")

Ex.No: 5 - Document Classification with Naive Bayes

import pandas as pd

from sklearn.model_selection import train_test_split

from sklearn.feature_extraction.text import CountVectorizer

from sklearn.naive_bayes import MultinomialNB

from sklearn import metrics

msg = pd.read_csv('Ex5_data.csv', names=['message', 'label'])

msg['labelnum'] = msg.label.map({'pos': 1, 'neg': 0})

X = msg.message

y = msg.labelnum

xtrain, xtest, ytrain, ytest = train_test_split(X, y, test_size=0.2, random_state=42)

count_vect = CountVectorizer()

xtrain_dtm = count_vect.fit_transform(xtrain)

xtest_dtm = count_vect.transform(xtest)

clf = MultinomialNB().fit(xtrain_dtm, ytrain)

predicted = clf.predict(xtest_dtm)

print("Confusion Matrix:\n", metrics.confusion_matrix(ytest, predicted))

print("Precision:", metrics.precision_score(ytest, predicted))

print("Recall:", metrics.recall_score(ytest, predicted))

Ex.No: 6 - Bayesian Network for CORONA Diagnosis

import pandas as pd

from pgmpy.models import BayesianModel

from pgmpy.estimators import MaximumLikelihoodEstimator

from pgmpy.inference import VariableElimination

data = pd.read_csv('Ex6_data.csv').replace('?', np.nan)

model = BayesianModel([

('Fever', 'InfectionStatus'),

('Cough', 'InfectionStatus'),

('TravelHistory', 'InfectionStatus'),

('ContactWithConfirmed', 'InfectionStatus')

])

model.fit(data, estimator=MaximumLikelihoodEstimator)

infer = VariableElimination(model)

result = infer.query(variables=['InfectionStatus'], evidence={'Fever': 'Yes', 'Cough': 'Yes'})

print(result)

Ex.No: 7 - EM and K-Means Clustering

import pandas as pd

from sklearn.cluster import KMeans, GaussianMixture

from sklearn.preprocessing import StandardScaler

import matplotlib.pyplot as plt

data = pd.read_csv('Ex7_data.csv')

X = data.drop('Target', axis=1)

scaler = StandardScaler().fit(X)

X_scaled = scaler.transform(X)
kmeans = KMeans(n_clusters=3, n_init=10).fit(X)

gmm = GaussianMixture(n_components=3).fit(X_scaled)

plt.figure(figsize=(12, 5))

plt.subplot(121)

plt.scatter(X.iloc[:, 2], X.iloc[:, 3], c=kmeans.labels_)

plt.title('K-Means')

plt.subplot(122)

plt.scatter(X.iloc[:, 2], X.iloc[:, 3], c=gmm.predict(X_scaled))

plt.title('GMM')

plt.show()

Ex.No: 8 - k-Nearest Neighbors

from sklearn.datasets import load_iris

from sklearn.model_selection import train_test_split

from sklearn.neighbors import KNeighborsClassifier

from sklearn.metrics import classification_report, confusion_matrix

iris = load_iris()

X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.3)

knn = KNeighborsClassifier(n_neighbors=5).fit(X_train, y_train)

y_pred = knn.predict(X_test)

print("Confusion Matrix:\n", confusion_matrix(y_test, y_pred))

print("\nClassification Report:\n", classification_report(y_test, y_pred))

Ex.No: 9 - Locally Weighted Regression

import numpy as np

import matplotlib.pyplot as plt

def local_regression(x0, X, Y, tau):

X = np.c_[np.ones(len(X)), X]

x0 = np.r_[1, x0]

weights = np.exp(-np.sum((X - x0) ** 2, axis=1) / (2 * tau ** 2))

W = np.diag(weights)

beta = np.linalg.pinv(X.T @ W @ X) @ (X.T @ W @ Y)

return x0 @ beta

X = np.linspace(-3, 3, 100)

Y = np.sin(X) + np.random.normal(0, 0.1, 100)

predictions = [local_regression(x, X, Y, 0.1) for x in X]

plt.scatter(X, Y)

plt.plot(X, predictions, color='red')

plt.show()

ML File
No ratings yet
ML File
13 pages
AIML
No ratings yet
AIML
12 pages
Aiml Lab
No ratings yet
Aiml Lab
14 pages
Machine Learning Algorithms in Python
No ratings yet
Machine Learning Algorithms in Python
18 pages
ML Lab P-1
No ratings yet
ML Lab P-1
10 pages
ML Lab Record
No ratings yet
ML Lab Record
33 pages
Wa0027.
No ratings yet
Wa0027.
34 pages
Name: Suprit Darshan Shrestha Reg - no:19BCE2584: Lab DA1 Machine Learning Lab
No ratings yet
Name: Suprit Darshan Shrestha Reg - no:19BCE2584: Lab DA1 Machine Learning Lab
9 pages
AI&ML
No ratings yet
AI&ML
9 pages
ML Lab File Batch 1
No ratings yet
ML Lab File Batch 1
20 pages
Advance Machine Learning
No ratings yet
Advance Machine Learning
28 pages
Machine Learning Lab: Algorithms & Implementation
No ratings yet
Machine Learning Lab: Algorithms & Implementation
11 pages
Program 1
No ratings yet
Program 1
25 pages
AIML Prograns
No ratings yet
AIML Prograns
6 pages
Machine Learning Through Python Lab Mannual
No ratings yet
Machine Learning Through Python Lab Mannual
33 pages
Machine Learning Algorithm Demos
No ratings yet
Machine Learning Algorithm Demos
31 pages
Machine Learning Lab Record: Dr. Sarika Hegde
No ratings yet
Machine Learning Lab Record: Dr. Sarika Hegde
23 pages
Machine Learning - Lab Manual
No ratings yet
Machine Learning - Lab Manual
35 pages
ML Lab Prog1-5 (5) College PDF
No ratings yet
ML Lab Prog1-5 (5) College PDF
12 pages
Machine Learning Algorithms Lab
No ratings yet
Machine Learning Algorithms Lab
48 pages
Lab Manual ML
No ratings yet
Lab Manual ML
28 pages
CCC
No ratings yet
CCC
25 pages
ML Record
No ratings yet
ML Record
24 pages
ML Lab Manual
No ratings yet
ML Lab Manual
25 pages
Ai Int-1
No ratings yet
Ai Int-1
6 pages
Machine Learning Algorithms Guide
No ratings yet
Machine Learning Algorithms Guide
9 pages
Code MLT
No ratings yet
Code MLT
9 pages
Codes & Outputs
No ratings yet
Codes & Outputs
9 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
26 pages
Machine Learning Lab: Algorithms & Implementation
No ratings yet
Machine Learning Lab: Algorithms & Implementation
33 pages
Lab Manual
No ratings yet
Lab Manual
25 pages
Machine Learning Laboratory Record Book: 1 Find S Algorithm
No ratings yet
Machine Learning Laboratory Record Book: 1 Find S Algorithm
22 pages
Screenshot 2023-12-07 at 11.07.49 AM
No ratings yet
Screenshot 2023-12-07 at 11.07.49 AM
14 pages
ML Lab Programs
No ratings yet
ML Lab Programs
8 pages
ML Lab Manual
No ratings yet
ML Lab Manual
90 pages
MLPrograma1-5 Py
No ratings yet
MLPrograma1-5 Py
17 pages
Ashwin Report
No ratings yet
Ashwin Report
18 pages
PRG 4
No ratings yet
PRG 4
2 pages
PRGM 4
No ratings yet
PRGM 4
3 pages
Ex 2
No ratings yet
Ex 2
6 pages
Machine Learning Laboratory (21AIL66)
No ratings yet
Machine Learning Laboratory (21AIL66)
7 pages
ML Lab Record
No ratings yet
ML Lab Record
49 pages
AIML Final Programs
No ratings yet
AIML Final Programs
8 pages
Null 0
No ratings yet
Null 0
6 pages
ML Lab Programs
No ratings yet
ML Lab Programs
18 pages
ID3 Program4
No ratings yet
ID3 Program4
3 pages
Atul MLT Exp 4-11
No ratings yet
Atul MLT Exp 4-11
17 pages
Naivebayes Labprg2
No ratings yet
Naivebayes Labprg2
3 pages
Practical - 1
No ratings yet
Practical - 1
25 pages
Naive
No ratings yet
Naive
5 pages
Rabia Malik (s0001)
No ratings yet
Rabia Malik (s0001)
5 pages
Lab 3 ML
No ratings yet
Lab 3 ML
3 pages
Python ML Algorithms Guide
No ratings yet
Python ML Algorithms Guide
7 pages
ML Lab Manual
No ratings yet
ML Lab Manual
12 pages
1 - All Python Codes + Neo4j Samples
No ratings yet
1 - All Python Codes + Neo4j Samples
16 pages
ML Lab Programs
No ratings yet
ML Lab Programs
21 pages
Ai Last 5
No ratings yet
Ai Last 5
4 pages
Pra 5 ML
No ratings yet
Pra 5 ML
5 pages
Digital Forensics Basics A Practical Guide Using Windows OS 1st Edition Nihad A Hassan PDF Version
No ratings yet
Digital Forensics Basics A Practical Guide Using Windows OS 1st Edition Nihad A Hassan PDF Version
99 pages
Glossary: Data Analytics
No ratings yet
Glossary: Data Analytics
15 pages
SAP HANA Interview Prep Guide
No ratings yet
SAP HANA Interview Prep Guide
52 pages
Mungkin Maksud Anda Adalah
No ratings yet
Mungkin Maksud Anda Adalah
4 pages
AI & NLP Enthusiast's Portfolio
No ratings yet
AI & NLP Enthusiast's Portfolio
1 page
DBMS Ctevt Students
100% (1)
DBMS Ctevt Students
230 pages
Upgrading - Alluxio v2.7.3 (Stable) Documentation
No ratings yet
Upgrading - Alluxio v2.7.3 (Stable) Documentation
4 pages
A Checklist For Museum Collections Management Policy - 2015
No ratings yet
A Checklist For Museum Collections Management Policy - 2015
28 pages
Chapter 4 Logical Database Design Logical DB Design For Relational
No ratings yet
Chapter 4 Logical Database Design Logical DB Design For Relational
48 pages
A RAG-based Medical Assistant Especially For Infectious Diseases
No ratings yet
A RAG-based Medical Assistant Especially For Infectious Diseases
6 pages
Storage Fundamentals
No ratings yet
Storage Fundamentals
34 pages
07 Data Pump
No ratings yet
07 Data Pump
10 pages
In Partial Fulfillment of The Requirements in The Subject English For Academic Purposes Program
No ratings yet
In Partial Fulfillment of The Requirements in The Subject English For Academic Purposes Program
7 pages
PBI Desktop Fundamentals Training Session 1
No ratings yet
PBI Desktop Fundamentals Training Session 1
70 pages
Niyati Deepak Patil Resume
No ratings yet
Niyati Deepak Patil Resume
1 page
Learning-Notes - Books - Designing-Data-Intensive-Applications - MD at Master Keyvanakbary - Learning-Notes
No ratings yet
Learning-Notes - Books - Designing-Data-Intensive-Applications - MD at Master Keyvanakbary - Learning-Notes
91 pages
What Are Ways To Avoid Plagiarism in Research - 1 - 26
100% (1)
What Are Ways To Avoid Plagiarism in Research - 1 - 26
4 pages
Creating A Dashboard For RAN
No ratings yet
Creating A Dashboard For RAN
4 pages
Naveen Final Thesis
No ratings yet
Naveen Final Thesis
45 pages
Data Management Essentials Guide
No ratings yet
Data Management Essentials Guide
8 pages
Interview Data Engineer
100% (1)
Interview Data Engineer
13 pages
Kalyan Panel Chart 2014 To 2020
No ratings yet
Kalyan Panel Chart 2014 To 2020
20 pages
Developing of M&E Database
No ratings yet
Developing of M&E Database
1 page
Introduction To Data Science
No ratings yet
Introduction To Data Science
16 pages
Automatic Seeding in SQL Server AG
No ratings yet
Automatic Seeding in SQL Server AG
9 pages
Course Ware Management System
78% (9)
Course Ware Management System
12 pages
UTF-8Jus AI Brochure
No ratings yet
UTF-8Jus AI Brochure
4 pages
Unit 3 CRM
No ratings yet
Unit 3 CRM
2 pages
Business Intelligence (BI) Is A Process and Technology-Driven Practice - 1
No ratings yet
Business Intelligence (BI) Is A Process and Technology-Driven Practice - 1
44 pages
Getting Started With Power Query: Presented By: John Larimer
No ratings yet
Getting Started With Power Query: Presented By: John Larimer
45 pages

ML - Lab Manual With Woad File

Uploaded by

ML - Lab Manual With Woad File

Uploaded by

Ex.

No: 1 - Candidate-Elimination Algorithm\

concepts = np.array(data.iloc[:, :-1])

target = np.array(data.iloc[:, -1])

def candidate_elimination(concepts, target):

general_h = [['?' for _ in range(n_features)]]

for i, instance in enumerate(concepts):

general_h = [g for g in general_h if all(

(feature == '?' or feature == specific_h[x])

for x, feature in enumerate(g)

for val in np.unique(concepts[:, x]):

if g_new not in general_h_new:

elif g[x] != instance[x]:

general_h = [g for g in general_h if g != ['?' for _ in range(n_features)]]

return specific_h, general_h

s_final, g_final = candidate_elimination(concepts, target)

print("Final Specific Hypothesis:", s_final)

print("Final General Hypotheses:", g_final)

Ex.No: 2 - ID3 Decision Tree Algorithm

def __init__(self, attribute):

return dataset, headers

def subtables(data, col, delete):

coldata = [row[col] for row in data]

counts = [0] * len(attr)

new_row = data[y][:col] + data[y][col+1:] if delete else data[y]

return attr, dic

for key in counts:

prob = counts[key] / len(S)

entropy -= prob * math.log(prob, 2)

def compute_gain(data, col):

attr, dic = subtables(data, col, delete=False)

weighted_entropy += (len(subset) / total_size) * entropy(subset)

return total_entropy - weighted_entropy

def build_tree(data, features):

last_col = [row[-1] for row in data]

fea = features[:split] + features[split+1:]

attr, dic = subtables(data, split, delete=True)

child = build_tree(dic[attr[x]], fea)

def print_tree(node, level):

print(" " * level, node.answer)

print(" " * level, node.attribute)

for value, child in node.children:

print(" " * (level + 1), value)

dataset, features = load_csv("Ex2_data.csv")

node = build_tree(dataset, features)

Ex.No: 3 - Backpropagation Algorithm

wout = np.random.uniform(size=(hidden_neurons, output_neurons))

bout = np.random.uniform(size=(1, output_neurons))

X = np.array([[2, 9], [1, 5], [3, 6]], dtype=float)

y = np.array([[92], [86], [89]], dtype=float)

hidden_input = np.dot(X, wh) + bh

output = sigmoid(np.dot(hidden_output, wout) + bout)

d_hidden = error_hidden * sigmoid_derivative(hidden_output)

print("Predicted Output:\n", output)

Ex.No: 4 - Naive Bayesian Classifier

from sklearn.metrics import confusion_matrix, classification_report

with open(filename, "r") as file:

dataset = [list(map(float, row)) for row in lines]

def split_dataset(dataset, split_ratio):

train_size = int(len(dataset) * split_ratio)

return dataset[:train_size], dataset[train_size:]

for row in dataset:

if class_val not in separated:

summaries = [(np.mean(attr), np.std(attr)) for attr in zip(*dataset)]

def calculate_probability(x, mean, stdev):

return 1.0 if x == mean else 0.0

exponent = math.exp(-(math.pow(x - mean, 2) / (2 * math.pow(stdev, 2))))

return (1 / (math.sqrt(2 * math.pi) * stdev)) * exponent

def predict(summaries, input_vector):

for class_val, class_summaries in summaries.items():

mean, stdev = class_summaries[i]

probabilities[class_val] *= calculate_probability(x, mean, stdev)

return max(probabilities, key=probabilities.get)

train, test = split_dataset(dataset, 0.67)

predictions = [predict(summaries, row) for row in test]

accuracy = sum(1 for i in range(len(test)) if test[i][-1] == predictions[i]) / len(test)

def init(self, attribute):