0% found this document useful (0 votes)

9 views7 pages

Import As Import As Import As From Import Import As Import

Uploaded by

Shantanu Dhage

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

9 views7 pages

Import As Import As Import As From Import Import As Import

Uploaded by

Shantanu Dhage

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 7

import pandas as pd # Pandas (version : 1.1.

5)
import numpy as np # Numpy (version : 1.19.2)
import matplotlib.pyplot as plt # Matplotlib (version : 3.3.2)
from sklearn.cluster import KMeans # Scikit Learn (version : 0.23.2)
import seaborn as sns # Seaborn (version : 0.11.1)
import warnings
warnings.filterwarnings('ignore')

data = pd.read_csv('Iris_p4.csv')

data.head()

len(data)

150

data.shape

(150, 6)

data.columns

Index(['Id', 'SepalLengthCm', 'SepalWidthCm', 'PetalLengthCm',

'PetalWidthCm',
'Species'],
dtype='object')

for i,col in enumerate(data.columns):

print(f'Column number {1+i} is {col}')

Column number 1 is Id
Column number 2 is SepalLengthCm
Column number 3 is SepalWidthCm
Column number 4 is PetalLengthCm
Column number 5 is PetalWidthCm
Column number 6 is Species

data.dtypes

Id int64
SepalLengthCm float64
SepalWidthCm float64
PetalLengthCm float64
PetalWidthCm float64
Species object
dtype: object

data.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 150 entries, 0 to 149
Data columns (total 6 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 Id 150 non-null int64
1 SepalLengthCm 150 non-null float64
2 SepalWidthCm 150 non-null float64
3 PetalLengthCm 150 non-null float64
4 PetalWidthCm 150 non-null float64
5 Species 150 non-null object
dtypes: float64(4), int64(1), object(1)
memory usage: 7.2+ KB

data.describe()

data.isnull()

data.isnull().sum()

Id 0
SepalLengthCm 0
SepalWidthCm 0
PetalLengthCm 0
PetalWidthCm 0
Species 0
dtype: int64

data.drop('Id', axis=1, inplace=True)

data.head()

data['Species'].value_counts()

Species
Iris-setosa 50
Iris-versicolor 50
Iris-virginica 50
Name: count, dtype: int64

target_data = data.iloc[:,4]
target_data.head()

0 Iris-setosa
1 Iris-setosa
2 Iris-setosa
3 Iris-setosa
4 Iris-setosa
Name: Species, dtype: object

clustering_data = data.iloc[:,[0,1,2,3]]
clustering_data.head()
fig, ax = plt.subplots(figsize=(15,7))
sns.set(font_scale=1.5)
ax = sns.scatterplot(x=data['SepalLengthCm'],y=data['SepalWidthCm'],
s=70, color='#f73434',edgecolor='#f73434', linewidth=0.3)
ax.set_ylabel('Sepal Width (in cm)')
ax.set_xlabel('Sepal Length (in cm)')
plt.title('Sepal Length vs Width', fontsize = 20)
plt.show()

from sklearn.cluster import KMeans

wcss=[]
for i in range(1,11):
km = KMeans(i)
km.fit(clustering_data)
wcss.append(km.inertia_)

np.array(wcss)

array([680.8244 , 152.36870648, 78.94084143, 57.31787321,

46.53558205, 38.95701116, 34.29998554, 29.95408642,
27.87928788, 26.63665757])

fig, ax = plt.subplots(figsize=(15,7))
ax = plt.plot(range(1,11),wcss, linewidth=2, color="red", marker ="8")
plt.axvline(x=3, ls='--')
plt.ylabel('WCSS')
plt.xlabel('No. of Clusters(k)')
plt.title('The Elbow Method', fontsize = 20)
plt.show()
from sklearn.cluster import KMeans
kms = KMeans(n_clusters=3, init='k-means++')
kms.fit(clustering_data)
KMeans(n_clusters=3)

KMeans(n_clusters=3)

clusters = clustering_data.copy()
clusters['Cluster_Prediction'] = kms.fit_predict(clustering_data)
clusters.head()

kms.cluster_centers_

array([[5.006 , 3.418 , 1.464 , 0.244 ],

[5.9016129 , 2.7483871 , 4.39354839, 1.43387097],
[6.85 , 3.07368421, 5.74210526, 2.07105263]])

fig, ax = plt.subplots(figsize=(15,7))
plt.scatter(x=clusters[clusters['Cluster_Prediction'] == 0]
['SepalLengthCm'],
y=clusters[clusters['Cluster_Prediction'] == 0]['SepalWidthCm'],
s=70,edgecolor='teal', linewidth=0.3, c='teal', label='Iris-
versicolor')

<matplotlib.collections.PathCollection at 0x1a5ad501e10>
plt.scatter(x=clusters[clusters['Cluster_Prediction'] == 1]
['SepalLengthCm'],
y=clusters[clusters['Cluster_Prediction'] == 1]['SepalWidthCm'],
s=70,edgecolor='lime', linewidth=0.3, c='lime', label='Iris-setosa')

<matplotlib.collections.PathCollection at 0x1a5ad454ad0>
plt.scatter(x=clusters[clusters['Cluster_Prediction'] == 2]
['SepalLengthCm'],
y=clusters[clusters['Cluster_Prediction'] == 2]['SepalWidthCm'],
s=70,edgecolor='magenta', linewidth=0.3, c='magenta', label='Iris-
virginica')

<matplotlib.collections.PathCollection at 0x1a5ad926390>

plt.scatter(x=kms.cluster_centers_[:, 0], y=kms.cluster_centers_[:,

1], s = 170, c = 'yellow', label =
'Centroids',edgecolor='black', linewidth=0.3)
plt.legend(loc='upper right')
plt.xlim(4,8)
plt.ylim(1.8,4.5)
ax.set_ylabel('Sepal Width (in cm)')
ax.set_xlabel('Sepal Length (in cm)')
plt.title('Clusters', fontsize = 20)
plt.show()

General Report
No ratings yet
General Report
85 pages
3 MSOFTX3000 Operation Manual Data Configuration
100% (7)
3 MSOFTX3000 Operation Manual Data Configuration
424 pages
Model Predictive Control in Thermal Management of Multiprocessor Systems-On-chip
No ratings yet
Model Predictive Control in Thermal Management of Multiprocessor Systems-On-chip
335 pages
Students Data - D Y Patil Campus
No ratings yet
Students Data - D Y Patil Campus
36 pages
Dsbda Ouput 1-10
No ratings yet
Dsbda Ouput 1-10
89 pages
Conocimientos Sobre El Habla
No ratings yet
Conocimientos Sobre El Habla
188 pages
HHHHH2
No ratings yet
HHHHH2
39 pages
Ploomber Notebook Conversion - 2
No ratings yet
Ploomber Notebook Conversion - 2
14 pages
Nandini Matplotlib Ws
No ratings yet
Nandini Matplotlib Ws
10 pages
Computer Simulation Techniques: The Definitive Introduction!
No ratings yet
Computer Simulation Techniques: The Definitive Introduction!
175 pages
Mcasemassigjan 06
No ratings yet
Mcasemassigjan 06
7 pages
Toc L13
No ratings yet
Toc L13
19 pages
FitSM Foundation Training V3.0 PDF
No ratings yet
FitSM Foundation Training V3.0 PDF
108 pages
EBI R500.1 EBIOverview PDF
100% (1)
EBI R500.1 EBIOverview PDF
72 pages
DSP Practical File For Kurukshetra University
No ratings yet
DSP Practical File For Kurukshetra University
27 pages
Practical 5
No ratings yet
Practical 5
11 pages
Exercise For K Means Tutorial
No ratings yet
Exercise For K Means Tutorial
5 pages
PR 6
No ratings yet
PR 6
6 pages
Soal CCNA
No ratings yet
Soal CCNA
11 pages
K Means Clustering
No ratings yet
K Means Clustering
4 pages
ML Lab Programs
No ratings yet
ML Lab Programs
23 pages
E23CSEU2241 LAB9 Data Mining
No ratings yet
E23CSEU2241 LAB9 Data Mining
5 pages
Inbuilt Kmeans
No ratings yet
Inbuilt Kmeans
3 pages
Dsbda Assig 6 Data Analytcs 3
No ratings yet
Dsbda Assig 6 Data Analytcs 3
6 pages
Exe 6
No ratings yet
Exe 6
11 pages
Course Outline Distributed Systems Course Outline Dstributed Systems
No ratings yet
Course Outline Distributed Systems Course Outline Dstributed Systems
2 pages
Yogesh Siddiq Edited
No ratings yet
Yogesh Siddiq Edited
6 pages
Linear SVM: 'Target'
No ratings yet
Linear SVM: 'Target'
13 pages
Unsupervised ML
No ratings yet
Unsupervised ML
17 pages
Information System Book
No ratings yet
Information System Book
48 pages
Tarea - 1.ipynb - Colab Jose
No ratings yet
Tarea - 1.ipynb - Colab Jose
12 pages
Kmean PGM
No ratings yet
Kmean PGM
3 pages
Kmeans Clustering Code
No ratings yet
Kmeans Clustering Code
2 pages
KNN ALGORITHM - Ipynb - Colab
No ratings yet
KNN ALGORITHM - Ipynb - Colab
4 pages
KNN - Jupyter Notebook
No ratings yet
KNN - Jupyter Notebook
8 pages
Exp 8 Rushya
No ratings yet
Exp 8 Rushya
8 pages
9 Ds
No ratings yet
9 Ds
5 pages
Data Visualization With Maplotlib
No ratings yet
Data Visualization With Maplotlib
8 pages
Unit 4-1
No ratings yet
Unit 4-1
13 pages
Ass - 10.ipynb - Colab
No ratings yet
Ass - 10.ipynb - Colab
8 pages
Practical 10 Code
No ratings yet
Practical 10 Code
5 pages
TranMinhTu1 bt2 2
No ratings yet
TranMinhTu1 bt2 2
5 pages
ML#07
No ratings yet
ML#07
21 pages
085
No ratings yet
085
4 pages
Implementing Logistic Regression For Iris Using Sklearn and Checking The Accuracy Using Confusion Matrix
No ratings yet
Implementing Logistic Regression For Iris Using Sklearn and Checking The Accuracy Using Confusion Matrix
7 pages
SVM and Kmeans - Iris Dataset - Ipynb - Colab
No ratings yet
SVM and Kmeans - Iris Dataset - Ipynb - Colab
5 pages
R Programming Guide
100% (1)
R Programming Guide
21 pages
Cota12 6
No ratings yet
Cota12 6
4 pages
Orange: From Experimental Machine Learning To Interactive Data Mining
No ratings yet
Orange: From Experimental Machine Learning To Interactive Data Mining
16 pages
Dsbda 10
No ratings yet
Dsbda 10
3 pages
Trần Mạnh Hùng 20192643.Ipynb - Colab
No ratings yet
Trần Mạnh Hùng 20192643.Ipynb - Colab
6 pages
Exp 07 (ML)
No ratings yet
Exp 07 (ML)
4 pages
EXP 07 (ML) - Sarthak
No ratings yet
EXP 07 (ML) - Sarthak
4 pages
Assignment No - 10
No ratings yet
Assignment No - 10
3 pages
Iris Unsupervised Cluster
No ratings yet
Iris Unsupervised Cluster
1 page
Assignment 5'
No ratings yet
Assignment 5'
4 pages
Iris - Ipynb - Colaboratory
No ratings yet
Iris - Ipynb - Colaboratory
8 pages
Clustering - With - Elbow - Plot - ML - 4 - Jupyter Notebook
No ratings yet
Clustering - With - Elbow - Plot - ML - 4 - Jupyter Notebook
6 pages
CC 105 - Information Management 1
No ratings yet
CC 105 - Information Management 1
6 pages
Department Of: Computer Science & Engineering
No ratings yet
Department Of: Computer Science & Engineering
4 pages
ML 2.3 Prashant
No ratings yet
ML 2.3 Prashant
4 pages
A2 60 Rohit Jakkam EDA of Iris - Ipynb - Colaboratory
No ratings yet
A2 60 Rohit Jakkam EDA of Iris - Ipynb - Colaboratory
5 pages
SC Assignment Q2
No ratings yet
SC Assignment Q2
7 pages
DPLT-UG-001 1.01 Datgel Point Load Tool gINT Add-In User Guide
No ratings yet
DPLT-UG-001 1.01 Datgel Point Load Tool gINT Add-In User Guide
9 pages
10 TH
No ratings yet
10 TH
7 pages
Hakin9 Extra Android Teaser
No ratings yet
Hakin9 Extra Android Teaser
19 pages
L3 - Classification - RandomForest - Jupyter Notebook
No ratings yet
L3 - Classification - RandomForest - Jupyter Notebook
6 pages
EXP 07 (ML) - Darshu
No ratings yet
EXP 07 (ML) - Darshu
4 pages
EXP 07 (ML) - Ashu
No ratings yet
EXP 07 (ML) - Ashu
4 pages
TE Seminar Report Template 20 21 Sem II 3
No ratings yet
TE Seminar Report Template 20 21 Sem II 3
18 pages
Week 6 K Nearestneighbors 1
No ratings yet
Week 6 K Nearestneighbors 1
11 pages
K Means On IRIS Dataset
No ratings yet
K Means On IRIS Dataset
4 pages
BDA pr2
No ratings yet
BDA pr2
2 pages
b21 DSBDA Assignment No 10
No ratings yet
b21 DSBDA Assignment No 10
1 page
QAI Practical No. 1
No ratings yet
QAI Practical No. 1
1 page
Why Microsoft Teams: For Chat, Meetings, Calling and Collaboration
No ratings yet
Why Microsoft Teams: For Chat, Meetings, Calling and Collaboration
12 pages
K Means Algorithm
No ratings yet
K Means Algorithm
1 page
Audit Course7 Report Format-1
No ratings yet
Audit Course7 Report Format-1
3 pages
Clustering - Jupyter Notebook
100% (1)
Clustering - Jupyter Notebook
11 pages
Weka Installation
No ratings yet
Weka Installation
7 pages
BE EXTRA CLASSES Time Table
No ratings yet
BE EXTRA CLASSES Time Table
1 page
PGM 7
No ratings yet
PGM 7
3 pages
CG Project +output PDF
No ratings yet
CG Project +output PDF
5 pages
Tutorial List of Cyber Security
No ratings yet
Tutorial List of Cyber Security
1 page
CV7BM Manual
No ratings yet
CV7BM Manual
13 pages
Ces Eac
No ratings yet
Ces Eac
2 pages
Timandra SlidesCarnival
No ratings yet
Timandra SlidesCarnival
39 pages
Data Visualization and Matplot
No ratings yet
Data Visualization and Matplot
11 pages
Rasio Upstream & Downstream HSI
No ratings yet
Rasio Upstream & Downstream HSI
3 pages
Pic Tape Measure: Microcontrolled Ultrasonic Distance Calculator With Data Recording and Foreground Masking
No ratings yet
Pic Tape Measure: Microcontrolled Ultrasonic Distance Calculator With Data Recording and Foreground Masking
9 pages
MT 799 PreAdvice Format
100% (2)
MT 799 PreAdvice Format
3 pages
Tiploa LMD Fim 1904 010 1
No ratings yet
Tiploa LMD Fim 1904 010 1
2 pages
Social Tools
No ratings yet
Social Tools
6 pages
03 - K Means Clustering On Iris Datasets
No ratings yet
03 - K Means Clustering On Iris Datasets
4 pages
Robotics Process Automation: White Paper
No ratings yet
Robotics Process Automation: White Paper
9 pages
Hiral Sheth - Linkedin Profile
No ratings yet
Hiral Sheth - Linkedin Profile
4 pages

Import As Import As Import As From Import Import As Import

Uploaded by

Import As Import As Import As From Import Import As Import

Uploaded by

import pandas as pd # Pandas (version : 1.1.

Index(['Id', 'SepalLengthCm', 'SepalWidthCm', 'PetalLengthCm',

for i,col in enumerate(data.columns):

data.drop('Id', axis=1, inplace=True)

from sklearn.cluster import KMeans

array([680.8244 , 152.36870648, 78.94084143, 57.31787321,

array([[5.006 , 3.418 , 1.464 , 0.244 ],

plt.scatter(x=kms.cluster_centers_[:, 0], y=kms.cluster_centers_[:,

You might also like