0% found this document useful (0 votes)

13 views7 pages

Ds Pract 5 Data Analytics1 Vedanti

The document contains Python code that imports the pandas and matplotlib libraries, reads a CSV file named 'HousingData.csv' into a DataFrame, and displays its contents. It includes descriptive statistics of the DataFrame, which has 506 rows and 14 columns, detailing various attributes related to housing data. Additionally, it shows operations to drop rows with missing values and confirms that the resulting DataFrame has no null values.

Uploaded by

pranjal.shinde.aids.2022

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

13 views7 pages

Ds Pract 5 Data Analytics1 Vedanti

Uploaded by

pranjal.shinde.aids.2022

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 7

In [117… import pandas as pd

In [119… import matplotlib as plt

In [121… df=pd.read_csv('HousingData.csv')

In [123… df

Out[123… CRIM ZN INDUS CHAS NOX RM AGE DIS RAD TAX PTRATIO

0 0.00632 18.0 2.31 0.0 0.538 6.575 65.2 4.0900 1 296 15.3 396.9

1 0.02731 0.0 7.07 0.0 0.469 6.421 78.9 4.9671 2 242 17.8 396.9

2 0.02729 0.0 7.07 0.0 0.469 7.185 61.1 4.9671 2 242 17.8 392.8

3 0.03237 0.0 2.18 0.0 0.458 6.998 45.8 6.0622 3 222 18.7 394.6

4 0.06905 0.0 2.18 0.0 0.458 7.147 54.2 6.0622 3 222 18.7 396.9

... ... ... ... ... ... ... ... ... ... ... ... .

501 0.06263 0.0 11.93 0.0 0.573 6.593 69.1 2.4786 1 273 21.0 391.9

502 0.04527 0.0 11.93 0.0 0.573 6.120 76.7 2.2875 1 273 21.0 396.9

503 0.06076 0.0 11.93 0.0 0.573 6.976 91.0 2.1675 1 273 21.0 396.9

504 0.10959 0.0 11.93 0.0 0.573 6.794 89.3 2.3889 1 273 21.0 393.4

505 0.04741 0.0 11.93 0.0 0.573 6.030 NaN 2.5050 1 273 21.0 396.9

506 rows × 14 columns

In [125… df.describe()

Out[125… CRIM ZN INDUS CHAS NOX RM A

count 486.000000 486.000000 486.000000 486.000000 506.000000 506.000000 486.0000

mean 3.611874 11.211934 11.083992 0.069959 0.554695 6.284634 68.5185

std 8.720192 23.388876 6.835896 0.255340 0.115878 0.702617 27.9995

min 0.006320 0.000000 0.460000 0.000000 0.385000 3.561000 2.9000

25% 0.081900 0.000000 5.190000 0.000000 0.449000 5.885500 45.1750

50% 0.253715 0.000000 9.690000 0.000000 0.538000 6.208500 76.8000

75% 3.560263 12.500000 18.100000 0.000000 0.624000 6.623500 93.9750

max 88.976200 100.000000 27.740000 1.000000 0.871000 8.780000 100.0000

In [127… df.index

Out[127… RangeIndex(start=0, stop=506, step=1)

In [129… df.head
Out[129… <bound method NDFrame.head of CRIM ZN INDUS CHAS NOX RM AGE
DIS RAD TAX \
0 0.00632 18.0 2.31 0.0 0.538 6.575 65.2 4.0900 1 296
1 0.02731 0.0 7.07 0.0 0.469 6.421 78.9 4.9671 2 242
2 0.02729 0.0 7.07 0.0 0.469 7.185 61.1 4.9671 2 242
3 0.03237 0.0 2.18 0.0 0.458 6.998 45.8 6.0622 3 222
4 0.06905 0.0 2.18 0.0 0.458 7.147 54.2 6.0622 3 222
.. ... ... ... ... ... ... ... ... ... ...
501 0.06263 0.0 11.93 0.0 0.573 6.593 69.1 2.4786 1 273
502 0.04527 0.0 11.93 0.0 0.573 6.120 76.7 2.2875 1 273
503 0.06076 0.0 11.93 0.0 0.573 6.976 91.0 2.1675 1 273
504 0.10959 0.0 11.93 0.0 0.573 6.794 89.3 2.3889 1 273
505 0.04741 0.0 11.93 0.0 0.573 6.030 NaN 2.5050 1 273

PTRATIO B LSTAT MEDV

0 15.3 396.90 4.98 24.0
1 17.8 396.90 9.14 21.6
2 17.8 392.83 4.03 34.7
3 18.7 394.63 2.94 33.4
4 18.7 396.90 NaN 36.2
.. ... ... ... ...
501 21.0 391.99 NaN 22.4
502 21.0 396.90 9.08 20.6
503 21.0 396.90 5.64 23.9
504 21.0 393.45 6.48 22.0
505 21.0 396.90 7.88 11.9

[506 rows x 14 columns]>

In [131… df.head()

Out[131… CRIM ZN INDUS CHAS NOX RM AGE DIS RAD TAX PTRATIO B

0 0.00632 18.0 2.31 0.0 0.538 6.575 65.2 4.0900 1 296 15.3 396.90

1 0.02731 0.0 7.07 0.0 0.469 6.421 78.9 4.9671 2 242 17.8 396.90

2 0.02729 0.0 7.07 0.0 0.469 7.185 61.1 4.9671 2 242 17.8 392.83

3 0.03237 0.0 2.18 0.0 0.458 6.998 45.8 6.0622 3 222 18.7 394.63

4 0.06905 0.0 2.18 0.0 0.458 7.147 54.2 6.0622 3 222 18.7 396.90

In [133… df.tail()

Out[133… CRIM ZN INDUS CHAS NOX RM AGE DIS RAD TAX PTRATIO B

501 0.06263 0.0 11.93 0.0 0.573 6.593 69.1 2.4786 1 273 21.0 391.99

502 0.04527 0.0 11.93 0.0 0.573 6.120 76.7 2.2875 1 273 21.0 396.90

503 0.06076 0.0 11.93 0.0 0.573 6.976 91.0 2.1675 1 273 21.0 396.90

504 0.10959 0.0 11.93 0.0 0.573 6.794 89.3 2.3889 1 273 21.0 393.45

505 0.04741 0.0 11.93 0.0 0.573 6.030 NaN 2.5050 1 273 21.0 396.90

In [135… df1=df.dropna()

In [137… df1
Out[137… CRIM ZN INDUS CHAS NOX RM AGE DIS RAD TAX PTRATIO

0 0.00632 18.0 2.31 0.0 0.538 6.575 65.2 4.0900 1 296 15.3 396.9

1 0.02731 0.0 7.07 0.0 0.469 6.421 78.9 4.9671 2 242 17.8 396.9

2 0.02729 0.0 7.07 0.0 0.469 7.185 61.1 4.9671 2 242 17.8 392.8

3 0.03237 0.0 2.18 0.0 0.458 6.998 45.8 6.0622 3 222 18.7 394.6

5 0.02985 0.0 2.18 0.0 0.458 6.430 58.7 6.0622 3 222 18.7 394.1

... ... ... ... ... ... ... ... ... ... ... ... .

499 0.17783 0.0 9.69 0.0 0.585 5.569 73.5 2.3999 6 391 19.2 395.7

500 0.22438 0.0 9.69 0.0 0.585 6.027 79.7 2.4982 6 391 19.2 396.9

502 0.04527 0.0 11.93 0.0 0.573 6.120 76.7 2.2875 1 273 21.0 396.9

503 0.06076 0.0 11.93 0.0 0.573 6.976 91.0 2.1675 1 273 21.0 396.9

504 0.10959 0.0 11.93 0.0 0.573 6.794 89.3 2.3889 1 273 21.0 393.4

394 rows × 14 columns

In [139… df1.isnull()

Out[139… CRIM ZN INDUS CHAS NOX RM AGE DIS RAD TAX PTRATIO B LS

0 False False False False False False False False False False False False F

1 False False False False False False False False False False False False F

2 False False False False False False False False False False False False F

3 False False False False False False False False False False False False F

5 False False False False False False False False False False False False F

... ... ... ... ... ... ... ... ... ... ... ... ...

499 False False False False False False False False False False False False F

500 False False False False False False False False False False False False F

502 False False False False False False False False False False False False F

503 False False False False False False False False False False False False F

504 False False False False False False False False False False False False F

394 rows × 14 columns

In [141… import numpy as np

In [143… df.columns

Out[143… Index(['CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE', 'DIS', 'RAD', 'TAX',
'PTRATIO', 'B', 'LSTAT', 'MEDV'],
dtype='object')

In [145… x=df1[['CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE', 'DIS', 'RAD', 'TAX',
'PTRATIO', 'B', 'LSTAT']]

In [147… y=df1[['MEDV']]

In [149… x
Out[149… CRIM ZN INDUS CHAS NOX RM AGE DIS RAD TAX PTRATIO

0 0.00632 18.0 2.31 0.0 0.538 6.575 65.2 4.0900 1 296 15.3 396.9

1 0.02731 0.0 7.07 0.0 0.469 6.421 78.9 4.9671 2 242 17.8 396.9

2 0.02729 0.0 7.07 0.0 0.469 7.185 61.1 4.9671 2 242 17.8 392.8

3 0.03237 0.0 2.18 0.0 0.458 6.998 45.8 6.0622 3 222 18.7 394.6

5 0.02985 0.0 2.18 0.0 0.458 6.430 58.7 6.0622 3 222 18.7 394.1

... ... ... ... ... ... ... ... ... ... ... ... .

499 0.17783 0.0 9.69 0.0 0.585 5.569 73.5 2.3999 6 391 19.2 395.7

500 0.22438 0.0 9.69 0.0 0.585 6.027 79.7 2.4982 6 391 19.2 396.9

502 0.04527 0.0 11.93 0.0 0.573 6.120 76.7 2.2875 1 273 21.0 396.9

503 0.06076 0.0 11.93 0.0 0.573 6.976 91.0 2.1675 1 273 21.0 396.9

504 0.10959 0.0 11.93 0.0 0.573 6.794 89.3 2.3889 1 273 21.0 393.4

394 rows × 13 columns

In [151… y

Out[151… MEDV

0 24.0

1 21.6

2 34.7

3 33.4

5 28.7

... ...

499 17.5

500 16.8

502 20.6

503 23.9

504 22.0

394 rows × 1 columns

In [153… from sklearn.model_selection import train_test_split

In [155… from sklearn.linear_model import LinearRegression

In [157… x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.25,random_state=42)

In [159… lm = LinearRegression()
lm.fit(x_train,y_train)

Out[159… ▾ LinearRegression

LinearRegression()

In [161… predictions=lm.predict(x_test)

In [163… predictions
Out[163… array([[29.40315823],
[17.32130164],
[21.88438126],
[30.53897078],
[18.74211111],
[34.49957016],
[22.18772843],
[30.40016057],
[33.30285959],
[15.07065834],
[22.15266803],
[40.7986985 ],
[21.81856333],
[16.57492925],
[19.06901469],
[20.36048341],
[17.0094124 ],
[15.281753 ],
[22.57233525],
[14.31888726],
[18.48367439],
[20.59950781],
[17.02508296],
[29.32482063],
[26.16559295],
[16.14119305],
[27.05876571],
[31.80271449],
[22.91935834],
[27.06461644],
[40.9285908 ],
[18.23395575],
[22.32757596],
[17.40043581],
[17.75100984],
[21.14924374],
[22.00396948],
[21.66088774],
[23.1598697 ],
[20.86075164],
[27.6556627 ],
[34.50415574],
[22.12517086],
[30.76421403],
[34.86183582],
[19.95497559],
[24.94727208],
[10.54144025],
[19.61633902],
[25.25533113],
[21.82692573],
[26.1224415 ],
[14.58753912],
[18.60907444],
[18.73269469],
[23.877063 ],
[43.39153407],
[22.4868859 ],
[15.58046183],
[23.42839246],
[21.35028809],
[21.41783737],
[14.59575339],
[28.83213251],
[-3.15989071],
[32.30293312],
[16.84715194],
[31.11268272],
[24.82335627],
[19.94867799],
[31.74110086],
[32.10741168],
[19.29684222],
[19.39763513],
[19.26122628],
[35.15713713],
[19.27819376],
[28.30029199],
[16.64597387],
[16.86726667],
[36.9666121 ],
[23.88353751],
[24.02647044],
[12.90795354],
[28.61288195],
[20.95440577],
[15.33870473],
[12.28771055],
[38.47633494],
[37.07379058],
[20.50728689],
[18.65066319],
[27.44199919],
[16.08244976],
[26.83793964],
[38.72160447],
[30.53333731],
[22.90723493],
[21.57563759]])

In [183… from sklearn import metrics

mse=metrics.mean_squared_error(y_test,predictions)

In [185… np.sqrt(mse)

Out[185… 5.457269439843607

In [193… import matplotlib.pyplot as plt

import seaborn as sns
plt.scatter(y_test,predictions)
plt.xlabel("y_test")
plt.ylabel("y_predictions")

Out[193… Text(0, 0.5, 'y_predictions')

In [ ]:

Merged
No ratings yet
Merged
35 pages
One Hot Encoding
No ratings yet
One Hot Encoding
12 pages
Prg7a - Jupyter Notebook
No ratings yet
Prg7a - Jupyter Notebook
12 pages
Project 4 - House Price Prediction - Ipynb - Colab
No ratings yet
Project 4 - House Price Prediction - Ipynb - Colab
5 pages
Assignment-07-DBSCAN Clustering (Crimes) - Jupyter Notebook
No ratings yet
Assignment-07-DBSCAN Clustering (Crimes) - Jupyter Notebook
11 pages
1 Abril PDF
No ratings yet
1 Abril PDF
10 pages
DSBDA4
No ratings yet
DSBDA4
6 pages
Assignment 4
No ratings yet
Assignment 4
7 pages
Gold Prediction 1719293155
No ratings yet
Gold Prediction 1719293155
13 pages
DL 1
No ratings yet
DL 1
4 pages
DSBDA Prac4 2
No ratings yet
DSBDA Prac4 2
1 page
April 23, 2025: Pandas PD
No ratings yet
April 23, 2025: Pandas PD
11 pages
Python Data Analysis Guide
No ratings yet
Python Data Analysis Guide
19 pages
Experiment No 11
No ratings yet
Experiment No 11
19 pages
Import: Sys - Executable - M Pip Install
No ratings yet
Import: Sys - Executable - M Pip Install
23 pages
Pandas
No ratings yet
Pandas
4 pages
1 Simple Linear Regression
No ratings yet
1 Simple Linear Regression
9 pages
Machine Learning Group Project
No ratings yet
Machine Learning Group Project
22 pages
A4 Dsbda Sana
No ratings yet
A4 Dsbda Sana
16 pages
Statistical Data Analysis - Ipynb - Colaboratory
No ratings yet
Statistical Data Analysis - Ipynb - Colaboratory
6 pages
Edp 3
No ratings yet
Edp 3
16 pages
Practical File Ip
No ratings yet
Practical File Ip
27 pages
K Means Clustering
No ratings yet
K Means Clustering
6 pages
7 Output
No ratings yet
7 Output
4 pages
Gestión de Carteras Mapa de Calor
No ratings yet
Gestión de Carteras Mapa de Calor
1 page
California Housing Data Analysis
No ratings yet
California Housing Data Analysis
1 page
LAB1 HTML
No ratings yet
LAB1 HTML
17 pages
03 Multiple Linear Regression
No ratings yet
03 Multiple Linear Regression
7 pages
ML PROGRAMS
No ratings yet
ML PROGRAMS
55 pages
LP Prcatical 2 Jupyter Notebook
No ratings yet
LP Prcatical 2 Jupyter Notebook
5 pages
PCA
No ratings yet
PCA
23 pages
Practical 5
No ratings yet
Practical 5
6 pages
Numpy Boolean Indexing: Filter
No ratings yet
Numpy Boolean Indexing: Filter
39 pages
Python Basics for Data Science
No ratings yet
Python Basics for Data Science
30 pages
Prac3.ipynb (Auto-R) - JupyterLab
No ratings yet
Prac3.ipynb (Auto-R) - JupyterLab
6 pages
Week 6 (PCA, SVD, LDA)
No ratings yet
Week 6 (PCA, SVD, LDA)
14 pages
Pca 2382487
No ratings yet
Pca 2382487
8 pages
Practica 9
No ratings yet
Practica 9
24 pages
Exp - 2-EDA - CaliforniaData Set - HeatMap - PairPlot-checkpoint - Jupyter Notebook
No ratings yet
Exp - 2-EDA - CaliforniaData Set - HeatMap - PairPlot-checkpoint - Jupyter Notebook
12 pages
Import As
100% (1)
Import As
27 pages
Ex. No.: 01 Working With Numpy Arrays
No ratings yet
Ex. No.: 01 Working With Numpy Arrays
30 pages
ModuleAr Merged
No ratings yet
ModuleAr Merged
42 pages
Data Analytics I: Link of The Dataset
No ratings yet
Data Analytics I: Link of The Dataset
12 pages
Data Analysis with Boston Dataset
No ratings yet
Data Analysis with Boston Dataset
4 pages
Normialization Dataset
No ratings yet
Normialization Dataset
7 pages
AI & Data Science Lab Record
No ratings yet
AI & Data Science Lab Record
28 pages
Data Cleaning
No ratings yet
Data Cleaning
22 pages
Ip Project
No ratings yet
Ip Project
27 pages
Data Cleaning EDA
No ratings yet
Data Cleaning EDA
5 pages
Localweighted - Jupyter Notebook
No ratings yet
Localweighted - Jupyter Notebook
4 pages
KNN052
No ratings yet
KNN052
5 pages
ML Practice Assignment
No ratings yet
ML Practice Assignment
7 pages
Numpy Dataframe
No ratings yet
Numpy Dataframe
12 pages
ML Journal
No ratings yet
ML Journal
58 pages
Data - Analytics Lab - Manual JNTUH R22 Regulation
No ratings yet
Data - Analytics Lab - Manual JNTUH R22 Regulation
26 pages
DNN Tutorial for Data Scientists
No ratings yet
DNN Tutorial for Data Scientists
9 pages
DSC Lab Programs
No ratings yet
DSC Lab Programs
24 pages
DV Mid Internal 1
No ratings yet
DV Mid Internal 1
8 pages
Time Series Analysis Group 9
No ratings yet
Time Series Analysis Group 9
16 pages
SL2VIVA
No ratings yet
SL2VIVA
25 pages
Ds 9
No ratings yet
Ds 9
12 pages
Ds Pract 2 Vedanti
No ratings yet
Ds Pract 2 Vedanti
7 pages
Datascience PR 6 Veda
No ratings yet
Datascience PR 6 Veda
6 pages
IT Leadership & Network Expertise
No ratings yet
IT Leadership & Network Expertise
8 pages
Ares Datasheets
No ratings yet
Ares Datasheets
16 pages
Construction Details From The DVHS Planetarium
No ratings yet
Construction Details From The DVHS Planetarium
8 pages
Emerging Research in Computing, Information, Communication and Applications
No ratings yet
Emerging Research in Computing, Information, Communication and Applications
1,028 pages
Autocad LT Brochure
No ratings yet
Autocad LT Brochure
4 pages
Hytera IP Dispatch Software User Manual
No ratings yet
Hytera IP Dispatch Software User Manual
38 pages
2024-02-18 - Summary of I-S00N Leaks
No ratings yet
2024-02-18 - Summary of I-S00N Leaks
43 pages
Evaluating The Effectiveness of ChatGPT in Enhancing Work Efficiency and Productivity of Computer Engineering Students in C++ Programming
No ratings yet
Evaluating The Effectiveness of ChatGPT in Enhancing Work Efficiency and Productivity of Computer Engineering Students in C++ Programming
28 pages
Urban Land Use Map Color Codes
0% (1)
Urban Land Use Map Color Codes
1 page
Application Example - Motor Sizing With NX MCD en V1.1
No ratings yet
Application Example - Motor Sizing With NX MCD en V1.1
38 pages
Oracle Train4sure 1z0-447 v2018-05-07 by Julia 42q
No ratings yet
Oracle Train4sure 1z0-447 v2018-05-07 by Julia 42q
21 pages
Silo Help
No ratings yet
Silo Help
272 pages
C4C S4 Integration Scenarios
0% (1)
C4C S4 Integration Scenarios
7 pages
HP 6120xg Config
No ratings yet
HP 6120xg Config
4 pages
SIPROTEC 5 Application Note: SIP5-APN-013: Teleprotection Scheme With SIPROTEC 5 Devices Edition 2012-04-10
No ratings yet
SIPROTEC 5 Application Note: SIP5-APN-013: Teleprotection Scheme With SIPROTEC 5 Devices Edition 2012-04-10
12 pages
IPC Quiz for CS Students
No ratings yet
IPC Quiz for CS Students
3 pages
Tips For Writing Effective Test Cases For Any Application
No ratings yet
Tips For Writing Effective Test Cases For Any Application
9 pages
Final Exam Foop
No ratings yet
Final Exam Foop
21 pages
MF50 Q&a
No ratings yet
MF50 Q&a
3 pages
Chapter 2 - The Origins of Software
No ratings yet
Chapter 2 - The Origins of Software
26 pages
Social Stories for Autism
No ratings yet
Social Stories for Autism
59 pages
Brochure Guidewire CorporateOverview
No ratings yet
Brochure Guidewire CorporateOverview
12 pages
Application of Data Analytics in Business PDF
No ratings yet
Application of Data Analytics in Business PDF
1 page
Module Orcad
No ratings yet
Module Orcad
44 pages
Budget Manager Mad
No ratings yet
Budget Manager Mad
14 pages
Easy English to Tamil Typing Tool
No ratings yet
Easy English to Tamil Typing Tool
7 pages
C++ Report Card Generator
No ratings yet
C++ Report Card Generator
23 pages
Upgrading FPD: Related Documents, On Page 5
No ratings yet
Upgrading FPD: Related Documents, On Page 5
6 pages
Parallel Database
No ratings yet
Parallel Database
27 pages
Web Designing Important Question
No ratings yet
Web Designing Important Question
2 pages

Ds Pract 5 Data Analytics1 Vedanti

Uploaded by

Ds Pract 5 Data Analytics1 Vedanti

Uploaded by

In [117… import pandas as pd

In [119… import matplotlib as plt

506 rows × 14 columns

Out[125… CRIM ZN INDUS CHAS NOX RM A

count 486.000000 486.000000 486.000000 486.000000 506.000000 506.000000 486.0000

mean 3.611874 11.211934 11.083992 0.069959 0.554695 6.284634 68.5185

std 8.720192 23.388876 6.835896 0.255340 0.115878 0.702617 27.9995

min 0.006320 0.000000 0.460000 0.000000 0.385000 3.561000 2.9000

25% 0.081900 0.000000 5.190000 0.000000 0.449000 5.885500 45.1750

50% 0.253715 0.000000 9.690000 0.000000 0.538000 6.208500 76.8000

75% 3.560263 12.500000 18.100000 0.000000 0.624000 6.623500 93.9750

max 88.976200 100.000000 27.740000 1.000000 0.871000 8.780000 100.0000

Out[127… RangeIndex(start=0, stop=506, step=1)

PTRATIO B LSTAT MEDV

[506 rows x 14 columns]>

394 rows × 14 columns

394 rows × 14 columns

In [141… import numpy as np

394 rows × 13 columns

394 rows × 1 columns

In [153… from sklearn.model_selection import train_test_split

In [155… from sklearn.linear_model import LinearRegression

In [183… from sklearn import metrics

In [193… import matplotlib.pyplot as plt

Out[193… Text(0, 0.5, 'y_predictions')

You might also like