Codes For Practice

The document outlines methods for feature selection in classification tasks using different data types. It includes code snippets for selecting features with numerical inputs and categorical outputs using ANOVA, as well as loading and preparing datasets with categorical inputs and outputs. Additionally, it demonstrates how to split a dataset into training and testing sets for further analysis.

Uploaded by

mohan venkey

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

34 views2 pages

Codes For Practice

Uploaded by

mohan venkey

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 2

1.

Feature Selection for Classification: Numerical Input, Categorical Output

# ANOVA feature selection for numeric input and categorical output
from sklearn.datasets import make_classification
from sklearn.feature_selection import SelectKBest
from sklearn.feature_selection import f_classif
# generate dataset
X, y = make_classification(n_samples=100, n_features=20, n_informative=2)
# define feature selection
fs = SelectKBest(score_func=f_classif, k=2)
# apply feature selection
X_selected = fs.fit_transform(X, y)
print(X_selected.shape)

2. Feature Selection for Classification: Categorical Input, Categorical Output

# load the dataset
def load_dataset(filename):
# load the dataset as a pandas DataFrame
data = read_csv(filename, header=None)
# retrieve numpy array
dataset = data.values
# split into input (X) and output (y) variables
X = dataset[:, :-1]
y = dataset[:,-1]
# format all fields as string
X = X.astype(str)
return X, y
3. Feature Selection for Classification: Categorical Input, Categorical Output
# load and summarize the dataset
from pandas import read_csv
from sklearn.model_selection import train_test_split
# load the dataset
def load_dataset(filename):
# load the dataset as a pandas DataFrame
data = read_csv(filename, header=None)
# retrieve numpy array
dataset = data.values
# split into input (X) and output (y) variables
X = dataset[:, :-1]
y = dataset[:,-1]

# format all fields as string

X = X.astype(str)
return X, y
# load the dataset
X, y = load_dataset('breast-cancer.csv')
# split into train and test sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33, random_state=1)
# summarize
print('Train', X_train.shape, y_train.shape)
print('Test', X_test.shape, y_test.shape)

23BCE7199 ML Lab Assignment
No ratings yet
23BCE7199 ML Lab Assignment
15 pages
Machine Learning Lab Assignment 1
No ratings yet
Machine Learning Lab Assignment 1
23 pages
Iii Aid - ML
No ratings yet
Iii Aid - ML
30 pages
ML Regression & Classification Guide
100% (1)
ML Regression & Classification Guide
45 pages
23BCE7092 ML Lab Assignment
No ratings yet
23BCE7092 ML Lab Assignment
14 pages
Basic ML Algo
No ratings yet
Basic ML Algo
10 pages
VND - Openxmlformats Officedocument - Wordprocessingml.document&rendition 1
No ratings yet
VND - Openxmlformats Officedocument - Wordprocessingml.document&rendition 1
24 pages
Code and Output of Cancer Detection Model
No ratings yet
Code and Output of Cancer Detection Model
13 pages
EX - NO:3: Algorithm
No ratings yet
EX - NO:3: Algorithm
11 pages
Aiml Ex 4-7
No ratings yet
Aiml Ex 4-7
8 pages
ML Lab File
No ratings yet
ML Lab File
43 pages
Practical 3
No ratings yet
Practical 3
2 pages
SanatKulkarni - AP22110010183 - Assignment5
No ratings yet
SanatKulkarni - AP22110010183 - Assignment5
8 pages
All in One
No ratings yet
All in One
13 pages
Slip
No ratings yet
Slip
5 pages
Pratham ML
No ratings yet
Pratham ML
14 pages
1
No ratings yet
1
13 pages
Python ML Algorithms Guide
No ratings yet
Python ML Algorithms Guide
7 pages
83 Sklearn Pipeline
No ratings yet
83 Sklearn Pipeline
8 pages
ML Codes
No ratings yet
ML Codes
9 pages
AAM PR QB
No ratings yet
AAM PR QB
13 pages
00 KNN Classification
No ratings yet
00 KNN Classification
8 pages
Da Program
No ratings yet
Da Program
18 pages
Labaihw
No ratings yet
Labaihw
1 page
Machine Learning Assignment 3
No ratings yet
Machine Learning Assignment 3
7 pages
Untitled Document
No ratings yet
Untitled Document
6 pages
KNN Model
No ratings yet
KNN Model
5 pages
Data Com ML PDF Code + Output
No ratings yet
Data Com ML PDF Code + Output
6 pages
Croprecommender Copy1
No ratings yet
Croprecommender Copy1
5 pages
1 KNN - Jupyter Notebook
No ratings yet
1 KNN - Jupyter Notebook
3 pages
ML Short Code - Under Updating
No ratings yet
ML Short Code - Under Updating
4 pages
Untitled Document
No ratings yet
Untitled Document
2 pages
ML5 Implementation
No ratings yet
ML5 Implementation
32 pages
AI Assignment-6
No ratings yet
AI Assignment-6
7 pages
ML
No ratings yet
ML
11 pages
Dav Lab Manual
No ratings yet
Dav Lab Manual
28 pages
ML 1-10
No ratings yet
ML 1-10
53 pages
ML Experiment WithDataset
No ratings yet
ML Experiment WithDataset
23 pages
COMP5318
No ratings yet
COMP5318
42 pages
Final ML Programs 075005
No ratings yet
Final ML Programs 075005
15 pages
ML Functions
No ratings yet
ML Functions
12 pages
Strangers
No ratings yet
Strangers
8 pages
Titanic Akshaya
No ratings yet
Titanic Akshaya
12 pages
Bacdeaf 23032025 115708 Split 1
No ratings yet
Bacdeaf 23032025 115708 Split 1
37 pages
Assignment 3
No ratings yet
Assignment 3
8 pages
Remaining ML Program
No ratings yet
Remaining ML Program
12 pages
ML pr5
No ratings yet
ML pr5
3 pages
ML PDF
No ratings yet
ML PDF
30 pages
MLT 1 - 7 Kanish
No ratings yet
MLT 1 - 7 Kanish
24 pages
Openlab 1
No ratings yet
Openlab 1
17 pages
Breast Cancer Classification Using DTC
No ratings yet
Breast Cancer Classification Using DTC
1 page
ML Yogesh
No ratings yet
ML Yogesh
23 pages
Lab On ML Print-Set-2022
No ratings yet
Lab On ML Print-Set-2022
10 pages
ML Lab
No ratings yet
ML Lab
29 pages
Import Pandas As PD DF PD - Read - CSV ("Titanic - Train - CSV") DF - Head
No ratings yet
Import Pandas As PD DF PD - Read - CSV ("Titanic - Train - CSV") DF - Head
20 pages
Automatic Feature Selection
No ratings yet
Automatic Feature Selection
4 pages
Python Data Science Tasks
No ratings yet
Python Data Science Tasks
4 pages
CQF June 2021 M4L4 Solutions
No ratings yet
CQF June 2021 M4L4 Solutions
14 pages
Data Science
No ratings yet
Data Science
1 page

Codes For Practice

Uploaded by

Codes For Practice

Uploaded by

1.

Feature Selection for Classification: Numerical Input, Categorical Output

2. Feature Selection for Classification: Categorical Input, Categorical Output

# format all fields as string

You might also like