Model

The document outlines the implementation of various transformer models (DistillBERT, BERT, RoBERTA) using PyTorch for a classification task. It includes the setup of data loaders, model architecture, and training parameters such as batch size, learning rate, and loss function. The models are initialized with pretrained weights and utilize a custom dataset class for tokenization and data formatting.

Uploaded by

tongnguyenminhkhang21012020

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

15 views3 pages

Model

Uploaded by

tongnguyenminhkhang21012020

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

You are on page 1/ 3

# =============================================================================

# Model
# =============================================================================
from src import utils,metric
from torch.utils.data import Dataset,DataLoader
import torch.nn as nn
MAX_LEN = 512
TRAIN_BATCH_SIZE = 32
VALID_BATCH_SIZE = 32
EPOCHS = 20
LEARNING_RATE = 1e-05
WEIGHT_DECAY = 1e-05
num_of_batches_per_epoch = len(X_train)//TRAIN_BATCH_SIZE

history = defaultdict(list)
class DistillBERT(torch.nn.Module):
def __init__(self,num_classes):
super(DistillBERTClass, self).__init__()
self.l1 = DistilBertModel.from_pretrained("distilbert-base-uncased")
self.classifier = torch.nn.Linear(768, 768)
self.dropout = torch.nn.Dropout(0.6)
self.classifier = torch.nn.Linear(768, num_classes)

def forward(self, input_ids, attention_mask):

output_1 = self.l1(input_ids=input_ids, attention_mask=attention_mask)
hidden_state = output_1[0]
bert_last = hidden_state[:, 0]
output = self.classifier(bert_last)
return output

class BERT(torch.nn.Module):
def __init__(self,num_classes):
super(BERTClass, self).__init__()
self.l1 = BertModel.from_pretrained("bert-base-
uncased",output_hidden_states=True)
self.classifier = torch.nn.Linear(768, 768)
self.dropout = torch.nn.Dropout(0.6)
self.classifier = torch.nn.Linear(768, num_classes)

def forward(self, input_ids, attention_mask):

output_1 = self.l1(input_ids=input_ids, attention_mask=attention_mask)
hidden_state = output_1[0]
bert_last = hidden_state[:, 0]
output = self.classifier(bert_last)
return output

class RoBERTA(torch.nn.Module):
def __init__(self,num_classes):
super(BibBirdClass, self).__init__()
self.l1 = BigBirdModel.from_pretrained("roberta-
base",output_hidden_states=True)
self.classifier = torch.nn.Linear(4096, 1024)
self.dropout = torch.nn.Dropout(0.6)
self.classifier = torch.nn.Linear(1024, num_classes)

def forward(self, input_ids, attention_mask):

output_1 = self.l1(input_ids=input_ids, attention_mask=attention_mask)
hidden_state = output_1[0]
bert_last = hidden_state[:, 0]
output = self.classifier(bert_last)
return output

from transformers import DistilBertConfig,DistilBertTokenizer,DistilBertModel

from transformers import BertConfig,BertTokenizer,BertModel
from transformers import BigBirdConfig,BigBirdTokenizer,BigBirdModel
from transformers import LongformerConfig,LongformerTokenizer,LongformerModel
num_classes = len(df_profile.labels.unique())
tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
baseline_model = BERTClass(num_classes)
baseline_model.to(device)

class BertDataFormat(Dataset):
def __init__(self, dataframe, tokenizer, max_len):
self.len = len(dataframe)
self.data = dataframe
self.tokenizer = tokenizer
self.max_len = max_len

def getitem(self, index):

cur_doc = str(self.data.doc[index])
cur_doc = " ".join(cur_doc.split())
inputs = self.tokenizer.encode_plus(
cur_doc,
None,
add_special_tokens=True,
max_length=self.max_len,
padding='max_length',
return_token_type_ids=True,
truncation=True
)
ids = inputs['input_ids']
mask = inputs['attention_mask']

return {
'ids': torch.tensor(ids, dtype=torch.long),
'mask': torch.tensor(mask, dtype=torch.long),
'targets': torch.tensor(self.data.labels[index], dtype=torch.long)
}

def __len__(self):
return self.len

training_set = BertDataFormat(train_df, tokenizer, MAX_LEN)

testing_set = BertDataFormat(test_df, tokenizer, MAX_LEN)

train_params = {'batch_size': TRAIN_BATCH_SIZE,

'shuffle': True,
'num_workers': 0
}

test_params = {'batch_size': VALID_BATCH_SIZE,

'shuffle': False,
'num_workers': 0
}

training_loader = DataLoader(training_set, **train_params)

testing_loader = DataLoader(testing_set, **test_params)

testing_set = BertDataFormat(test_df, tokenizer, MAX_LEN)

testing_loader = DataLoader(testing_set, **test_params)

loss_function = torch.nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(params = baseline_model.parameters(),
lr=LEARNING_RATE,weight_decay=WEIGHT_DECAY)

Bert
No ratings yet
Bert
2 pages
PES1PG24CS018 Debjit DLTP Assignment-2 BERT Report
No ratings yet
PES1PG24CS018 Debjit DLTP Assignment-2 BERT Report
10 pages
Effects of Batches - Jupyter Notebook
No ratings yet
Effects of Batches - Jupyter Notebook
73 pages
BLDD VIT ResNet50v2 CustomCNN
No ratings yet
BLDD VIT ResNet50v2 CustomCNN
38 pages
Quality Testing MobileNet V2 Compressed
No ratings yet
Quality Testing MobileNet V2 Compressed
13 pages
Quality Testing Resnet18 Compressed
No ratings yet
Quality Testing Resnet18 Compressed
13 pages
Homework IntroToDL
No ratings yet
Homework IntroToDL
3 pages
NN From Scratch
No ratings yet
NN From Scratch
5 pages
Mlp-Fromscratch Sigmoid-Mse
No ratings yet
Mlp-Fromscratch Sigmoid-Mse
13 pages
Ej Stanford Dog Densenet
No ratings yet
Ej Stanford Dog Densenet
6 pages
Assignment 3 DS5620
No ratings yet
Assignment 3 DS5620
11 pages
Python Deep Learning Lab Programs
No ratings yet
Python Deep Learning Lab Programs
35 pages
Python Code
No ratings yet
Python Code
3 pages
DL Practical PROGRAM
No ratings yet
DL Practical PROGRAM
28 pages
Final Code
No ratings yet
Final Code
16 pages
Distilgpt2 Combo Eval-1
No ratings yet
Distilgpt2 Combo Eval-1
4 pages
MLP Pytorch Sigmoid Mse
No ratings yet
MLP Pytorch Sigmoid Mse
20 pages
Reproducibility Project
No ratings yet
Reproducibility Project
22 pages
Autoencoder From Scratch
No ratings yet
Autoencoder From Scratch
21 pages
Stanford Dogs EfficientNetV2S
No ratings yet
Stanford Dogs EfficientNetV2S
7 pages
MLP Pytorch Softmax Crossentr
No ratings yet
MLP Pytorch Softmax Crossentr
20 pages
Credit Card Clustering Autoencoder
No ratings yet
Credit Card Clustering Autoencoder
6 pages
Exercise - 1
No ratings yet
Exercise - 1
38 pages
HW4ML Project Code
No ratings yet
HW4ML Project Code
24 pages
DL 5 Excuted
No ratings yet
DL 5 Excuted
13 pages
Yolo Step-by-Step - Ipynb
No ratings yet
Yolo Step-by-Step - Ipynb
447 pages
Ilovepdf Merged
No ratings yet
Ilovepdf Merged
10 pages
CIFAR - 10 - Dataset - Using - CNN - Aniiiii - HTML
No ratings yet
CIFAR - 10 - Dataset - Using - CNN - Aniiiii - HTML
8 pages
NN From Scratch PDF 1735495327
No ratings yet
NN From Scratch PDF 1735495327
19 pages
Experiment No 13 Final
No ratings yet
Experiment No 13 Final
9 pages
Val
No ratings yet
Val
9 pages
Converta Esse C
No ratings yet
Converta Esse C
15 pages
DL Program
No ratings yet
DL Program
31 pages
Project Source
No ratings yet
Project Source
21 pages
Deep Learning Program Printout
No ratings yet
Deep Learning Program Printout
32 pages
Hand Written
No ratings yet
Hand Written
13 pages
MobileNetV2 Code
No ratings yet
MobileNetV2 Code
3 pages
Hybridmodel With CNN Modifications
No ratings yet
Hybridmodel With CNN Modifications
5 pages
Ccnet Only
No ratings yet
Ccnet Only
6 pages
DLV Lab Manual Print
No ratings yet
DLV Lab Manual Print
29 pages
Logistic Regression
No ratings yet
Logistic Regression
4 pages
Lab 9
No ratings yet
Lab 9
29 pages
Softmax Regression Scratch
No ratings yet
Softmax Regression Scratch
5 pages
361 Project Code
No ratings yet
361 Project Code
10 pages
Train Edu Bert
No ratings yet
Train Edu Bert
3 pages
Softmax Regression Mnist
No ratings yet
Softmax Regression Mnist
3 pages
Keras - Datasets Keras - Datasets: "X - Train Shape" "Y - Train Shape" "X - Test Shape" "Y - Test Shape"
No ratings yet
Keras - Datasets Keras - Datasets: "X - Train Shape" "Y - Train Shape" "X - Test Shape" "Y - Test Shape"
6 pages
Vit32 GPTMD
No ratings yet
Vit32 GPTMD
6 pages
HW4 Pedro Aguiar
No ratings yet
HW4 Pedro Aguiar
6 pages
Assignment 7 ML
No ratings yet
Assignment 7 ML
20 pages
# !pip Install Keras Tensorflow - U
No ratings yet
# !pip Install Keras Tensorflow - U
24 pages
AM19 ADL U-Net-Model
No ratings yet
AM19 ADL U-Net-Model
37 pages
Current Code
No ratings yet
Current Code
25 pages
CV Lab Final AwaisKhan EE A
No ratings yet
CV Lab Final AwaisKhan EE A
7 pages
Deep Learning Programs Updated
No ratings yet
Deep Learning Programs Updated
24 pages
Deep Learning Experiments
No ratings yet
Deep Learning Experiments
42 pages
Untitled 10
No ratings yet
Untitled 10
6 pages
Intro To Pytorch
No ratings yet
Intro To Pytorch
12 pages
Deep Learning
No ratings yet
Deep Learning
46 pages
MyNotes Concrete Col
100% (1)
MyNotes Concrete Col
29 pages
Unit 11 Boyle Charles GayLussac and Combined Gas Law Worksheet Gas WS 1 2010
No ratings yet
Unit 11 Boyle Charles GayLussac and Combined Gas Law Worksheet Gas WS 1 2010
2 pages
Lecture Measurement: Retaining Wall
No ratings yet
Lecture Measurement: Retaining Wall
22 pages
Adventure - 10 May 1922
No ratings yet
Adventure - 10 May 1922
200 pages
What Is The Purpose of Praise and Worship - Abundant Life
No ratings yet
What Is The Purpose of Praise and Worship - Abundant Life
8 pages
Atom Worksheet: Subatomic Particles
No ratings yet
Atom Worksheet: Subatomic Particles
3 pages
Gatco, Inc.: Grease Lubrication Recommendations For Gatco Rotary Bushings and Tool Holders
No ratings yet
Gatco, Inc.: Grease Lubrication Recommendations For Gatco Rotary Bushings and Tool Holders
2 pages
One-Shot Calibration Guidance
No ratings yet
One-Shot Calibration Guidance
4 pages
SP Essay
No ratings yet
SP Essay
11 pages
Keith Scott-Mumby - Nature's Number One Healing Secret (2024)
100% (1)
Keith Scott-Mumby - Nature's Number One Healing Secret (2024)
26 pages
Power Profile - Electrical Powers PDF
No ratings yet
Power Profile - Electrical Powers PDF
6 pages
Global Warming Impact on Sunderbans
No ratings yet
Global Warming Impact on Sunderbans
10 pages
1smart Mirror Research Paper
No ratings yet
1smart Mirror Research Paper
3 pages
2021 Carrier Performance
No ratings yet
2021 Carrier Performance
651 pages
A Genetic Algorithm For Solving The Optimal Power Flow Problem
No ratings yet
A Genetic Algorithm For Solving The Optimal Power Flow Problem
14 pages
Mathematical Literacy GR 10 Paper 2
No ratings yet
Mathematical Literacy GR 10 Paper 2
9 pages
T ITE Spec ENG
No ratings yet
T ITE Spec ENG
2 pages
2 - 04. Energy Method (5. Minimum Total Potential E - 01)
No ratings yet
2 - 04. Energy Method (5. Minimum Total Potential E - 01)
13 pages
Polyvalence Hertzberger
No ratings yet
Polyvalence Hertzberger
8 pages
Manual of Newborn Care: A. Santhosh Kumar (Ed) : The Indian Journal of Pediatrics January 2012
No ratings yet
Manual of Newborn Care: A. Santhosh Kumar (Ed) : The Indian Journal of Pediatrics January 2012
2 pages
Ducks, Geese & Swans of North America A Completely New and Expa
100% (9)
Ducks, Geese & Swans of North America A Completely New and Expa
576 pages
Operating Procedure For Water Tight GRP Manhole Covers
No ratings yet
Operating Procedure For Water Tight GRP Manhole Covers
7 pages
Laxmi Sky City Brochure Min
No ratings yet
Laxmi Sky City Brochure Min
15 pages
Digital Signal Processing-Full
100% (2)
Digital Signal Processing-Full
1,291 pages
Mock Drill Reporting Form: Person Completing Form and Title: Date
No ratings yet
Mock Drill Reporting Form: Person Completing Form and Title: Date
2 pages
BTS Cdma
No ratings yet
BTS Cdma
98 pages
Hardware of The PIC16F877
No ratings yet
Hardware of The PIC16F877
2 pages
Water System O&M Insights
0% (1)
Water System O&M Insights
53 pages
2024 09 US Nutrition Guide
No ratings yet
2024 09 US Nutrition Guide
15 pages
Happiness To Live by 100 Inspiring Stories To Smile About ISBN 0785296387, 9780785296386 Full Chapter Download
No ratings yet
Happiness To Live by 100 Inspiring Stories To Smile About ISBN 0785296387, 9780785296386 Full Chapter Download
16 pages