0% found this document useful (0 votes)

28 views4 pages

Assignment 9

Uploaded by

nihalthangallapally123

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

28 views4 pages

Assignment 9

Uploaded by

nihalthangallapally123

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

assignment-9

November 12, 2024

[2]: import torch

import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader, Dataset
from collections import Counter
from itertools import chain

# Sample parallel sentences for demonstration (replace with actual data)

source_sentences = ["hello", "how are you", "good morning"]
target_sentences = ["hola", "cómo estás", "buenos días"]

# Vocabulary building function

def build_vocab(sentences):
counter = Counter(chain.from_iterable(s.split() for s in sentences))
vocab = {word: idx + 3 for idx, (word, _) in enumerate(counter.
↪most_common())}

vocab["<pad>"] = 0
vocab["<sos>"] = 1
vocab["<eos>"] = 2
return vocab

# Build vocabulary for source and target languages

source_vocab = build_vocab(source_sentences)
target_vocab = build_vocab(target_sentences)

# Tokenize function
def tokenize(sentence, vocab):
tokens = ["<sos>"] + sentence.split() + ["<eos>"]
return [vocab[token] if token in vocab else vocab["<pad>"] for token in␣
↪tokens]

# Prepare data for training

train_data = [(torch.tensor(tokenize(src, source_vocab)), torch.
↪tensor(tokenize(tgt, target_vocab)))

for src, tgt in zip(source_sentences, target_sentences)]

# Define Dataset and DataLoader

1
class TranslationDataset(Dataset):
def __init__(self, data):
self.data = data

def __len__(self):
return len(self.data)

def getitem(self, idx):

return self.data[idx]

dataset = TranslationDataset(train_data)
dataloader = DataLoader(dataset, batch_size=2, shuffle=True, collate_fn=lambda␣
↪x: x)

# Encoder model
class Encoder(nn.Module):
def __init__(self, input_dim, emb_dim, hidden_dim, n_layers):
super(Encoder, self).__init__()
self.embedding = nn.Embedding(input_dim, emb_dim)
self.lstm = nn.LSTM(emb_dim, hidden_dim, n_layers, batch_first=True)

def forward(self, src):

embedded = self.embedding(src)
outputs, (hidden, cell) = self.lstm(embedded)
return outputs, hidden, cell

# Attention model
class Attention(nn.Module):
def __init__(self, hidden_dim):
super(Attention, self).__init__()
self.attn = nn.Linear(hidden_dim * 2, hidden_dim)
self.v = nn.Linear(hidden_dim, 1, bias=False)

def forward(self, hidden, encoder_outputs):

src_len = encoder_outputs.shape[1]
hidden = hidden[-1].unsqueeze(1).repeat(1, src_len, 1)
energy = torch.tanh(self.attn(torch.cat((hidden, encoder_outputs),␣
↪dim=2)))

attention = self.v(energy).squeeze(2)
return torch.softmax(attention, dim=1)

# Decoder model with attention

class Decoder(nn.Module):
def __init__(self, output_dim, emb_dim, hidden_dim, n_layers, attention):
super(Decoder, self).__init__()
self.output_dim = output_dim
self.embedding = nn.Embedding(output_dim, emb_dim)

2
self.lstm = nn.LSTM(emb_dim + hidden_dim, hidden_dim, n_layers,␣
↪batch_first=True)
self.fc_out = nn.Linear(hidden_dim * 2, output_dim)
self.attention = attention

def forward(self, tgt, hidden, cell, encoder_outputs):

tgt = tgt.unsqueeze(1)
embedded = self.embedding(tgt)
attn_weights = self.attention(hidden, encoder_outputs)
context = torch.bmm(attn_weights.unsqueeze(1), encoder_outputs)
lstm_input = torch.cat((embedded, context), dim=2)
output, (hidden, cell) = self.lstm(lstm_input, (hidden, cell))
prediction = self.fc_out(torch.cat((output, context), dim=2).squeeze(1))
return prediction, hidden, cell

# Seq2Seq model combining encoder and decoder

class Seq2Seq(nn.Module):
def __init__(self, encoder, decoder, device):
super(Seq2Seq, self).__init__()
self.encoder = encoder
self.decoder = decoder
self.device = device

def forward(self, src, tgt):

encoder_outputs, hidden, cell = self.encoder(src)
outputs = torch.zeros(tgt.shape[0], tgt.shape[1], self.decoder.
↪output_dim).to(self.device)

input = tgt[:, 0]
for t in range(1, tgt.shape[1]):
output, hidden, cell = self.decoder(input, hidden, cell,␣
↪encoder_outputs)

outputs[:, t] = output
input = output.argmax(1)
return outputs

# Hyperparameters and model initialization

INPUT_DIM = len(source_vocab)
OUTPUT_DIM = len(target_vocab)
EMB_DIM = 256
HIDDEN_DIM = 512
N_LAYERS = 2

encoder = Encoder(INPUT_DIM, EMB_DIM, HIDDEN_DIM, N_LAYERS)

attention = Attention(HIDDEN_DIM)
decoder = Decoder(OUTPUT_DIM, EMB_DIM, HIDDEN_DIM, N_LAYERS, attention)
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
model = Seq2Seq(encoder, decoder, device).to(device)

3
# Training setup
optimizer = optim.Adam(model.parameters(), lr=0.001)
criterion = nn.CrossEntropyLoss(ignore_index=target_vocab["<pad>"])

# Training loop
def train(model, dataloader, optimizer, criterion):
model.train()
epoch_loss = 0
for batch in dataloader:
src, tgt = zip(*batch)
src, tgt = torch.nn.utils.rnn.pad_sequence(src,␣
↪padding_value=source_vocab["<pad>"], batch_first=True), \

torch.nn.utils.rnn.pad_sequence(tgt,␣
↪padding_value=target_vocab["<pad>"], batch_first=True)

src, tgt = src.to(device), tgt.to(device)

optimizer.zero_grad()
output = model(src, tgt)

output_dim = output.shape[-1]
output = output[:, 1:].reshape(-1, output_dim)
tgt = tgt[:, 1:].reshape(-1)

loss = criterion(output, tgt)

loss.backward()
optimizer.step()
epoch_loss += loss.item()
return epoch_loss / len(dataloader)

# Training epochs
for epoch in range(10):
loss = train(model, dataloader, optimizer, criterion)
print(f'Epoch {epoch+1}, Loss: {loss:.4f}')

Epoch 1, Loss: 2.0400

Epoch 2, Loss: 1.8393
Epoch 3, Loss: 1.5252
Epoch 4, Loss: 1.2470
Epoch 5, Loss: 0.8623
Epoch 6, Loss: 0.5609
Epoch 7, Loss: 0.4295
Epoch 8, Loss: 0.1870
Epoch 9, Loss: 0.2638
Epoch 10, Loss: 0.1014

RNN Text Generation
No ratings yet
RNN Text Generation
3 pages
Cs 224N: Assignment #4: 1. Neural Machine Translation With Rnns (45 Points)
No ratings yet
Cs 224N: Assignment #4: 1. Neural Machine Translation With Rnns (45 Points)
10 pages
EncoderDecoderSeq2Seq DeepLSTM
100% (1)
EncoderDecoderSeq2Seq DeepLSTM
7 pages
NLP 4
No ratings yet
NLP 4
10 pages
GPT2 From Scratch in PyTorch
No ratings yet
GPT2 From Scratch in PyTorch
13 pages
Neural Machine Translation Assignment
No ratings yet
Neural Machine Translation Assignment
11 pages
Project Source
No ratings yet
Project Source
21 pages
A4
No ratings yet
A4
8 pages
NLP
No ratings yet
NLP
15 pages
Deep Learning Lab Manual With Code
No ratings yet
Deep Learning Lab Manual With Code
10 pages
CS 224n: NMT Assignment Guide
No ratings yet
CS 224n: NMT Assignment Guide
7 pages
Transformers Torch
No ratings yet
Transformers Torch
38 pages
AI Lab6
No ratings yet
AI Lab6
22 pages
Language Translation With NN - Transformer and Torchtext - PyTorch Tutorials 2.3.0+cu121 Documentation
No ratings yet
Language Translation With NN - Transformer and Torchtext - PyTorch Tutorials 2.3.0+cu121 Documentation
8 pages
Medical Text Classifier GabrieldeOlaguibel
No ratings yet
Medical Text Classifier GabrieldeOlaguibel
12 pages
Transformers Implementations 1731410319
No ratings yet
Transformers Implementations 1731410319
10 pages
Assignment 7
No ratings yet
Assignment 7
10 pages
Natural Language Processing Lab 9
No ratings yet
Natural Language Processing Lab 9
13 pages
Encoder-Decoder Machine Translation
No ratings yet
Encoder-Decoder Machine Translation
6 pages
Differ - Blog-Heres How You Can Build and Train GPT-2 From Scratch Using PyTorch
No ratings yet
Differ - Blog-Heres How You Can Build and Train GPT-2 From Scratch Using PyTorch
13 pages
The Illustrated Transformer - Jay Alammar - Visualizing Machine Learning One Concept at A Time - .Booklet
No ratings yet
The Illustrated Transformer - Jay Alammar - Visualizing Machine Learning One Concept at A Time - .Booklet
14 pages
Lab 5
No ratings yet
Lab 5
7 pages
DL 7 The
No ratings yet
DL 7 The
134 pages
Assingment-3 NLP
No ratings yet
Assingment-3 NLP
5 pages
Assignment 1
No ratings yet
Assignment 1
7 pages
LLM Code Ref
No ratings yet
LLM Code Ref
10 pages
Exp 8 Machine Translation
No ratings yet
Exp 8 Machine Translation
11 pages
DAA FinalReport
No ratings yet
DAA FinalReport
14 pages
Seq2Seq Neural Machine Translation
No ratings yet
Seq2Seq Neural Machine Translation
57 pages
DL Notations
No ratings yet
DL Notations
5 pages
Report
No ratings yet
Report
13 pages
XCS224N Assignment 4 Neural Machine Translation With Rnns
No ratings yet
XCS224N Assignment 4 Neural Machine Translation With Rnns
10 pages
RNN LSTM From Scratch - Ipynb
No ratings yet
RNN LSTM From Scratch - Ipynb
55 pages
NLP Assignment 2
No ratings yet
NLP Assignment 2
3 pages
Emotion Dect
No ratings yet
Emotion Dect
4 pages
Deep Learning PGM 1
No ratings yet
Deep Learning PGM 1
6 pages
Chap 7.1 Sequence Analysis Using FFN
No ratings yet
Chap 7.1 Sequence Analysis Using FFN
47 pages
Lab 8
No ratings yet
Lab 8
2 pages
M5 Topic 1 - Encoder Decoder
No ratings yet
M5 Topic 1 - Encoder Decoder
21 pages
PyTorch Transformer Model Guide
No ratings yet
PyTorch Transformer Model Guide
2 pages
01 Pytorch Workflow - Ipynb
No ratings yet
01 Pytorch Workflow - Ipynb
73 pages
Bahdanau Attention Mechanism (Also Known As Additive Attention)
No ratings yet
Bahdanau Attention Mechanism (Also Known As Additive Attention)
41 pages
CM-Sentence Generation Proposal
No ratings yet
CM-Sentence Generation Proposal
8 pages
LLM Report
No ratings yet
LLM Report
6 pages
Chatbot Agri
No ratings yet
Chatbot Agri
7 pages
Speech
No ratings yet
Speech
13 pages
Summaries of The Chapters
No ratings yet
Summaries of The Chapters
29 pages
Lecture Notes - Advanced Language Model - BERT, GPT
No ratings yet
Lecture Notes - Advanced Language Model - BERT, GPT
24 pages
Bert
No ratings yet
Bert
2 pages
Astro AI
No ratings yet
Astro AI
20 pages
AE556 2024 Topic7 Transformer
No ratings yet
AE556 2024 Topic7 Transformer
49 pages
IndicTrans2 PDF to Punjabi Docx Conversion
No ratings yet
IndicTrans2 PDF to Punjabi Docx Conversion
5 pages
LLM Fine Tune
No ratings yet
LLM Fine Tune
11 pages
Polynomial Expansion Paper
No ratings yet
Polynomial Expansion Paper
4 pages
Set A
No ratings yet
Set A
20 pages
Chapter 3
No ratings yet
Chapter 3
14 pages
DL Programs
No ratings yet
DL Programs
13 pages
Lesson 14 - Transformer
No ratings yet
Lesson 14 - Transformer
124 pages
Obst
No ratings yet
Obst
11 pages
A Steganography Scheme On JPEG Compressed Cover Image With High Embedding Capacity
No ratings yet
A Steganography Scheme On JPEG Compressed Cover Image With High Embedding Capacity
23 pages
Sorting Algorithm
No ratings yet
Sorting Algorithm
65 pages
Topic: Operator Precedence Parsing (3 Sep)
No ratings yet
Topic: Operator Precedence Parsing (3 Sep)
3 pages
Esdat Unit 2 Activity 2
No ratings yet
Esdat Unit 2 Activity 2
4 pages
The Binary Search Algorithm: in Structured Flowchart Form Implemented in Both C/C++ and Java
No ratings yet
The Binary Search Algorithm: in Structured Flowchart Form Implemented in Both C/C++ and Java
10 pages
Predicting Results of Brazilian Soccer League Matches: University of Wisconsin-Madison
No ratings yet
Predicting Results of Brazilian Soccer League Matches: University of Wisconsin-Madison
13 pages
Simplex Method
No ratings yet
Simplex Method
5 pages
Etsi Es 202 050
No ratings yet
Etsi Es 202 050
45 pages
13 Unsupervised Learning
No ratings yet
13 Unsupervised Learning
9 pages
Important Questions
No ratings yet
Important Questions
4 pages
CSCI 5521 Spring 2025 Final Exam
No ratings yet
CSCI 5521 Spring 2025 Final Exam
8 pages
Transformer - Ipynb - Colab
No ratings yet
Transformer - Ipynb - Colab
5 pages
Gradient Leakage Attacks in Federated Learning - Research Frontiers, Taxonomy and Future Directions
No ratings yet
Gradient Leakage Attacks in Federated Learning - Research Frontiers, Taxonomy and Future Directions
8 pages
Digital Signal Processing With MATLAB / Simulink: Ryan D. Reas
No ratings yet
Digital Signal Processing With MATLAB / Simulink: Ryan D. Reas
59 pages
ANN Example
No ratings yet
ANN Example
10 pages
Python - How To Find The Exact Intersection of A Curve (As NP - Array) With y 0 - Stack Overflow
No ratings yet
Python - How To Find The Exact Intersection of A Curve (As NP - Array) With y 0 - Stack Overflow
4 pages
MathFilters: Analog Filter Design Tool
No ratings yet
MathFilters: Analog Filter Design Tool
5 pages
DSP PPT-1
100% (1)
DSP PPT-1
25 pages
DSP Lab Sample Viva Questions
No ratings yet
DSP Lab Sample Viva Questions
7 pages
Adgenpsf
No ratings yet
Adgenpsf
63 pages
Topic 2 Structures and Strategies For
No ratings yet
Topic 2 Structures and Strategies For
68 pages
Kuliah 2 Sistem Digital - 21
No ratings yet
Kuliah 2 Sistem Digital - 21
39 pages
Chapter 5 Sorting
No ratings yet
Chapter 5 Sorting
8 pages
HND Questions
100% (1)
HND Questions
6 pages
Lösungen Zu Den Exercises AI Python
No ratings yet
Lösungen Zu Den Exercises AI Python
26 pages
Assignment Comp
No ratings yet
Assignment Comp
2 pages
Introduction To Time Series Analysis
No ratings yet
Introduction To Time Series Analysis
17 pages
Lecture 17 Properties of Fourier Transform
No ratings yet
Lecture 17 Properties of Fourier Transform
6 pages
Review of Machine Learning Models For WinLoss Prediction in League of Legends
No ratings yet
Review of Machine Learning Models For WinLoss Prediction in League of Legends
7 pages

Assignment 9

Uploaded by

Assignment 9

Uploaded by

assignment-9

November 12, 2024

[2]: import torch

# Sample parallel sentences for demonstration (replace with actual data)

# Vocabulary building function

# Build vocabulary for source and target languages

# Prepare data for training

for src, tgt in zip(source_sentences, target_sentences)]

# Define Dataset and DataLoader

def __getitem__(self, idx):

def forward(self, src):

def forward(self, hidden, encoder_outputs):

# Decoder model with attention

def forward(self, tgt, hidden, cell, encoder_outputs):

# Seq2Seq model combining encoder and decoder

def forward(self, src, tgt):

# Hyperparameters and model initialization

encoder = Encoder(INPUT_DIM, EMB_DIM, HIDDEN_DIM, N_LAYERS)

src, tgt = src.to(device), tgt.to(device)

loss = criterion(output, tgt)

Epoch 1, Loss: 2.0400

You might also like

def getitem(self, idx):