0% found this document useful (0 votes)

26 views6 pages

PLC - Codegen - Codelama - Ipynb - Colab

The document outlines the process of setting up a Google Colab notebook for training a model using the CodeLlama framework, including installing necessary libraries and preparing a dataset. It details the tokenization of the dataset and the configuration of a model with 4-bit quantization settings. Additionally, it addresses an error encountered during model loading related to GPU memory and provides a prompt for generating code from the fine-tuned model.

Uploaded by

vaishnavimahindrakar2004

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

26 views6 pages

PLC - Codegen - Codelama - Ipynb - Colab

Uploaded by

vaishnavimahindrakar2004

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 6

2/27/25, 11:59 PM PLC_codeGen_codelama.

ipynb - Colab

pip install transformers accelerate torch datasets peft bitsandbytes

https://colab.research.google.com/drive/1p58RwOA0-k0Gq5edNOY6mFis61SBuyae#scrollTo=h40RpyaynDYP&printMode=true 1/6
2/27/25, 11:59 PM PLC_codeGen_codelama.ipynb - Colab
Success u y u sta ed d a cuda cupt cu .5.8
Attempting uninstall: nvidia-cublas-cu12
Found existing installation: nvidia-cublas-cu12 12.5.3.2
Uninstalling nvidia-cublas-cu12-12.5.3.2:
Successfully uninstalled nvidia-cublas-cu12-12.5.3.2
Attempting uninstall: nvidia-cusparse-cu12
Found existing installation: nvidia-cusparse-cu12 12.5.1.3
Uninstalling nvidia-cusparse-cu12-12.5.1.3:
Successfully uninstalled nvidia-cusparse-cu12-12.5.1.3
Attempting uninstall: nvidia-cudnn-cu12
Found existing installation: nvidia-cudnn-cu12 9.3.0.75
Uninstalling nvidia-cudnn-cu12-9.3.0.75:
Successfully uninstalled nvidia-cudnn-cu12-9.3.0.75
Attempting uninstall: nvidia-cusolver-cu12
Found existing installation: nvidia-cusolver-cu12 11.6.3.83
Uninstalling nvidia-cusolver-cu12-11.6.3.83:
Successfully uninstalled nvidia-cusolver-cu12-11.6.3.83
Successfully installed bitsandbytes-0.45.3 datasets-3.3.2 dill-0.3.8 multiprocess-0.70.16 nvidia-cublas-cu12-12.4.5.8 nvidia-cuda-cupt

from datasets import Dataset

from transformers import AutoTokenizer

# Load CSV dataset

import pandas as pd

df = pd.read_csv("dataset.csv")

# Load tokenizer
model_name = "codellama/CodeLlama-7b-hf"
tokenizer = AutoTokenizer.from_pretrained(model_name)

# 🚨 FIX: Assign padding token explicitly

tokenizer.pad_token = tokenizer.eos_token # Use EOS token for padding

# Tokenize dataset
def tokenize_function(examples):
inputs = tokenizer(
examples["name"], truncation=True, padding="max_length", max_length=512
)
targets = tokenizer(

https://colab.research.google.com/drive/1p58RwOA0-k0Gq5edNOY6mFis61SBuyae#scrollTo=h40RpyaynDYP&printMode=true 2/6
2/27/25, 11:59 PM PLC_codeGen_codelama.ipynb - Colab
examples["code"], truncation=True, padding="max_length", max_length=512
)

return {
"input_ids": inputs["input_ids"],
"attention_mask": inputs["attention_mask"],
"labels": targets["input_ids"], # Expected output
}

# Convert Pandas DataFrame to Hugging Face Dataset

dataset = Dataset.from_pandas(df)

# Apply tokenization
dataset = dataset.map(tokenize_function, batched=True, remove_columns=["name", "code"])

# Split dataset into training and validation sets

dataset = dataset.train_test_split(test_size=0.1)

print("✅ Dataset successfully tokenized and prepared!")

Map: 100% 50/50 [00:00<00:00, 449.15 examples/s]

✅ Dataset successfully tokenized and prepared!

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig

# Define 4-bit quantization settings

bnb_config = BitsAndBytesConfig(
load_in_4bit=True,
bnb_4bit_quant_type="nf4",
bnb_4bit_use_double_quant=True,
bnb_4bit_compute_dtype=torch.float16
)

model_name = "codellama/CodeLlama-7b-hf"

# Load tokenizer
tokenizer = AutoTokenizer.from_pretrained(model_name)
https://colab.research.google.com/drive/1p58RwOA0-k0Gq5edNOY6mFis61SBuyae#scrollTo=h40RpyaynDYP&printMode=true 3/6
2/27/25, 11:59 PM PLC_codeGen_codelama.ipynb - Colab

# Free GPU memory before loading

torch.cuda.empty_cache()

from accelerate import infer_auto_device_map

device_map = infer_auto_device_map(model, max_memory={0: "12GiB", "cpu": "20GiB"})

model = AutoModelForCausalLM.from_pretrained(
model_name,
quantization_config=bnb_config,
device_map=device_map,
torch_dtype=torch.float16,
)

print("✅ Model loaded successfully on Google Colab's T4 GPU!")

---------------------------------------------------------------------------
ValueError Traceback (most recent call last)
<ipython-input-18-dfc82b45ae0f> in <cell line: 0>()
21 device_map = infer_auto_device_map(model, max_memory={0: "12GiB", "cpu": "20GiB"})
22
---> 23 model = AutoModelForCausalLM.from_pretrained(
24 model_name,
25 quantization_config=bnb_config,

2 frames
/usr/local/lib/python3.11/dist-packages/transformers/quantizers/quantizer_bnb_4bit.py in validate_environment(self, *args, **kwargs)
101 pass
102 elif "cpu" in device_map_without_lm_head.values() or "disk" in device_map_without_lm_head.values():
--> 103 raise ValueError(
104 "Some modules are dispatched on the CPU or the disk. Make sure you have enough GPU RAM to fit the "
105 "quantized model. If you want to dispatch the model on the CPU or the disk while keeping these modules "

ValueError: Some modules are dispatched on the CPU or the disk. Make sure you have enough GPU RAM to fit the quantized model. If you
want to dispatch the model on the CPU or the disk while keeping these modules in 32-bit, you need to set
`llm_int8_enable_fp32_cpu_offload=True` and pass a custom `device_map` to `from_pretrained`. Check
https://huggingface.co/docs/transformers/main/en/main_classes/quantization#offload-between-cpu-and-gpu for more details.

https://colab.research.google.com/drive/1p58RwOA0-k0Gq5edNOY6mFis61SBuyae#scrollTo=h40RpyaynDYP&printMode=true 4/6
2/27/25, 11:59 PM PLC_codeGen_codelama.ipynb - Colab

Next steps: Explain error

# Load fine-tuned model

tokenizer = AutoTokenizer.from_pretrained("./finetuned_codellama")
model = AutoModelForCausalLM.from_pretrained("./finetuned_codellama", torch_dtype=torch.float16, device_map="auto")

# New Prompt
prompt = "generate ladder of bottle filling system on conveyer belt"

# Tokenize input
inputs = tokenizer(prompt, return_tensors="pt").to("cuda")

# Generate code
with torch.no_grad():
outputs = model.generate(**inputs, max_new_tokens=100)

# Decode output
generated_code = tokenizer.decode(outputs[0], skip_special_tokens=True)
print(generated_code)

https://colab.research.google.com/drive/1p58RwOA0-k0Gq5edNOY6mFis61SBuyae#scrollTo=h40RpyaynDYP&printMode=true 5/6
2/27/25, 11:59 PM PLC_codeGen_codelama.ipynb - Colab

https://colab.research.google.com/drive/1p58RwOA0-k0Gq5edNOY6mFis61SBuyae#scrollTo=h40RpyaynDYP&printMode=true 6/6

Fast Llama Training Guide
No ratings yet
Fast Llama Training Guide
5 pages
Vedant@13
No ratings yet
Vedant@13
3 pages
Unsloth: Fast Llama-3 Training Guide
No ratings yet
Unsloth: Fast Llama-3 Training Guide
10 pages
Facedetection
No ratings yet
Facedetection
16 pages
PyTorch Cheat Sheet for Developers
No ratings yet
PyTorch Cheat Sheet for Developers
2 pages
Qwin Train
No ratings yet
Qwin Train
4 pages
Week 2
No ratings yet
Week 2
4 pages
Test Gpu Acceleration Pythonl
No ratings yet
Test Gpu Acceleration Pythonl
1 page
111
No ratings yet
111
3 pages
Tutorials Sources Beginner Ptcheat
No ratings yet
Tutorials Sources Beginner Ptcheat
7 pages
IndicTrans2 PDF to Punjabi Docx Conversion
No ratings yet
IndicTrans2 PDF to Punjabi Docx Conversion
5 pages
RL 3
No ratings yet
RL 3
8 pages
Finetuning
No ratings yet
Finetuning
3 pages
PyTorch Tutorial: Docs & Errors
No ratings yet
PyTorch Tutorial: Docs & Errors
15 pages
Difficulties
No ratings yet
Difficulties
9 pages
Video Api Endpoint N
No ratings yet
Video Api Endpoint N
7 pages
09 Tensorflow101 Slide
No ratings yet
09 Tensorflow101 Slide
78 pages
Deep Learning with PyTorch Guide
0% (1)
Deep Learning with PyTorch Guide
65 pages
Video Retalking Setup & Execution
No ratings yet
Video Retalking Setup & Execution
1 page
7.copy of Text To Image Generation With LLM With Hugging Face - Ipynb
No ratings yet
7.copy of Text To Image Generation With LLM With Hugging Face - Ipynb
1,156 pages
Difficulties Faced
No ratings yet
Difficulties Faced
9 pages
Crack Detection with CNN
No ratings yet
Crack Detection with CNN
8 pages
Lab 9
No ratings yet
Lab 9
29 pages
Retorno 1
No ratings yet
Retorno 1
29 pages
Deforum Stable Diffusion - Ipynb
No ratings yet
Deforum Stable Diffusion - Ipynb
12 pages
Logs
No ratings yet
Logs
2 pages
Deep Learning With PyTorch: Object Classification - Filliat Et Al
No ratings yet
Deep Learning With PyTorch: Object Classification - Filliat Et Al
3 pages
Def Set Random Seed (Seed)
No ratings yet
Def Set Random Seed (Seed)
29 pages
Improved - FCC - Cat - Dog - Ipynb - Colab
No ratings yet
Improved - FCC - Cat - Dog - Ipynb - Colab
12 pages
Linux
No ratings yet
Linux
7 pages
Ultimate Guide To Tensorflow 2.0 in Python
100% (1)
Ultimate Guide To Tensorflow 2.0 in Python
23 pages
Pytorch
No ratings yet
Pytorch
38 pages
Task VIII Quantum Vision Transformer
No ratings yet
Task VIII Quantum Vision Transformer
1 page
BasicNeuralNetwork TrainingAndEvaluation - Ipynb Colaboratory
No ratings yet
BasicNeuralNetwork TrainingAndEvaluation - Ipynb Colaboratory
2 pages
Trainrealfill
No ratings yet
Trainrealfill
19 pages
Documentation
No ratings yet
Documentation
12 pages
English To Hindi Text Translation
No ratings yet
English To Hindi Text Translation
10 pages
GPT 4o Creates and Responds To Auto Big Bench 144 Tasks 1719566767
No ratings yet
GPT 4o Creates and Responds To Auto Big Bench 144 Tasks 1719566767
6 pages
BEH41803. Using Google Colab To Train Image From Folder. Dog Vs Cat Step 1: Connect To Google Drive
No ratings yet
BEH41803. Using Google Colab To Train Image From Folder. Dog Vs Cat Step 1: Connect To Google Drive
7 pages
Tomato Leaf Disease Model
No ratings yet
Tomato Leaf Disease Model
7 pages
Wa0028.
No ratings yet
Wa0028.
5 pages
PyTorch Deep Learning Guide
No ratings yet
PyTorch Deep Learning Guide
19 pages
QuantizationLoRA Fine-Tune A 7B Model Single GPU
No ratings yet
QuantizationLoRA Fine-Tune A 7B Model Single GPU
6 pages
Credit Card Clustering Autoencoder
No ratings yet
Credit Card Clustering Autoencoder
6 pages
Install TensorFlow With Pip
No ratings yet
Install TensorFlow With Pip
5 pages
TENSORRT
No ratings yet
TENSORRT
26 pages
Ex 6
No ratings yet
Ex 6
7 pages
Aditya Joshi 23252595 Assign 5
No ratings yet
Aditya Joshi 23252595 Assign 5
7 pages
Transfer Learning & Fine Tuning Guide
No ratings yet
Transfer Learning & Fine Tuning Guide
2 pages
Predict
No ratings yet
Predict
3 pages
PyTorch Overview and Key Concepts
No ratings yet
PyTorch Overview and Key Concepts
35 pages
Hand On Day 2 Salinan - Dari - 2 - Using - Transformers
No ratings yet
Hand On Day 2 Salinan - Dari - 2 - Using - Transformers
10 pages
Pytorch Performance Tuning Guide: Szymon Migacz, 04/12/2021
No ratings yet
Pytorch Performance Tuning Guide: Szymon Migacz, 04/12/2021
20 pages
Chat-Oi QWQ! VC Pode Analisar Essa Proposta de Projeto - 1
No ratings yet
Chat-Oi QWQ! VC Pode Analisar Essa Proposta de Projeto - 1
18 pages
Paper 2
No ratings yet
Paper 2
5 pages
PyTorch ResNet50 Training Guide
No ratings yet
PyTorch ResNet50 Training Guide
55 pages
Pytorch Neural Networks Guide 1717173717
No ratings yet
Pytorch Neural Networks Guide 1717173717
17 pages
Module 1 Operation Management With TQM
No ratings yet
Module 1 Operation Management With TQM
9 pages
Canned Food Quality Factors
No ratings yet
Canned Food Quality Factors
5 pages
Novel Technologies in Food Science Book PDF
100% (1)
Novel Technologies in Food Science Book PDF
432 pages
Advanced Microsoft Access Database Course
No ratings yet
Advanced Microsoft Access Database Course
1 page
g9 Ethics Statement and Eligibility
No ratings yet
g9 Ethics Statement and Eligibility
18 pages
1.3.8 Write - Prepare A Personal Narrative (Writing Guide)
No ratings yet
1.3.8 Write - Prepare A Personal Narrative (Writing Guide)
5 pages
Aishwarya Bahirmal - Resume
No ratings yet
Aishwarya Bahirmal - Resume
2 pages
Bossy President (Official) Manga
No ratings yet
Bossy President (Official) Manga
1 page
Order,+ERC+Case+No +2014-003+RM
No ratings yet
Order,+ERC+Case+No +2014-003+RM
4 pages
15 Glossaire
100% (1)
15 Glossaire
37 pages
m400 Datasheet
No ratings yet
m400 Datasheet
7 pages
Learning Materials in Sets
No ratings yet
Learning Materials in Sets
28 pages
Single-Cell Profiling of Acral Melanoma Infiltrating Lymphocytes Reveals A Suppressive Tumor Microenvironment
No ratings yet
Single-Cell Profiling of Acral Melanoma Infiltrating Lymphocytes Reveals A Suppressive Tumor Microenvironment
17 pages
Norma Ashrae 62 1989
No ratings yet
Norma Ashrae 62 1989
3 pages
Citizen Architect Handbook
No ratings yet
Citizen Architect Handbook
50 pages
Pigeons and Doves Constitute The Bird
100% (1)
Pigeons and Doves Constitute The Bird
5 pages
Geometry of Multiple Zeta Values
No ratings yet
Geometry of Multiple Zeta Values
9 pages
Bài tập viết lại câu tiếng Anh lớp 6 HSG
No ratings yet
Bài tập viết lại câu tiếng Anh lớp 6 HSG
13 pages
Marketing Plan - Hell Crust Pizza 14.09.24
No ratings yet
Marketing Plan - Hell Crust Pizza 14.09.24
39 pages
White Label ATMs in India
No ratings yet
White Label ATMs in India
4 pages
3rdsem Remote Sensing Practical File
100% (1)
3rdsem Remote Sensing Practical File
42 pages
Dream Job
No ratings yet
Dream Job
8 pages
Buy Tyre Online, Tyre Price in India, Buy Tyres
No ratings yet
Buy Tyre Online, Tyre Price in India, Buy Tyres
6 pages
Comparing Gas Exchange 8Cd Exploring Science 8
No ratings yet
Comparing Gas Exchange 8Cd Exploring Science 8
11 pages
Mark Scheme Jan 1997 Unit-1
No ratings yet
Mark Scheme Jan 1997 Unit-1
10 pages
Advance Microprocessor Notes
No ratings yet
Advance Microprocessor Notes
45 pages
Kubernetes Native Microservices With Quarkus and MicroProfile 1st Edition John Clingan Ken Finnigan All Chapters Available
No ratings yet
Kubernetes Native Microservices With Quarkus and MicroProfile 1st Edition John Clingan Ken Finnigan All Chapters Available
125 pages
Financial Accounting Full Notes
No ratings yet
Financial Accounting Full Notes
125 pages
Position Paper Jerusalem
No ratings yet
Position Paper Jerusalem
13 pages
WINDOWS 11 SENIORS GUIDE The Most User Friendly Seniors and Beginners Manual To Learn Windows 11 S Essential Features 1st Edition Steve White
100% (2)
WINDOWS 11 SENIORS GUIDE The Most User Friendly Seniors and Beginners Manual To Learn Windows 11 S Essential Features 1st Edition Steve White
78 pages

PLC - Codegen - Codelama - Ipynb - Colab

Uploaded by

PLC - Codegen - Codelama - Ipynb - Colab

Uploaded by

2/27/25, 11:59 PM PLC_codeGen_codelama.

pip install transformers accelerate torch datasets peft bitsandbytes

from datasets import Dataset

# Load CSV dataset

# 🚨 FIX: Assign padding token explicitly

# Convert Pandas DataFrame to Hugging Face Dataset

# Split dataset into training and validation sets

print("✅ Dataset successfully tokenized and prepared!")

Map: 100% 50/50 [00:00<00:00, 449.15 examples/s]

# Define 4-bit quantization settings

# Free GPU memory before loading

from accelerate import infer_auto_device_map

print("✅ Model loaded successfully on Google Colab's T4 GPU!")

Next steps: Explain error

# Load fine-tuned model

You might also like