In-Context Learning vs Fine-Tuning (LoRA) Comparison

A comprehensive study comparing In-Context Learning (ICL) and Parameter-Efficient Fine-Tuning (LoRA) approaches using Llama 3.2 1B for multilingual summarization tasks.

Project Overview

This project evaluates the effectiveness of two different approaches to adapt large language models for specific tasks:

In-Context Learning (ICL): Few-shot prompting with examples provided in the context
Fine-Tuning with LoRA: Parameter-efficient fine-tuning using Low-Rank Adaptation

The study covers three language configurations:

English: English-only summarization
French: French-only summarization
Crosslingual: Mixed English and French training data

Project Structure

├── main.py                          # Main script for ICL inference with few-shot prompting
├── finetune.py                      # Fine-tuning script using LoRA adapters
├── evaluate_finetuned.py            # Evaluation script for fine-tuned models
├── download_model.py                # Utility to download base model from HuggingFace
├── upload_model.py                  # Utility to upload trained models to HuggingFace
├── metrics.py                       # ROUGE and BERTScore calculation
├── config.py                        # Configuration and token management
├── utils.py                         # Helper functions and prompts
├── data/
│   ├── train.csv, val.csv, test.csv         # English dataset
│   ├── train_fr.csv, val_fr.csv, test_fr.csv # French dataset
│   ├── train_cross.csv, val_cross.csv, test_cross.csv # Crosslingual dataset
│   └── download_data.py             # Data download utility
└── requirements.txt                 # Python dependencies

Installation

Prerequisites

Python 3.10+
CUDA-capable GPU (recommended for fast training/inference)
HuggingFace API token for model access

Setup

Clone or download the project files
Install dependencies:

pip install -r requirements.txt

Set up environment variables in a .env file:

HUGGINGFACE_TOKEN=your_token_here

Activate your conda environment (if using conda):

conda activate deeplearning

Usage

In-Context Learning (Few-Shot Prompting)

Run the main script to evaluate ICL performance with different numbers of shots:

python main.py --task_type english --k_shots 5 
python main.py --task_type french --k_shots 5 
python main.py --task_type crosslingual --k_shots 5

Arguments:

--task_type: Task type (english, french, or crosslingual)
--k_shots: Number of few-shot examples (default: 0)

Fine-Tuning with LoRA

Train LoRA adapters on specific language configurations:

python finetune.py --finetune_type english --num_samples 1000
python finetune.py --finetune_type french --num_samples 1000
python finetune.py --finetune_type crosslingual --num_samples 1000

Arguments:

--finetune_type: Type of fine-tuning (english, french, or crosslingual)
--num_samples: Number of training samples to use (default: all samples)
--push_to_hub: Upload trained adapter to HuggingFace (optional)

Evaluating Fine-Tuned Models

Pre-trained LoRA adapters are available on HuggingFace at shauryagoyall. Download and evaluate them:

python evaluate_finetuned.py --adapter_path shauryagoyall/llama-3.2-1b-english-1000samples --task_type english
python evaluate_finetuned.py --adapter_path shauryagoyall/llama-3.2-1b-french-5000samples --task_type french
python evaluate_finetuned.py --adapter_path shauryagoyall/llama-3.2-1b-crosslingual-1000samples --task_type crosslingual

Arguments:

--adapter_path: Path to LoRA adapter
--task_type: Task type for evaluation
--quantize: Use 4-bit quantization (default: True)

Evaluation Metrics

The project uses the following evaluation metrics:

ROUGE-1, ROUGE-2, ROUGE-L: N-gram overlap metrics for summarization quality
BERTScore: Contextual similarity using pre-trained BERT models with language-specific variants

Results are saved to rouge_results.csv with columns:

Model name
Experiment type (ICL/Fine-tuning)
Dataset name
ROUGE-1, ROUGE-2, ROUGE-L, BERT-F1 scores

Model Configuration

Base Model: Meta-Llama-3.2-1B-Instruct
Quantization: 4-bit (BitsAndBytes) for efficient memory usage
LoRA Configuration: Rank=16, Alpha=32, Target modules=all linear layers
Max Sequence Length: 2048 tokens

Results

Results are automatically saved to rouge_results.csv after each evaluation. The file contains:

Performance metrics for each configuration
Comparison between ICL and fine-tuned approaches
Results across different dataset sizes (1000 and 5000 samples)

Contact

For questions or issues, please refer to the project documentation or contact the project maintainer.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

In-Context Learning vs Fine-Tuning (LoRA) Comparison

Project Overview

Project Structure

Installation

Prerequisites

Setup

Usage

In-Context Learning (Few-Shot Prompting)

Fine-Tuning with LoRA

Evaluating Fine-Tuned Models

Evaluation Metrics

Model Configuration

Results

Contact

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 33 Commits
.vscode		.vscode
data		data
.DS_Store		.DS_Store
.gitattributes		.gitattributes
.gitignore		.gitignore
README.md		README.md
config.py		config.py
download_model.py		download_model.py
evaluate_finetuned.py		evaluate_finetuned.py
finetune.py		finetune.py
main.py		main.py
metrics.py		metrics.py
requirements.txt		requirements.txt
rouge_results.csv		rouge_results.csv
upload_model.py		upload_model.py
utils.py		utils.py

Folders and files

Latest commit

History

Repository files navigation

In-Context Learning vs Fine-Tuning (LoRA) Comparison

Project Overview

Project Structure

Installation

Prerequisites

Setup

Usage

In-Context Learning (Few-Shot Prompting)

Fine-Tuning with LoRA

Evaluating Fine-Tuned Models

Evaluation Metrics

Model Configuration

Results

Contact

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages