Encoder-Decoder with Attention

English → French neural machine translation built from scratch in CuPy.

Architecture

Encoder: 2-layer bidirectional GRU
Decoder: 2-layer GRU with Bahdanau attention
Tokenization: BPE (1000 merges)
Optimizer: Adam with gradient clipping
Implementation: Pure CuPy (no PyTorch/TensorFlow)

All layers, backpropagation, and attention mechanisms implemented manually.

What I Learned

Implementing GRU cells and recurrent backpropagation through time
Building attention mechanisms from scratch (projection, alignment scoring, context vectors)
Manual gradient computation for complex architectures
BPE tokenization and optimization (reduced O(n²) complexity with caching)
Training dynamics: gradient clipping, learning rate scheduling, checkpoint management
GPU programming with CuPy for deep learning primitives

Pipeline

1. Prepare Data

python -m src.data

Downloads fra-eng corpus, trains BPE, builds vocabularies, and preprocesses ~163k sentence pairs.

2. Train Model

python -m src.train

Trains for 5000 iterations (~20-30 min on GPU). Saves checkpoints to models/seq2seq.pkl.

3. Evaluate

python -m src.eval

Translates test phrases using the trained model.

Requirements

pip install numpy cupy d2l torch

Requires CUDA-compatible GPU.

Name		Name	Last commit message	Last commit date
Latest commit History 30 Commits
src		src
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Encoder-Decoder with Attention

Architecture

What I Learned

Pipeline

1. Prepare Data

2. Train Model

3. Evaluate

Requirements

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Encoder-Decoder with Attention

Architecture

What I Learned

Pipeline

1. Prepare Data

2. Train Model

3. Evaluate

Requirements

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages