Transformers [WIP]

May 30, 2025

by Noel Thomas, Founder

[N_V] := \{1, ..., N_V\}

Low-Rank Adaptation for Efficient LLM Fine-Tuning

June 24, 2025

How LoRA enables parameter-efficient training of large language models.

Vector Databases for Retrieval-Augmented Generation

June 23, 2025

How vector search engines speed up context retrieval for large language models.

Tell us about your project

Say Hey

Our offices

Calgary
Alberta, Canada
(587) 700-9968
Montreal
Quebec, Canada
(825) 365-9891

Our offices

Follow us

Transformers [WIP]

Motivation

Introduction

The "Attention is All You Need" Transformer

Embedding

Chunking

Tokenization

Token Embedding Algorithm

Positional Encoding

Positional Embedding Algorithm

Stage 1: Attention

Stage 1.1: Multi-Head Self-Attention (MHSA)

Stage 2: Feed Forward Network

Putting it together

Residual Connections

Token Normalization

More articles

Low-Rank Adaptation for Efficient LLM Fine-Tuning

Vector Databases for Retrieval-Augmented Generation

Tell us about your project

Our offices

Motivation

Introduction

The "Attention is All You Need" Transformer

Embedding

Chunking

Tokenization

Token Embedding Algorithm

Positional Encoding

Positional Embedding Algorithm

Stage 1: Attention

Stage 1.1: Multi-Head Self-Attention (MHSA)

Stage 2: Feed Forward Network

Putting it together

Residual Connections

Token Normalization

Footnotes

More articles

Low-Rank Adaptation for Efficient LLM Fine-Tuning

Vector Databases for Retrieval-Augmented Generation

Tell us about your project

Our offices