makhal.fr

Posts

Séries

Bio

Tags

menu

Posts
Séries
Bio
Tags

inference

2026

27 avril 2026 9 min de lecture

L'inférence, c'est un problème de mémoire

Et si la source de tous nos problemes n'est pas le computing qu'on dispose, mais la mémoire ? On decouvre ce que c'est la VRAM et compagnie

llm inference self-hosted architecture

20 avril 2026 7 min de lecture

C'est quoi l'inférence ?

On découvre la deuxième vie d'un modèle IA, l'inférence, et les enjeux qui y sont liés.

llm souverainete gpu inference self-hosted

14 avril 2026 11 min de lecture

Fini OpenAI : LLM maison sur un GPU

On a remplacé l'API OpenAI pour tout un labo universitaire. Coût : un GPU de 30W et zéro dépendance cloud.

llm souverainete gpu inference self-hosted

© 2026 makhal.fr