27 avril 2026 9 min de lecture L'inférence, c'est un problème de mémoire Et si la source de tous nos problemes n'est pas le computing qu'on dispose, mais la mémoire ? On decouvre ce que c'est la VRAM et compagnie llm inference self-hosted architecture
20 avril 2026 7 min de lecture C'est quoi l'inférence ? On découvre la deuxième vie d'un modèle IA, l'inférence, et les enjeux qui y sont liés. llm souverainete gpu inference self-hosted
14 avril 2026 11 min de lecture Fini OpenAI : LLM maison sur un GPU On a remplacé l'API OpenAI pour tout un labo universitaire. Coût : un GPU de 30W et zéro dépendance cloud. llm souverainete gpu inference self-hosted