20 avril 2026 7 min de lecture C'est quoi l'inférence ? On découvre la deuxième vie d'un modèle IA, l'inférence, et les enjeux qui y sont liés. llm souverainete gpu inference self-hosted
14 avril 2026 11 min de lecture Fini OpenAI : LLM maison sur un GPU On a remplacé l'API OpenAI pour tout un labo universitaire. Coût : un GPU de 30W et zéro dépendance cloud. llm souverainete gpu inference self-hosted