
Installe une IA en local : gratuite, privée, sans abonnement (Guide Complet)
Audio Summary
AI Summary
Les prix des IA explosent, les abonnements mensuels deviennent limités et l'utilisation sérieuse d'API coûte cher. Pour contourner cela, l'auteur propose de faire tourner une IA en local sur sa propre machine, garantissant ainsi une confidentialité à 100%, une rapidité et une indépendance totale. Cette vidéo a pour but d'expliquer l'installation de ces IA de manière détaillée, en clarifiant chaque concept pour permettre une adaptation à n'importe quelle configuration matérielle, actuelle ou future.
Avant de télécharger quoi que ce soit, il est crucial de comprendre comment fonctionnent les modèles d'IA sur une machine locale. Deux éléments principaux déterminent la faisabilité et l'efficacité de l'installation : les paramètres et le contexte.
Les **paramètres** sont représentés par un nombre suivi de "B" (billion), indiquant des milliards. Par exemple, un modèle 7B possède 7 milliards de paramètres. Certains modèles peuvent atteindre des centaines de milliards, voire plus. Chaque paramètre peut être vu comme un bouton de réglage dans le "cerveau" du modèle, ajusté lors de l'entraînement pour acquérir des connaissances. Plus un modèle a de paramètres, plus il est capable de nuances, de raisonnement et de connaissances, mais plus il est lourd et nécessite de ressources pour fonctionner. En résumé : plus de paramètres = plus intelligent, mais aussi plus lourd.
Le **contexte** représente la quantité d'informations que le modèle peut retenir simultanément. Il est souvent mesuré en "tokens". Une fenêtre de contexte plus grande permet au modèle de traiter et de retenir plus d'informations (code, documents, messages) à la fois, ce qui réduit les oublis et améliore l'efficacité sur les tâches longues. Un contexte trop petit peut entraîner une perte de fil dans la conversation. Avant de choisir un modèle, il faut donc considérer le nombre de paramètres et la taille de contexte souhaitée, car ces deux éléments déterminent la taille du modèle sur la machine.
Le lieu où tourne le modèle est le **GPU (carte graphique)**. Les caractéristiques importantes d'un GPU pour l'IA sont sa vitesse, son nombre de cœurs, et surtout sa **VRAM (Video RAM)**, la mémoire dédiée à la carte