Méthodologie

Comment eCompatible calcule ses recommandations

Cette page documente les règles utilisées pour enrichir les fiches GPU : compatibilité IA locale, alimentation, boîtiers et recommandations CPU. Les formules sont volontairement simples, vérifiables et affichées avec leurs limites.

Compatibilité IA locale

Pour les modèles LLM, l’estimation VRAM additionne le poids des paramètres, le cache KV, la mémoire d’activation et une marge système de 1 Go. Le cache KV tient compte de la Grouped Query Attention quand le modèle expose un nombre de têtes KV inférieur au nombre de têtes d’attention.

VRAM = paramètres × bytes/paramètre
     + KV cache(n_layers, hidden_size, n_kv_heads, contexte)
     + mémoire d’activation
     + 1 Go de marge système

Les valeurs affichées sont des fourchettes estimées, recoupées avec des sources communautaires, des tailles de modèles et la formule interne. Elles ne sont pas des mesures ponctuelles garanties.

En pratique, le poids des tenseurs donne l’ordre de grandeur. Une quantification Q4_K_M tourne autour de 4,8-4,9 bits par paramètre sur une référence 8B, soit environ 0,6 octet. Dans les faits, le ratio effectif varie selon l’architecture, les tenseurs conservés en précision supérieure et les métadonnées GGUF.

Le calculateur interne retient une moyenne légèrement conservatrice de 0,55 octet par paramètre, puis recoupe le résultat avec les fourchettes sourcées. À ces ratios, un modèle 24B représente de l’ordre de 13 à 15 Go de poids brut avant cache KV, buffers runtime et overhead CUDA/ROCm : sur une carte 16 Go, un cas limite plutôt qu’un usage confortable. L’ordre de grandeur Q4_K_M suit le tableau publié par llama.cpp.

Pour un modèle 70B en Q4_K_M, le poids seul avoisine 39 à 43 Go selon le modèle. Une carte 24 Go ne peut pas contenir le modèle entièrement en VRAM : il faut offloader une partie en RAM système, ce qui ralentit fortement la génération parce que les données traversent le bus PCIe à chaque token.

Pour les modèles image, FLUX.1 dev FP8 illustre la même logique : le modèle principal approche 12 Go, mais l’encodeur texte, le VAE et les buffers de génération ajoutent plusieurs Go. 12 Go impose généralement de l’offload ; 16 Go est fonctionnel mais tendu ; 24 Go donne une marge beaucoup plus confortable.

La VRAM réelle peut varier d’environ 20 % selon le backend utilisé (llama.cpp, Ollama, vLLM, ComfyUI), la taille de contexte, le format du cache KV (FP16 ou quantifié) et les optimisations mémoire activées. La tolérance de 15 % sert de garde-fou interne pour détecter les écarts entre la formule et les fourchettes communautaires.

Encodage et décodage vidéo

Le bloc média GPU est dérivé d’une table de vérité relue par carte, puis reproduit par règles à partir de l’architecture et des exceptions connues. Les champs affichés se limitent aux signaux utiles : encodage AV1, décodage AV1, encodage H.265/HEVC et nombre d’encodeurs NVENC quand il est explicitement documenté.

Une carte peut être masquée si la source est trop faible ou si le SKU n’est pas confirmé. La section indique la présence d’un encodeur ou décodeur matériel, pas une équivalence de qualité entre NVIDIA, AMD et Intel à bitrate identique.

Alimentation recommandée

La recommandation part du TGP officiel de la carte. Le calcul retient la plus grande valeur entre 1,5 × TGP et le pic transitoire sourcé quand il existe, puis ajoute 200 W pour le reste de la machine. Le résultat est arrondi au palier d’alimentation standard supérieur.

La mention ATX 3.x n’est ajoutée que pour les cartes à connecteur 12VHPWR/12V-2x6 ou à forts pics transitoires documentés. Elle indique une marge de compatibilité et de câblage, pas une obligation universelle pour toutes les configurations.

Compatibilité boîtier

La matrice boîtier compare la longueur de référence du GPU et son épaisseur en slots avec les dimensions internes de dix boîtiers de référence. Une marge de longueur faible ou une épaisseur proche de la limite déclenche un verdict prudent.

Les longueurs affichées correspondent au design de référence. Les versions personnalisées par les partenaires peuvent être nettement plus longues ; le modèle exact reste à vérifier avant achat. La largeur sert d’indication, mais eCompatible ne rend pas de verdict dur sur la clearance latérale ni sur le pli du câble 12VHPWR/12V-2x6.

Recommandation CPU

La recommandation CPU est dérivée des données de bottleneck internes : le minimum raisonnable est le CPU le moins puissant dont le bottleneck reste sous 12 % à la résolution demandée. Le sweet spot est le CPU le moins puissant sous 5 %. Aucun prix n’est utilisé dans cette règle.

Mise à jour

Les données sources utilisées par les pages enrichies sont vérifiées au moins une fois par trimestre. Une section peut être masquée si la source datée manque ou si la donnée n’est pas suffisamment vérifiable.