Il y a plusieurs années j’ai acheté une carte graphique. J’avais jeté mon dévolu sur une puce spécifique (AMD Radeon puisque sous Linux c’est ce qui marche le mieux avec du code libre) puis comparé les modèles des fabricants pour choisir le plus performante (pour le prix).
J’ai eu rapidement divers crash ou freeze complets dans certaines applications. J’ai cherché longtemps le problème. Etait-ce du à l’application? A l’OS ? Au GPU ? A l’alimentation? A la mémoire? On trouve plein de rapport de bugs sur des crash Linux dont j’ai eu l’expérience :
- Bug [amdgpu]] *ERROR* ring gfx timeout or [vega10] *ERROR* Failed to initialize parser -125!
- Bug #935030 linux: radeon GPU freeze on 4.19(buster) but not on 5.2(unstable)
- Bug #928146: (libdrm-amdgpu1: GPU hang)
- Bug #927948: xwayland: GPU hang on OpenGL apps with Wayland
Mais aussi plein de rapports de crash dans certaines applications spécifiques Windows.
Vu que j’ai les 2 OS et des problèmes dans les 2 (mais pas dans les mêmes proportions), j’en suis arrivé à la conclusion que le problème n’était pas spécifique qu’à Linux. Mais sous Linux, quand le GPU plante, il n’y a pas de mécanisme de reset propre qui fait qu’on récupère son bureau contrairement à Windows.
J’avais trouvé une parade (relative) en diminuant logiciellement la vitesse d’horloge du GPU. Cela rendait les crashs beaucoup moins nombreux mais dans certaines applications j’en avais toujours. Et puis quand j’ai changé d’écran et pouvait afficher plus de 60FPS, les crashs sont revenus.
J’en ai déduit que les crashs étaient en quelque sorte liés à la charge du GPU. Qu’il me fallait un moyen d’avoir une fréquence de fonctionnement plus stable. Et c’est alors que j’ai découvert cela :
En fait, les cartes gaming sont vendues dans un mode overclockées pour se différencier des concurrents sur les benchmarks. Mais cette fréquence est bien éloignée des spécifications du fabricant de la puce.
On va trouver une Radeon 5700 XT vendue à 1935Mhz quand la spécification AMD indique 1755Mhz.
Sauf qu’en fait dans ce mode, la carte n’est pas stable et peut crasher. Et comme par hasard, on vous propose un mode « silencieux » qui respecte, lui, la spécification AMD. Et ce mode s’active en changeant le BIOS de la carte (qui gère les fréquences de fonctionnement) par le bouton de la photo ci dessus !
Donc voici mon conseil, regardez si vous avez une carte overclockée et essayer de revenir aux réglages du fabricant de la puce (le fameux mode « silencieux »). Ne gaspillez pas votre argent dans une carte « overclockée » si c’est pour qu’elle plante dans votre application favorite.
Dites moi si cela a résolu votre problème également :-)
t’as abandonné le projet my search c’est bien dommage.
https://search.jesuislibre.net/