Le Forum de l'Alliance Francophone

Nouvelles:

Auteur Sujet: PrimeGrid  (Lu 581716 fois)

0 Membres et 3 Invités sur ce sujet

Hors ligne [AF] fansyl

  • Boinc'eur devant l'éternel
  • *****
  • Messages: 2397
  •   
Réponse #2250 le: 20 November 2017 à 21:10
Ca fait des années qu'ils précisent que les UT Genefer sont à réaliser sur des GPU sans overclocking :aulit:. Après, l'explication du pourquoi... :??:

GPUGrid fait la même recommandation, tout simplement pour éviter des UTs qui reviennent en erreur à cause de cela... je pense que certaines application GPGPU sont capables de + stresser des cartes graphiques que les jeux. Certaines utilisent bcp le bus PCIE, d'autres de la bande passante mémoire, etc...

 :hello:

Je crunche dans le silence et c'est ma joie !
Ryzen 1700X/32Go/GTX970 (sous WC) - i7-3770T/16Go/HD4000 - Ryzen 5700G/32Go/GTX1050 - Q9550/8Go/GT1030 - 3xAndroidBox S912



Hors ligne Maeda

  • Boinc'eur devant l'éternel
  • *****
  • Messages: 2470
  •   
Réponse #2251 le: 22 November 2017 à 18:44
Si ca s'apparente aux LLR CPU, ces calculs font vraiment tourner les processeurs au max, donc il faut que ce soit stable.
Il est légitime de vouloir overclocker sa carte graphique si elle ne chauffe pas beaucoup (ou si en watercooling) ; après la chauffe n'est peut-être pas la cause de l'erreur, mais plutôt une limite de fonctionnement entre les éléments mémoire/GPU/bus.

D'un autre côté, l'overclocking peut être fait sur la fréquence du GPU et/ou de la mémoire, l'un ou l'autre a pu poser problème au final, il aurait fallu tester sur les applications Genefer lançables à la main (enfin sous Linux de ce que j'ai pu tester) pour ne pas causer d'erreur d'UT.

Au final, seules les personnes ayant créées les UT pourraient définir la cause de l'erreur, mais évidemment, elles ne sont pas là pour débugger chaque GPU overclocké pour en définir le seuil overclocking stable (plutôt les vraies erreurs). "Stable" reste un grand mot car un overclocking de GPU donnant une UT en erreur sur 100, ça n'est pas stable.

Personnellement, je pars du principe que ces tests ont été faits par les constructeurs et donc eux ont perdu du temps pour définir ces seuils, pas nous ou les créateurs du code des UT. Pour les jeux ça passe, pour les vrais calculs complexes, non.


Hors ligne GuL

  • Boinc'eur devant l'éternel
  • *****
  • Messages: 2225
  •   
Réponse #2252 le: 23 November 2017 à 20:26
Si ca s'apparente aux LLR CPU, ces calculs font vraiment tourner les processeurs au max, donc il faut que ce soit stable.
Il est légitime de vouloir overclocker sa carte graphique si elle ne chauffe pas beaucoup (ou si en watercooling) ; après la chauffe n'est peut-être pas la cause de l'erreur, mais plutôt une limite de fonctionnement entre les éléments mémoire/GPU/bus.

Pour les jeux ça passe, pour les vrais calculs complexes, non.
Oui, Genefer est du LLR. Quand on voit à quel point l'overclocking CPU est sensible avec les LLR, on comprend que ça soit stressant pour les GPU, et tu as raison, les cartes grand public sont optimisées pour les jeux et pas pour les calculs, ce qui explique que l'overclocking du fabriquant soit trop élevé.

Voici d'ailleurs la différence entre Sieve et LLR
Citer
In simple terms sieving is just as the definition means to sift/sieve out unwanted particles. A sieve file has a bunch of potential candidates and sieves through them to see if any are easily recognizable as a composite number. It then removes it from the batch and sends the rest on to be further checked by LLR. Both are very important to the process otherwise LLR would take 'X' amount as long to complete work.
Traduction:
Citer
En termes simples, le tamisage est exactement ce que dit la définition de tamiser/passer au crible les particules indésirables. Un fichier tamis a un tas de candidats potentiels et les passe au crible pour voir si certains sont facilement reconnaissables comme des nombre composites. Il les retire ensuite du lot et envoi le reste pour être vérifié par LLR. Les deux sont très importants pour le processus, sinon LLR prendrait 'X' fois plus de temps pour compléter le travail.
« Modifié: 23 November 2017 à 20:28 par GuL »



Hors ligne jm91160

  • Boinc'eur Respectable
  • ****
  • Messages: 806
  •   
Réponse #2253 le: 11 December 2017 à 21:21
Bonjour,
J'ai une question de deadline.
J'ai 2 WU Genefer 19 dont les deadlines sont notoirement insuffisante par rapport au temps restant de calcul. Que faire? Abandonner de suite?
Je ne sais plus que quel projet mais j'ai vu des deadlines qui était retardé.
D'avance merci pour vos réponses.



naz

  • Invité
Réponse #2254 le: 11 December 2017 à 21:33
Garde les et finis les! Elles seront comptabilisée  :kookoo:



Hors ligne jm91160

  • Boinc'eur Respectable
  • ****
  • Messages: 806
  •   
Réponse #2255 le: 11 December 2017 à 21:46
Garde les et finis les! Elles seront comptabilisée  :kookoo:

Merci Naz  :jap:



Hors ligne Xe120

  • CàA
  • Boinc'eur devant l'éternel
  • *****
  • Messages: 1525
  •   
    • E-mail
Réponse #2256 le: 11 December 2017 à 22:57
Vérifie les deadlines sur le site.  :)




Hors ligne GuL

  • Boinc'eur devant l'éternel
  • *****
  • Messages: 2225
  •   
Réponse #2257 le: 16 December 2017 à 00:26
En ce qui concerne le problème d'arrêt du GPU, ce n'est clairement pas lié à l'overclocking (coupé), ni au manque de ressources cpu (1 cœur disponible). Je vais quand même vérifier en libérant plus de cœurs.

Je viens de voir ça :
Citer
maxErr exceeded for 28205522^65536+1, 1.0000 > 0.4500
Errors occurred for all available transform implementations
Waiting 10 minutes before attempting to continue from last checkpoint...
Voilà, j'ai l'explication des 10 minutes d'arrêt ! :gno: Je vais retester en baissant encore un peu plus la fréquence
Bonne nuit à tous  :hooga:



Hors ligne GuL

  • Boinc'eur devant l'éternel
  • *****
  • Messages: 2225
  •   
Réponse #2258 le: 18 December 2017 à 21:39
Calcul qui plante, application qui détecte une erreur de calcul, rollback au dernier checkpoint. Par contre, il vaudrait mieux chercher à savoir pourquoi le calcul plante (GPU reset par exemple ? OC trop poussé qui génère des erreurs de calcul ?) ...
C'est possible, cette carte a eu deux unités genefer 22 invalidées. Elle est à 1050 MHz d'usine, mais c'est peut-être trop.
Merci de l'idée  :jap:
Bon à 1000 MHz la carte Radeon R9 Fury continue à faire planter les genefer 16. Je l'ai descendue à 975 MHz, mais la carte ne descend pas plus bas, même si je mets 950 MHz dans msi afterburner. J'ai encore quelques plantages, mais beaucoup moins. Impossible de toucher à la fréquence mémoire, c'est de la HBM et elle est verrouillée par le constructeur.

Au moins ça tourne  :hyperbon:
« Modifié: 18 December 2017 à 21:46 par GuL »



Hors ligne toTOW

  • Boinc'eur devant l'éternel
  • *****
  • Messages: 4518
  •   
    • FAH-Addict.net
    • E-mail
Réponse #2259 le: 20 December 2017 à 21:19
Ca peut être aussi un autre composant qui fatigue : au hasard, une alim qui n'arrive plus à fournir une tension propre ...

T'as des problèmes que dans ce projet ?

FAH-Addict, première source d'information francophone sur le projet Folding@Home.


Hors ligne GuL

  • Boinc'eur devant l'éternel
  • *****
  • Messages: 2225
  •   
Réponse #2260 le: 21 December 2017 à 22:57
Ca peut être aussi un autre composant qui fatigue : au hasard, une alim qui n'arrive plus à fournir une tension propre ...

T'as des problèmes que dans ce projet ?
Ca m'étonnerait que ce soit l'alim : je n'ai aucun soucis avec ma HD 7970 si je la mets à la place. Les deux ont deux connecteurs pci-express 8 pins, donc la demande en puissance doit être similaire. Mon alim est une Corsair TX 850M. Autant dire qu'il y a de la marge !

Je n'ai pas de problèmes avec d'autres projets. Par contre, quand je traite des photos raw avec DxO Photolab, qui utilise la carte graphique, j'ai environ 10% d'erreurs comme sur les photos ci-dessous, alors que la carte est underclokée de 75 MHz.



De plus, les cartes sapphire disposent de deux bios, un legacy et un UEFI. J'ai essayé les deux et j'ai le même résultat. Je suis en train de tester les photos avec la HD7970. EDIT : sur 200 photos, j'ai 0 erreur  :sun:

Bref, je crois que ça va être retour au vendeur, vu que la carte est encore sous garantie. Ma carte étant une deuxième main, vous savez comment ça se passe dans ces cas là ? La carte a été achetée en janvier 2017 chez Grosbill.
« Modifié: 21 December 2017 à 23:16 par GuL »



Hors ligne toTOW

  • Boinc'eur devant l'éternel
  • *****
  • Messages: 4518
  •   
    • FAH-Addict.net
    • E-mail
Réponse #2261 le: 22 December 2017 à 22:10
Ah oui, avec des erreurs graphiques comme ça y'a pas photo, ta carte est morte ... :/

FAH-Addict, première source d'information francophone sur le projet Folding@Home.


Hors ligne GuL

  • Boinc'eur devant l'éternel
  • *****
  • Messages: 2225
  •   
Réponse #2262 le: 23 December 2017 à 00:13
Grosbill a accepté sans problème de faire un retour de matériel, même si c'est une seconde main. Pour la réparation, pas de soucis. Par contre, si je veux un avoir, ça sera au nom de l'ancien propriétaire  :/



Hors ligne Rhodan71

  • Boinc'eur Confirmé
  • ***
  • Messages: 411
  •   
Réponse #2263 le: 01 February 2018 à 09:11
Le Tour de Primes 2018 est parti !
http://www.primegrid.com/forum_thread.php?id=7805



AMD Ryzen 9 3900X@3,8Ghz (12c/24t) + RTX 2070 Super, Windows 11, 64 Go RAM
AMD Threadripper 1950X@3,4Ghz (16c/32t), Ubuntu 22.04, 64 Go RAM


Hors ligne Xe120

  • CàA
  • Boinc'eur devant l'éternel
  • *****
  • Messages: 1525
  •   
    • E-mail
Réponse #2264 le: 01 February 2018 à 09:59
Citer
Use LLR's multithreaded mode. It requires a little bit of setup, but it's worth the effort. Follow these steps:


    Create a app_config.xml file in the directory C:\ProgramData\BOINC\projects\www.primegrid.com\ (or wherever your BOINC data directory is located). For a quad core CPU, the file should contain the following contents. Change the two occurrences of "4" to the number of actual cores your computer has. The example below is for PPSE. Change the app name (2 places) to whatever LLR app you're running. The app names are listed on your task selection page.

    <app_config>
       <app>
          <name>llrPPSE</name>
          <fraction_done_exact/>
          <max_concurrent>1</max_concurrent>
        </app>
       <app_version>
           <app_name>llrPPSE</app_name>
           <cmdline>-t 4</cmdline>
           <avg_ncpus>4</avg_ncpus>
       </app_version>
    </app_config>

    After creating the file, click on "Options/Read config files". You should then restart BOINC or reboot.
    The first time BOINC downloads (in this example) a PPSE-LLR task, it may act a little strange and download 4 tasks instead of 1. The run times on this first set of tasks may look a bit strange too. This is normal. This will also occur anytime BOINC downloads more than one task at a time. This can be avoided by setting "Use at most [ 1 ] % of the CPUs" before you download PPSE tasks. After one task was downloaded, increase the percentage.
    Some people have observed that when using multithreaded LLR, hyperthreading is actually beneficial. I don't use hyperthreading myself, but I encourage you to experiment and see what works best for you.

Je viens de voir qu'on peut créer une application multithreadé, ça peut être intéressant pour les impatients qui veulent quand même faire tourner les grosses recherches.  :kookoo:




Hors ligne JeromeC

  • CàA
  • Boinc'eur devant l'éternel
  • *****
  • Messages: 31102
  •   
Réponse #2265 le: 01 February 2018 à 12:10
C'est bizarre leur truc, ça veut dire que par défaut c'est bien une appli multi-thread mais qu'elle sait pas utiliser les cores virtuels liés à l'hyper-threading et il faut le forcer via le cfg... c'est une première...

A quoi bon prendre la vie au sérieux, puisque de toute façon nous n’en sortirons pas vivants ? (Alphonse Allais)



Hors ligne DocPhilou1966

  • Boinc'eur devant l'éternel
  • *****
  • Messages: 1869
  •   
    • Mon Job
    • E-mail
Réponse #2266 le: 01 February 2018 à 19:17
Le Tour de Primes 2018 est parti !
http://www.primegrid.com/forum_thread.php?id=7805

Merci pour l'info et merci @Xe120 pour le tuyau :)

 
13800346^131072+1   935,840 (decimal)   2019-01-27 Generalized Fermat Prime Search


Hors ligne Antares

  • Intel Pentium G3420 à 3.2 go + Nvidia GeForce GTS450 Win 10 Pro 64bits
  • Méchant modo
  • Boinc'eur devant l'éternel
  • ******
  • Messages: 7207
  •   
    • E-mail
Réponse #2267 le: 01 February 2018 à 22:32

Quand le dernier arbre sera abattu, la dernière rivière empoisonnée, le dernier poisson capturé, alors le visage pâle réalisera que l'argent ne se mange pas.

Sitting Bull



Hors ligne DocPhilou1966

  • Boinc'eur devant l'éternel
  • *****
  • Messages: 1869
  •   
    • Mon Job
    • E-mail
Réponse #2268 le: 02 February 2018 à 05:15
@Xe120 : avec cette "option mt", le CPU chauffe moins. Et ça tourne très vite.
En route pour essayer de choper un beau maillot :)
PPS - PPSE - GNF16

 
13800346^131072+1   935,840 (decimal)   2019-01-27 Generalized Fermat Prime Search


Hors ligne GuL

  • Boinc'eur devant l'éternel
  • *****
  • Messages: 2225
  •   
Réponse #2269 le: 02 February 2018 à 07:45
C'est bizarre leur truc, ça veut dire que par défaut c'est bien une appli multi-thread mais qu'elle sait pas utiliser les cores virtuels liés à l'hyper-threading et il faut le forcer via le cfg... c'est une première...
:hello:
Non, ça veut dire que par défaut leur application est monotâche. Par contre sur les LLR, il est déconseillé d'utiliser l'hyperthreading, qui ne fait que remplir les trous entre deux calculs. Les calculs LLR étant déjà optimisés, il n'y a plus de trous à remplir, et dans certains cas ce peut même être contre-productif.



Hors ligne JeromeC

  • CàA
  • Boinc'eur devant l'éternel
  • *****
  • Messages: 31102
  •   
Réponse #2270 le: 02 February 2018 à 08:10
Donc ça veut dire qu'ils l'ont développé l'appli (les) pour qu'elle fonctionne en mt (sinon tu peux mettre tous les paramètres de la terre...) mais que par défaut ils la laissent en mono via leur cfg ?? encore plus curieux comme approche !!!

A quoi bon prendre la vie au sérieux, puisque de toute façon nous n’en sortirons pas vivants ? (Alphonse Allais)



Hors ligne GuL

  • Boinc'eur devant l'éternel
  • *****
  • Messages: 2225
  •   
Réponse #2271 le: 02 February 2018 à 09:39
Eh oui. C'est le cas de certaines applications LHC par exemple ou de même de seti. Même si tu installes l'application optimisée, il y a la possibilité de rajouter des arguments encore plus optimisés dans la ligne de commande, qui font une sacrée différence  :gniak:



Hors ligne toTOW

  • Boinc'eur devant l'éternel
  • *****
  • Messages: 4518
  •   
    • FAH-Addict.net
    • E-mail
Réponse #2272 le: 02 February 2018 à 20:31
Enfin se priver des calculs en MT alors qu'on peut le faire, c'est quand même complètement con ... :/

FAH-Addict, première source d'information francophone sur le projet Folding@Home.


Hors ligne Maeda

  • Boinc'eur devant l'éternel
  • *****
  • Messages: 2470
  •   
Réponse #2273 le: 03 February 2018 à 01:11
Sauf si ça fait trop chauffer :nexath:, là pas le choix sans MT.


Hors ligne Xe120

  • CàA
  • Boinc'eur devant l'éternel
  • *****
  • Messages: 1525
  •   
    • E-mail
Réponse #2274 le: 09 February 2018 à 07:20
Petite nouveauté :
Citer
Terminé et validé (1st)
Maintenant c'est précisé si on fini l'UT en premier  :hello: