Portail de l'AF

Nouvelles

Projet du Mois FB: Yoyo@home

Faites un don

Shoutbox

modesti:
Aujourd'hui à 10:45:41
Moi aussi, Jéjé, mais sur le thème par défaut, c'est en haut à gauche :spamafote:
JeromeC:
Hier à 21:34:13
Selon le thème du coup c'est pas forcément en haut à gauche, moi là je l'ai en haut à droite
modesti:
2024-09-15, 21:31:07
Avec plaisir, zelandonii :)
zelandonii:
2024-09-15, 20:39:43
Merci @modesti car je n'avais pas vu ce header.  :+1:
modesti:
2024-09-15, 10:37:01
En haut à gauche, tu as ton identifiant et une flèche à droite de celui-ci. Tu cliques et choisis le menu "Affichage et disposition"
zelandonii:
2024-09-15, 10:30:15
Ah oui ! Comment fait-on ça ?
JeromeC:
2024-09-12, 21:09:09
(tu peux d'ailleurs changer le thème)
JeromeC:
2024-09-12, 21:08:45
Re-bienvenu sur la nouvelle version du forum :)
zelandonii:
2024-09-11, 20:34:12
Très sympa cette nouvelle interface.
zelandonii:
2024-09-11, 20:34:00
Ça tourne du tonnerre !
zelandonii:
2024-09-11, 20:33:46
Pour faire plus simple, j'ai remplacé le waterblock par un ventilateur et j'ai rajouté deux ventilos.
zelandonii:
2024-09-11, 20:33:11
Quelques semaines que je n'étais pas venu pour cause de panne du PC. C'était le watercooling qui n'avait plus de liquide.
zelandonii:
2024-09-11, 20:32:11
Salut à tous !
JeromeC:
2024-09-10, 10:08:05
Autre option : on déménage tous au Groenland et voila.
ousermaatre:
2024-09-08, 19:21:28
 :hello: Meuh non, il y aura tjrs des raids, seulement, ils seront peut-être, plus souvent sur les mêmes thèmes.
[AF>Libristes] alain65:
2024-09-08, 18:02:24
Ça serait dommage, c'est la seule compète à laquelle j'ai le temps de participer. On bascule sur les projets du raid...Et plus qu'à attendre.
JeromeC:
2024-09-08, 16:15:50
Au train où vont les choses on fera bientôt plus aucun RAID alors...... :/
[AF>Libristes] alain65:
2024-09-07, 06:05:51
Une idée comme ça en passant : Le Raid d'automne au tout début de l'hiver et le raid de printemps à la fin  :siflotte:
[AF>Libristes] alain65:
2024-09-07, 06:04:21
@modesti : Ça c'est une bonne nouvelle ;)
modesti:
2024-09-06, 11:43:05
Petite info pour les fans de raid : compte tenu des températures (même si elles ont baissé un peu), le raid d'automne sera transformé en raid d'hiver
modesti:
2024-09-03, 10:48:11
Et le retour d'ARP  :bounce:
Maeda:
2024-09-03, 09:51:08
Un nouveau projet pour WCG pour la fin d'année ? https://www.worldcommunitygrid.org/forums/wcg/viewthread_thread,46744_offset,0
Maeda:
2024-08-28, 08:55:36
Prêt !
modesti:
2024-08-26, 15:13:48
Salut les AFones ! :hello: Prêts pour la rentrée ?
modesti:
2024-08-24, 11:11:06
Je confirme: ça marche! Merci beaucoup Sébastien :jap:
Maeda:
2024-08-24, 08:42:05
C'était ça, ça marche :jap:
Sébastien:
2024-08-24, 08:28:08
J'ai désactivé le rafraîchissement automatique de la shoutbox
Maeda:
2024-08-23, 21:59:28
@Sébastien : je ne suis pas sûr que tu aies saisi le souci soulevé par modesti. Si on ne touche à rien (pas de clic) dans la shoutbox, mais qu'on scroll vers le bas pour lire, au bout de ~2sec d'arrêt (pour lire), il remonte tout en haut (peu pratique

Recent

[Linux] Script pour suspendre / reprendre les UT

Démarré par Maeda, 04 Juin 2016 à 16:32

« précédent - suivant »

0 Membres et 1 Invité sur ce sujet

Maeda

Salut !
Avec ce que tu décris et le test que j'ai fait chez moi : je me suis rendu compte que par exemple si on avait par exemple 11 projects attachés, et qu'on indiquait vouloir tuer le 1), il cherchait le 1) et le 11).

Corrections faites sur les deux scripts (le plus important étant le resume_calc), peux-tu essayer en téléchargeant de nouveau les deux depuis mon Github ? J'ai espoir que ça corrige ton problème.

Scrat65

Bonsoir,

Bon, je passe en mode tutoiement. J'ai chargé tes deux nouveaux scripts et j'ai testé avec WCG. Sans succès.
Voici ce que cela donne :
> Choix du projet cible <
1) -----------
   name: Collatz Conjecture
--
2) -----------
   name: World Community Grid
--
3) -----------
   name: WUProp@Home
> Entrer le choix voulu par le nombre correspondant < (0=quitter)
2
> Heure exacte à laquelle reprendre les calculs [taper ENTREE pour action immédiate] < /!\ format = mm/jj/aaaa hh:mm

=============
Votre choix :
2) -----------
   name: World Community Grid
-> REPRISE des calculs =
=============
Est-ce OK ? (taper OK)
OK
== Script suspend_calc détecté ==
2515 suspend_calc.sh Sun Feb 19 18:12:22 2017
Entrer le nombre correspondant pour tuer le processus à l'heure définie : (taper ENTREE pour ne rien tuer et continuer)
2515
Problème avec le PID : mauvaise saisie, on repart du début
> Choix du projet cible <
1) -----------
   name: Collatz Conjecture
--
2) -----------
   name: World Community Grid
--
3) -----------
   name: WUProp@Home
> Entrer le choix voulu par le nombre correspondant < (0=quitter)


À suivre...

Bonsoir chez vous
« Nous sommes des nains juchés sur les épaules de géants ; nous voyons plus qu'eux, et plus loin ; non que notre regard soit perçant, ni élevée notre taille, mais nous sommes élevés, exhaussés, par leur stature gigantesque » Bernard de Chartres (XIIe siècle)

Maeda

En fait c'est ta signature (enfin le "Bonsoir chez vous") qui me perturbe, je finis par lire un vouvoiement :hap:.

Peux-tu essayer, avec un suspend_calc de lancé, de taper cette commande en remplaçant manuellement le 4424 par le PID qui t'intéresse ?
killsusp=4424;ps -eo pid,comm | grep suspend_calc | tr -d [:alpha:] | tr -d " "| tr -d "_" | grep -E "^$killsusp\$"

⚠ Donne moi bien toute la ligne qu'il te retourne (y compris les "potentiels" espaces).

Merci.

Scrat65

Euh, la commande indiquée ne me retourne rien du tout... et le suspend_calc lancé reste bien vivant dans htop...

Je crunche sur un serveur Ubuntu 16.04 avec lequel je communique depuis mon portable en ssh

Bonsoir chez toi  :jap:
« Nous sommes des nains juchés sur les épaules de géants ; nous voyons plus qu'eux, et plus loin ; non que notre regard soit perçant, ni élevée notre taille, mais nous sommes élevés, exhaussés, par leur stature gigantesque » Bernard de Chartres (XIIe siècle)

Maeda

Ok, il devrait te retourner quelque chose. Le problème est bien à ce niveau.

Peux-tu ouvrir une "issue" sur mon github qu'on en discute/teste là-bas, ça ne polluera pas ce topic, l'avancée de la correction du bug n'est pas très intéressante au final (une fois qu'il sera corrigé, on l'oubliera) :siflotte:

Issues

Scrat65

Avant, j'essaye sur mon portable. Je réactive mon client boinc et j'essaye avec WCG. Réponse d'ici ce soir...
« Nous sommes des nains juchés sur les épaules de géants ; nous voyons plus qu'eux, et plus loin ; non que notre regard soit perçant, ni élevée notre taille, mais nous sommes élevés, exhaussés, par leur stature gigantesque » Bernard de Chartres (XIIe siècle)

Maeda

Je pense avoir trouvé le problème (le fait que ton script s'appelle suspend_calc.sh).
Peux-tu refaire le test avec cette ligne (moins sale que celle que j'avais mise) ? Même principe, change le 4424 par le PID du suspend_calc que tu veux (aucun impact sur ce qui tourne) et donne-moi son retour :

killsusp=4424;pgrep *suspend_calc* | grep -Fx $killsusp

Merci.

Scrat65

1. Sur mon portable, le problème est le même ("Problème avec le PID : mauvaise saisie, on repart du début") et ta ligne renvoie :
pgrep: fournissez un seul motif à la fois
Essayez « pgrep --help » pour plus d'informations.


2. Sur le serveur, en ssh depuis mon portable, ta ligne renvoie :
Expression régulière précédente invalide

Désolé de ce bien maigre retour et merci beaucoup pour tes réponses.

« Nous sommes des nains juchés sur les épaules de géants ; nous voyons plus qu'eux, et plus loin ; non que notre regard soit perçant, ni élevée notre taille, mais nous sommes élevés, exhaussés, par leur stature gigantesque » Bernard de Chartres (XIIe siècle)

Maeda

OK. Essaie celle-ci :
killsusp=4424;pgrep suspend_ | grep -Fx $killsusp

Scrat65

La commande me renvoie le numéro du PID (en rouge).
~$ killsusp=18430;pgrep suspend_ | grep -Fx $killsusp
18430


Et toujours le même "problème de PID : mauvaise saisie, on repart du début"
« Nous sommes des nains juchés sur les épaules de géants ; nous voyons plus qu'eux, et plus loin ; non que notre regard soit perçant, ni élevée notre taille, mais nous sommes élevés, exhaussés, par leur stature gigantesque » Bernard de Chartres (XIIe siècle)

Maeda

Peux-tu essayer de remplacer la ligne suivante dans suspend_calc :
testpid="$(ps -eo pid,comm | grep suspend_calc | tr -d [:alpha:] | tr -d " "| tr -d "_" | grep -E "^$killsusp\$")"

Et la remplacer par :
testpid="$(pgrep suspend_ | grep -Fx $killsusp)"

Scrat65

J'ai changé ligne indiquée dans resume_calc (et pas dans suspend_calc).
Une fois le changement fait, j'ai lancé un suspend_calc puis un resume_calc et cela marche. :hap:

== Script suspend_calc détecté ==
25355 suspend_calc.sh Tue Feb 21 14:17:10 2017
Entrer le nombre correspondant pour tuer le processus à l'heure définie : (taper ENTREE pour ne rien tuer et continuer)
25355
On tue le suspend_calc demandé
Reprise des calculs...
[210217 14:19:03] Reprise de : collatz_sieve_3189933832941393149952_52776558133248_0
[210217 14:19:03] Reprise de : collatz_sieve_3177304824792571969536_52776558133248_1
Fin script


Encore tous mes remerciements pour ta réactivité et ton aide. :jap:
« Nous sommes des nains juchés sur les épaules de géants ; nous voyons plus qu'eux, et plus loin ; non que notre regard soit perçant, ni élevée notre taille, mais nous sommes élevés, exhaussés, par leur stature gigantesque » Bernard de Chartres (XIIe siècle)

Maeda

 :jap:
Ce n'est pas encore parfait, mais ça fonctionne tant que le script suspend_calc s'appelle "suspend_". A voir si je trouve mieux en cherchant un peu.

Github à jour.

Scrat65

Cela fonctionne chez moi avec un script qui s'appelle "suspend_calc.sh".
« Nous sommes des nains juchés sur les épaules de géants ; nous voyons plus qu'eux, et plus loin ; non que notre regard soit perçant, ni élevée notre taille, mais nous sommes élevés, exhaussés, par leur stature gigantesque » Bernard de Chartres (XIIe siècle)

[AF>Libristes] ElGuillermo

Hello !

Pour les Windowsiens (et les Linuxiens qui ont un Wine installé) :
Le gestionnaire BoincTasks possède un système de règles qui permet de suspendre des tâches selon différents critères (pourcentage de complétion, temps restant, etc).
C'est très simple et ça fonctionne bien (et ça permet, en plus, de gérer un parc entier de machines, distantes ou non, de surveiller les températures des CPUs/GPUs et d'agir en conséquence, etc)...

http://efmer.com/b/?q=boinctasks_download

Un joli tuto maison sur la création de règles pour suspendre une UT selon son état de complétion :
https://forum.boinc-af.org/index.php/topic,5607.msg356279.html#msg356279

JeromeC

==> https://forum.boinc-af.org/index.php/topic,5607.msg399370.html#msg399370

Ce tuto n'est pas mis à jour depuis 2015 mais si je regarde sur le site BT la dernière version date aussi de 09/2015... mais le forum a l'air toujours actif et l'admin continue de répondre... ptet que l'appli est parfaite et n'a plus besoin d'évoluer ? :D
A quoi bon prendre la vie au sérieux, puisque de toute façon nous n'en sortirons pas vivants ? (Alphonse Allais)


[AF>Libristes] cottesloe

Salut,
J'ai un petit problème avec le script suspend.
En vue du raid de printemps, j'ai charger mon cache en Asteroids et en Primegrid.
Pour Asteroids, j'ai ce retour:
Votre choix :
1) -----------
   name: Asteroids@home
=============
Est-ce OK pour démarrer ? (taper OK)
OK
En cours de surveillance... limite temps restant = 99s
[030417 22:54:39] Suspension de : ps_170403_input_100055_14_0
03-Apr-2017 22:54:39: GUI RPC error: No such project
Operation failed: Error -1
[030417 22:54:44] Suspension de : ps_170403_input_100055_14_0
03-Apr-2017 22:54:44: GUI RPC error: No such project
Operation failed: Error -1

et comme ça toute la nuit. Les UT sont terminées et renvoyées normalement.  :??:

Pour Prime, c'est parti pareil, mais au milieu de la nuit, les UTs se sont bien arrêtée à 1.30min de la fin de calcul.  :??: :??:

Bref, que faut-il faire pour que le script fonctionne normalement? 

Merci.
:hello:

"Je sers la science et c'est ma joie" Disciplus Simplex
Écoutez la meilleure émission radio de la Terre, et rêver l'avenir encore un peu sur La Planète Bleue. www.laplanetebleue.com

Maeda

Vérifie si la variable boincdir au tout début de suspend_calc est bien avec le bon chemin.
Sinon relance simplement le manager Boinc (boincmgr).

[AF>Libristes] cottesloe

Mon dossier boinc est sous /var/lib/boinc/
C'est ce que j'ai renseigné sur la ligne boincdos
boincdos="/var/lib/boinc/"
Le plus curieux, les UTs Primegrid sont bien stoppées, mais pas celles d'asteroids...

"Je sers la science et c'est ma joie" Disciplus Simplex
Écoutez la meilleure émission radio de la Terre, et rêver l'avenir encore un peu sur La Planète Bleue. www.laplanetebleue.com

Maeda

J'ai pareil.

Il y a un léger bug. J'ai pas le temps tout de suite d'uploader la MAJ.

Il suffit, dans le script suspend_calc, de changer la ligne suivante :

url_prj="$(boinccmd --get_project_status | grep -A 2 "^$chx_prj) " | grep URL | cut -d " " -f6)"

-> Il manquait le ^ avant $chx_prj

Puis stopper et relancer les suspend_calc déjà lancés.

[AF>Libristes] cottesloe

OK, je vois ça ce soir, et je te dis quoi.  :jap:

"Je sers la science et c'est ma joie" Disciplus Simplex
Écoutez la meilleure émission radio de la Terre, et rêver l'avenir encore un peu sur La Planète Bleue. www.laplanetebleue.com

[AF>Libristes] cottesloe

Ça à l'air de fonctionner avec le chapeau ^ qui manquait.
Bravo!  :jap:  :jap:  :jap:
Je vais pouvoir faire un "petit" lâcher pour le raid.  :hello:

"Je sers la science et c'est ma joie" Disciplus Simplex
Écoutez la meilleure émission radio de la Terre, et rêver l'avenir encore un peu sur La Planète Bleue. www.laplanetebleue.com

Scrat65

Bonjour,

Dans le cadre du Penthatlon, j'ai un soucis avec le script suspend_cal pour les UT Einstein@home, plus particulièrement les UT pour le GPU. La limite par défaut de 59 s ne s'applique pas à ces UT qui sont calculées totalement et renvoyées donc adieu la préparation de mon lacher...
J'ai essayé de compléter la liste des projets en indiquant pour celui d'Einstein@home une limite de 69s pour ces UT que ma Nvidia  GTX 970 calcule en environ 18 mn  :

http://einstein.phys.uwm.edu/)
        limite="69s"
form="$chcom[0-6][0-9]\.|$chcom[0-9]\." ;;

Mais cela ne fonctionne pas ; les UT passent toujours à 100 % et partent en DL  :??:

Une idée ?

Bonjour chez vous
« Nous sommes des nains juchés sur les épaules de géants ; nous voyons plus qu'eux, et plus loin ; non que notre regard soit perçant, ni élevée notre taille, mais nous sommes élevés, exhaussés, par leur stature gigantesque » Bernard de Chartres (XIIe siècle)

Maeda

Salut !

Pour les Einstein / GPU, j'ai mis 669s, pour être sûr, je n'ai pas testé moins :
http://einstein.phys.uwm.edu/)
                limite="669s"
                form="$chcom[0-6][0-6][0-9]\.|$chcom[0-9][0-9]\.|$chcom[0-9]\." ;;


Toutes mes UT se suspendent à 11 min de la fin, c'est correct.
Il faudrait que je trouve un moyen plus élégant pour mettre ce paramètre  :/

Scrat65

Hello,

Merci de ta réactivité. J'essaye 669 s et je te tiens au courant.

Edit : une première UT est bien suspendue à 11 mn de la fin mais à seulement 40,37% réalisée. Je vais essayer :
limite="369s"
form="$chcom[0-3][0-6][0-9]\.|$chcom[0-9][0-9]\.|$chcom[0-9]\." ;;

L'UT est suspendue à 6 mn avant la fin et à 67 % réalisée ; c'est mieux...

PS : pourrais-je savoir quel GPU utilises-tu pour les UT GPU Einstein ?


« Nous sommes des nains juchés sur les épaules de géants ; nous voyons plus qu'eux, et plus loin ; non que notre regard soit perçant, ni élevée notre taille, mais nous sommes élevés, exhaussés, par leur stature gigantesque » Bernard de Chartres (XIIe siècle)