Le Forum de l'Alliance Francophone

Nouvelles:

Auteur Sujet: [QuChemPedIA] le topic de préparation  (Lu 133224 fois)

0 Membres et 1 Invité sur ce sujet

Hors ligne damotbe

  • Boinc'eur Respectable
  • ****
  • Messages: 545
  •   
le: 04 April 2018 à 14:26




Bonjour à tous.  :hello:

Infos utiles.
Pour les plateformes Mac et Windows il est nécessaire d'installer Virtualbox : https://www.virtualbox.org/
                                                                                                       


Statut :a l’arrêt
URL du projet : https://quchempedia.univ-angers.fr/athome/
Application disponible : https://quchempedia.univ-angers.fr/athome/apps.php
État du serveur : https://quchempedia.univ-angers.fr/athome/server_status.php
L'alliance francophone : https://quchempedia.univ-angers.fr/athome/team_display.php?teamid=4
Classement mondial de L'af : https://www.boincstats.com/stats/185/team/list/

Je ne sais pas trop où mettre ce sujet. Je vais vous parler ici du projet que j'essaye de mettre en place à l'Université d'Angers : QuChemPedIA et de sa partie Boinc.

TL;DR : Clean Energy Project + Intelligence Artificielle + plateforme ouverte

QuChemPedIA : Quantum Chemistry encycloPEDia + Intelligence Artificielle

Citer
Présentation : Ce projet s’inscrit dans les domaines des sciences des données et de l’intelligence artificielle. L’objectif est de révolutionner le domaine de la chimie quantique et informatique moléculaire. La chimie moléculaire se définit comme l’étude d’entités discrètes (molécules) et correspond à la communauté la plus large de chimistes. Des centaines de millions de molécules sont connues, contenant généralement moins d’une centaine d’atomes et moins d’un millier d’électrons. Les propriétés chimiques de ces molécules dépendent de la position des électrons qui peut être calculée de manière approchée par des méthodes issues de la mécanique quantique. Les différents paramètres de calcul définissent la qualité de la méthode et son coût en temps (de quelques heures à quelques milliers d’heures par molécule). Avec la démocratisation de la puissance de calcul, la chimie informatique est devenue une partie essentielle de la recherche en chimie.
Aujourd’hui, il est impossible pour un humain de prendre en compte les résultats, même restreints aux données les plus importantes, pour les millions de molécules connues. Pour les chimistes, l’ambition de ce projet est de changer radicalement d’approche en utilisant des méthodes d’intelligence artificielle et de fouille de données afin d’explorer plus efficacement l’immense combinatoire de l’espace moléculaire.
Le projet se situe donc à la frontière entre l’apprentissage artificiel quand il s’agit de prédire les propriétés d’une molécule et l’optimisation combinatoire quand nous cherchons à proposer des nouvelles molécules maximisant un ou plusieurs objectifs. La méthodologie envisagée, qui allie apprentissage profond (deep learning) et programmation par contraintes pour générer des molécules, est inédite à notre connaissance et offre des opportunités remarquables. Associer une fonction de coût tout en prévoyant les voies de synthèse permet par exemple de proposer des molécules moins coûteuses pour l’environnement, base de la chimie verte de demain. La recherche de nouveaux matériaux photovoltaïques est d’ailleurs la première des applications que nous envisageons.

Dans un premier temps, le projet Boinc permettra d'alimenter les procédures d'intelligence artificielle en données. Les volontaires calculeront des molécules pour lesquelles il n'existe pas de résultats publiques en chimie quantique. Il est très probable que dans un second temps, les volontaires soient sollicités pour réaliser les calculs nécessaires aux procédures d'exploration de l'espace moléculaire (intelligence artificielle).

Avancement du projet :
  • OK : Serveur physique pour héberger les services Quchempedia dont le projet Boinc
    • Bi-Xeon E5-2640 (10C/20T) + 128Go RAM + 64 To HDD
  • OK : Choix d'un code libre pour les calculs en chimie quantique :
  • OK : Tests des cas d'utilisation du code de calcul
  • En cours : Compilation statique et portable du code de calcul : www.nwchem-sw.org/index.php/Compiling_NWChem
    • Cherche solutions et volontaires pour Windows (merci Sébastien https://forum.boinc-af.org/index.php/topic,7838.msg473501.html#msg473501)
    • Cherche solutions et volontaires pour compilation MAC (application sans VM)
    • Cherche solutions et volontaires pour Android (pas envisageable)
    • OK : Cherche solutions et volontaires pour compilation portable pour Linux (ne pas dépendre des packages)
    • OK : mise en place de VM pour les applications
  • OK : mise en place du software pour le serveur Boinc:
    • OK : Installation de Proxmox
    • OK : configuration du firewall et des règles réseaux, tests VM et tests CT
    • OK : Installation de Nginx Apache pour le reverse proxy et cache HTTP
    • OK : certificats HTTPS
    • OK : création de la VM (QEMU-KVM) pour le boinc-serveur
    • OK : mise en place des applications et tests
    • OK : gestion des scripts, campagnes de calcul, badges, etc.
    • TODO: gestion plus fine des erreurs et crédits après des calculs (très) longs

Mis a jour par fzs600 le 15 mars 2023
.
« Modifié: 15 March 2023 à 09:57 par fzs600 »



Hors ligne damotbe

  • Boinc'eur Respectable
  • ****
  • Messages: 545
  •   
Réponse #1 le: 04 April 2018 à 14:26
13 Novembre 2019:

Notre premier article scientifique en lien avec le projet est disponible en Open Access et les données en Open Data.
"Dataset’s chemical diversity limits the generalizability of machine learning predictions"
https://jcheminf.biomedcentral.com/articles/10.1186/s13321-019-0391-2?fbclid=IwAR0LtM098-vkv0rJnoSV8Yo5ZbuFu4HXpZKsn3ekTTtA4rM0Sb5_HMSSSwI

Avec une traduction du message de Thomas Cauchy qui explique l'article et les recherches à venir
Citer
Bonjour,

Je suis le chimiste de ce projet. La publication mentionnée par Benoit Da Mota a été écrite lors du lancement du projet boinc. Mais je peux extraire quelques phrases de cet article pour montrer ce que nous avons en tête.. :

"Résumé : L'ensemble de données QM9 est devenu la référence en matière de prédiction par Apprentissage Automatique (ML) pour de nombreuses propriétés chimiques. QM9 est basé sur la GDB, qui est une exploration combinatoire de l'espace chimique. Les prédictions à l'aide du ML ont récemment été publiées avec une précision comparable à celle des calculs de la théorie fonctionnelle de la densité. De tels modèles nécessitent d'être reproduits et généralisés sur des données réelles. PC9, un nouvel ensemble de données équivalents à QM9 (seulement H, C, N, O et F et jusqu'à 9 atomes "lourds") issu du projet PubChemQC est présenté dans cet article. Une étude statistique des distances de liaison et des fonctions chimiques montre que ce nouvel ensemble de données couvre une plus grande diversité chimique. Une régression Kernel Ridge, une régression Elastic Net et le modèle de réseau neuronal fourni par SchNet ont été utilisés sur les deux ensembles de données. La précision globale de la prédiction de l'énergie est plus élevée pour le sous-ensemble QM9. Cependant, un modèle entraîné sur PC9 montre une plus grande capacité à prédire les énergies des autres ensembles de données."

Le jeu de données QM9 contient environ 130 000 petites molécules, alors que PC9 en contient 119 000 (mais a été extrait d'un autre type de calculs). Le problème est que les résultats complets de la QM9 ne sont pas accessibles au public. Ils ont extrait certains résultats de calculs de mécanique quantique coûteux et ont détruit le fichier de données. Nous ne sommes pas satisfaits de PC9 qui est une simple démonstration qu'une plus grande diversité est nécessaire.

Pour le moment, le projet Boinc vise à recalculer les molécules intéressantes de QM9 et PC9 avec le même niveau de calcul cette fois. Tous les résultats seront disponibles sur la base de documents QuChemPedia https://quchempedia.univ-angers.fr lorsque cette plate-forme sera un peu plus robuste (début 2020), à l'image de notre outil de contrôle qualité tel que développé par mon collègue.

Nous ne sommes pas encore entièrement satisfaits de NWChem. Avec le même projet Boinc, Benoit Da Mota et moi-même, utilisons Gaussian (propriétaire) qui est très efficace. Mais Nwchem est open source....
Nous avons calculé environ 130 k sur 200 k grâce à votre aide !
Pour décembre, nous espérons proposer à la communauté de calculer de nouvelles molécules qui n'existent peut-être même pas et ne sont pas stables afin d'aider l'outil d'apprentissage machine à mieux généraliser. Ces nouvelles molécules seront générées par une procédure d'apprentissage automatique (IA).

Si vous avez des questions....
Amicalement
Thomas
« Modifié: 13 November 2019 à 20:58 par damotbe »



Hors ligne damotbe

  • Boinc'eur Respectable
  • ****
  • Messages: 545
  •   
Réponse #2 le: 04 April 2018 à 14:26
réservé



Hors ligne JeromeC

  • CàA
  • Boinc'eur devant l'éternel
  • *****
  • Messages: 31106
  •   
Réponse #3 le: 04 April 2018 à 15:43
:bounce:

A quoi bon prendre la vie au sérieux, puisque de toute façon nous n’en sortirons pas vivants ? (Alphonse Allais)



Hors ligne [AF] fansyl

  • Boinc'eur devant l'éternel
  • *****
  • Messages: 2397
  •   
Réponse #4 le: 04 April 2018 à 15:46
 :plusun:

Je crunche dans le silence et c'est ma joie !
Ryzen 1700X/32Go/GTX970 (sous WC) - i7-3770T/16Go/HD4000 - Ryzen 5700G/32Go/GTX1050 - Q9550/8Go/GT1030 - 3xAndroidBox S912



Hors ligne modesti

  • CàA
  • Boinc'eur devant l'éternel
  • *****
  • Messages: 19058
  •   
    • Brocantes en Bourbonnais
    • E-mail
Réponse #5 le: 04 April 2018 à 15:55
ATA prêt :chefouichef:


Viendez chez nous, cause qu'on est les meilleur(e)s :D


In memoriam Jip - In memoriam Cocagne


Hors ligne [AF>Amis des Lapins] Jean-Luc

  • Boinc'eur devant l'éternel
  • *****
  • Messages: 3396
  •   
    • Le calcul partagé en atsronomie sous BOINC
    • E-mail
Réponse #6 le: 04 April 2018 à 16:35
OK damotbe.
Si je peux aider à faire des essais... N'hésite pas.
Tiens-nous au courant.



Rédacteur d'un article sur BOINC, adresse :
http://www.astrocaw.eu/?p=605
Créateur d'un site actif de recherche sur les suites aliquotes :
http://www.aliquotes.com/


naz

  • Invité
Réponse #7 le: 04 April 2018 à 16:53
Il serait bien de développer le projet aussi pour android  :kookoo:
Sinon je serais dispo  :hyperbon: :hyperbon: :hyperbon:



Hors ligne Ceclo

  • CàA
  • Boinc'eur devant l'éternel
  • *****
  • Messages: 1538
  •   
    • E-mail
Réponse #8 le: 04 April 2018 à 17:13
Partant pour mettre quelques thread à dispo! Le projet me semble très intéressant!  :kookoo:



Hors ligne Antares

  • Intel Pentium G3420 à 3.2 go + Nvidia GeForce GTS450 Win 10 Pro 64bits
  • Méchant modo
  • Boinc'eur devant l'éternel
  • ******
  • Messages: 7207
  •   
    • E-mail
Réponse #9 le: 04 April 2018 à 17:58
Moi aussi, mais sous windows seulement...

Quand le dernier arbre sera abattu, la dernière rivière empoisonnée, le dernier poisson capturé, alors le visage pâle réalisera que l'argent ne se mange pas.

Sitting Bull



Hors ligne ousermaatre

  • Gentil admin
  • Boinc'eur devant l'éternel
  • *******
  • Messages: 12229
  •   
    • E-mail
Réponse #10 le: 04 April 2018 à 18:10
 :hello: damotbe

Génial, un beau projet francophone!!!!
Tu es bien dans la bonne partie du forum pour ton topic.

Si tu as besoin d'aide ou de place pour inscrire tes informations, on est là.


Hors ligne damotbe

  • Boinc'eur Respectable
  • ****
  • Messages: 545
  •   
Réponse #11 le: 04 April 2018 à 18:56
Il serait bien de développer le projet aussi pour android  :kookoo:
Sinon je serais dispo  :hyperbon: :hyperbon: :hyperbon:

Si quelqu'un sait comment s'y prendre et peut nous aider, carrément ! (comme pour Windows et Mac)
Pour l'instant, on va surtout tourner avec Linux et les distros compatibles.



Hors ligne Antares

  • Intel Pentium G3420 à 3.2 go + Nvidia GeForce GTS450 Win 10 Pro 64bits
  • Méchant modo
  • Boinc'eur devant l'éternel
  • ******
  • Messages: 7207
  •   
    • E-mail
Réponse #12 le: 04 April 2018 à 19:08
A mettre sur le portail...

Quand le dernier arbre sera abattu, la dernière rivière empoisonnée, le dernier poisson capturé, alors le visage pâle réalisera que l'argent ne se mange pas.

Sitting Bull



Hors ligne overclockman

  • Boinc'eur devant l'éternel
  • *****
  • Messages: 1738
  •   
Réponse #13 le: 04 April 2018 à 19:23
Voila une bonne raison de plus de ré installer linux.  :hyperbon:

Sujet intéressant me tarde de voir ça.  :jap:



Hors ligne JeromeC

  • CàA
  • Boinc'eur devant l'éternel
  • *****
  • Messages: 31106
  •   
Réponse #14 le: 04 April 2018 à 20:10
Si quelqu'un sait comment s'y prendre et peut nous aider, carrément ! (comme pour Windows et Mac)
Pour l'instant, on va surtout tourner avec Linux et les distros compatibles.
Pour le multi-OS y'a le projet à base de VM/VB (j'espère que toTow va pas nous lire !!) mais bon ça couvre pas Android.

Je dis ça parce que au moins ça permettrait plus facilement d'avoir une version Mac, parce que sinon... l'eau va couler sous les ponts :/
(je suppose que la priorité n°2 sera une version windows)

Seb (qui ne vient plus trop nous voir) serait certainement de bon conseil sur le développement d'un projet boinc, sinon on avait Steiner mais lui ça fait des années qu'il ne vient plus (ni ne crunche).

A quoi bon prendre la vie au sérieux, puisque de toute façon nous n’en sortirons pas vivants ? (Alphonse Allais)



Hors ligne fzs600

  • Méchant modo
  • Boinc'eur devant l'éternel
  • ******
  • Messages: 7779
  •   
Réponse #15 le: 04 April 2018 à 21:10
(j'espère que toTow va pas nous lire !!)
:warf:


Utilisateur GNU-LINUX. fzs600@hub.g3l.org


Hors ligne toTOW

  • Boinc'eur devant l'éternel
  • *****
  • Messages: 4518
  •   
    • FAH-Addict.net
    • E-mail
Réponse #16 le: 05 April 2018 à 01:01
Vu ce qu'ils proposent sur leur site, j'ai peur que la VM sous Linux pour tout le monde soit la situation la plus simple, à moins d'avoir des spécialistes pour développer sous Windows et sous Mac ... leur sources m'ont pas l'air très compatible avec autre chose qu'un bon vieux GCC ... :/

A moins que ce soit plus simple que prévu et qu'on puisse passer par http://www.mingw.org/ ...

FAH-Addict, première source d'information francophone sur le projet Folding@Home.


Hors ligne damotbe

  • Boinc'eur Respectable
  • ****
  • Messages: 545
  •   
Réponse #17 le: 05 April 2018 à 07:15
Pour l'avoir déjà compilé, même sous Linux c'est assez pénible... Mais la doc indique Windows et Mac



Hors ligne mamouth

  • Boinc'eur Respectable
  • ****
  • Messages: 815
  •   
    • Confrérie Tchantchès
Réponse #18 le: 05 April 2018 à 09:05
Super un nouveau projet à connotation AF

Je vais l'attendre avec impatience
Bon courage et bonne chance pour la mise en place

Tu fais ça dans le cadre de ton boulot ou de façon bénévole ?



Hors ligne damotbe

  • Boinc'eur Respectable
  • ****
  • Messages: 545
  •   
Réponse #19 le: 05 April 2018 à 09:10
Merci pour vos encouragements.

C'est pour le boulot, je suis enseignant-chercheur en Informatique et je monte le projet avec un enseignant-chercheur en Chimie.



Hors ligne JeromeC

  • CàA
  • Boinc'eur devant l'éternel
  • *****
  • Messages: 31106
  •   
Réponse #20 le: 05 April 2018 à 11:44
On vous attend de pied ferme ! :)

A quoi bon prendre la vie au sérieux, puisque de toute façon nous n’en sortirons pas vivants ? (Alphonse Allais)



Hors ligne Oncle Bob

  • Boinc'eur devant l'éternel
  • *****
  • Messages: 5342
  •   
Réponse #21 le: 05 April 2018 à 12:25
Manque le plus important : les badges :D

Boincstat
Projets du moment
Config principale : i7 2600K@4,2 GHz / 32 Go@1333 MHz / GTX 970 (Win 10)
Crunchbox passives : i7-4785T / 8 Go@1600 MHz / Akasa Euler S (Debian) || i3-4130T / 4 Go@1600 MHz / Akasa Euler (Debian)
ARM : 1*S922 + 1*H3
Boinc@Raspberry Pi | Boinc et Linux | Date fin de projets


Hors ligne Spica

  • Méchant modo
  • Boinc'eur devant l'éternel
  • ******
  • Messages: 5146
  •   
Réponse #22 le: 05 April 2018 à 14:41
Merci pour vos encouragements.

C'est pour le boulot, je suis enseignant-chercheur en Informatique et je monte le projet avec un enseignant-chercheur en Chimie.
super idée, super projet... Je parie que je le connais l'enseignant-chercheur en Chimie....
Vu que je deviens un fantome j'espère quand même y participer...Celà va peut-etre meme m'aider dans mes activités professionnelles....

22717 SETI@home classic workunits; Redécouverte pulsar J1916+12 (le 07Nov2009) Einstein@Home.


Hors ligne JeromeC

  • CàA
  • Boinc'eur devant l'éternel
  • *****
  • Messages: 31106
  •   
Réponse #23 le: 05 April 2018 à 16:55
:kookoo:

A quoi bon prendre la vie au sérieux, puisque de toute façon nous n’en sortirons pas vivants ? (Alphonse Allais)



Hors ligne fzs600

  • Méchant modo
  • Boinc'eur devant l'éternel
  • ******
  • Messages: 7779
  •   
Réponse #24 le: 05 April 2018 à 17:58


Utilisateur GNU-LINUX. fzs600@hub.g3l.org