Le Forum de l'Alliance Francophone

Nouvelles:

Auteur Sujet: [BLA-BLA] GPU  (Lu 367951 fois)

0 Membres et 3 Invités sur ce sujet

Hors ligne nabz

  • Animateur fanatique
  • Boinc'eur devant l'éternel
  • *****
  • Messages: 5530
  •   
Réponse #1625 le: 13 December 2014 à 17:32
En tout cas si AMD reprend du poil de la bête, c'est une bonne nouvelle, je suis pour la biodiversité. :)

Marre que nVidia nous tonde en nous vendant des cartes mono-GPU milieu de gamme, au prix auquel on pouvait avoir des bi-GPU haut de gamme il y a quelques années. :rhaa:

Contrôle de BOINC : SAM - BoincTasks 1.80 béta - Bureau à distance Chrome
Calculs : Boinc 7.16.6 SE - VirtualBox 6.1.12 -  TThrottle 7.72 - Pilote AMD 20.4.2 - Pilote nVidia 451.67
OS et utilitaires : Win10 Pro x64 rev 20.04 - Core Temp 1.15 - CCleaner 5.69


Hors ligne TRINITAS

  • Boinc'eur Confirmé
  • ***
  • Messages: 296
  •   
    • E-mail
Réponse #1626 le: 13 December 2014 à 18:47
Tu vas encore étre plus en rogne XD

nVidia officialise pour Janvier la GTX960:
GM206 => 1280-80-48 - 3GB G-DDR5 192 bits à .........240 dollars XD

A ce prix la, autant prendre la R9-290-_-

PC1: RyZen 7 5800X3D - 32GB DDR4 - 2xRadeon RX 7900 GRE - Windows 10 Pro
PC2: Xeon E5-2678 v3 (x2) - 64GB DDR4 - GeForce RTX 2080 SUPER FE + Radeon VII - Windows 10 Pro
PC3: RyZen 3 3200G - 16GB DDR4 - ARC A770 16GB - Windows 10 Pro


Hors ligne TRINITAS

  • Boinc'eur Confirmé
  • ***
  • Messages: 296
  •   
    • E-mail
Réponse #1627 le: 16 December 2014 à 22:03
grosses news AMD et NVIDIA: (Cores:TMU:ROP)

R9-390X: BERMUDE 20 nm => 4736:296:128 - 8GB HBM 8192 bits => 10% supérieure à la GM200
R9-390: BERMUDE 20 nm => 4480:280:128 - 8GB HBM 8192 bits
R9-380X: FIJI 20 nm => 3840:240:64 - 4GB HBM 4096 bits => 17% supérieure à la GTX980
R9-380: FIJI 20 nm => 3584:224:64 - 4GB HBM 4096 bits

GeForce GTX Titan II => GM200 20 nm => 3072:192:96 - 12GB GDDR5 512 bits
GeForce GTX 985 => GM200 20 nm => 2688:168:96 - 8GB GDDR5 512 bits

Consommations:
BERMUDE: ?
FIJI: 220 Watts
GM200: 230 Watts

Rien sur les R9-370, possible que ce soit des TONGA boostées pour faire pareil que les Hawaï.

Rapports performances: (en 4K)
BERMUDE: 150.7%
GTX Titan II: 135.2%
GTX 985: 119.9%
FIJI: 118.8%
GTX980: 100%
R9-290X: 90.5%
GTX780 Ti: 89.7%

PC1: RyZen 7 5800X3D - 32GB DDR4 - 2xRadeon RX 7900 GRE - Windows 10 Pro
PC2: Xeon E5-2678 v3 (x2) - 64GB DDR4 - GeForce RTX 2080 SUPER FE + Radeon VII - Windows 10 Pro
PC3: RyZen 3 3200G - 16GB DDR4 - ARC A770 16GB - Windows 10 Pro


Philippe06121966

  • Invité
Réponse #1628 le: 17 December 2014 à 18:12
nVidia : driver: 347.9 dispo (BETA)



Hors ligne toTOW

  • Boinc'eur devant l'éternel
  • *****
  • Messages: 4518
  •   
    • FAH-Addict.net
    • E-mail
Réponse #1629 le: 21 December 2014 à 18:16
Bon bah si j'en crois BOINC et les projets : Coprocesseurs   AMD Hawaii (4096MB) OpenCL: 2.0

Ca m'étonne que Hawaii soit compatible OpenCL 2.0 ... après c'est peut être juste la version des drivers qu'il voit ?

FAH-Addict, première source d'information francophone sur le projet Folding@Home.


Hors ligne TRINITAS

  • Boinc'eur Confirmé
  • ***
  • Messages: 296
  •   
    • E-mail
Réponse #1630 le: 21 December 2014 à 19:10
C'est les drivers qui sont en 2.0, mais Hawaï c'est du 1.2......

BOINC mélange un peu les deux, et n'est pas vraiment top au niveau détection: Tu retourne en version Catalyst 14.9 par exemple, tu retrouvera 1.2

Utilise AIDA64 si tu veux savoir ta VRAI version matériel et software...

Le 2.0, ce sera avec les Radeon Rx-300 GCN2.0 + le IGP des APU "Carrizo"
« Modifié: 21 December 2014 à 19:21 par Gael91 »

PC1: RyZen 7 5800X3D - 32GB DDR4 - 2xRadeon RX 7900 GRE - Windows 10 Pro
PC2: Xeon E5-2678 v3 (x2) - 64GB DDR4 - GeForce RTX 2080 SUPER FE + Radeon VII - Windows 10 Pro
PC3: RyZen 3 3200G - 16GB DDR4 - ARC A770 16GB - Windows 10 Pro


Hors ligne toTOW

  • Boinc'eur devant l'éternel
  • *****
  • Messages: 4518
  •   
    • FAH-Addict.net
    • E-mail
Réponse #1631 le: 21 December 2014 à 19:20
Pourtant :

Citer
C:\Users\toTOW>clinfo
Number of platforms:                             1
  Platform Profile:                              FULL_PROFILE
  Platform Version:                              OpenCL 2.0 AMD-APP (1642.5)
  Platform Name:                                 AMD Accelerated Parallel Proces
sing
  Platform Vendor:                               Advanced Micro Devices, Inc.
  Platform Extensions:                           cl_khr_icd cl_khr_d3d10_sharing
 cl_khr_d3d11_sharing cl_khr_dx9_media_sharing cl_amd_event_callback cl_amd_offl
ine_devices


  Platform Name:                                 AMD Accelerated Parallel Proces
sing
Number of devices:                               2
  Device Type:                                   CL_DEVICE_TYPE_GPU
  Vendor ID:                                     1002h
  Board name:                                    AMD Radeon R9 200 Series
  Device Topology:                               PCI[ B#2, D#0, F#0 ]
  Max compute units:                             44
  Max work items dimensions:                     3
    Max work items[0]:                           256
    Max work items[1]:                           256
    Max work items[2]:                           256
  Max work group size:                           256
  Preferred vector width char:                   4
  Preferred vector width short:                  2
  Preferred vector width int:                    1
  Preferred vector width long:                   1
  Preferred vector width float:                  1
  Preferred vector width double:                 1
  Native vector width char:                      4
  Native vector width short:                     2
  Native vector width int:                       1
  Native vector width long:                      1
  Native vector width float:                     1
  Native vector width double:                    1
  Max clock frequency:                           1000Mhz
  Address bits:                                  64
  Max memory allocation:                         4024434688
  Image support:                                 Yes
  Max number of images read arguments:           128
  Max number of images write arguments:          64
  Max image 2D width:                            16384
  Max image 2D height:                           16384
  Max image 3D width:                            2048
  Max image 3D height:                           2048
  Max image 3D depth:                            2048
  Max samplers within kernel:                    16
  Max size of kernel argument:                   1024
  Alignment (bits) of base address:              2048
  Minimum alignment (bytes) for any datatype:    128
  Single precision floating point capability
    Denorms:                                     No
    Quiet NaNs:                                  Yes
    Round to nearest even:                       Yes
    Round to zero:                               Yes
    Round to +ve and infinity:                   Yes
    IEEE754-2008 fused multiply-add:             Yes
  Cache type:                                    Read/Write
  Cache line size:                               64
  Cache size:                                    16384
  Global memory size:                            4294967296
  Constant buffer size:                          65536
  Max number of constant args:                   8
  Local memory type:                             Scratchpad
  Local memory size:                             32768
  Max pipe arguments:                            16
  Max pipe active reservations:                  16
  Max pipe packet size:                          4024434688
  Max global variable size:                      3621991168
  Max global variable preferred total size:      4294967296
  Max read/write image args:                     64
  Max on device events:                          1024
  Queue on device max size:                      524288
  Max on device queues:                          1
  Queue on device preferred size:                16384
  SVM capabilities:
    Coarse grain buffer:                         Yes
    Fine grain buffer:                           Yes
    Fine grain system:                           No
    Atomics:                                     No
  Preferred platform atomic alignment:           0
  Preferred global atomic alignment:             0
  Preferred local atomic alignment:              0
  Kernel Preferred work group size multiple:     64
  Error correction support:                      0
  Unified memory for Host and Device:            0
  Profiling timer resolution:                    1
  Device endianess:                              Little
  Available:                                     Yes
  Compiler available:                            Yes
  Execution capabilities:
    Execute OpenCL kernels:                      Yes
    Execute native function:                     No
  Queue on Host properties:
    Out-of-Order:                                No
    Profiling :                                  Yes
  Queue on Device properties:
    Out-of-Order:                                Yes
    Profiling :                                  Yes
  Platform ID:                                   000007FED9C96B60
  Name:                                          Hawaii
  Vendor:                                        Advanced Micro Devices, Inc.
  Device OpenCL C version:                       OpenCL C 2.0
  Driver version:                                1642.5 (VM)
  Profile:                                       FULL_PROFILE
  Version:                                       OpenCL 2.0 AMD-APP (1642.5)
  Extensions:                                    cl_khr_fp64 cl_amd_fp64 cl_khr_
global_int32_base_atomics cl_khr_global_int32_extended_atomics cl_khr_local_int3
2_base_atomics cl_khr_local_int32_extended_atomics cl_khr_int64_base_atomics cl_
khr_int64_extended_atomics cl_khr_3d_image_writes cl_khr_byte_addressable_store
cl_khr_gl_sharing cl_ext_atomic_counters_32 cl_amd_device_attribute_query cl_amd
_vec3 cl_amd_printf cl_amd_media_ops cl_amd_media_ops2 cl_amd_popcnt cl_khr_d3d1
0_sharing cl_khr_d3d11_sharing cl_khr_dx9_media_sharing cl_khr_image2d_from_buff
er cl_khr_spir cl_khr_subgroups cl_khr_gl_event cl_khr_depth_images


  Device Type:                                   CL_DEVICE_TYPE_CPU
  Vendor ID:                                     1002h
  Board name:
  Max compute units:                             8
  Max work items dimensions:                     3
    Max work items[0]:                           1024
    Max work items[1]:                           1024
    Max work items[2]:                           1024
  Max work group size:                           1024
  Preferred vector width char:                   16
  Preferred vector width short:                  8
  Preferred vector width int:                    4
  Preferred vector width long:                   2
  Preferred vector width float:                  4
  Preferred vector width double:                 2
  Native vector width char:                      16
  Native vector width short:                     8
  Native vector width int:                       4
  Native vector width long:                      2
  Native vector width float:                     4
  Native vector width double:                    2
  Max clock frequency:                           3337Mhz
  Address bits:                                  64
  Max memory allocation:                         2413327360
  Image support:                                 Yes
  Max number of images read arguments:           128
  Max number of images write arguments:          64
  Max image 2D width:                            8192
  Max image 2D height:                           8192
  Max image 3D width:                            2048
  Max image 3D height:                           2048
  Max image 3D depth:                            2048
  Max samplers within kernel:                    16
  Max size of kernel argument:                   4096
  Alignment (bits) of base address:              1024
  Minimum alignment (bytes) for any datatype:    128
  Single precision floating point capability
    Denorms:                                     Yes
    Quiet NaNs:                                  Yes
    Round to nearest even:                       Yes
    Round to zero:                               Yes
    Round to +ve and infinity:                   Yes
    IEEE754-2008 fused multiply-add:             Yes
  Cache type:                                    Read/Write
  Cache line size:                               64
  Cache size:                                    32768
  Global memory size:                            9653309440
  Constant buffer size:                          65536
  Max number of constant args:                   8
  Local memory type:                             Global
  Local memory size:                             32768
  Max pipe arguments:                            16
  Max pipe active reservations:                  16
  Max pipe packet size:                          2413327360
  Max global variable size:                      1879048192
  Max global variable preferred total size:      1879048192
  Max read/write image args:                     64
  Max on device events:                          0
  Queue on device max size:                      0
  Max on device queues:                          0
  Queue on device preferred size:                0
  SVM capabilities:
    Coarse grain buffer:                         Yes
    Fine grain buffer:                           Yes
    Fine grain system:                           Yes
    Atomics:                                     Yes
  Preferred platform atomic alignment:           0
  Preferred global atomic alignment:             0
  Preferred local atomic alignment:              0
  Kernel Preferred work group size multiple:     1
  Error correction support:                      0
  Unified memory for Host and Device:            1
  Profiling timer resolution:                    306
  Device endianess:                              Little
  Available:                                     Yes
  Compiler available:                            Yes
  Execution capabilities:
    Execute OpenCL kernels:                      Yes
    Execute native function:                     Yes
  Queue on Host properties:
    Out-of-Order:                                No
    Profiling :                                  Yes
  Queue on Device properties:
    Out-of-Order:                                No
    Profiling :                                  No
  Platform ID:                                   000007FED9C96B60
  Name:                                          Intel(R) Core(TM) i7 CPU
  920  @ 2.67GHz
  Vendor:                                        GenuineIntel
  Device OpenCL C version:                       OpenCL C 1.2
  Driver version:                                1642.5 (sse2)
  Profile:                                       FULL_PROFILE
  Version:                                       OpenCL 1.2 AMD-APP (1642.5)
  Extensions:                                    cl_khr_fp64 cl_amd_fp64 cl_khr_
global_int32_base_atomics cl_khr_global_int32_extended_atomics cl_khr_local_int3
2_base_atomics cl_khr_local_int32_extended_atomics cl_khr_int64_base_atomics cl_
khr_int64_extended_atomics cl_khr_3d_image_writes cl_khr_byte_addressable_store
cl_khr_gl_sharing cl_ext_device_fission cl_amd_device_attribute_query cl_amd_vec
3 cl_amd_printf cl_amd_media_ops cl_amd_media_ops2 cl_amd_popcnt cl_khr_d3d10_sh
aring cl_khr_spir cl_khr_gl_event

Et ça semble logique, pour OpenCL 2.0 sur CPU, j'ai vu qu'il fallait absolument du SSE4.x ...

D'ailleurs, même le Khronos Group indique Hawaii comme compatible ici : https://www.khronos.org/conformance/adopters/conformant-products#opencl

FAH-Addict, première source d'information francophone sur le projet Folding@Home.


Hors ligne TRINITAS

  • Boinc'eur Confirmé
  • ***
  • Messages: 296
  •   
    • E-mail
Réponse #1632 le: 21 December 2014 à 19:28

PC1: RyZen 7 5800X3D - 32GB DDR4 - 2xRadeon RX 7900 GRE - Windows 10 Pro
PC2: Xeon E5-2678 v3 (x2) - 64GB DDR4 - GeForce RTX 2080 SUPER FE + Radeon VII - Windows 10 Pro
PC3: RyZen 3 3200G - 16GB DDR4 - ARC A770 16GB - Windows 10 Pro


Hors ligne toTOW

  • Boinc'eur devant l'éternel
  • *****
  • Messages: 4518
  •   
    • FAH-Addict.net
    • E-mail
Réponse #1633 le: 21 December 2014 à 22:54
Bizarre du coup ...

FAH-Addict, première source d'information francophone sur le projet Folding@Home.


Hors ligne Necromago

  • Boinc'eur Confirmé
  • ***
  • Messages: 347
  •   
Réponse #1634 le: 23 December 2014 à 17:34
Petite question GPU justement...

J'aimerai mettre à contribution mon GPU sur ma Debian Wheezy:

CUDA: NVIDIA GPU 0: GeForce GT 520 (driver version unknown, CUDA version 5.5, compute capability 2.1, 1023MB, 992MB available, 156 GFLOPS peak)   

Mais je souhaiterai un projet qui ne me fasse pas déprimer en voyant ma petite carte gfx lutter pour faire une UT...

Auriez-vous des idées et/ou conseils pour moi ?
Merci.


SETI@home classic WU : 10,787
SETI@home classic CPU time : 59,954 hours


Philippe06121966

  • Invité
Réponse #1635 le: 23 December 2014 à 18:15
Si trop long, les Collatz Mini. Sinon, PPS Sieve ça devrait fonctionner.
 :hello: :kookoo:



Hors ligne Necromago

  • Boinc'eur Confirmé
  • ***
  • Messages: 347
  •   
Réponse #1636 le: 23 December 2014 à 19:14
Je viens de lancer ces projets en test:

Collatz Conjecture
Einstein@home
Milkyway@home
POEM@home
PrimeGrid
Seti@home

Et toujours ce dernier:
WUProp@Home

Je vous tiens au courant des résultats sous 8j.


SETI@home classic WU : 10,787
SETI@home classic CPU time : 59,954 hours


Hors ligne toTOW

  • Boinc'eur devant l'éternel
  • *****
  • Messages: 4518
  •   
    • FAH-Addict.net
    • E-mail
Réponse #1637 le: 24 December 2014 à 18:45
Collatz et Milkyway sont des proejts pour ATI ... je te les déconseille ...

Pour les autres tu devrais pas avoir trop de déceptions, à moins d'incompatibilité des applis avec linux ...

FAH-Addict, première source d'information francophone sur le projet Folding@Home.


Hors ligne Necromago

  • Boinc'eur Confirmé
  • ***
  • Messages: 347
  •   
Réponse #1638 le: 24 December 2014 à 22:56
C'est noté, merci.


SETI@home classic WU : 10,787
SETI@home classic CPU time : 59,954 hours


Hors ligne Oncle Bob

  • Boinc'eur devant l'éternel
  • *****
  • Messages: 5342
  •   
Réponse #1639 le: 25 December 2014 à 01:06
Collatz et Milkyway sont des proejts pour ATI ... je te les déconseille ...

DP pure ?

Boincstat
Projets du moment
Config principale : i7 2600K@4,2 GHz / 32 Go@1333 MHz / GTX 970 (Win 10)
Crunchbox passives : i7-4785T / 8 Go@1600 MHz / Akasa Euler S (Debian) || i3-4130T / 4 Go@1600 MHz / Akasa Euler (Debian)
ARM : 1*S922 + 1*H3
Boinc@Raspberry Pi | Boinc et Linux | Date fin de projets


Hors ligne nabz

  • Animateur fanatique
  • Boinc'eur devant l'éternel
  • *****
  • Messages: 5530
  •   
Réponse #1640 le: 25 December 2014 à 03:47
Oui pour Milky.

Collatz ne calcule ni en SP, ni en DP, mais en entiers.
« Modifié: 27 December 2014 à 03:46 par nabz »

Contrôle de BOINC : SAM - BoincTasks 1.80 béta - Bureau à distance Chrome
Calculs : Boinc 7.16.6 SE - VirtualBox 6.1.12 -  TThrottle 7.72 - Pilote AMD 20.4.2 - Pilote nVidia 451.67
OS et utilitaires : Win10 Pro x64 rev 20.04 - Core Temp 1.15 - CCleaner 5.69


Hors ligne Oncle Bob

  • Boinc'eur devant l'éternel
  • *****
  • Messages: 5342
  •   
Réponse #1641 le: 25 December 2014 à 21:33
Ben alors, pourquoi pas de Colatz en SP pour NVidia ?

Boincstat
Projets du moment
Config principale : i7 2600K@4,2 GHz / 32 Go@1333 MHz / GTX 970 (Win 10)
Crunchbox passives : i7-4785T / 8 Go@1600 MHz / Akasa Euler S (Debian) || i3-4130T / 4 Go@1600 MHz / Akasa Euler (Debian)
ARM : 1*S922 + 1*H3
Boinc@Raspberry Pi | Boinc et Linux | Date fin de projets


Hors ligne Necromago

  • Boinc'eur Confirmé
  • ***
  • Messages: 347
  •   
Réponse #1642 le: 25 December 2014 à 23:31
J'ai des WU pour ma Nvidia pourtant...


SETI@home classic WU : 10,787
SETI@home classic CPU time : 59,954 hours


Philippe06121966

  • Invité
Réponse #1643 le: 26 December 2014 à 09:30
Oui MW fonctionne sur les cartes nVidia.

Par contre, les performances en Double Précision des cartes GTX sont ... disons ... très faibles, surtout comparées aux ATI.
(à l'exception des TITAN et TITAN BLACK + cartes pros)

Une GTX770 mettra au moins 10 x plus de temps pour calculer une UT MW qu'une HD7950.

=> La remarque de toTOW concerne les performances, pas la possibilité technique de faire tourner les projets  :jap:

AMHA, une GT520 peut être utilisée "idéalement" sur EINSTEIN, PPS Sieve, Collatz Mini (CUDA)

Eventuellement Collatz Solo (= de points / 24h que les Mini).

 :hello: :kookoo:



Philippe06121966

  • Invité
Réponse #1644 le: 26 December 2014 à 10:01
Merci pour l'info !  :jap:

Et niveau "temps de calcul", ça donne quoi ?

Pas moyen d'optimiser tout ça ?



Hors ligne Necromago

  • Boinc'eur Confirmé
  • ***
  • Messages: 347
  •   
Réponse #1645 le: 26 December 2014 à 23:53
Bon, après tests, hormis deux projets, la GeForce GT 520 ne dépote pas :(

Einstein@home
ou
Seti@home

Au moins je suis fixé :)


SETI@home classic WU : 10,787
SETI@home classic CPU time : 59,954 hours


Philippe06121966

  • Invité
Réponse #1646 le: 27 December 2014 à 07:40
 :hello:

Hormis ton GPU, quelle est la configuration de ton pc ?

Si tu veux changer de carte, c'est bientôt les soldes + il y a probablement de nombreux gamers
qui vont en revendre après le passage du Père Noël  ;)

Il y a pas mal de cartes < 100 € (occasion) qui sont 10x plus performantes que la GT520.

(GTX750Ti (pas besoin d'alimentation par câble PCI-E si j'ai bien compris) , GTX660 / 660Ti, HD7950, ...)

 :kookoo:



Hors ligne Necromago

  • Boinc'eur Confirmé
  • ***
  • Messages: 347
  •   
Réponse #1647 le: 27 December 2014 à 09:28
La configuration est assez basique...

CM : ASROCK ConRoe1333-D667 R1.0 (PCI-X 1.1)
CPU : Intel C2D E6850
RAM : 2Go DDR
GfX : GeForce GT 520
HDD : 40 Go IDE

Oui, c'est avant tout de la récupération :)
« Modifié: 27 December 2014 à 09:39 par Necromago »


SETI@home classic WU : 10,787
SETI@home classic CPU time : 59,954 hours


Philippe06121966

  • Invité
Réponse #1648 le: 27 December 2014 à 09:53
 :jap:

Je laisse des crunchers plus expérimentés te conseiller pour le choix d'un autre GPU, au cas où tu voudrais en changer.

Ce genre de carte ne demande pas beaucoup de puissance électrique : http://www.leboncoin.fr/informatique/746628978.htm?ca=15_s

+ en CUDA, pas besoin de beaucoup de temps CPU

 :hello: :kookoo:



Hors ligne Necromago

  • Boinc'eur Confirmé
  • ***
  • Messages: 347
  •   
Réponse #1649 le: 27 December 2014 à 11:44
Je comprends bien, mais j'aimerai que la carte soit 100% compatible avec ma carte-mère...

Des fois qu'un jour je recycle le PC pour mes nains.


SETI@home classic WU : 10,787
SETI@home classic CPU time : 59,954 hours