Sur ATI en OpenCL, j'ai remarqué que ce n'est pas de laisser un core de libre qui est le plus efficace, mais bien de fixer l'affinité de l'application à un seul thread.
Faites l'essai sur vos machines : par exemple sur mon i7 et ses 8 threads (appelé Core 1, HT 1, core 2, HT2, ...) j'ai les perfs optimales en fixant l'affinité sur HT4 (choisi au hasard, mais ca marche si je choisis n'importe quel autre thread). Pour tester simplement, vous pouvez le faire avec le gestionnaire de tâches windows.
Pour automatiser, j'utilise Bill2's Process Manager, qui permet de créer des règles de gestion de priorité et/ou affinités automatiques.