В феврале этого года NVIDIA анонсировала выход высокопроизовдительной видекарты Quadro GP100. В сравнении с предыдущими поколениями видеокарт серии Quadro, новая карта гораздо быстрее и является более энергоэффективной. Карта имеет 3 584 CUDA-ядер, которые обеспечивают счётную мощность в 10,6 и 5,3 терафлопс для вычислений с одинарной и с двойной точностью, соответственно.
Видеокарта имеет на борту 16 ГБ памяти типа HBM2 (high-bandwidth memory, второе поколение памяти с высокой пропускной способностью), которая обеспечивает передачу данных с умопомрачительной скоростью 720 ГБ/с. Как счётная мощность, там и память обеспечивают крайне высокую производительность, подходящую для решения наиболее сложных нестационарных задач электромагнитезма.
У меня была возможность оценить скорость нестационарных расчётов в ANSYS 18 HFSS Transient на рабочей станции DELL Precision T5600 для трёх вычислителей: видеокарты Quadro GP100, видеокарты NVIDIA Tesla K40 и центрального процессора Intel Xeon E5-2687W. Повышение скорости расчёта на Quadro GP100 по сравнению с Tesla K40 (замеренное для всего времени расчёта, а не только для вычислений на GPU), составило до 1,8 раза. В сравнении с восемью ядрами Xeon E5-2687W, скорость расчётов на Quadro GP100 в лучшем случае оказалась в 8,3 раза выше!