Первый запуск RTX 3090 и сравнение с 2080Ti
Ждал месяц поставки, наконец получил Gigabyte 3090 Gaming OC24G от JD. Выбрал эту карту в основном из-за 4-летней гарантии. До этого была 2080Ti Founders Edition (референсная версия), которая просто вышла из строя с артефактами.
Провел простые тесты, сравнение:
Толщина примерно в 1.7 раза больше, чем у референсной 2080Ti, длина как на фото, поэтому в корпусе пришлось снять крепления для оптического привода/жестких дисков.

Установил, подключил питание. Блока питания на 850Вт хватает:

В целом, температура ниже, чем у референсной 2080Ti. При полной нагрузке на CUDA в течение 5 дней температура стабильно держалась около 70 градусов, что неудивительно, учитывая размеры карты.
Измерил мощность с помощью умной розетки Xiaomi. Общая потребляемая мощность системы около 500Вт, а вместе с двумя мониторами и двумя роутерами — примерно 600Вт. В комнате можно использовать как обогреватель, эффект действительно отличный: и вычисления, и бесплатное отопление, двойная выгода.

По шуму: на полной мощности очень громко. При низкой нагрузке шум вентиляторов корпуса у меня намного громче, чем у видеокарты. В корпус добавил слой HEPA-фильтра, из-за чего стало шумно. Зато нет пыли — фото 2080Ti выше сделано после двух лет использования, просто вынул и сфотографировал, чисто.
Вычислительная производительность
Если планируете заниматься глубоким обучением или параллельными вычислениями, не забудьте обновиться до CUDA 11. Старая версия CUDA 10 не поддерживает 3090.
У меня в системе все еще старый PCIe 3. Скорость шины в основном влияет на скорость копирования данных в видеопамять. У меня данные копируются только один раз при инициализации, поэтому необходимости в PCIe 4 нет. Если для глубокого обучения вам нужны батчи (batch), то переход на PCIe 4 необходим.
Протестировал вычислительную мощность RTX 3090 в сравнении с 2080Ti. Использовал Pytorch 1.7 + CUDA 11, запускал свою собственную программу. Хотя результаты не являются репрезентативными, они позволяют сравнить разницу между двумя картами. Результаты следующие:
| 3090 | 2080Ti | CPU | |
|---|---|---|---|
| Простое среднее (Mean) | 88 мс (34x) | 144 мс (20x) | 3 с (1x) |
| Смешанный алгоритм | 184 мс (76x) | 282 мс (50x) | 14 с (1x) |