Новая версия CUDA 4.0 упрощает параллельное программированиеопубликовано: 02.03.2011
Компания NVIDIA объявила о выходе новой версии набора инструментов NVIDIA CUDA для разработки параллельных приложений с помощью графических процессоров NVIDIA.
Набор инструментов NVIDIA CUDA 4.0 был создан, чтобы упростить параллельное программирование и позволить широкому кругу разработчиков задействовать GPU в своих приложениях. Основные возможности новой архитектуры:
- Технология NVIDIA GPUDirect 2.0 обеспечивает равноправную связь между GPU в рамках одного сервера или рабочей станции, что упрощает и ускоряет мультипроцессорное программирование и работу приложений.
- Унифицированная виртуальная адресация (UVA) организует единое адресное пространство для основной системной памяти и памяти GPU, что делает параллельное программирование еще быстрее и проще.
- Библиотеки примитивов Thrust C++ - набор алгоритмов C++ с открытым кодом для параллельных расчетов и структур данных, которые упрощают программирование для разработчиков на C++. Thrust ускоряет стандартные операции, такие как параллельное хранение, в 5-100 раз по сравнению с библиотеками Standard Template Library (STL) и Threading Building Blocks (TBB).
Архитектура CUDA 4.0 включает и другие функции и возможности:
- MPI интеграция с приложениями CUDA — модификация MPI, такая как OpenMPI, автоматически пересылает данные из и в память GPU по Infiniband, когда приложение посылает или получает запрос с MPI.
- Многопоточность и GPU — многочисленные потоки с CPU хоста могут обмениваться контекстом на одном GPU, что упрощает совместное использование GPU многопоточными приложениями.
- Использование нескольких GPU одним потоком с CPU — один поток с CPU хоста может иметь доступ ко всем GPU в системе. Разработчики могут легко распределить работу между несколькими GPU для таких задач, как обмен «ореолами» в приложениях.
- Новая библиотека NPP для обработки изображений и компьютерного видения — большой набор операций по трансформации изображения, которые позволяют быстро разрабатывать приложения обработки изображений и компьютерного зрения.
К другим новым и улучшенным возможностям относится автоматический анализ производительности в Visual Profiler, новые функции в cuda-gdb и поддержка MacOS, поддержка функций C++, таких как new / delete и виртуальные функции, а также новый бинарный дизассемлер на GPU.
Версия CUDA Toolkit 4.0 будет доступна бесплатно с 4 марта 2011 года при условии вступления в программу разработчиков CUDA. По материалам сайта ixbt.com |