cuda

7Ciepło

1Odpowiedz

Szybkość transmisji danych w operacjach cudaMemcpy jest silnie uzależniona od liczby pasów PCI-e 3.0 (lub 2.0) przydzielonych do uruchomienia z procesora na GPU. Ciekawi mnie sposób wykorzystania pasó

5Ciepło

1Odpowiedz

CUDA cutil.h gdzie to jest?

Czy ktoś wie, który i gdzie jest zestaw SDK/toolkitów, które zawierają cutil.h? Próbowałem CUDA toolkits3.2 i toolkits5.0 (znam tej wersji nie jest obsługiwane już przez cutil.h) także zauważam jakiś

7Ciepło

2Odpowiedz

Odpowiednik cudaGetErrorString dla cuBLAS?

Środowisko wykonawcze CUDA ma funkcję wygody cudaGetErrorString(cudaError_t error), która tłumaczy wyliczenie błędu na czytelny ciąg znaków. cudaGetErrorString jest używane w makrze CUDA_SAFE_CALL(som

16Ciepło

1Odpowiedz

Tworzenie plików obiektów CUDA przy użyciu cmake

Mam następującą konfigurację. Mam zamiar rozszerzyć framework napisany w C++ za pomocą MPI i innych rzeczy używając CUDA. Projekt wykorzystuje cmake do budowania. Chciałbym uniknąć korzystania z bibli

7Ciepło

1Odpowiedz

CUDA: Czy pamięć podręczna tekstur na FERMI jest oddzielona od pamięci podręcznej L1?

Czy ma sens przepisanie kodu tak, aby ładował on dane przez bufor tekstowy (zakładając, że nie potrzebuję filtrowania i innych opcji modułów tekstur) lub czy jest taki sam? Jak załadować niektóre dane

11Ciepło

2Odpowiedz

error: cuda_runtime.h: Brak takiego pliku lub katalogu

Jak zmusić gcc do przeglądania/usr/cuda/local/include for cuda_runtime.h? Próbuję skompilować aplikację CUDA z opakowaniem C. Używam Ubuntu 10.04. Mam pomyślnie skompilowany mojej aplikacji CUDA w .so

6Ciepło

1Odpowiedz

Alokacja dynamiczna z podziałem pamięci GPU 2D

Jestem świadomy alokacji dynamicznej, gdy używane są tablice 1D, ale jak można to zrobić, gdy używane są tablice 2D? myKernel<<<blocks, threads,sizeofSharedMemoryinBytes>>>(); .... __global__

6Ciepło

2Odpowiedz

nvcc 5,0 i OpenACC

Według NVIDIA website: "CUDA Toolkit uzupełnia i pełni obsługuje programowanie z dyrektyw OpenACC". Czy oznacza to, że programy OpenACC (pargma i API) mogą być kompilowane z nvcc kompilatora? Czy ozna

9Ciepło

2Odpowiedz

HANDLE_ERROR nie znaleziono błędu w Cuda

__global__ void add(int a, int b, int *c) { *c = a + b; } int main(void) { int c; int *dev_c; HANDLE_ERROR(cudaMalloc((void**)&dev_c, sizeof(int))); add<<<1,1>>>(2, 7, dev_c); HANDLE_ERROR

8Ciepło

1Odpowiedz

cudaMemset() - czy ustawia bajty lub liczby całkowite?

Od online dokumentacji: cudaError_t cudaMemset (void * devPtr, int value, size_t count) wypełnia pierwsze bajtów count obszaru pamięci wskazywanego przez devPtr ze stałą bajt wartości wartości. Para