cuda

    7Ciepło

    1Odpowiedz

    Szybkość transmisji danych w operacjach cudaMemcpy jest silnie uzależniona od liczby pasów PCI-e 3.0 (lub 2.0) przydzielonych do uruchomienia z procesora na GPU. Ciekawi mnie sposób wykorzystania pasó

    5Ciepło

    1Odpowiedz

    Czy ktoś wie, który i gdzie jest zestaw SDK/toolkitów, które zawierają cutil.h? Próbowałem CUDA toolkits3.2 i toolkits5.0 (znam tej wersji nie jest obsługiwane już przez cutil.h) także zauważam jakiś

    7Ciepło

    2Odpowiedz

    Środowisko wykonawcze CUDA ma funkcję wygody cudaGetErrorString(cudaError_t error), która tłumaczy wyliczenie błędu na czytelny ciąg znaków. cudaGetErrorString jest używane w makrze CUDA_SAFE_CALL(som

    16Ciepło

    1Odpowiedz

    Mam następującą konfigurację. Mam zamiar rozszerzyć framework napisany w C++ za pomocą MPI i innych rzeczy używając CUDA. Projekt wykorzystuje cmake do budowania. Chciałbym uniknąć korzystania z bibli

    7Ciepło

    1Odpowiedz

    Czy ma sens przepisanie kodu tak, aby ładował on dane przez bufor tekstowy (zakładając, że nie potrzebuję filtrowania i innych opcji modułów tekstur) lub czy jest taki sam? Jak załadować niektóre dane

    11Ciepło

    2Odpowiedz

    Jak zmusić gcc do przeglądania/usr/cuda/local/include for cuda_runtime.h? Próbuję skompilować aplikację CUDA z opakowaniem C. Używam Ubuntu 10.04. Mam pomyślnie skompilowany mojej aplikacji CUDA w .so

    6Ciepło

    1Odpowiedz

    Jestem świadomy alokacji dynamicznej, gdy używane są tablice 1D, ale jak można to zrobić, gdy używane są tablice 2D? myKernel<<<blocks, threads,sizeofSharedMemoryinBytes>>>(); .... __global__

    6Ciepło

    2Odpowiedz

    Według NVIDIA website: "CUDA Toolkit uzupełnia i pełni obsługuje programowanie z dyrektyw OpenACC". Czy oznacza to, że programy OpenACC (pargma i API) mogą być kompilowane z nvcc kompilatora? Czy ozna

    9Ciepło

    2Odpowiedz

    __global__ void add(int a, int b, int *c) { *c = a + b; } int main(void) { int c; int *dev_c; HANDLE_ERROR(cudaMalloc((void**)&dev_c, sizeof(int))); add<<<1,1>>>(2, 7, dev_c); HANDLE_ERROR

    8Ciepło

    1Odpowiedz

    Od online dokumentacji: cudaError_t cudaMemset (void * devPtr, int value, size_t count) wypełnia pierwsze bajtów count obszaru pamięci wskazywanego przez devPtr ze stałą bajt wartości wartości. Para