Estoy teniendo problemas para conseguir Theano el uso de la GPU en mi máquina.

Cuando ejecuto:
/usr/local/lib/python2.7/dist-paquetes/theano/misc$ THEANO_FLAGS=floatX=float32,dispositivo=gpu python check_blas.py
ADVERTENCIA (theano.sandbox.cuda): CUDA está instalado, pero el dispositivo gpu no está disponible (error: no se puede obtener el número de las tarjetas gráficas disponibles: no hay CUDA capaz dispositivo es detectado)

También he comprobado que el driver de NVIDIA se instala con: lspci -vnn | grep-i VGA-12

con el resultado: controlador de Kernel en uso: nvidia

Sin embargo, cuando ejecuto: nvidia-smi
resultado: NVIDIA: no se pudo abrir el archivo de dispositivo /dev/nvidiactl (No existe el fichero o el directorio).
NVIDIA-SMI ha fallado porque no podía comunicarse con el driver de NVIDIA. Asegúrese de que el último driver de NVIDIA está instalado y en ejecución.

y /dev/nvidiaactl no existe. ¿Qué está pasando?

ACTUALIZACIÓN: /nvidia-smi trabaja con el resultado:

+------------------------------------------------------+
| NVIDIA-SMI 4.304...   Driver Version: 304.116        |
|-------------------------------+----------------------+----------------------+
| GPU  Name                     | Bus-Id        Disp.  | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap| Memory-Usage         | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GRID K520                | 0000:00:03.0     N/A |                  N/A |
| N/A   39C  N/A     N/A /  N/A |   0%   10MB / 4095MB |     N/A      Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Compute processes:                                               GPU Memory |
|  GPU       PID  Process name                                     Usage      |
|=============================================================================|
|    0            Not Supported                                               |
+-----------------------------------------------------------------------------+

y después de compilar el NVIDIA_CUDA-6.0_Samples, la ejecución de la deviceQuery puedo obtener resultado:

cudaGetDeviceCount devuelto 35
-> CUDA versión de controlador es insuficiente para CUDA runtime, versión
Resultado = fallo de

estás ejecutando nvidia-smi como usuario root? Si no, intente ejecutar como root. Si se está ejecutando como root, su controlador no está instalado correctamente. Intente volver a instalar el controlador. Por cierto, Ubuntu 14.04 no es oficialmente compatible con cualquier versión CUDA través de 6.0
Gracias! Yo no se ejecuta como root. Se trabajó. Voy a probar con una versión anterior de ubuntu
¿Cómo instalar los drivers de Nvidia?

OriginalEl autor user3822367 | 2014-07-09

5 Comentarios

  1. 4

    CUDA Gpu en un sistema linux que no son utilizables hasta ciertos «archivos de dispositivo» se han establecido correctamente.

    Hay una nota a este efecto en la documentación.

    En general, hay varias maneras en que estos archivos de dispositivo puede ser establecida:

    1. Si un X-server se está ejecutando.
    2. Si una GPU actividad se inició como usuario root (tales como la ejecución de nvidia-smi, o cualquier CUDA aplicación).
    3. A través de secuencias de comandos de inicio (consulte la documentación vinculada anteriormente para un ejemplo).

    Si ninguno de estos pasos, la Gpu no será funcional para usuarios no root. Tenga en cuenta que los archivos no persisten a través de la re-botas, y debe ser re-establecido en cada ciclo de arranque, a través de uno de los 3 métodos anteriores. Si usted utiliza el método 2, y reiniciar el equipo, la Gpu no estará disponible hasta que se utilice el método 2 de nuevo.

    Sugiero la lectura de linux guía de inicio totalmente (enlazado más arriba), si usted está teniendo problemas para configurar un sistema linux para el uso de la GPU CUDA.

    Así que he creado una nueva AWS g2 instancia con ubuntu13.10 y lo intentó de nuevo, la ejecución de nvidia-smi como root, y compilado de las muestras, y cuando ejecuto deviceQuery me sale el error: cudaGetDeviceCount devuelto 35 -> CUDA versión de controlador es insuficiente para CUDA versión de tiempo de ejecución Resultado = FAIL
    Este es un problema completamente diferente, por supuesto. Por LO Q+A no están destinados a ser las sesiones de chat. ¿Por qué no leer la documentación que he enlazado? Indica lo que es necesario establecer un adecuado CUDA de instalación y las instrucciones específicas para validar cada paso del camino. Para empezar, ¿qué versión del controlador se informó al ejecutar nvidia-smi -a como root, y qué versión de CUDA toolkit está instalado?
    Gracias por la documentación, yo en realidad había encontrado anteriormente y trató de seguir los pasos, pero algunos de los pasos antes de la instalación que no ha funcionado para mí. Versión de controlador: 304.116, CUDA: 6.0
    CUDA 6 no funcionará con 304.116. Usted necesita instalar un controlador como 331.62 o más reciente. Si realmente instalar el CUDA toolkit (por ejemplo, usar el runfile método de instalación se describe en la documentación) en la plataforma, en lugar de tratar de traerlo de un IAM o repositorios, obtendrá un controlador adecuado. La mejor opción es instalar un reciente driver de la Gpu en esa plataforma, que creo que son de REJILLA de K520, algo así como este. Si usted no está utilizando la CUADRÍCULA K520 o linux de 64 bits, a continuación, elija un controlador adecuado.
    Así que traté de instalar el controlador de 340.42 de la página web y directamente desde el CUDA toolkit, y ambos fallar con un error del núcleo. La única manera que tengo que trabajar es a través de los pasos aquí: binarytides.com/install-nvidia-drivers-ubuntu-14-04, pero nvidia-current fue 304, y cuando traté de 331, 334, 340 se niega a la par con mi CUADRÍCULA K520

    OriginalEl autor Robert Crovella

  2. 3

    Si usted está usando CUDA 7.5, asegúrese de seguir oficiales de instrucción:
    CUDA 7.5 no admite el valor predeterminado g++ versión. Instalar una versión compatible y hacer que sea el predeterminado.

    sudo apt-get install g++-4.9
    
    sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-4.9 20
    sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-5 10
    
    sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-4.9 20
    sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-5 10
    
    sudo update-alternatives --install /usr/bin/cc cc /usr/bin/gcc 30
    sudo update-alternatives --set cc /usr/bin/gcc
    
    sudo update-alternatives --install /usr/bin/c++ c++ /usr/bin/g++ 30
    sudo update-alternatives --set c++ /usr/bin/g++

    Si theano GPU de prueba código de error:

    De ERROR (theano.sandbox.cuda): Error al compilar cuda_ndarray.cu:
    libcublas.así.7.5: no se puede abrir el archivo objeto compartido: No existe el fichero o
    directorio de ADVERTENCIA (theano.sandbox.cuda): CUDA está instalado, pero
    dispositivo gpu no está disponible (error: cuda unavilable)

    Sólo mediante ldconfig comando para vincular el objeto compartido de cuda 7.5:

    sudo ldconfig /usr/local/cuda-7.5/lib64
    OT: muchas gracias, esta ldconfig truco, me ayudó a resolver el problema después de 2 horas de inútil depuración

    OriginalEl autor maroon912

  3. 0

    He perdido un montón de horas tratando de conseguir AWS G2 para funcionar en ubuntu pero no por la obtención de error exacto como lo hizo. Actualmente estoy ejecutando Theano con gpu suavemente con este redhat AMI. Para instalar Theano en Redhat seguir el proceso de la Instalación de Theano en CentOS en Theano documentación.

    OriginalEl autor Corei13

  4. 0

    Tenía el mismo problema y volver a instalar Cuda y al final dice que tengo que actualizar la RUTA include /usr/local/cuda7.0/bin y LD_LIBRARY_PATH para incluir /usr/local/cuda7.0/lib64. La RUTA de acceso (agregar LD_LIBRARY_PATH en el mismo archivo) se puede encontrar en /etc/environment. A continuación, theano encontrado gpu. Básicos de error por mi parte…

    OriginalEl autor Jesse Burström

  5. 0

    Tengo

    -> CUDA driver version is insufficient for CUDA runtime version

    y mi problema está relacionado con el seleccionado el modo de GPU.
    En otras palabras, el problema puede estar relacionado con el modo GPU (Rendimiento/Modo de Ahorro de Energía), cuando se selecciona (con la utilidad nvidia-settings, en el «PRIMER Perfiles de» configuraciones) la GPU de Intel integrada y ejecutar el deviceQuery script… aparece este error:

    Pero este error es engañosa,
    por la selección de de nuevo el NVIDIA(modo de funcionamiento) con nvidia-settings utilidad que el problema desaparece.

    Este no es un problema de versión.

    Que respecta a

    P. s: La selección está disponible cuando el Primer relacionadas con la materia que está instalado. Más detalles: https://askubuntu.com/questions/858030/nvidia-prime-in-nvidia-x-server-settings-in-16-04-1

    OriginalEl autor Fabiano Tarlao

Dejar respuesta

Please enter your comment!
Please enter your name here