¿Cuál es el máximo número de bloques en una cuadrícula que puede ser creado por el kernel de lanzamiento? Estoy un poco confundido aquí desde

Ahora la capacidad de cálculo de la tabla de aquí dice que no puede ser 65535 bloques por cuadrícula dimemsion en CUDA capacidad de cálculo 2.0.

¿Eso significa que el número total de bloques = 65535*65535?

O significa que usted puede cambiar en la mayoría de los 65535 en una 1d cuadrícula de bloques de 65536
o 2d cuadrícula de sqrt(65535) * sqrt(65535) ?

Gracias.

  • Hola Gaurish, ¿por qué no aceptan la respuesta? saludos

2 Comentarios

  1. 34

    65535 por dimensión de la cuadrícula. Calcular 1.x cartas, 1D y 2D rejillas son compatibles. Calcular 2.x cartas, las redes de 3D también son compatibles, por lo 65535, 65535 x 65535, y 65535 x 65535 x 65535 son los límites de Fermi (compute 2.x) las tarjetas.

    • 65535, no 65536
    • Se copian los valores incorrectos de la pregunta original. Mea culpa.
    • Que podría ser, en contraste con el máximo número de hilos por bloque, que comúnmente es de 512, aunque el máximo tamaño del bloque es de 521 x 512 x 64.
    • Aunque me parece mal, mi generación de la CUDA programa de ejemplo, deviceQuery, indica que puedo utilizar 2147483647 para la primera dimensión: Max dimension size of a grid size (x,y,z): (2147483647, 65535, 65535)
    • Que es la correcta para los dispositivos con Capacidad de cálculo 3.0 y superiores, consulte en.wikipedia.org/wiki/CUDA#Version_features_and_specifications. El límite de sólo en la dirección x es ahora de 2^31-1.
  2. -3

    creo que es 65535 por rejilla..

    • No, es 65535 por cuadrícula de dimensión calcular 1.x y 2.x dispositivos.

Dejar respuesta

Please enter your comment!
Please enter your name here