'cookieOptions={msg};'> El blog del ensamblador

Select your language

6/10/20

La serie 3000 de Nvidia es la serie FX de las tarjetas de vídeo

 


¡Hola!

Hace mucho que no pasaba por acá, pero últimamente hay algo que me tiene indignado con respecto a Hardware de ultima generación, en esta ocasión hablaré de las gráficas Nvidia RTX-3000; nombre clave "Ampere" y su gran diferencia entre el Marketing y el producto real que están ofreciendo.

Recuerdo como ayer, cuando AMD lanzó sus procesadores FX y el rendimiento no fue el esperado, marketeaban "8 núcleos", sin embargo la gente común no sabían que estos "núcleos", compartían varios recursos en común, entre ellos la Unidad de Punto Flotante (FPU por sus siglas en ingles), el compartimiento de estos recursos restaba bastante rendimiento (en especial en Windows el cual no manejó esto muy bien al principio).

¡Hoy el Marketing lo hace de nuevo, esta vez Nvidia con la serie 3000!

Se que a este punto los mas experimentados ya saben a lo que me refiero, pero para los que no saben, el "rendimiento bruto" de una unidad de computo (sea CPU o GPU) se mide en "Flops" (Operaciones de punto flotante) y sus múltiplos "Gigaflops", "Teraflops", etc... normalmente este rendimiento esta tomado en base a los "Flops" FP-32 (Punto Flotante de 32-bits) que puede ejecutar una unidad de computo, estos "Flops" son el resultado de la multiplicación de la frecuencia en que está operando la gráfica por la cantidad de núcleos (Shading Units en ingles) que la gráfica posee por dos, notaran la cantidad de "núcleos" que marketea Nvidia en "Ampere" 5888 en la 3070 RTX, 8704 núcleos en la 3080 y unos "majestuosos" 10496 en la 3090 un numero muy alto aun para los 8 nm de fabricación de Samsung, entonces cuando multiplicamos esta cantidad de núcleos por la frecuencia obtenemos:

1.73 GHz por 5888 núcleos por 2 = 20.4 Tflops para la 3070

1.71 GHz por 8704 núcleos por 2 = 29.8 Tflops para la 3080

1.69 GHz por 10496 núcleos por 2 = 35.5 Tflops para la 3090

Todo parece bien hasta este punto, cuando comparas esos números con la generación anterior y el rendimiento real...

1.54GHz por 4352 núcleos por 2 = 13.4 Tflops para la 2080 Ti

¡Una diferencia de 2.65x veces! si comparamos la 3090 con la 2080 Ti pero cuando nos vamos a la comparación de rendimiento real entre estos dos dispositivos es de 28% para resoluciones de 2K (2560x1440) y 36% para 4K (4096x3840), algo decepcionante si me preguntas... el rendimiento real por núcleo es inferior.

Ahora ¿Donde está el problema?

Empecé este articulo hablando de los procesadores FX y sus "núcleos incompletos" resulta que los núcleos de procesamiento actuales tienen dos partes primordiales, núcleos de Punto Flotante (FP Cores) y núcleos de enteros (Int Cores), el asunto con las GTX3000 es que solo la mitad de los núcleos (Shading Units) están compuestos por Int y FP cores, el resto solo son FP, osea, que estos núcleos solo hacen la función de Punto Flotante de la gráfica digamos que "están de relleno", como mencioné arriba la potencia bruta de las gráficas se mide en Flops, pero como pueden apreciar, "potencia bruta" y rendimiento real no van de la mano, por ejemplo una AMD Radeon RX 5700 XT tiene menor potencia bruta que una Nvidia GTX 1080 Ti pero el rendimiento real es prácticamente idéntico en la actualidad, así que la serie 3000 realmente solo está vendiendo la mitad de los núcleos completos que marketean, así que este seria el numero real de núcleos completos que podemos tomar en cuenta:

2944 para la 3070

4352 para la 3080 y

5248 para la 3090

*En caso de la 2080 Ti que poseen todos sus núcleos (Shading Units) completos osea que esos 4352 núcleos son tanto FP Cores como Int Cores, y por esto señores es que la diferencia en rendimiento entre la serie 2000 y 3000 es minúscula si tomamos en cuenta las especificaciones que nos marketean... 

Recordemos que Nvidia proclamó que la RTX 3070 superaría a la 2080 Ti en rendimiento, eso es físicamente imposible, así que probablemente Nvidia opte por "capar" a la serie 2000 como ha hecho históricamente, si, las GTX 1000 fueron capadas a la salida de las RTX 2000 en principio las GTX 1080 Ti rendían +/- 1% lo que las RTX 2080 y su rendimiento ha sido recortado desde entonces con cada controlador nuevo lanzado, pero esa es otra parte de la estrategia de Marketing de Nvidia, que tal vez cubra mas adelante.

En cuanto a AMD, los rumores apuntan a que "Big Navi" posea 5120 núcleos (Shading Units) con ambas funciones Int y FP, así espero ustedes no se sorprendan si supera a la GTX 3090 con menos de la mitad de los núcleos marketeados...

Espero hayan disfrutado el articulo, saludos desde República Dominicana.

14/4/16

AMD Polaris 11 muestra 1024 nucleos en CompuBench


Este es un hallazgo muy interesante, en la base de datos CompuBench algunas entradas de dispositivos de lo que parece ser Polaris AMD 11 (Las SKU de mainstream) ha aparecido. Todo es un poco dificil de sacar, pero cada hardware de gráficos tiene un número de identificación de dispositivo, un DEVICE_ID. Estos DEVICE_ID han

6/4/16

AMD revela numeros de rendimiento de "Bristol Ridge"


Apenas ayer AMD pre-anuncio la 7ma generacion de APU (Unidades de Procesamiento Acelerado) para portatiles basadas en "Bristol Ridge" las cuales estan basadas en las actuales APU "Carrizo", sin embargo mencionan una diferencia notable tanto en poder de computo como en rendimiento real para el usuario, estos procesadores continuaran siendo fabricado en un proceso de 28 nanometros, sin embargo en esta ocasion integraran un controlador de memoria DDR