Todas las GPU puede hacer operaciones IA que son básicamente F16,INT8 lo más usado y INT 4 en algunas cosas.
La diferencia radica en la potencia, lógicamente las GPU con unidades dedicadas van tener un ratio mayor de núcleos F16 por cual dará más potencia Tflops y TOPS, por ejemplo la RX 6080 XT al dividir registro solo tiene un ratio 1:2.
- 6080XT FP32 = 20 Tflops , FP16= 40 Tops , INT 8 = 80 Tops, INT 4 = 160 Tops.
En serie 7000 AMD no da números ni específica ratio, pero generalmente las GPU con unidades dedicadas parten de 1:4 respecto a los FP32, estimaciones:
- 7800xt FP32 =18 Tflops , F16 = 72 Tflops, INT8 = 144 Tops y INT4 = 288 Tops.