Intel、Nvidia、O ARM promove a AI padrão FP8:A placa gráfica mais forte tem 4,5 vezes melhoria de desempenho

Inteligência artificial da IA ​​tem sido um tópico quente nos últimos anos,Tanto a CPU quanto a GPU estão melhorando o desempenho da IA,Intel, que originalmente tinha um relacionamento competitivo 、 Nvidia e Arm também uniram forças pela primeira vez,Formato FP8 lançado ,Este novo formato de IA pode melhorar o desempenho da computação,O desempenho do cartão de aceleração mais poderoso H100 é 4,5 vezes maior。

As três empresas trabalham juntas para lançar um formato de IA universal relacionado ao caos atual,Muitas pessoas sabem que a precisão única do FP32 é frequentemente usada para medir o desempenho da GPU.、FP64 Formato de precisão dupla,No entanto, na era da IA, não há necessidade de tão alta precisão,Além disso, os fabricantes costumam personalizar o formato de cálculo,Então o INT8 também apareceu nos últimos anos、BF16、Padrões de IA como TF32。

Os fabricantes lutam um ao outro obviamente não são propícios ao desenvolvimento da tecnologia de IA,Então Intel、NVIDIA e ARM uniram forças para lançar o formato padrão da AI FP8,E lançou os formatos FP8 para um papel branco de aprendizado profundo,Os padrões também foram submetidos à associação IEEE,Se nada inesperado acontecer, ele se tornará um padrão comum no campo da IA.。

De acordo com eles,Existem duas variantes de codificação do padrão FP8,E5m2、E4m3,Pode minimizar os desvios do padrão IEEE754 atual,Não apenas pode trazer maior flexibilidade para a computação de IA,Também pode equilibrar software e hardware,Melhorar a eficiência do desenvolvedor。

De acordo com os resultados divulgados pela NVIDIA,FP8 tem efeitos semelhantes ao ponto flutuante de 16 bits em modelos de treinamento amplamente utilizados,E melhor desempenho,O cartão de aceleração H100 da NVIDIA usa o novo formato FP8,Alcance 4,5x Melhoria de desempenho no modelo Bert。

Vale notar que,Três principais fabricantes definem em conjunto o padrão FP8,Mas eu não vi AMD,Não sei qual é a atitude da AMD,No entanto, a AMD deve eventualmente adotar o padrão FP8.,Unificado com as três famílias。

Deixe uma resposta

seu endereço de e-mail não será publicado. Os campos obrigatórios estão marcados *