Ang artipisyal na katalinuhan ng AI ay isang malaking mainit na paksa sa mga nakaraang taon,Ang parehong mga CPU at GPU ay nagpapabuti sa pagganap ng AI,Noong una, ang Intel ay may mapagkumpitensyang relasyon 、 Sa kauna-unahang pagkakataon, nagsanib pwersa ang NVIDIA at ARM,Ipinakilala ang format ng FP8 ,Ang bagong format ng AI na ito ay maaaring mapabuti ang pagganap ng computing,Sa kasalukuyan, ang pagganap ng H100 ay 4.5 beses na mas mataas。

Ang tatlong kumpanya ay nagsanib pwersa upang ilunsad ang isang karaniwang format ng AI na may kinalaman sa kasalukuyang kaguluhan,Maraming mga tao ang nakakaalam na ang FP32 solong katumpakan ay madalas na ginagamit upang masukat ang pagganap ng GPU bago、FP64 dobleng katumpakan format,Gayunpaman, sa edad ng AI, ang gayong mataas na antas ng katumpakan ay hindi kinakailangan,Bilang karagdagan, ang mga tagagawa ay may posibilidad na ipasadya ang format ng pagkalkula,Nitong mga nakaraang taon, lumitaw din ang INT8、BF16、Mga pamantayan ng AI tulad ng TF32。
Ang mga tagagawa na nakikipaglaban sa mga silo ay malinaw na hindi kaaya-aya sa pag-unlad ng teknolohiya ng AI,Kaya Intel、Ang tatlong pangunahing mga higante ng CPU / GPU, NVIDIA at ARM, ay nagtulungan upang ilunsad ang FP8, ang pamantayang format ng AI,at inilathala ang FP8 Mga Format para sa Malalim na Pag-aaral White Paper,Ang pamantayan ay isinumite din sa IEEE Association,Kung wala nang iba pa, ito ang magiging unibersal na pamantayan sa larangan ng AI sa susunod。
Ayon sa kanila,Ang pamantayan ng FP8 ay magkakaroon ng dalawang variant ng pag-encode,E5M2, ayon sa pagkakabanggit、E4M3,Ang mga paglihis mula sa kasalukuyang mga pamantayan sa IEEE754 ay maaaring mabawasan,Hindi lamang ito maaaring magdala ng higit na kakayahang umangkop sa AI computing,Nagbibigay din ito ng balanse sa pagitan ng hardware at software,Pagbutihin ang kahusayan ng developer。
Ayon sa mga resulta na inilathala ng NVIDIA,Ang FP8 ay may 16-bit na lumulutang-point na epekto sa malawakang ginagamit na mga modelo ng pagsasanay,At mas maganda ang performance,Ang H100 accelerator card ng NVIDIA ay gumagamit ng bagong format ng FP8,Ang isang 4.5x na pagpapabuti ng pagganap ay nakamit sa modelo ng BERT。
Ito ay nagkakahalaga ng noting,Ang tatlong pangunahing vendor ay magkasamang tumutukoy sa pamantayan ng FP8,Ngunit hindi nakatingin si AMC,Hindi ko alam kung ano ang ugali ni AMD,Gayunpaman, ang AMD ay dapat na kalaunan ay magpatibay ng pamantayan ng FP8 pati na rin,Magkaisa sa Tatlo。
