Ang artipisyal na katalinuhan ay naging isang mainit na paksa sa mga nakaraang taon,Parehong CPU at GPU ay nagpapabuti sa pagganap ng AI,Intel, na orihinal na nagkaroon ng isang mapagkumpitensyang relasyon 、 Sumali rin sina Nvidia at Arm sa mga puwersa sa kauna -unahang pagkakataon,Inilunsad ang format na FP8 ,Ang bagong format na AI ay maaaring mapabuti ang pagganap ng computing,Ang pagganap ng pinakamalakas na acceleration card H100 ay 4.5 beses na mas mataas。
Ang tatlong kumpanya ay nagtutulungan upang ilunsad ang isang unibersal na format ng AI na may kaugnayan sa kasalukuyang kaguluhan,Maraming tao ang nakakaalam na ang FP32 solong katumpakan ay madalas na ginagamit upang masukat ang pagganap ng GPU.、FP64 Double Format ng katumpakan,Gayunpaman, sa panahon ng AI, hindi na kailangan para sa napakataas na kawastuhan,Bilang karagdagan, ang mga tagagawa ay madalas na ipasadya ang format ng pagkalkula,Kaya ang INT8 ay lumitaw din sa mga nakaraang taon、BF16、Mga Pamantayang AI tulad ng TF32。
Ang mga tagagawa ay nakikipaglaban sa bawat isa ay malinaw na hindi kaaya -aya sa pag -unlad ng teknolohiya ng AI,Kaya Intel、Ang NVIDIA at ARM ay sumali sa pwersa upang ilunsad ang AI Standard Format FP8,At pinakawalan ang mga format ng FP8 para sa malalim na pag -aaral ng puting papel,Ang mga pamantayan ay isinumite din sa IEEE Association,Kung walang inaasahang mangyayari, ito ay magiging isang karaniwang pamantayan sa larangan ng AI.。
Ayon sa kanila,Mayroong dalawang mga variant ng pag -encode ng pamantayang FP8,E5M2、E4M3,Maaari itong mabawasan ang mga paglihis mula sa kasalukuyang pamantayan ng IEEE754,Hindi lamang ito maaaring magdala ng mas mataas na kakayahang umangkop sa computing ng AI,Maaari rin itong balansehin ang software at hardware,Pagbutihin ang kahusayan ng developer。
Ayon sa mga resulta na inilabas ng NVIDIA,Ang FP8 ay may katulad na mga epekto sa 16-bit na lumulutang na punto sa malawak na ginagamit na mga modelo ng pagsasanay,At mas mahusay na pagganap,Ang NVIDIA's H100 Acceleration Card ay gumagamit ng bagong format na FP8,Makamit ang 4.5x na pagpapabuti ng pagganap sa modelo ng BERT。
Ito ay nagkakahalaga ng pagpuna na,Tatlong pangunahing tagagawa ang magkakasamang tumutukoy sa pamantayang FP8,Ngunit hindi ko nakita si Amd,Hindi alam kung ano ang saloobin ni AMD,Gayunpaman, ang AMD ay dapat sa huli ay magpatibay ng pamantayang FP8.,Pinagkaisa sa tatlong pamilya。