AI- ja ML-uutisia suomeksi
Seuraa
Ilmoitetaan PyTorch/XLA 2.4: parempi Pallas ja kehittäjäkokemus, lisäksi 'eager mode'
PyTorch/XLA 2.4 tarjoaa merkittäviä parannuksia syvälleoppimiseen TPU- ja GPU-ympäristöissä. Tämä versio esittelee Pallas-kääntäjäkielen parannukset, jotka tukevat nyt sekä TPU- että GPU-ympäristöjä, mikä parantaa suorituskykyä Python-koodilla. Uudet API-kutsut, kuten torch_xla.sync(), yksinkertaavat integroinnin olemassa oleviin PyTorch-työvirtoihin. Kokeellinen vaivihka-tila sallii operaatioiden välittömän suorituksen kohdehardwarella, vaikka TPU-ympäristöissä vaaditaan "mark_step"-kutsu emulaation toteuttamiseksi. Pallasin parannuksiin kuuluvat muun muassa Flash Attention- ja Paged Attention-tuki, sekä valmiit Megablocks' block sparse kernels -yhteenlaskukernelit ryhmämatrassi- ja matriisituloille. Lisäksi uusi TPU-kommandorivi, tpu-info, helpottaa vianetsintää näyttämällä käyttöasteen ja laitteen tiedot, mikä on samankaltainen kuin Nvidia:n nvidia-smi-työkalu. Vaikka nämä muutokset ovat merkittäviä, olemassa oleva koodi on edelleen yhteensopiva, mikä tekee päivityksen sujuvaksi kehittäjille. Nämä päivitykset tähtäävät yhteensopivuuden ja suorituskyvyn parantamiseen PyTorch/XLA:ssa.