On sanottu, että teknologiayritykset joko etsivät GPU:ita tai ovat hankkimassa niitä. Huhtikuussa Teslan toimitusjohtaja Elon Musk osti 10 000 GPU:ta ja ilmoitti, että yritys ostaisi jatkossakin suuren määrän GPU:ita NVIDIAlta. Yrityspuolella IT-henkilöstö pyrkii myös kovasti varmistamaan, että GPU:ita käytetään jatkuvasti sijoitetun pääoman tuoton maksimoimiseksi. Jotkut yritykset saattavat kuitenkin huomata, että vaikka GPU:iden määrä kasvaa, GPU:n joutotila muuttuu vakavammaksi.
Jos historia on opettanut meille jotain korkean suorituskyvyn laskennasta (HPC), niin tallennusta ja verkkoa ei pidä uhrata sen kustannuksella, että keskitytään liikaa laskemiseen. Jos tallennus ei pysty siirtämään tietoja tehokkaasti laskentayksiköihin, vaikka sinulla olisi eniten GPU:ita maailmassa, et saavuta optimaalista tehokkuutta.
Small World Big Datan analyytikon Mike Matchettin mukaan pienempiä malleja voidaan suorittaa muistissa (RAM), mikä mahdollistaa enemmän keskittymisen laskemiseen. Suurempia malleja, kuten ChatGPT, joissa on miljardeja solmuja, ei kuitenkaan voida tallentaa muistiin korkeiden kustannusten vuoksi.
"Et mahdu miljardeja solmuja muistiin, joten tallennustilasta tulee entistä tärkeämpää", Matchett sanoo. Valitettavasti tiedon tallennus jää usein huomiotta suunnitteluprosessin aikana.
Yleisesti ottaen mallin koulutusprosessissa on käyttötavasta riippumatta neljä yhteistä kohtaa:
1. Mallikoulutus
2. Päätelmäsovellus
3. Tietojen tallennus
4. Nopeutettu laskenta
Malleja luotaessa ja käyttöönotettaessa useimmat vaatimukset asettavat etusijalle nopean käsitteen testauksen (POC) tai testausympäristöt mallin koulutuksen aloittamiseksi. Tietojen tallennustarpeita ei oteta huomioon.
Haasteena on kuitenkin se, että koulutus tai johtopäätösten käyttöönotto voi kestää kuukausia tai jopa vuosia. Monet yritykset skaalaavat nopeasti mallikokojaan tänä aikana, ja infrastruktuuria on laajennettava kasvavien mallien ja tietokokonaisuuksien mukaan.
Googlen tekemä tutkimus miljoonista ML-harjoittelukuormista paljastaa, että keskimäärin 30 % harjoitusajasta kuluu syöttötietoputkeen. Vaikka aiemmat tutkimukset ovat keskittyneet grafiikkasuorittimien optimointiin koulutuksen nopeuttamiseksi, dataputken eri osien optimoinnissa on edelleen monia haasteita. Kun sinulla on huomattava laskentateho, todellinen pullonkaula on se, kuinka nopeasti voit syöttää tietoja laskelmiin tulosten saamiseksi.
Erityisesti tiedon tallennuksen ja hallinnan haasteet edellyttävät tiedon kasvun suunnittelua, jonka avulla voit jatkuvasti poimia datan arvoa edistyessäsi, etenkin kun uskaltaudut kehittyneempiin käyttötapauksiin, kuten syväoppimiseen ja hermoverkkoihin, jotka asettavat korkeampia vaatimuksia tallennustilaa kapasiteetin, suorituskyvyn ja skaalautuvuuden suhteen.
Erityisesti:
Skaalautuvuus
Koneoppiminen vaatii valtavien tietomäärien käsittelyä, ja datamäärän kasvaessa myös mallien tarkkuus paranee. Tämä tarkoittaa, että yritysten on kerättävä ja tallennettava enemmän tietoja joka päivä. Kun tallennustilaa ei voi skaalata, dataintensiiviset työmäärät luovat pullonkauloja, rajoittaen suorituskykyä ja aiheuttavat kalliita GPU:n joutoaikaa.
Joustavuus
Joustava tuki useille protokollille (mukaan lukien NFS, SMB, HTTP, FTP, HDFS ja S3) on tarpeen eri järjestelmien tarpeiden täyttämiseksi sen sijaan, että se olisi rajoitettu yhteen ympäristöön.
Latenssi
I/O-viive on kriittinen mallien rakentamisessa ja käytössä, koska tiedot luetaan ja luetaan uudelleen useita kertoja. I/O-viiveen vähentäminen voi lyhentää mallien koulutusaikaa päivillä tai kuukausilla. Nopeampi mallikehitys merkitsee suoraan suurempia liiketoimintaetuja.
Läpäisykyky
Tallennusjärjestelmien suoritusteho on ratkaisevan tärkeä tehokkaan mallikoulutuksen kannalta. Koulutusprosessit sisältävät suuria tietomääriä, tyypillisesti teratavuina tunnissa.
Rinnakkaispääsy
Korkean suorituskyvyn saavuttamiseksi koulutusmallit jakavat toiminnot useisiin rinnakkaisiin tehtäviin. Tämä tarkoittaa usein sitä, että koneoppimisalgoritmit käyttävät samoja tiedostoja useista prosesseista (mahdollisesti useilla fyysisillä palvelimilla) samanaikaisesti. Tallennusjärjestelmän tulee käsitellä samanaikaisia vaatimuksia suorituskyvystä tinkimättä.
Erinomaisilla ominaisuuksillaan alhaisessa viiveessä, suuressa suorituskyvyssä ja laajamittaisessa rinnakkais-I/O:ssa, Dell PowerScale on ihanteellinen tallennuspaikka GPU-kiihdytettyyn tietojenkäsittelyyn. PowerScale vähentää tehokkaasti aikaa, joka tarvitaan analyysimalleihin, jotka kouluttavat ja testaavat usean teratavun tietojoukkoja. PowerScalen all-flash-tallennustilassa kaistanleveys kasvaa 18-kertaiseksi, mikä poistaa I/O-pullonkaulat, ja se voidaan lisätä olemassa oleviin Isilon-klustereihin suuren strukturoimattoman datan arvon nopeuttamiseksi ja vapauttamiseksi.
Lisäksi PowerScalen usean protokollan käyttömahdollisuudet tarjoavat rajattoman joustavuuden työkuormien suorittamiseen, jolloin tiedot voidaan tallentaa yhdellä protokollalla ja käyttää toista. Erityisesti PowerScale-alustan tehokkaat ominaisuudet, joustavuus, skaalautuvuus ja yritystason toiminnallisuus auttavat vastaamaan seuraaviin haasteisiin:
- Nopeuta innovaatiota jopa 2,7-kertaiseksi, mikä vähentää mallin harjoittelujaksoa.
- Poista I/O-pullonkaulat ja tarjoa nopeampaa mallin koulutusta ja validointia, parannettua mallin tarkkuutta, parannettua datatieteen tuottavuutta ja maksimoi laskentainvestointien tuotto hyödyntämällä yritystason ominaisuuksia, korkeaa suorituskykyä, samanaikaisuutta ja skaalautuvuutta. Paranna mallin tarkkuutta syvemmillä, korkeamman resoluution tietojoukoilla hyödyntämällä jopa 119 PB tehokasta tallennuskapasiteettia yhdessä klusterissa.
- Saavuta käyttöönotto mittakaavassa aloittamalla pienet ja itsenäisesti skaalautuvat laskenta- ja tallennustilat, jotka tarjoavat vankkoja tietosuoja- ja suojausvaihtoehtoja.
- Paranna datatieteen tuottavuutta paikan päällä tehdyn analytiikan ja esivalidoidun ratkaisun avulla nopeampien ja vähäriskisten käyttöönottojen avulla.
- Hyödynnä testattuja malleja, jotka perustuvat luokkansa parhaisiin teknologioihin, mukaan lukien NVIDIA GPU -kiihdytys ja referenssiarkkitehtuurit NVIDIA DGX -järjestelmillä. PowerScalen korkea suorituskyky ja samanaikaisuus täyttävät tallennussuorituskykyvaatimukset koneoppimisen kaikissa vaiheissa tiedonkeruusta ja valmistelusta mallin koulutukseen ja päättelyyn. Yhdessä OneFS-käyttöjärjestelmän kanssa kaikki solmut voivat toimia saumattomasti samassa OneFS-ohjatussa klusterissa yritystason ominaisuuksien, kuten suorituskyvyn hallinnan, tiedonhallinnan, tietoturvan ja tietosuojan avulla, mikä mahdollistaa yritysten mallikoulutuksen ja validoinnin nopeamman suorittamisen.
Postitusaika: 03.07.2023