Microsoftin massiivinen FPGA-pohjainen tekoälyalusta mahdollistaa reaaliaikaisen käsittelyn datakeskuksen mittakaavassa

Lukuajan kuvake 3 min. lukea


Lukijat auttavat tukemaan MSpoweruseria. Saatamme saada palkkion, jos ostat linkkien kautta. Työkaluvihje-kuvake

Lue ilmoitussivumme saadaksesi selville, kuinka voit auttaa MSPoweruseria ylläpitämään toimitustiimiä Lue lisää

Microsoft paljasti tänään lisää tekniikasta, joka lopulta antaa voiman roboteille, jotka murskaavat kallomme kantapäänsä alla.

Project Brainwave -niminen Microsoftin pilvipohjainen tekoälyalusta saa virtansa Intelin uusista 14 nm:n Stratix 10 FPGA -yksiköistä, ja ne pystyvät toimittamaan jatkuvan 39.5 teraflopsin, suorittaen jokaisen pyynnön alle millisekunnissa. Tämän korkean suorituskyvyn ja erittäin alhaisen viiveen ansiosta Microsoft toimittaa reaaliaikaista tekoälyä, josta on tulossa yhä tärkeämpää, kun pilviinfrastruktuurit käsittelevät reaaliaikaisia ​​tietovirtoja, olivatpa ne sitten hakukyselyitä, videoita, anturivirtoja tai vuorovaikutusta käyttäjien kanssa.

Liittämällä korkean suorituskyvyn FPGA:t suoraan datakeskusverkkoonsa Microsoft voi palvella DNN:itä laitteistomikropalveluina, joissa DNN voidaan yhdistää etä-FPGA:iden joukkoon ja kutsua palvelin ilman ohjelmistoa silmukassa. Tämä järjestelmäarkkitehtuuri sekä vähentää viivettä, koska CPU:n ei tarvitse käsitellä saapuvia pyyntöjä, että mahdollistaa erittäin korkean suorituskyvyn, FPGA-käsittelyn pyynnöt niin nopeasti kuin verkko pystyy suoratoistamaan ne.

Project Brainwave käyttää tehokasta "pehmeää" DNN-prosessointiyksikköä (tai DPU:ta), joka on syntetisoitu kaupallisesti saataville FPGA:ille, joka yhdistää sekä FPGA:n digitaaliset ASIC-signaalinkäsittelylohkot että syntetisoitavan logiikan tarjotakseen suuremman ja optimoidun määrän toiminnallisia yksiköitä. Useita mukautettuja tekniikoita käyttämällä se voi saavuttaa suorituskyvyn, joka on verrattavissa moniin kovakoodattuihin DPU-siruihin tai sitä suurempi.

Auttaakseen kehittäjiä hyödyntämään kaikkea tätä voimaa Project Brainwave sisältää ohjelmistopinon, joka on suunniteltu tukemaan laajaa valikoimaa suosittuja syväoppimiskehyksiä. Se tukee jo Microsoft Cognitive Toolkitiä ja Googlen Tensorflowa, ja aikoo tukea monia muita.

Järjestelmä on suunniteltu näyttämään korkeaa todellista suorituskykyä monissa monimutkaisissa malleissa, ja se pystyy käsittelemään reaaliajassa monimutkaisia, muistiintensiivisiä malleja, kuten LSTM:itä.

Jopa varhaisessa Stratix 10 silikonissa Microsoft esitteli siirrettyä Project Brainwave -järjestelmää, joka käytti suurta GRU-mallia – viisi kertaa suurempi kuin Resnet-50 – ilman eriä, ja saavutti ennätyssuorituskyvyn. Demossa käytettiin Microsoftin mukautettua 8-bittistä liukulukumuotoa ("ms-fp8"), joka ei kärsi (keskimäärin) tarkkuushäviöistä useissa malleissa.

He osoittivat Stratix 10:n kestävän 39.5 teraflopsia tällä suurella GRU:lla ja suoritti jokaisen pyynnön alle millisekunnissa. Tällä suorituskykytasolla Brainwave-arkkitehtuuri ylläpitää yli 130,000 10 laskentaoperaation suorittamista jaksoa kohden, mikä perustuu yhden makrokäskyn antamiseen 10 jaksoa kohden. Stratix XNUMX:llä toimiva Project Brainwave saavutti ennennäkemättömän korkean reaaliaikaisen tekoälyn suorituskyvyn äärimmäisen haastavissa malleissa, ja tämän päivän suorituskyky on vain lähtökohta.

Microsoft aikoo tuoda Project Brainwaven Azureen vuonna 2018, jotta kuka tahansa asiakas voi päästä käsiksi teknologiaan, jolloin he voivat käyttää monimutkaisimpia syväoppimismallejaan ennätysteholla ja tuoda Armageddonin askeleen lähemmäksi.

Lue lisää tekniikasta Microsoftissa täällä.

Lisää aiheista: ai, FPGA, microsoft, projekti brainwave

Jätä vastaus

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *