A Microsoft számítási hálózati eszközkészlete felülmúlja a Google TensorFlow-ot az elosztott mély tanulási teljesítményben

Olvasási idő ikonra 2 perc olvas


Az olvasók segítenek az MSpoweruser támogatásában. Kaphatunk jutalékot, ha a linkjeinken keresztül vásárol. Eszköztipp ikon

Olvassa el közzétételi oldalunkat, hogy megtudja, hogyan segítheti az MSPowerusert a szerkesztői csapat fenntartásában Tovább

CNTK-diagram

Tavaly a Microsoft Research bemutatta a Computational Network Toolkit (CNTK), egy egységes számítási hálózati keretrendszert, amely a mély neurális hálózatokat számítási lépések sorozataként írja le irányított gráfon keresztül. A CNTK és a Microsoft Azure GPU Lab kombinációjával a Microsoft elosztott GPU-platformot kínál, amelyet a közösség felhasználhat az AI-kutatás előmozdítására. A CNTK tavalyi elindítása óta az MSR csapata jelentősen javította a gépi tanulás hatékonyságát az Azure GPU Lab segítségével. Valójában a CNTK kínálja a leghatékonyabb elosztott számítási teljesítményt a Google TensorFlow és mások mellett.

A küldetéskritikus mesterségesintelligencia-kutatásban úgy gondoljuk, hogy a hatékonyság és a teljesítmény az egyik legfontosabb tervezési kritérium. Számos mélytanulási eszköztár áll rendelkezésre Zseblámpa, Theano és a Kávézó a közelmúltban nyílt forráskódú eszközkészletekhez Google és a IBM. Összehasonlítottuk a CNTK-t négy népszerű eszközkészlettel. Arra összpontosítunk, hogy a szimulált adatokat használó különböző eszközkészletek nyers számítási hatékonyságát összehasonlítsuk a hatékony mini kötegmérettel (8192), hogy teljes mértékben kihasználhassuk az összes GPU-t. Teljesen csatlakoztatott 4 rétegű neurális hálózattal (lásd a benchmark szkriptek), az egyes eszközkészletek másodpercenként feldolgozható képkockák számát a diagram szemlélteti. Két konfigurációt tartalmazunk egyetlen Linux gépen 1, illetve 4 GPU-val (Nvidia K40). Jelentjük továbbá a 8 GPU-s CNTK-sebességet az Azure GPU Labon, 2 azonos Linux-géppel (2 x 4 GPU), ahogyan az alap-benchmarkban is szerepel. A CNTK kedvezően teljesít az elosztott mély tanulás (4 GPU vagy 8 GPU) számítási hatékonyságában az összes általunk tesztelt eszközkészleten. A CNTK egyszerűen 8 GPU-n túl skálázható több gépen, kiváló elosztott rendszerteljesítménnyel.

Bővebben a témákról: CNTK, Számítógépes hálózati eszköztár, Deep Learning, google, gépi tanulás, microsoft, kutatás, TensorFlow

Hagy egy Válaszol

E-mail címed nem kerül nyilvánosságra. Kötelező kitölteni *