A Microsoft számítási hálózati eszközkészlete felülmúlja a Google TensorFlow-ot az elosztott mély tanulási teljesítményben
2 perc olvas
Publikálva
Olvassa el közzétételi oldalunkat, hogy megtudja, hogyan segítheti az MSPowerusert a szerkesztői csapat fenntartásában Tovább
Tavaly a Microsoft Research bemutatta a Computational Network Toolkit (CNTK), egy egységes számítási hálózati keretrendszert, amely a mély neurális hálózatokat számítási lépések sorozataként írja le irányított gráfon keresztül. A CNTK és a Microsoft Azure GPU Lab kombinációjával a Microsoft elosztott GPU-platformot kínál, amelyet a közösség felhasználhat az AI-kutatás előmozdítására. A CNTK tavalyi elindítása óta az MSR csapata jelentősen javította a gépi tanulás hatékonyságát az Azure GPU Lab segítségével. Valójában a CNTK kínálja a leghatékonyabb elosztott számítási teljesítményt a Google TensorFlow és mások mellett.
A küldetéskritikus mesterségesintelligencia-kutatásban úgy gondoljuk, hogy a hatékonyság és a teljesítmény az egyik legfontosabb tervezési kritérium. Számos mélytanulási eszköztár áll rendelkezésre Zseblámpa, Theano és a Kávézó a közelmúltban nyílt forráskódú eszközkészletekhez Google és a IBM. Összehasonlítottuk a CNTK-t négy népszerű eszközkészlettel. Arra összpontosítunk, hogy a szimulált adatokat használó különböző eszközkészletek nyers számítási hatékonyságát összehasonlítsuk a hatékony mini kötegmérettel (8192), hogy teljes mértékben kihasználhassuk az összes GPU-t. Teljesen csatlakoztatott 4 rétegű neurális hálózattal (lásd a benchmark szkriptek), az egyes eszközkészletek másodpercenként feldolgozható képkockák számát a diagram szemlélteti. Két konfigurációt tartalmazunk egyetlen Linux gépen 1, illetve 4 GPU-val (Nvidia K40). Jelentjük továbbá a 8 GPU-s CNTK-sebességet az Azure GPU Labon, 2 azonos Linux-géppel (2 x 4 GPU), ahogyan az alap-benchmarkban is szerepel. A CNTK kedvezően teljesít az elosztott mély tanulás (4 GPU vagy 8 GPU) számítási hatékonyságában az összes általunk tesztelt eszközkészleten. A CNTK egyszerűen 8 GPU-n túl skálázható több gépen, kiváló elosztott rendszerteljesítménnyel.