Корпорація Майкрософт користується торговою маркою DeepSpeed, їх бібліотекою AI на 1 трильйон параметрів
2 хв. читати
Опубліковано
Прочитайте нашу сторінку розкриття інформації, щоб дізнатися, як ви можете допомогти MSPoweruser підтримувати редакційну команду Читати далі
Microsoft подала заявку на торгову марку для DeepSpeed, їх оптимізованої бібліотеки AI, яка дозволяє навчати великомасштабних моделей AI на скромному обладнанні.
Торгова марка, подана 8 грудня 2020 року, містить посилання на «надання тимчасового використання комп’ютерного програмного забезпечення, яке не можна завантажувати, для обробки штучного інтелекту та глибокого навчання,” припускаючи, що Microsoft, можливо, думає про те, щоб зробити DeepSpeed доступним через онлайн-хмарний сервіс.
DeepSpeed, випущена в лютому цього року, являє собою бібліотеку Python, яка дозволяє створювати моделі глибокого навчання з трильйоном параметрів, що більш ніж у п’ять разів більше, ніж у поточної найбільшої моделі в світі, використовуючи лише 800 відеокарт Nvidia V100. Без DeepSpeed для виконання такого ж завдання знадобилося б 4,000 Nvidia A100, які в 2.5 рази швидше, ніж V100, і працювали б протягом 100 днів.
Інструмент особливо корисний після того, як GPT-3 показав, що моделі продовжують покращувати, чим більше нейронна мережа та набір даних. Однак це загрожує виштовхнути новітні інновації з досяжності невеликих команд з меншими ресурсами, але DeepSpeed дозволив цим командам конкурувати з набагато більшими сервісами з мінімальним обладнанням. Перехід на хмарну обробку може зробити навчання ШІ для великих моделей ще більш доступним.
Дізнайтеся більше про DeepSpeed у Microsoft тут і перегляньте товарний знак тут.
через Алюміній
Форум користувачів
0 повідомлення