Корпорація Майкрософт користується торговою маркою DeepSpeed, їх бібліотекою AI на 1 трильйон параметрів

Значок часу читання 2 хв. читати


Читачі допомагають підтримувати MSpoweruser. Ми можемо отримати комісію, якщо ви купуєте через наші посилання. Значок підказки

Прочитайте нашу сторінку розкриття інформації, щоб дізнатися, як ви можете допомогти MSPoweruser підтримувати редакційну команду Читати далі

глибока швидкість

Microsoft подала заявку на торгову марку для DeepSpeed, їх оптимізованої бібліотеки AI, яка дозволяє навчати великомасштабних моделей AI на скромному обладнанні.

Торгова марка, подана 8 грудня 2020 року, містить посилання на «надання тимчасового використання комп’ютерного програмного забезпечення, яке не можна завантажувати, для обробки штучного інтелекту та глибокого навчання,” припускаючи, що Microsoft, можливо, думає про те, щоб зробити DeepSpeed ​​доступним через онлайн-хмарний сервіс.

DeepSpeed, випущена в лютому цього року, являє собою бібліотеку Python, яка дозволяє створювати моделі глибокого навчання з трильйоном параметрів, що більш ніж у п’ять разів більше, ніж у поточної найбільшої моделі в світі, використовуючи лише 800 відеокарт Nvidia V100. Без DeepSpeed ​​для виконання такого ж завдання знадобилося б 4,000 Nvidia A100, які в 2.5 рази швидше, ніж V100, і працювали б протягом 100 днів.

Інструмент особливо корисний після того, як GPT-3 показав, що моделі продовжують покращувати, чим більше нейронна мережа та набір даних. Однак це загрожує виштовхнути новітні інновації з досяжності невеликих команд з меншими ресурсами, але DeepSpeed ​​дозволив цим командам конкурувати з набагато більшими сервісами з мінімальним обладнанням. Перехід на хмарну обробку може зробити навчання ШІ для великих моделей ще більш доступним.

Дізнайтеся більше про DeepSpeed ​​в Microsoft тут, і перегляньте торгову марку тут.

через Алюміній