Η Microsoft διαθέτει εμπορικά σήματα DeepSpeed, τη βιβλιοθήκη τεχνητής νοημοσύνης 1 τρισεκατομμυρίων παραμέτρων
2 λεπτό. ανάγνωση
Δημοσιεύθηκε στις
Διαβάστε τη σελίδα αποκάλυψης για να μάθετε πώς μπορείτε να βοηθήσετε το MSPoweruser να διατηρήσει τη συντακτική ομάδα Διάβασε περισσότερα
Η Microsoft έχει υποβάλει αίτηση για ένα εμπορικό σήμα για το DeepSpeed, τη βελτιστοποιημένη βιβλιοθήκη AI που επιτρέπει την εκπαίδευση μοντέλων τεχνητής νοημοσύνης μεγάλης κλίμακας σε μέτριο υλικό.
Το εμπορικό σήμα, που κατατέθηκε στις 8 Δεκεμβρίου 2020, κάνει αναφορά σε «παροχή προσωρινής χρήσης διαδικτυακού λογισμικού υπολογιστή που δεν μπορεί να ληφθεί για επεξεργασία τεχνητής νοημοσύνης και βαθιά μάθηση,», υποδηλώνοντας ότι η Microsoft μπορεί να σκέφτεται να διαθέσει το DeepSpeed μέσω μιας διαδικτυακής υπηρεσίας cloud.
Το DeepSpeed, που κυκλοφόρησε φέτος τον Φεβρουάριο, είναι μια βιβλιοθήκη Python που επιτρέπει τη δημιουργία μοντέλων βαθιάς εκμάθησης με ένα τρισεκατομμύριο παραμέτρους, περισσότερες από πέντε φορές περισσότερες από το σημερινό μεγαλύτερο μοντέλο στον κόσμο, χρησιμοποιώντας μόνο 800 κάρτες γραφικών Nvidia V100. Χωρίς το DeepSpeed, η ίδια εργασία θα απαιτούσε 4,000 Nvidia A100s, τα οποία είναι έως και 2.5 φορές ταχύτερα από το V100, τσακίζοντας για 100 ημέρες.
Το εργαλείο είναι ιδιαίτερα χρήσιμο αφού το GPT-3 έδειξε ότι τα μοντέλα συνεχίζουν να βελτιώνουν όσο μεγαλύτερο είναι το νευρωνικό δίκτυο και το σύνολο δεδομένων. Αυτό, ωστόσο, απείλησε να ωθήσει τις πιο πρόσφατες καινοτομίες από τις μικρότερες ομάδες με λιγότερους πόρους, αλλά το DeepSpeed επέτρεψε σε αυτές τις ομάδες να ανταγωνιστούν με πολύ μεγαλύτερες υπηρεσίες με ελάχιστο υλικό. Μια μετάβαση στην επεξεργασία cloud θα μπορούσε να κάνει την εκπαίδευση τεχνητής νοημοσύνης μεγάλων μοντέλων ακόμα πιο προσιτή.
Διαβάστε περισσότερα για το DeepSpeed στη Microsoft εδώκαι δείτε το εμπορικό σήμα εδώ.
μέσω Αλουμιά