Το Microsoft Azure επεκτείνει τη διαθεσιμότητα των μοντέλων OpenAI GPT-4 και GPT-35-Turbo σε περισσότερες περιοχές

Εικονίδιο ώρας ανάγνωσης 2 λεπτό. ανάγνωση


Οι αναγνώστες βοηθούν στην υποστήριξη του MSpoweruser. Ενδέχεται να λάβουμε προμήθεια εάν αγοράσετε μέσω των συνδέσμων μας. Εικονίδιο επεξήγησης εργαλείου

Διαβάστε τη σελίδα αποκάλυψης για να μάθετε πώς μπορείτε να βοηθήσετε το MSPoweruser να διατηρήσει τη συντακτική ομάδα Διάβασε περισσότερα

Λογότυπο υπηρεσίας Microsoft Azure OpenAI

Η Microsoft χθες ανακοίνωσε η διευρυμένη διαθεσιμότητα της υπηρεσίας Azure OpenAI. Με αυτήν την επέκταση, οι πελάτες στην Αυστραλία East, Canada East, East United States 2, Japan East και United Kingdom South θα μπορούν να έχουν πρόσβαση σε δημοφιλή μοντέλα OpenAI GPT-4 και GPT-35-Turbo. Πριν από αυτήν την επέκταση, η υπηρεσία Azure OpenAI ήταν διαθέσιμη στις Ανατολικές Ηνωμένες Πολιτείες, την Κεντρική Γαλλία, τις Νότιο Κεντρικές Ηνωμένες Πολιτείες και τη Δυτική Ευρώπη. Κατά τη διάρκεια της πρόσφατης κλήσης κερδών, η Microsoft ανακοίνωσε ότι η υπηρεσία Azure OpenAI εξυπηρετεί πλέον περισσότερους από 11,000 πελάτες, προσελκύοντας κατά μέσο όρο 100 νέους πελάτες καθημερινά.

Σήμερα η Microsoft ανακοίνωσε επίσης τη γενική διαθεσιμότητα της σειράς Virtual Machine (VM) Azure ND H100 v5, που διαθέτει τις πιο πρόσφατες GPUs NVIDIA H100 Tensor Core και δικτύωση NVIDIA Quantum-2 InfiniBand. Αυτή η νέα σειρά VM έχει σχεδιαστεί ειδικά για φόρτους εργασίας AI και είναι τώρα διαθέσιμη στις ανατολικές Ηνωμένες Πολιτείες και στις περιοχές Azure των Νοτίων Κεντρικών Ηνωμένων Πολιτειών. Παρόλο που τα VM είναι γενικά διαθέσιμα, οι πελάτες πρέπει να δηλώσουν το ενδιαφέρον τους για πρόσβαση στα νέα VM.

Τα VM ND H100 v5 περιλαμβάνουν τα ακόλουθα χαρακτηριστικά:

  • Εξοπλισμένα με οκτώ NVIDIA H100 Tensor Core GPU, αυτά τα VM υπόσχονται σημαντικά ταχύτερη απόδοση μοντέλου AI από τις προηγούμενες γενιές.
  • Οι επεξεργαστές Intel Xeon Scalable 4ης γενιάς αποτελούν τη βάση αυτών των VM, εξασφαλίζοντας βέλτιστη ταχύτητα επεξεργασίας.
  • Το NVIDIA Quantum-2 ConnectX-7 InfiniBand με 400 Gb/s ανά GPU με 3.2 Tb/s ανά VM εύρους ζώνης μεταξύ κόμβων εξασφαλίζει απρόσκοπτη απόδοση σε όλες τις GPU, ταιριάζοντας με τις δυνατότητες υπερυπολογιστών κορυφαίας απόδοσης παγκοσμίως.
  • Με το PCIe Gen5 να παρέχει εύρος ζώνης 64 GB/s ανά GPU, το Azure επιτυγχάνει σημαντικά πλεονεκτήματα απόδοσης μεταξύ CPU και GPU.
  • Η μνήμη DDR5 βρίσκεται στον πυρήνα αυτών των VM, παρέχοντας μεγαλύτερες ταχύτητες μεταφοράς δεδομένων και αποτελεσματικότητα, καθιστώντας τα ιδανικά για φόρτους εργασίας με μεγαλύτερα σύνολα δεδομένων.
  • Με έως και έξι φορές μεγαλύτερη ταχύτητα στις λειτουργίες πολλαπλασιασμού πίνακα κατά τη χρήση του νέου τύπου δεδομένων κινητής υποδιαστολής FP8 8-bit σε σύγκριση με το FP16 στις προηγούμενες γενιές.
  • Με έως και δύο φορές μεγαλύτερη ταχύτητα σε μοντέλα μεγάλων γλωσσών όπως το BLOOM 175B συμπερασματικά μοντέλα από άκρο σε άκρο, αποδεικνύοντας τις δυνατότητές τους να βελτιστοποιούν περαιτέρω τις εφαρμογές τεχνητής νοημοσύνης.

Περισσότερα για τα θέματα: κυανός, Υπηρεσία Azure OpenAI, microsoft