מיקרוסופט מכריזה על מספר תכונות חדשות ב-Azure AI, כולל אווטאר טקסט לדיבור

סמל זמן קריאה 3 דקות לקרוא

סמל לוח השנה פורסם ב 15 בנובמבר 2023

פורסם ב 15 בנובמבר 2023

קוראים עוזרים לתמוך ב-MSpoweruser. אנו עשויים לקבל עמלה אם תקנה דרך הקישורים שלנו.

שירותי Azure AI מאפשרים למפתחים ליצור יישומי בינה מלאכותית עם ממשקי API ומודלים מוכנים מראש וניתנים להתאמה אישית. שירותי Azure AI כוללים שירות Vision, שירות דיבור, שירות מתרגם ועוד. ב-Ignite 2023, מיקרוסופט הכריזה היום על מספר תכונות חדשות ב-Azure AI כולל אווטאר טקסט לדיבור, קול עצבי אישי, מצב תרגום מכונה משופר חדש ועוד. מצא את הפרטים למטה.

חדש אופטימיזציה של משימות יכולת סיכום בשפת Azure AI, המופעלת על ידי דגמי שפה גדולים (GPT-3.5-Turbo, GPT-4, Z-Code++ ועוד).
חדש מודל תרגום מכונה מסוגל לתרגם משפה אחת לאחרת מבלי לתרגם באנגלית כמתווך. בנוסף, ניתן להתאים אותו באמצעות נתוני לקוחות כדי להתאים טוב יותר את התרגומים להקשר של התעשייה.
הכרת יישות בשם, תרגום מסמכים וסיכום בקונטיינרים יאפשרו לסוכנויות ממשלתיות ולתעשיות, כגון שירותים פיננסיים ושירותי בריאות, עם דרישות תושבות נתונים מחמירות להפעיל שירותי AI על התשתית שלהם.
קול אישי, תכונה חדשה של קול עצבי מותאם אישית שתאפשר לעסקים ליצור קולות עצביים מותאמים אישית עם 60 שניות של דגימות אודיו עבור המשתמשים שלהם. קול אישי הוא תכונת גישה מוגבלת.
אווטאר טקסט לדיבור, יכולת חדשה של טקסט לדיבור שתיצור פקסימיליה ריאלית של אדם מדבר על בסיס קלט טקסט ונתוני וידאו של אדם אמיתי שמדבר. גם אווטארים שנבנו מראש וגם אווטרים מותאמים אישית נמצאים כעת בתצוגה מקדימה, עם זאת, אווטאר מותאם אישית הוא תכונת גישה מוגבלת.

שירות Azure AI Vision מקבל את העדכונים הבאים:

פונקציונליות חיים ו Vision SDK: פונקציונליות Liveness תסייע במניעת התקפות זיוף של זיהוי פנים ותואמת ISO 30107-3 PAD Level 2. Vision SDK for Face יאפשר למפתחים להוסיף בקלות זיהוי פנים וחיות ליישומים ניידים. שתי התכונות נמצאות בתצוגה מקדימה.
ניתוח תמונה 4.0: API זה מציג מודלים חדשניים של ניתוח תמונה, הכוללים כיתוב תמונה, OCR, זיהוי אובייקטים ועוד, כולם נגישים דרך נקודת קצה אחת וסינכרונית של API. יש לציין כי דגם ה-OCR המשופר מתגאה בדיוק משופר הן עבור טקסט מודפס והן בכתב יד בתמונות. ניתוח תמונה 4.0 זמין בדרך כלל.
דגם קרן פירנצה: מאומן עם מיליארדי צמדי טקסט-תמונה ומשולב כשירותי ראייה ממוחשבת חסכונית ומוכנה לייצור ב-Azure AI Vision, תכונה משופרת זו מאפשרת למפתחים ליצור יישומי ראייה ממוחשבת מתקדמים ומוכנים לשוק, אחראיים בתעשיות שונות. דגם קרן פירנצה זמין בדרך כלל.

לבסוף, העדכונים החדשים בשירותי Azure AI יהפכו את תהליך חילוץ התובנות מסרטונים קל מתמיד. כעת אתה יכול להשתמש ב- Azure AI כדי לקבל סיכום טקסט של תוכן וידאו. כמו כן, אתה יכול לחפש עכשיו לחפש נושאים, רגעים או פרטים ספציפיים בתוך סרטונים נרחבים תוך שימוש בשפה טבעית. מצא את הפרטים למטה.

סיכום וידאו לטקסט: משתמשים יוכלו לחלץ את המהות של תוכן וידאו וליצור סיכומי טקסט תמציתיים ואינפורמטיביים. האלגוריתם המתקדם מפלח סרטוני וידאו לפרקים קוהרנטיים, תוך שימוש ברמזים ויזואליים, אודיו וטקסטים כדי ליצור קטעים שניתן להכיל בקלות בחלונות הנחיה של מודל שפה גדול (LLM). כל חלק מכיל תוכן חיוני, כולל תמלילים, אירועי אודיו ואלמנטים ויזואליים. זה אידיאלי ליצירת תקצירי וידאו, חומרי הדרכה או שיתוף ידע.
חיפוש יעיל של תוכן וידאו: משתמשים יוכלו להפוך תוכן וידאו לפורמט הניתן לחיפוש באמצעות התובנות של LLMs ו-Video Indexer. על ידי המרת תובנות וידאו להנחיות ידידותיות ל-LLM, הדגשים העיקריים נגישים לחיפוש יעיל. פילוח סצנות, אירועי אודיו ופרטים חזותיים משפרים עוד יותר את חלוקת התוכן, ומאפשרים למשתמשים לאתר במהירות נושאים, רגעים או פרטים ספציפיים בתוך סרטונים נרחבים.

עוד על הנושאים: Azure AI, מיקרוסופט, אווטאר טקסט לדיבור

פראדיפ ויסוואב

מומחה תוכנה ושירותים

פראדיפ הוא בוגר מדעי המחשב והנדסה. הוא גם היה שותף סטודנט של מיקרוסופט. כיום הוא עובד בחברת IT מובילה.

השאירו תגובה