บริการ Microsoft Azure Text to Speech นำเสนอรูปแบบเสียงและอารมณ์ที่เป็นธรรมชาติ

ไอคอนเวลาอ่านหนังสือ 2 นาที. อ่าน


ผู้อ่านช่วยสนับสนุน MSpoweruser เราอาจได้รับค่าคอมมิชชันหากคุณซื้อผ่านลิงก์ของเรา ไอคอนคำแนะนำเครื่องมือ

อ่านหน้าการเปิดเผยข้อมูลของเราเพื่อดูว่าคุณจะช่วย MSPoweruser รักษาทีมบรรณาธิการได้อย่างไร อ่านเพิ่มเติม

Microsoft Azure

บริการ Text to Speech ของ Microsoft Cognitive Services จะแปลงข้อความเป็นคำพูดเพื่อให้มีอินเทอร์เฟซที่เป็นธรรมชาติมากขึ้น นักพัฒนาสามารถใช้บริการนี้เพื่อสร้างแอพและบริการที่พูดได้อย่างเป็นธรรมชาติ ต้องขอบคุณการวิจัยที่ก้าวล้ำในเทคโนโลยีการสังเคราะห์เสียงพูด บริการ Text to Speech ของ Microsoft จึงให้เสียงพูดที่ลื่นไหลและเป็นธรรมชาติ ซึ่งตรงกับรูปแบบความเครียดและโทนเสียงของมนุษย์ วันนี้ Microsoft ได้ประกาศรูปแบบเสียงและรูปแบบอารมณ์ใหม่สามรูปแบบ เพื่อให้นักพัฒนามีทางเลือกมากขึ้นในการเลือกรูปแบบเสียงพูดสำหรับแอปพลิเคชันของตน

Microsoft กำลังประกาศรูปแบบเสียงสามแบบต่อไปนี้:

  • Newscast – ด้วยเสียง TTS ของระบบประสาทในรูปแบบการถ่ายทอดข่าว ผู้ใช้ของคุณสามารถเพลิดเพลินกับการฟังข่าวหรือบทความในเสียงแบบมืออาชีพที่สะท้อนถึงสิ่งที่คุณอาจได้ยินจากรายการข่าวทางโทรทัศน์หรือวิทยุ
  • การบริการลูกค้า – รูปแบบการบริการลูกค้ามีลักษณะที่เป็นมิตรและมีส่วนร่วม และเหมาะสำหรับสถานการณ์ที่เกี่ยวข้องกับการสนับสนุนลูกค้า เช่น บุคคลที่เช็คอินในเที่ยวบิน การจองร้านอาหาร หรือการรายงานการเรียกร้อง
  • ผู้ช่วยดิจิทัล – ลูกค้าจำนวนมากใช้เสียง TTS ของระบบประสาทสำหรับโซลูชันผู้ช่วยดิจิทัล เรากำลังแนะนำสองรูปแบบในพื้นที่นี้: รูปแบบการแชทสำหรับบอทสนทนาแบบเป็นกันเอง และรูปแบบมืออาชีพมากขึ้นสำหรับสถานการณ์ต่างๆ เช่น ผู้ช่วยดิจิทัลในรถยนต์

Microsoft กำลังประกาศรูปแบบอารมณ์สามรูปแบบต่อไปนี้:

  • ร่าเริง
  • ความเห็นอกเห็นใจ
  • ซึ่งเป็นเพลง

มีการใช้รูปแบบการถ่ายทอดข่าวในแอป Bing สำหรับอุปกรณ์เคลื่อนที่แล้ว โปรดดูวิดีโอสาธิตด้านล่าง

ที่มา: ไมโครซอฟท์

ฟอรั่มผู้ใช้

ข้อความ 0