ไมโครซอฟต์พัฒนา “VALL-E” เอไอเลียนเสียงคนได้เหมือนเป๊ะในเวลา 3 วิ!
บริษัทไมโครซอฟต์เปิดตัวปัญญาประดิษฐ์ตัวใหม่ “VALL-E” เลียนเสียงคนได้ในเวลาแค่ 3 วินาที และใส่อารมณ์ลงไปในคำพูดได้ด้วย! วงการเทคโนโลยีสั่นสะเทือนอีกครั้ง เมื่อสัปดาห์ที่แล้ว บริษัทไมโครซอฟต์ (Microsoft) ยักษ์ใหญ่ด้านเทคโนโลยี ออกมาประกาศเปิดตัวโมเดลปัญญาประดิษฐ์ (เอไอ) ตัวใหม่ที่มีชื่อว่า “VALL-E” (ไม่ใช่การ์ตูน WALL-E นะ!) ความพิเศษของเอไอตัวนี้คือ มันสามารถจำลองเลียงของคนได้อย่างไร้ที่ติ เพียงป้อนตัวอย่างเสียงความยาวแค่ 3 วินาทีให้มัน มันก็จะสามารถเรียนรู้เสียงนั้นและสังเคราะห์เสียงนั้นออกมา จุดเด่นของ VALL-E นอกจากเรื่องความเร็วในการเรียนรู้แล้ว มันยังสามารถใช้เสียงที่จดจำมาพูดอะไรก็ได้ และใส่ “อารมณ์” ไหนลงไปก็ได้ พูดง่าย ๆ มันจะไม่ใช่เสียงโมโนโทนแบบเอไออื่น แต่จะเป็นเสียงที่พูดราวกับเป็นคนจริง ๆ ที่มีอารมณ์ความรู้สึก ทีมผู้พัฒนาคาดการณ์ว่า VALL-E อาจถูกนำไปใช้สำหรับแอปพลิเคชันแปลงข้อความเป็นคำพูด (Text-to-Speech) คุณภาพสูง หรือโปรแกรมแก้ไขดัดแปลงเสียงที่บันทึกไว้ จากที่พูดประโยคหนึ่ง ก็อาจตัดต่อให้พูดเป็นอีกประโยคหนึ่งโดยที่เสียงยังเป็นของผู้พูดคนเดิม ไมโครซอฟต์เปิดเผยว่า VALL-E สร้างขึ้นจากเทคโนโลยีที่เรียกว่า…