Meta โชว์ Voicebox ปัญญาประดิษฐ์สร้างเสียงจากข้อความ , เลียนแบบเสียงใครก็ได้โดยใช้ตัวอย่างแค่สองวินาที

Loading

  ทีมวิจัย Meta AI รายงานถึงปัญญาประดิษฐ์ Voicebox ที่แปลงข้อความเป็นเสียง (text-to-speech – TTS) ด้วยความแม่นยำสูง มีอัตราความผิดพลาดของคำต่ำ และยังสามารถเลียนแบบเสียงใครก็ได้ โดยต้องการตัวอย่างเสียงเพียงสั้นๆ เท่านั้น   ทีมงานสร้าง Voicebox จากหนังสือเสียงภาษาอังกฤษ, ฝรั่งเศส, สเปน, เยอรมนี, และโปรตุเกส รวมข้อมูล 50,000 ชั่วโมง ความสามารถของ Voicebox สามารถเลียนแบบเสียงจากตัวอย่างเสียงสั้นๆ เท่านั้น , สามารถเลียนแบบสไตล์การพูดข้ามภาษาได้ ด้วยการใส่ข้อความภาษาอื่นๆ เข้าไปแม้ว่าตัวอย่างเสียงจะพูดอีกภาษา , ใช้ลบเสียงรบกวนและตัดต่อข้อความได้ โดยการตัดช่วงเวลาที่ไม่ต้องการออกจากตัวอย่าง แล้วใส่แต่ข้อความเข้าไป   Voicebox มีประโยชน์หลายอย่าง เช่น การสร้างเสียงเพื่อทดแทนสำหรับผู้ป่วยที่พูดไม่ได้แล้ว ให้สามารถสื่อสารด้วยเสียงเดิมของตัวเอง แต่ Meta AI ก็ยอมรับว่ามันมีอันตรายมาก เพราะสามารถใช้สร้างข่าวปลอมได้หลากหลาย ในอนาคตทีมงานจะสร้างโมเดลที่สมจริงแต่ตรวจสอบได้ง่ายว่าเป็นเสียงที่สังเคราะห์ขึ้นมา   ที่มา – Meta AI…