ทีมวิจัย Meta AI รายงานถึงปัญญาประดิษฐ์ Voicebox ที่แปลงข้อความเป็นเสียง (text-to-speech – TTS) ด้วยความแม่นยำสูง มีอัตราความผิดพลาดของคำต่ำ และยังสามารถเลียนแบบเสียงใครก็ได้ โดยต้องการตัวอย่างเสียงเพียงสั้นๆ เท่านั้น
ทีมงานสร้าง Voicebox จากหนังสือเสียงภาษาอังกฤษ, ฝรั่งเศส, สเปน, เยอรมนี, และโปรตุเกส รวมข้อมูล 50,000 ชั่วโมง ความสามารถของ Voicebox สามารถเลียนแบบเสียงจากตัวอย่างเสียงสั้นๆ เท่านั้น , สามารถเลียนแบบสไตล์การพูดข้ามภาษาได้ ด้วยการใส่ข้อความภาษาอื่นๆ เข้าไปแม้ว่าตัวอย่างเสียงจะพูดอีกภาษา , ใช้ลบเสียงรบกวนและตัดต่อข้อความได้ โดยการตัดช่วงเวลาที่ไม่ต้องการออกจากตัวอย่าง แล้วใส่แต่ข้อความเข้าไป
Voicebox มีประโยชน์หลายอย่าง เช่น การสร้างเสียงเพื่อทดแทนสำหรับผู้ป่วยที่พูดไม่ได้แล้ว ให้สามารถสื่อสารด้วยเสียงเดิมของตัวเอง แต่ Meta AI ก็ยอมรับว่ามันมีอันตรายมาก เพราะสามารถใช้สร้างข่าวปลอมได้หลากหลาย ในอนาคตทีมงานจะสร้างโมเดลที่สมจริงแต่ตรวจสอบได้ง่ายว่าเป็นเสียงที่สังเคราะห์ขึ้นมา
ที่มา – Meta AI
———————————————————————————————————————————————————————————————-
ที่มา : blognone / วันที่เผยแพร่ 17 มิ.ย.66
Link : https://www.blognone.com/node/134394