เมื่อประมาณ 2 สัปดาห์ที่ผ่านมา มีเครื่องมือ AI ตัวหนึ่งได้กลายเป็นที่พูดถึงอย่างมาก โดยเฉพาะในสหรัฐอเมริกา ซึ่งแพลตฟอร์มดังกล่าวมีชื่อว่า “DeepSeek” สตาร์ทอัพสัญชาติจีน ผู้พัฒนาโมเดล AI ส่งผลให้คนในแวดวงเทคโนโลยีออกมาแสดงความคิดเห็นอย่างล้นหลามเกี่ยวกับความสำเร็จของบริษัทนี้และผลกระทบต่อสถานะของ AI ในปัจจุบัน
DeepSeek คืออะไร?
DeepSeek คือบริษัทสตาร์ทอัพของจีน ก่อตั้งโดย Liang Wenfeng ผู้จัดการกองทุนเฮดจ์ฟันด์และเป็นบุคคลสำคัญในวงการ AI ของจีน ได้ทำการเปิดตัว DeepSeek เมื่อเดือนพฤษภาคม 2023 โดยผลิตภัณฑ์ที่เปิดตัวออกมาแล้วได้รับการพูดถึงอย่างมาก คือ โมเดล R1 ซึ่งเน้นด้านงานที่เกี่ยวข้องกับการให้เหตุผล (Reasoning Tasks) และเป็นคู่แข่งสำคัญของโมเดล o1 ของ OpenAI
-
- เส้นทางของ DeepSeek เริ่มต้นด้วยการเปิดตัว DeepSeek Coder ในเดือนพฤศจิกายน 2023 ซึ่งเป็นโมเดล Open-Source ที่ออกแบบมาสำหรับงานเขียนโค้ดโดยเฉพาะ
-
- ต่อมาในปีเดียวกันได้เปิดตัว DeepSeek LLM โมเดลที่มีเป้าหมายเพื่อแข่งขันกับโมเดลภาษาขนาดใหญ่อื่น ๆ
-
- ต่อมาในเดือนพฤษภาคม 2024 ก็ได้เปิดตัว DeepSeek-V2 ที่ได้รับความสนใจอย่างมากจากประสิทธิภาพที่สูงและต้นทุนที่ต่ำ โดยการเปิดตัวนี้ได้จุดชนวนให้เกิดสงครามราคาในตลาดโมเดล AI ของจีน บีบบังคับให้บริษัทยักษ์ใหญ่ของจีน เช่น ByteDance, Tencent, Baidu และ Alibaba ลดราคาของโมเดล AI เพื่อให้สามารถแข่งขันได้
-
- หลังจากนั้นก็ได้พัฒนาต่อไปเป็น DeepSeek-Coder-V2 ซึ่งเป็นโมเดลที่ก้าวหน้าขึ้นออกแบบมาสำหรับการแก้ปัญหาการเขียนโค้ดที่ซับซ้อน และรองรับความยาวบริบทสูงถึง 128,000 โทเคน โมเดลนี้เปิดให้ใช้งานผ่าน API ราคาประหยัด โดยคิดค่าบริการที่ 0.14 ดอลลาร์สหรัฐต่อโทเคนสำหรับข้อมูลนำเข้า และ 0.28 ดอลลาร์สหรัฐต่อโทเคนสำหรับข้อมูลผลลัพธ์
-
- โมเดลล่าสุดของบริษัท ได้แก่ DeepSeek-V3 และ DeepSeek-R1 ที่ช่วยเสริมความแข็งแกร่งให้ DeepSeek ในฐานะผู้สร้างความเปลี่ยนแปลงในวงการ AI ซึ่งเป็นโมเดลที่มีศักยภาพที่น่าประทับใจในด้านการทดสอบประสิทธิภาพต่าง ๆ โดยที่ใช้ทรัพยากรน้อยกว่าคู่แข่งอย่างมีนัยสำคัญ ส่วน DeepSeek-R1 ซึ่งเปิดตัวในเดือนมกราคม 2025 เน้นด้านงานที่เกี่ยวข้องกับการให้เหตุผล หรือ Reasoning Tasks และยังเป็นคู่แข่งสำคัญของโมเดล o1 ของ OpenAI
อย่างไรก็ตาม แม้ DeepSeek จะประสบความสำเร็จในระยะเวลาอันสั้น แต่บริษัทยังคงมุ่งเน้นด้านการวิจัยเป็นหลัก และยังไม่มีแผนการเชิงพาณิชย์ในวงกว้างในอนาคตอันใกล้ นอกจากนี้ DeepSeek ยังได้ขึ้นแท่นเป็นแอปฯ ฟรีที่มียอดดาวน์โหลดสูงสุดในสหรัฐอเมริกาบน iOS แซงหน้า ChatGPT อีกด้วย
DeepSeek อ้างว่า โมเดลที่ออกแบบมามีต้นทุนในการพัฒนาที่ต่ำกว่าโมเดลของเจ้าอื่น ๆ โดยมีต้นทุนที่ราว 5.6 ล้านดอลลาร์สหรัฐ และหากเทียบกับเจ้าอื่นที่ใช้หลายร้อยล้านดอลลาร์สหรัฐ ต้นทุนของ DeepSeek จึงต่ำมาก
DeepSeek มีข้อได้เปรียบตรงที่มีงานวิจัยของตัวเองและยังมี Open-Source อย่างเช่น PyTorch และ Llama จาก Meta อีกด้วย
นอกจากนี้ Liang Wenfeng ก็ได้กลายเป็นจุดศูนย์กลางของความภาคภูมิใจของชาติจีน โดยในปี 2021 ทาง Liang ได้เริ่มซื้อหน่วยประมวลผลกราฟิกของ Nvidia จำนวนมากเพื่อใช้ในโครงการ AI ควบคู่กับการบริหารกองทุน High-Flyer โดยในช่วงแรกเขายังออกแบบอัลกอริทึมที่ใช้วิเคราะห์กราฟหุ้น และต่อมาก็ได้ตั้งเป้าหมายในการพัฒนา AI ที่ฉลาดระดับเทียบเท่ามนุษย์
————————————————————————————————————
ที่มา : thairath money / วันที่เผยแพร่ 28 ม.ค. 68
Link : https://www.thairath.co.th/money/tech_innovation/tech_companies/2838414