[RE: ขอคนสาย Tech อธิบายที [Deepseek]]
สรุปการทำงานของ Deepseek
ช่วงก่อนเปิดตัว
เนื่องจากจีนถูกจำกัดการเข้าถึงทรัพยากร GPU ทำให้ไม่สามารถจัดหาทรัพยากรเพิ่มเติมได้ จึงต้องหาวิธีการใหม่ในการพัฒนาโมเดล AI โดยการใช้งานทรัพยากรที่มีอยู่อย่างจำกัดให้เกิดประสิทธิภาพสูงสุด
------------------------------------------------
ช่วงหลังเปิดตัว
การเปิดเผยข้อมูลภายใต้ MIT License
1. Deepseek เปิดเผยข้อมูลการพัฒนาแบบ Open Source ภายใต้ MIT License
ผู้ใช้งานสามารถใช้งานโมเดลได้ฟรี
สามารถนำไปพัฒนาต่อยอดได้ฟรี
เปิดเอกสารและข้อมูลสำหรับการศึกษาต่อ
https://en.wikipedia.org/wiki/DeepSeek
2 การพัฒนาแบบ Native 8 Floating Point (FP)
ต่างจากโมเดล AI ชั้นนำ เช่น ChatGPT ที่พัฒนาด้วยความแม่นยำสูงสุดในระดับ 32 FP แล้วค่อยย่อขนาดโมเดล
Deepseek ออกแบบและฝึกโมเดลให้ฉลาดในระดับ 8 FP โดยตรง ทำให้มีความต้องการทรัพยากรน้อยกว่ามาก
ลดภาระด้านการจดจำข้อมูลลง โดยยังคงประสิทธิภาพที่สูงอยู่
3 การคาดการณ์หลายคำในครั้งเดียว
ในระบบการทำงานของ LLM ทั่วไป เช่น ChatGPT จะคาดเดาคำถัดไปทีละคำ
Meta เคยเสนอแนวคิดการคาดเดาหลายคำพร้อมกัน แต่ยังไม่สามารถพัฒนาได้สำเร็จ
Deepseek ใช้แนวทางนี้โดยการคาดเดาคำถัดไป 3-4 คำต่อการประมวลผลหนึ่งครั้ง
วิธีนี้ช่วยลดทรัพยากรและจำนวนการประมวลผลลงอย่างมีนัยสำคัญ
4 การปรับเปลี่ยนวิธีการค้นหาและจัดการข้อมูล
Deepseek ลดการใช้กระบวนการบีบอัดและถอดรหัสข้อมูลที่ซับซ้อน
แทนที่ด้วยกระบวนการ Index-based Search ซึ่งมีความเร็วและประสิทธิภาพที่สูงกว่าเดิม
DeepSeek โดดเด่นในเรื่องการใช้ทรัพยากรอย่างมีประสิทธิภาพ ทำให้สามารถเสนอราคาต่อ 1 ล้าน tokens ได้ต่ำมากที่ $0.55 (ประมาณ 19 บาท) เมื่อเทียบกับ OpenAI-o1 ที่ราคา $15 (ประมาณ 505 บาท) โดยประสิทธิภาพของ DeepSeek ใกล้เคียง OpenAI แต่ราคาถูกกว่า 26 เท่า
------------------------------------
ส่งผลต่อตลาดหุ้นอย่างไร
1 เจ้าตลาดโดนเจ้าเล็กตบได้ โดยความสามารถใกล้เคียงแต่ประหยัดทรัพยากรลง
2 อาจจะส่งผลต่อยอดสั่งซื้อ GPU ในอนาคตลดลง เพราะใช้น้อยลง
contactme themasksoccer@gmail.com