[RE: ขอคนสาย Tech อธิบายที [Deepseek]]
wizmacho พิมพ์ว่า:
devildog พิมพ์ว่า:
ไม่ใช่คนสายเทค แต่ก็เกี่ยวข้องอยู่บ้าง มีความเห็นแบบนี้ครับ
- มันมีความก้าวหน้าในเรื่องการฝึกโมเดลที่ใช้ Mixed Precision
(ซึ่งช่วยลดต้นทุนการฝึกโมเดลได้) รวมถึงการจัดการปัญหา Loss Spiking ใน MOE
ที่สามารถช่วยลดต้นทุนได้มากเหมือนกัน
- DeepSeek โชว์ให้เห็นเลยว่า มันการปรับปรุงประสิทธิภาพการฝึกให้ดีขึ้นอย่างมากมาก
ในคหสต. โดยเฉพาะ โมเดลที่เรียกว่า R1 Zero
โมเดลนี้แสดงให้เห็นว่า test time compute scaling
สามารถทำได้ด้วย Reinforcement Learning เพียงอย่างเดียว
ไม่ต้องมี Supervised fine tuning
- อีกอันที่น่าสนใจคือ น่าสนใจมาก มันยืนยันได้ว่าไม่มีอะไรพิเศษในโครงสร้างการทำงานของ o1/o3
(ไม่มี MCTS หรืออื่นๆ) ซึ่ง OAI ก็เองก็เคยยืนยันไว้ แต่คนส่วนใหญ่ไม่ค่อยเชื่อ
- ถัดมาที่น่าสนใจมากๆ คือ R1 Zero มันจะคิดในแบบที่ไม่มีเหตุผล หรือ nonsensical
ไม่ใช่แค่การสลับระหว่างภาษา แต่ยังรวมถึงการสร้างข้อความที่ไม่มีความหมายสำหรับมนุษย์ด้วย
เพราะโมเดลมันต้องการแค่ต้องการ converge ไปที่ global minimum cost function ของมัน
output tokens หรือคำหรือข้อความที่ AI สร้างขึ้นมาเมื่อมันตอบคำถามหรือทำงานอะไรก็ตามที่ให้มันทำ
ตรงนี้เกิดขึ้นในเลเยอร์สุกท้ายของโมเดล หรือโดยสรุปก็คือ มันแฮกคอสฟังก์ชั่นโดยการไม่คิดแบบคน
คีย์หลักๆที่จับได้ ก็คงประมาณนี้โดยคร่าวๆ
ส่วนรายละเอียดเชิงลึกจริงๆของโมเดล ก็ต้องไปเรียน PyTorch หรือ TensorFlow ไรงั้นมั้งครับ
ถ้าสนใจโมเดล R1 ก็คงต้องไปศึกษาเชิงลึกเรื่อง Reinforcement Learning
ทดลองเปลี่ยน ไฮเปอร์พารามิเตอร์ อะไรงั้นหละมั้งครับ
ผมไปลองของมา ลองถามอะไรที่เกี่ยวกับรัฐบาลจีนที่เค้าบอกมันไม่ Gen ให้ ปรากฏผมเห็นหลังบ้านมันทำงานอยู่ แล้วพอขั้นสุดท้ายเหมือนมีโค้ดมาเขียนครอบเพื่อตรวจสอบสิ่งที่คิดอีกที แล้วก็ลบทั้งหมดทิ้ง แล้วที่มันเจนมาหลังบ้านก็ตรงกับข้อมูลทั่วไปธรรมดา ไม่ได้ไบแอสอะไรด้วยนะ ผมลองเอา deep tech ใส่พวกนี้ แต่ผลออกมาแย่กว่า นศ ป โท ผมอีก ส่วนตัวผมเลยให้ AI มันก็พอ ๆ กับการที่เราคิดไรไม่ทัน จัดเข้าโมเดลไปเลย ส่วนตัวผมก็ยังมองว่ามันคือ deterministic problem ที่ยังไงก็ต้องมีองค์ความรู้แบบนั้นอยู่แล้ว เพียงแต่จะจับมาชนกันได้ไหม เหมือนคิดโครงสร้างยา โปรตีน ให้เวลาคนก็ทำได้แหละ แต่นานกว่าโคตร ๆ ผมก็ vary ตัวแปรไปเรื่อย ๆ
ส่วนตัวก็เห็นด้วย และมันก็น่าจะเป็นไปทางนั้นแหละครับ
แต่คีย์ที่เป็นเรื่องใหญ่ที่กระทบตลาดหุ้นเมกา และเรื่องอื่นๆ กลับไม่น่าจะใช่ด้านนี้ครับ