ขอคนสาย Tech อธิบายที [Deepseek]

BLOG BOARD_B

ติดต่อรายละเอียดเพิ่มเติมได้ที่ Email: sale@soccersuck.com

ไว้คราวหน้า X

ไม่ต้องแสดงข้อความนี้อีกเลย

ไปหน้าที่ 1, 2, 3

ไปที่หน้า

ตั้งกระทู้ใหม่

ฝากรูป

หน้าแรกบอร์ด >> บอร์ดวาไรตี้

ผู้ตั้ง

ข้อความ

ออฟไลน์

wizmacho

ดาวเตะพรีเมียร์ลีก

Status:

: 0 ใบ

เข้าร่วม: 21 May 2011

ตอบ: 13976

ที่อยู่:

โพสเมื่อ: Tue Jan 28, 2025 00:45

ขอคนสาย Tech อธิบายที [Deepseek]

เชื่อว่าหลายคนน่าจะรู้แล้ว กับ AI ตัวใหม่ของจีนตัวนี้ Deepseek เท่าที่อ่านคือเอาโค้ดมาแกะรันเครื่องตัวเองได้เลย เพราะเป็น opensource แบบพวกที่อัพบน github ส่วนตัวสงสัยว่าโมเดลมันต่างกันไง ผมที่ใช้ python กับ C++ ยอมรับว่าเข้าไม่ถึงหลังบ้านจริง ๆ ครับ

ปล ที่หุ้นเมกาตัวเทคร่วง เพราะตัวนี้เลยครับ เข้าใจว่าถูกกว่า 95% เลย ฝรั่งบอกนี่เท่ากับตอนรัสเซียส่งดาวเทียมสปุตนิกไปก่อนเมกาเลยอ่ะ

หากโดน 40 เรื้อน จะถูกแบน

โหวตเป็นกระทู้แนะนำ

My Locker

ออนไลน์

devildog

ซุปตาร์ยูโร

Status:

: 0 ใบ

เข้าร่วม: 30 Jan 2010

ตอบ: 8693

ที่อยู่: ทรานซิลเวเนีย

โพสเมื่อ: Tue Jan 28, 2025 01:43

Top Comment [RE: ขอคนสาย Tech อธิบายที [Deepseek]]

ไม่ใช่คนสายเทค แต่ก็เกี่ยวข้องอยู่บ้าง มีความเห็นแบบนี้ครับ

- มันมีความก้าวหน้าในเรื่องการฝึกโมเดลที่ใช้ Mixed Precision
(ซึ่งช่วยลดต้นทุนการฝึกโมเดลได้) รวมถึงการจัดการปัญหา Loss Spiking ใน MOE
ที่สามารถช่วยลดต้นทุนได้มากเหมือนกัน

- DeepSeek โชว์ให้เห็นเลยว่า มันการปรับปรุงประสิทธิภาพการฝึกให้ดีขึ้นอย่างมากมาก
ในคหสต. โดยเฉพาะ โมเดลที่เรียกว่า R1 Zero
โมเดลนี้แสดงให้เห็นว่า test time compute scaling
สามารถทำได้ด้วย Reinforcement Learning เพียงอย่างเดียว
ไม่ต้องมี Supervised fine tuning

- อีกอันที่น่าสนใจคือ น่าสนใจมาก มันยืนยันได้ว่าไม่มีอะไรพิเศษในโครงสร้างการทำงานของ o1/o3
(ไม่มี MCTS หรืออื่นๆ) ซึ่ง OAI ก็เองก็เคยยืนยันไว้ แต่คนส่วนใหญ่ไม่ค่อยเชื่อ

- ถัดมาที่น่าสนใจมากๆ คือ R1 Zero มันจะคิดในแบบที่ไม่มีเหตุผล หรือ nonsensical
ไม่ใช่แค่การสลับระหว่างภาษา แต่ยังรวมถึงการสร้างข้อความที่ไม่มีความหมายสำหรับมนุษย์ด้วย
เพราะโมเดลมันต้องการแค่ต้องการ converge ไปที่ global minimum cost function ของมัน

output tokens หรือคำหรือข้อความที่ AI สร้างขึ้นมาเมื่อมันตอบคำถามหรือทำงานอะไรก็ตามที่ให้มันทำ
ตรงนี้เกิดขึ้นในเลเยอร์สุกท้ายของโมเดล หรือโดยสรุปก็คือ มันแฮกคอสฟังก์ชั่นโดยการไม่คิดแบบคน

คีย์หลักๆที่จับได้ ก็คงประมาณนี้โดยคร่าวๆ

ส่วนรายละเอียดเชิงลึกจริงๆของโมเดล ก็ต้องไปเรียน PyTorch หรือ TensorFlow ไรงั้นมั้งครับ
ถ้าสนใจโมเดล R1 ก็คงต้องไปศึกษาเชิงลึกเรื่อง Reinforcement Learning
ทดลองเปลี่ยน ไฮเปอร์พารามิเตอร์ อะไรงั้นหละมั้งครับ

หากโดน 40 เรื้อน จะถูกแบน

wizmacho , Archawin5 , kamaujung_ , Mirt3838 , AntiGod , NG NK OH , จารสิน , แฟล็ปแจ็ค ยอดนักผจญภัย , มนุษย์แกะ , DarthKaiser , mikesawa , KnightX007 , peterxxx , Genezis , mottokung , nuni_es , bnh , acrylicz , [AXiS]`NEW , beatzaza789 , Nakata_sushi

My Locker

ออฟไลน์

MarkZuckerberg

ดาวเตะลา ลีกา

Status:

: 0 ใบ

เข้าร่วม: 08 Apr 2024

ตอบ: 3264

ที่อยู่:

โพสเมื่อ: Tue Jan 28, 2025 00:49

[RE: ขอคนสาย Tech อธิบายที [Deepseek]]

อย่าไปอ้างอิงอะไรกับตลาดหุ้นเลยครับ แมวตดยังตกใจหนีกันทั้งวง

ผมไปลองเล่นมาละตัว R1 ภาษาอังกฤษโคตรเอ๋อ

แก้ไขล่าสุดโดย MarkZuckerberg เมื่อ Tue Jan 28, 2025 00:49, ทั้งหมด 1 ครั้ง

หากโดน 40 เรื้อน จะถูกแบน

My Locker

ออฟไลน์

uryoPyRA

นักเตะท้ายซอย

Status:

: 0 ใบ

เข้าร่วม: 27 Feb 2022

ตอบ: 687

ที่อยู่:

โพสเมื่อ: Tue Jan 28, 2025 01:09

[RE]ขอคนสาย Tech อธิบายที [Deepseek]

เท่าที่อ่านมาคร่าวๆ ที่เห็นชัดเลยคือไม่ต้องใช้ทรัพยากรมากในการเทรน เพราะเอาโมเดลใหญ่ที่เปลืองทรัพยากร ไปสอนโมเดลเล็ก

ประมาณ อาจารย์ (กังฟู) กับลูกศิษย์ ท่านอาจารย์ใช้เวลาศึกษาล้มลุกคุกคลานหลายปี (เปลือง GPU, จำนวน parameters) กว่าจะได้เคล็ดวิชามา ส่วนลูกศิษย์ก็เรียนจากอาจารย์ เก่งง่ายกว่าเดิม (ประหยัดขึ้น)

โพสต์บนแอป Soccersuck บน iOS

หากโดน 40 เรื้อน จะถูกแบน

My Locker

ออฟไลน์

sacashi

นักบอลถ้วย ง.

Status: One More Light ♡

: 0 ใบ

เข้าร่วม: 01 Mar 2010

ตอบ: 2285

ที่อยู่: สุขุมวิทยา

โพสเมื่อ: Tue Jan 28, 2025 01:10

[RE: ขอคนสาย Tech อธิบายที [Deepseek]]

หลักๆ น่าจะความสามารถพอๆ กับ ChatGPT
แต่ใช้ทุนพัฒนาน้อยกว่าหลายร้อยหลายพันเท่าละมั้ง
หุ้น Tech เมการ่วงยาวๆ เลย ช้อนหักแล้วเนี่ย 555

หากโดน 40 เรื้อน จะถูกแบน

from doubters to believers ♡

My Locker

ออฟไลน์

HuyEE

กำเนิดดาวรุ่ง

Status:

: 0 ใบ

เข้าร่วม: 04 Sep 2013

ตอบ: 932

ที่อยู่:

โพสเมื่อ: Tue Jan 28, 2025 01:10

[RE: ขอคนสาย Tech อธิบายที [Deepseek]]

ใจความสำคัญรวบรัดได้คือ ผมทำได้เหมือนคุณและอาจจะดีกว่าคุณ
พวกคุณใช้หลัก 100m แต่ผมใช้แค่ 5m อะครับ

หากโดน 40 เรื้อน จะถูกแบน

My Locker

ออนไลน์

devildog

ซุปตาร์ยูโร

Status:

: 0 ใบ

เข้าร่วม: 30 Jan 2010

ตอบ: 8693

ที่อยู่: ทรานซิลเวเนีย

โพสเมื่อ: Tue Jan 28, 2025 01:43

[RE: ขอคนสาย Tech อธิบายที [Deepseek]]

หากโดน 40 เรื้อน จะถูกแบน

My Locker

ออฟไลน์

boy1000

ปลายอาชีพค้าแข้ง

Status:

: 0 ใบ

เข้าร่วม: 04 Sep 2013

ตอบ: 59844

ที่อยู่:

โพสเมื่อ: Tue Jan 28, 2025 02:00

[RE: ขอคนสาย Tech อธิบายที [Deepseek]]

ผมเข้าใจว่าไม่ได้ต่างกันมากนะ แต่มันไม่ต่างกันมากแบบที่ Deepseek เขาใช้เงินทุนน้อยกว่า ทีมงานน้อยกว่า เวลาน้อยกว่า แล้วก็ใช้ชิปเก่าๆพัฒนา ไม่ต้องไปใช้ชิปรุ่นแพงๆประมวลผล แล้วก็ให้ใช้ฟรี

คือเหมือนอเมริกาพัฒนาแทบตาย อันนี้พัฒนามาง่ายๆก็ได้ระดับเดียวกันแล้ว และก็ปล่อยให้ใช้สบายๆแบบฟรีๆก็ของธรรมดาอ่ะ จะหวงอะไรแบบนั้น

ถ้าอย่างเราๆก็พวกที่ใช้ตัวอื่นๆอย่าง ChatGPT Claude แบบเสียเงินอยู่ ก็มีตัว Deepseek มาให้ใช้ฟรีที่คุณภาพไม่ต่างกัน(บางที่บอกดีกว่าซะด้วยซ้ำ) แล้วจะไปเสียเงินทำไมละครับ

ปล. แต่ผมไม่เคยลองนะ

หากโดน 40 เรื้อน จะถูกแบน

My Locker

ออฟไลน์

purena

ปลายอาชีพค้าแข้ง

Status:

: 1 ใบ

: 0 ใบ

เข้าร่วม: 04 Nov 2006

ตอบ: 24676

ที่อยู่: ตามสำเนาทะเบียนบ้าน

โพสเมื่อ: Tue Jan 28, 2025 02:03

[RE: ขอคนสาย Tech อธิบายที [Deepseek]]

https://www.soccersuck.com/boards/topic/2532172/1

คร่าวๆ อะไรไม่จำเป็นตัดทิ้ง เอาให้ลีนที่สุด และมีประสิทธิภาพสูงสุด

สนใจว่าฟรีและดีแล้วจะเป็นแอนดรอยแห่งวงการเอไอได้มั้ย

หากโดน 40 เรื้อน จะถูกแบน

My Locker

ออฟไลน์

KafeRazer

นักบอลลีกภูมิภาค

Status:

: 0 ใบ

เข้าร่วม: 22 Sep 2006

ตอบ: 6284

ที่อยู่:

โพสเมื่อ: Tue Jan 28, 2025 02:07

[RE: ขอคนสาย Tech อธิบายที [Deepseek]]

ใช้ดีจริง ชอบฟังค์ชัน deepthink แล้วอ่าน log ที่มันคิดก่อนตอบเรา สนุกดี เหมือนอ่านความคิดคนเลย

หากโดน 40 เรื้อน จะถูกแบน

My Locker

ออฟไลน์

wizmacho

ดาวเตะพรีเมียร์ลีก

Status:

: 0 ใบ

เข้าร่วม: 21 May 2011

ตอบ: 13976

ที่อยู่:

โพสเมื่อ: Tue Jan 28, 2025 02:11

[RE: ขอคนสาย Tech อธิบายที [Deepseek]]

devildog พิมพ์ว่า:

ผมไปลองของมา ลองถามอะไรที่เกี่ยวกับรัฐบาลจีนที่เค้าบอกมันไม่ Gen ให้ ปรากฏผมเห็นหลังบ้านมันทำงานอยู่ แล้วพอขั้นสุดท้ายเหมือนมีโค้ดมาเขียนครอบเพื่อตรวจสอบสิ่งที่คิดอีกที แล้วก็ลบทั้งหมดทิ้ง แล้วที่มันเจนมาหลังบ้านก็ตรงกับข้อมูลทั่วไปธรรมดา ไม่ได้ไบแอสอะไรด้วยนะ ผมลองเอา deep tech ใส่พวกนี้ แต่ผลออกมาแย่กว่า นศ ป โท ผมอีก ส่วนตัวผมเลยให้ AI มันก็พอ ๆ กับการที่เราคิดไรไม่ทัน จัดเข้าโมเดลไปเลย ส่วนตัวผมก็ยังมองว่ามันคือ deterministic problem ที่ยังไงก็ต้องมีองค์ความรู้แบบนั้นอยู่แล้ว เพียงแต่จะจับมาชนกันได้ไหม เหมือนคิดโครงสร้างยา โปรตีน ให้เวลาคนก็ทำได้แหละ แต่นานกว่าโคตร ๆ ผมก็ vary ตัวแปรไปเรื่อย ๆ

หากโดน 40 เรื้อน จะถูกแบน

devildog , RIDER_V7

My Locker

ออฟไลน์

RocketMan

ซุปตาร์โอลิมปิก

Status:

: 0 ใบ

: 1 ใบ

เข้าร่วม: 01 Jun 2018

ตอบ: 10520

ที่อยู่:

โพสเมื่อ: Tue Jan 28, 2025 02:16

[RE: ขอคนสาย Tech อธิบายที [Deepseek]]

ประเด็นคือมัน opensoure นั้นทำให้บริษัทเทคใหม่ๆที่อยากทำ ai มีความต้องการทรัพยากรที่จะนำไปเทรดลดลง ส่งผลกระทบผู้ผลิตชิบ

การที่มันเป็น opensoure นั้นทำให้บริษัทเทคหน้าใหม่ขึ้นมาเป็นคู่แข่งที่น่ากลัว แย่งตลาด บลาๆ ผลกระทบต่อหุ้นบิ๊กเทค ai เลยโดนไปด้วย

หากโดน 40 เรื้อน จะถูกแบน

duckystyle

My Locker

ออฟไลน์

itoonggy

ปลายอาชีพค้าแข้ง

Status:

: 0 ใบ

เข้าร่วม: 13 Jun 2007

ตอบ: 46116

ที่อยู่: บ้านนอก

โพสเมื่อ: Tue Jan 28, 2025 02:20

[RE: ขอคนสาย Tech อธิบายที [Deepseek]]

น่ากลัวขนาดทำเอาหุ้น Nvidia ตก 15% ในวันเดียว META ตั้ง War room ขึ้นมาเลยทีเดียว

หากโดน 40 เรื้อน จะถูกแบน

My Locker

ออนไลน์

devildog

ซุปตาร์ยูโร

Status:

: 0 ใบ

เข้าร่วม: 30 Jan 2010

ตอบ: 8693

ที่อยู่: ทรานซิลเวเนีย

โพสเมื่อ: Tue Jan 28, 2025 02:43

[RE: ขอคนสาย Tech อธิบายที [Deepseek]]

wizmacho พิมพ์ว่า:

devildog พิมพ์ว่า:

ส่วนตัวก็เห็นด้วย และมันก็น่าจะเป็นไปทางนั้นแหละครับ

แต่คีย์ที่เป็นเรื่องใหญ่ที่กระทบตลาดหุ้นเมกา และเรื่องอื่นๆ กลับไม่น่าจะใช่ด้านนี้ครับ

หากโดน 40 เรื้อน จะถูกแบน

My Locker

ออนไลน์

devildog

ซุปตาร์ยูโร

Status:

: 0 ใบ

เข้าร่วม: 30 Jan 2010

ตอบ: 8693

ที่อยู่: ทรานซิลเวเนีย

โพสเมื่อ: Tue Jan 28, 2025 02:54

[RE: ขอคนสาย Tech อธิบายที [Deepseek]]

itoonggy พิมพ์ว่า:

น่ากลัวขนาดทำเอาหุ้น Nvidia ตก 15% ในวันเดียว META ตั้ง War room ขึ้นมาเลยทีเดียว

ก็ไม่น่าแปลกนะครับ มันน่าจะข่าวดีมากกว่าข่าวร้ายสำหรับ META

หากโดน 40 เรื้อน จะถูกแบน

itoonggy

My Locker

ออฟไลน์

PuiNaJa

นักเตะตำบล

Status:

: 0 ใบ

เข้าร่วม: 21 Dec 2009

ตอบ: 3174

ที่อยู่:

โพสเมื่อ: Tue Jan 28, 2025 03:08

[RE: ขอคนสาย Tech อธิบายที [Deepseek]]

ซักพักเมกาบอกเอไอตัวนี้มีความเชื่อมโยงรัฐบาลจีน เพราะงั้นต้องถุกแบน

หากโดน 40 เรื้อน จะถูกแบน

AntiGod

My Locker

ไปหน้าที่ 1, 2, 3

ไปที่หน้า

ตั้งกระทู้ใหม่

หน้าแรกบอร์ด >> บอร์ดวาไรตี้

กรุณาระบุเหตุผลที่จะแจ้งความ

ผู้ต้องหา:

ข้อความ:

Submit

Cancel

กรุณาเลือก Forum และ ประเภทกระทู้

Forum:

ประเภท:

Submit

Cancel