BLOG BOARD_B
ติดต่อรายละเอียดเพิ่มเติมได้ที่ Email: sale@soccersuck.com
ไว้คราวหน้า X
ไว้คราวหน้า X
ไม่ต้องแสดงข้อความนี้อีกเลย
ไปหน้าที่ 1, 2, 3
ไปที่หน้า
GO
ตั้งกระทู้ใหม่
ฝากรูป
ผู้ตั้ง
ข้อความ
ออฟไลน์
ซุปตาร์ยูโร
Status:
: 0 ใบ : 0 ใบ
เข้าร่วม: 30 Jan 2010
ตอบ: 8693
ที่อยู่: ทรานซิลเวเนีย
โพสเมื่อ: Tue Jan 28, 2025 03:32
[RE: ขอคนสาย Tech อธิบายที [Deepseek]]
PuiNaJa พิมพ์ว่า:
ซักพักเมกาบอกเอไอตัวนี้มีความเชื่อมโยงรัฐบาลจีน เพราะงั้นต้องถุกแบน  


เป็นงั้นได้ง่ายแบบนั้นก็สบายเลย แต่ประเด็นมันไม่ใช่แบบนั้นอะสิครับ

total resources อาจจะหลอกกันได้ ซึ่งก็อาจจะใช่ก็ได้ และส่วนตัวก็เชื่อไปทางนั้นด้วย

แต่ "last" training run มันจะทำได้ไง แค่ไป replicated และ verified ก็ได้คำตอบแล้ว

ซึ่งคอนเซปมันก็ง่ายๆคือ ตลาดโลกบอกผมมีน้ำมัน95 มาขายลิตรละ 40บาท

จีนบอกผมขายให้ 4บาทละกัน คุณภาพก็เหมือนๆกันแถวๆนั้นแหละ จะไปตรวจสอบไรก็ตามใจ

เมกาแบนบอกห้ามซื้อจากจีน มันก็นะ

ส่วน total resources ผมก็มองว่าจีนอย่างโม้ อะไรมันจะเทพปานนั้น

แต่ก็ไม่ใช่ประเด็นอะ มันจะลงทุนไป 5ล้านล้านล้านล้านเหรียญ ก็เรื่องมัน

แต่น้ำมันลิตรนึง 4บาท กะ 40บาท คุณภาพแถวๆเดียวกัน ลื้อจะเอาไร ก็ทำนองนั้นอะครับ
3
0
หากโดน 40 เรื้อน จะถูกแบน
ออฟไลน์
นักเตะเทศบาล
Status: I rustle jimmies, you rustle cocks.
: 0 ใบ : 0 ใบ
เข้าร่วม: 19 May 2011
ตอบ: 5068
ที่อยู่: Turin and Manchester
โพสเมื่อ: Tue Jan 28, 2025 04:17
[RE: ขอคนสาย Tech อธิบายที [Deepseek]]
ประเด็นคือ Deepseek มันถูกปล่อยมาหลังจากทรัมป์กับบรรดา big tech เพิ่งอวยคมกันไปกับโปรเจ็คเอไอ 500 พันล้านดอลลาร์เมื่อวันก่อน

พรี่สีเปิดก่อนแบบนี้ เดี๋ยวทรัมป์หาทางจัดคืนแน่นอน
0
0
หากโดน 40 เรื้อน จะถูกแบน
ออนไลน์
นักบอลไทยพรีเมียร์ลีก
Status:
: 0 ใบ : 0 ใบ
เข้าร่วม: 14 Aug 2012
ตอบ: 4570
ที่อยู่:
โพสเมื่อ: Tue Jan 28, 2025 07:52
[RE: ขอคนสาย Tech อธิบายที [Deepseek]]
ถ้าให้ย่อยแบบเข้าใจง่าย
ราคาต่อประสิทธิภาพสูงมาก ถ้าเทียบกับตัวอื่นๆ
ในขณะที่ประสิทธิภาพก็ใกล้เคียงกับตัวท็อปของตลาด
รวมทั้งเปิดให้ทุกคนเข้าถึงและเอาไปใช้พัฒนาต่อได้
คิดไปคิดมาก็คล้ายแอนดรอยจริงๆ
0
0
หากโดน 40 เรื้อน จะถูกแบน
ออฟไลน์
ดาวซัลโวโอลิมปิก
Status:
: 0 ใบ : 1 ใบ
เข้าร่วม: 14 Jul 2022
ตอบ: 3831
ที่อยู่:
โพสเมื่อ: Tue Jan 28, 2025 08:09
[RE: ขอคนสาย Tech อธิบายที [Deepseek]]
ลองใช้บ้างแล้ว

ฟรีเวอร์ชั่นเทียบกันนะ


ดีกว่า Gemini Chatgpt Copilot ในหลายๆ คำถามเลย



ลองให้มันเขียนโค้ดให้ ทำได้ดีกว่าของพวกฝรั่ง


เขาว่า มันใช้พลังงานทรัพยากร ในการตอบคำถามน้อยกว่า โปรแกรมพวกฝรั่งด้วย อันนี้ น่าจะเป็นท่าไม้ตาย
2
0
หากโดน 40 เรื้อน จะถูกแบน
HELLO WORLD

ออฟไลน์
นักเตะหมู่บ้าน
Status:
: 0 ใบ : 0 ใบ
เข้าร่วม: 23 Jan 2006
ตอบ: 2801
ที่อยู่: Somewhere in neverland
โพสเมื่อ: Tue Jan 28, 2025 08:35
[RE: ขอคนสาย Tech อธิบายที [Deepseek]]
เข้าใจถูกไหมว่ามันฟรีแบบฟรี 100% แล้ว เค้าได้อะไรได้ข้อมูลเฉยๆ ป่ะ
0
0
หากโดน 40 เรื้อน จะถูกแบน
Just go where destiny takes you.
ออฟไลน์
โค้ช B-License
Status: Middle fingers up if you don't give a f**k
: 0 ใบ : 0 ใบ
เข้าร่วม: 05 Apr 2010
ตอบ: 42847
ที่อยู่: ข้าวเหนียวมะม่วงรสช็อคโกแลต
โพสเมื่อ: Tue Jan 28, 2025 09:21
[RE: ขอคนสาย Tech อธิบายที [Deepseek]]
มันแน่อยู่แล้ว ทุกคนอยากหนีจาก Nvidia เพราะตอนนี้ Nvidia มันตั้งราคาของเองได้ตามใจ จีนปลดแอกตรงนี้ได้ถือว่าดี ไม่งั้น Nvidia มันจะใหญ่เกินไป
0
0
หากโดน 40 เรื้อน จะถูกแบน

SAVE OF THE CENTURY !!

ออนไลน์
แข้งบุนเดสลีกา
Status:
: 0 ใบ : 0 ใบ
เข้าร่วม: 22 Oct 2012
ตอบ: 8717
ที่อยู่:
โพสเมื่อ: Tue Jan 28, 2025 09:42
[RE: ขอคนสาย Tech อธิบายที [Deepseek]]
โคตรดีใจ ที่open Ai มีคู่แข่งบ้าง

คิดถึงว่า มีเทคอย่างAIประสิทธิภาพสูงครอบครองอยู่ที่เดียวแล้วคิดดีไม่ได้เลย
0
0
หากโดน 40 เรื้อน จะถูกแบน
Talent bringt dich an den start, Einstellung ans ziel.
พรสวรรค์นำคุณไปที่จุดเริ่มต้น ทัศนคตินำคุณไปสู่เส้นชัย
ออฟไลน์
ดาวซัลโวโอลิมปิก
Status:
: 0 ใบ : 1 ใบ
เข้าร่วม: 14 Jul 2022
ตอบ: 3831
ที่อยู่:
โพสเมื่อ: Tue Jan 28, 2025 09:53
[RE: ขอคนสาย Tech อธิบายที [Deepseek]]
Deepseek

ได้พวกคนจีน ที่จบ ม. ดังๆ ของอเมริกา อย่าง MIT Stanford Berkeley ไปทำงานให้เพียบเลย เป็นระดับตัวท็อปๆ ทั้งนั้น
0
0
หากโดน 40 เรื้อน จะถูกแบน
HELLO WORLD

ออฟไลน์
นักบอล ดิวิชั่น 1
Status:
: 0 ใบ : 0 ใบ
เข้าร่วม: 11 Feb 2017
ตอบ: 1234
ที่อยู่:
โพสเมื่อ: Tue Jan 28, 2025 09:58
[RE: ขอคนสาย Tech อธิบายที [Deepseek]]
สรุปการทำงานของ Deepseek
ช่วงก่อนเปิดตัว

เนื่องจากจีนถูกจำกัดการเข้าถึงทรัพยากร GPU ทำให้ไม่สามารถจัดหาทรัพยากรเพิ่มเติมได้ จึงต้องหาวิธีการใหม่ในการพัฒนาโมเดล AI โดยการใช้งานทรัพยากรที่มีอยู่อย่างจำกัดให้เกิดประสิทธิภาพสูงสุด

------------------------------------------------

ช่วงหลังเปิดตัว
การเปิดเผยข้อมูลภายใต้ MIT License

1. Deepseek เปิดเผยข้อมูลการพัฒนาแบบ Open Source ภายใต้ MIT License
ผู้ใช้งานสามารถใช้งานโมเดลได้ฟรี
สามารถนำไปพัฒนาต่อยอดได้ฟรี
เปิดเอกสารและข้อมูลสำหรับการศึกษาต่อ
https://en.wikipedia.org/wiki/DeepSeek



2 การพัฒนาแบบ Native 8 Floating Point (FP)

ต่างจากโมเดล AI ชั้นนำ เช่น ChatGPT ที่พัฒนาด้วยความแม่นยำสูงสุดในระดับ 32 FP แล้วค่อยย่อขนาดโมเดล
Deepseek ออกแบบและฝึกโมเดลให้ฉลาดในระดับ 8 FP โดยตรง ทำให้มีความต้องการทรัพยากรน้อยกว่ามาก
ลดภาระด้านการจดจำข้อมูลลง โดยยังคงประสิทธิภาพที่สูงอยู่


3 การคาดการณ์หลายคำในครั้งเดียว

ในระบบการทำงานของ LLM ทั่วไป เช่น ChatGPT จะคาดเดาคำถัดไปทีละคำ
Meta เคยเสนอแนวคิดการคาดเดาหลายคำพร้อมกัน แต่ยังไม่สามารถพัฒนาได้สำเร็จ
Deepseek ใช้แนวทางนี้โดยการคาดเดาคำถัดไป 3-4 คำต่อการประมวลผลหนึ่งครั้ง
วิธีนี้ช่วยลดทรัพยากรและจำนวนการประมวลผลลงอย่างมีนัยสำคัญ


4 การปรับเปลี่ยนวิธีการค้นหาและจัดการข้อมูล

Deepseek ลดการใช้กระบวนการบีบอัดและถอดรหัสข้อมูลที่ซับซ้อน
แทนที่ด้วยกระบวนการ Index-based Search ซึ่งมีความเร็วและประสิทธิภาพที่สูงกว่าเดิม

DeepSeek โดดเด่นในเรื่องการใช้ทรัพยากรอย่างมีประสิทธิภาพ ทำให้สามารถเสนอราคาต่อ 1 ล้าน tokens ได้ต่ำมากที่ $0.55 (ประมาณ 19 บาท) เมื่อเทียบกับ OpenAI-o1 ที่ราคา $15 (ประมาณ 505 บาท) โดยประสิทธิภาพของ DeepSeek ใกล้เคียง OpenAI แต่ราคาถูกกว่า 26 เท่า

------------------------------------

ส่งผลต่อตลาดหุ้นอย่างไร
1 เจ้าตลาดโดนเจ้าเล็กตบได้ โดยความสามารถใกล้เคียงแต่ประหยัดทรัพยากรลง
2 อาจจะส่งผลต่อยอดสั่งซื้อ GPU ในอนาคตลดลง เพราะใช้น้อยลง



0
0
หากโดน 40 เรื้อน จะถูกแบน
contactme themasksoccer@gmail.com
ออฟไลน์
นักบอลถ้วย ก.
Status: ABCD WXYZ
: 0 ใบ : 0 ใบ
เข้าร่วม: 07 Jun 2010
ตอบ: 2040
ที่อยู่: ผมย้ายไปทำอย่างอื่นแล้ว
โพสเมื่อ: Tue Jan 28, 2025 10:04
[RE: ขอคนสาย Tech อธิบายที [Deepseek]]
devildog พิมพ์ว่า:
ไม่ใช่คนสายเทค แต่ก็เกี่ยวข้องอยู่บ้าง มีความเห็นแบบนี้ครับ

- มันมีความก้าวหน้าในเรื่องการฝึกโมเดลที่ใช้ Mixed Precision
(ซึ่งช่วยลดต้นทุนการฝึกโมเดลได้) รวมถึงการจัดการปัญหา Loss Spiking ใน MOE
ที่สามารถช่วยลดต้นทุนได้มากเหมือนกัน

- DeepSeek โชว์ให้เห็นเลยว่า มันการปรับปรุงประสิทธิภาพการฝึกให้ดีขึ้นอย่างมากมาก
ในคหสต. โดยเฉพาะ โมเดลที่เรียกว่า R1 Zero
โมเดลนี้แสดงให้เห็นว่า test time compute scaling
สามารถทำได้ด้วย Reinforcement Learning เพียงอย่างเดียว
ไม่ต้องมี Supervised fine tuning

- อีกอันที่น่าสนใจคือ น่าสนใจมาก มันยืนยันได้ว่าไม่มีอะไรพิเศษในโครงสร้างการทำงานของ o1/o3
(ไม่มี MCTS หรืออื่นๆ) ซึ่ง OAI ก็เองก็เคยยืนยันไว้ แต่คนส่วนใหญ่ไม่ค่อยเชื่อ

- ถัดมาที่น่าสนใจมากๆ คือ R1 Zero มันจะคิดในแบบที่ไม่มีเหตุผล หรือ nonsensical
ไม่ใช่แค่การสลับระหว่างภาษา แต่ยังรวมถึงการสร้างข้อความที่ไม่มีความหมายสำหรับมนุษย์ด้วย
เพราะโมเดลมันต้องการแค่ต้องการ converge ไปที่ global minimum cost function ของมัน

output tokens หรือคำหรือข้อความที่ AI สร้างขึ้นมาเมื่อมันตอบคำถามหรือทำงานอะไรก็ตามที่ให้มันทำ
ตรงนี้เกิดขึ้นในเลเยอร์สุกท้ายของโมเดล หรือโดยสรุปก็คือ มันแฮกคอสฟังก์ชั่นโดยการไม่คิดแบบคน

คีย์หลักๆที่จับได้ ก็คงประมาณนี้โดยคร่าวๆ

ส่วนรายละเอียดเชิงลึกจริงๆของโมเดล ก็ต้องไปเรียน PyTorch หรือ TensorFlow ไรงั้นมั้งครับ
ถ้าสนใจโมเดล R1 ก็คงต้องไปศึกษาเชิงลึกเรื่อง Reinforcement Learning
ทดลองเปลี่ยน ไฮเปอร์พารามิเตอร์ อะไรงั้นหละมั้งครับ  


นี่ขนาดไม่ใช่สาย ไอที นะ
ผมสายไอที ยังไม่รู้เท่าท่านเลย สุดยอดครับ
0
0
หากโดน 40 เรื้อน จะถูกแบน
ออฟไลน์
กำเนิดดาวรุ่ง
Status:
: 0 ใบ : 0 ใบ
เข้าร่วม: 18 Sep 2020
ตอบ: 818
ที่อยู่:
โพสเมื่อ: Tue Jan 28, 2025 11:18
[RE: ขอคนสาย Tech อธิบายที [Deepseek]]
liverboy พิมพ์ว่า:
เข้าใจถูกไหมว่ามันฟรีแบบฟรี 100% แล้ว เค้าได้อะไรได้ข้อมูลเฉยๆ ป่ะ  

น่าจะไปสุดที่ให้เช่าใช้เหมือนคนอื่น ๆ แต่ในราคาที่ถูกกว่า เพราะ ต้นทุนในการ train ต่ำกว่า
แต่ถ้าจะให้รอบรู้มาก ก็ต้องมี Train set ที่ใหญ่เหมือนชาวบ้านเขา

1
0
หากโดน 40 เรื้อน จะถูกแบน
ออฟไลน์
ดาวซัลโวยุโรป
Status:
: 0 ใบ : 0 ใบ
เข้าร่วม: 15 Sep 2005
ตอบ: 6418
ที่อยู่:
โพสเมื่อ: Tue Jan 28, 2025 12:32
[RE: ขอคนสาย Tech อธิบายที [Deepseek]]
เท่าที่อ่านมาคร่าวๆ สรุปแบบเข้าใจง่ายๆก็คือโมเดลใช้ vRam มากขึ้น แต่ลดความต้องการของหน่วยประมวลผลลง แล้ว vRam หรือ Ram มันราคาถูกกว่าพวกหน่วยประมวลผลเยอะครับ เห็นเขาคำนวณกันว่า based model ต้องใช้แรมระดับเกือบๆจะ 1 TB ในการรัน ตอนนี้ชาวบ้านธรรมดาไม่น่าจะรันได้ ตอนนี้ที่ชาวบ้านแบบเราๆลองกันได้คือเป็นพวก Distill model ครับ เป็นโมเดลขนาดเล็ก

ส่วนผมยังไม่ได้ลองนะ
แก้ไขล่าสุดโดย rafa van roo vart เมื่อ Tue Jan 28, 2025 12:36, ทั้งหมด 1 ครั้ง
0
0
หากโดน 40 เรื้อน จะถูกแบน
ออนไลน์
ซุปตาร์ยูโร
Status:
: 0 ใบ : 0 ใบ
เข้าร่วม: 01 Jun 2016
ตอบ: 15139
ที่อยู่:
โพสเมื่อ: Tue Jan 28, 2025 13:17
[RE: ขอคนสาย Tech อธิบายที [Deepseek]]
boy1000 พิมพ์ว่า:
ผมเข้าใจว่าไม่ได้ต่างกันมากนะ แต่มันไม่ต่างกันมากแบบที่ Deepseek เขาใช้เงินทุนน้อยกว่า ทีมงานน้อยกว่า เวลาน้อยกว่า แล้วก็ใช้ชิปเก่าๆพัฒนา ไม่ต้องไปใช้ชิปรุ่นแพงๆประมวลผล แล้วก็ให้ใช้ฟรี

คือเหมือนอเมริกาพัฒนาแทบตาย อันนี้พัฒนามาง่ายๆก็ได้ระดับเดียวกันแล้ว และก็ปล่อยให้ใช้สบายๆแบบฟรีๆก็ของธรรมดาอ่ะ จะหวงอะไรแบบนั้น

ถ้าอย่างเราๆก็พวกที่ใช้ตัวอื่นๆอย่าง ChatGPT Claude แบบเสียเงินอยู่ ก็มีตัว Deepseek มาให้ใช้ฟรีที่คุณภาพไม่ต่างกัน(บางที่บอกดีกว่าซะด้วยซ้ำ) แล้วจะไปเสียเงินทำไมละครับ

ปล. แต่ผมไม่เคยลองนะ  


ถามนิดท่าน

ทำไมจีน ถึงทำได้ง่ายน่ะท่าน
0
0
หากโดน 40 เรื้อน จะถูกแบน
Liverpool ยังขาด no.6
ออฟไลน์
ปลายอาชีพค้าแข้ง
Status:
: 0 ใบ : 0 ใบ
เข้าร่วม: 04 Sep 2013
ตอบ: 59844
ที่อยู่:
โพสเมื่อ: Tue Jan 28, 2025 16:00
[RE: ขอคนสาย Tech อธิบายที [Deepseek]]
jocolenoname1234 พิมพ์ว่า:
boy1000 พิมพ์ว่า:
ผมเข้าใจว่าไม่ได้ต่างกันมากนะ แต่มันไม่ต่างกันมากแบบที่ Deepseek เขาใช้เงินทุนน้อยกว่า ทีมงานน้อยกว่า เวลาน้อยกว่า แล้วก็ใช้ชิปเก่าๆพัฒนา ไม่ต้องไปใช้ชิปรุ่นแพงๆประมวลผล แล้วก็ให้ใช้ฟรี

คือเหมือนอเมริกาพัฒนาแทบตาย อันนี้พัฒนามาง่ายๆก็ได้ระดับเดียวกันแล้ว และก็ปล่อยให้ใช้สบายๆแบบฟรีๆก็ของธรรมดาอ่ะ จะหวงอะไรแบบนั้น

ถ้าอย่างเราๆก็พวกที่ใช้ตัวอื่นๆอย่าง ChatGPT Claude แบบเสียเงินอยู่ ก็มีตัว Deepseek มาให้ใช้ฟรีที่คุณภาพไม่ต่างกัน(บางที่บอกดีกว่าซะด้วยซ้ำ) แล้วจะไปเสียเงินทำไมละครับ

ปล. แต่ผมไม่เคยลองนะ  


ถามนิดท่าน

ทำไมจีน ถึงทำได้ง่ายน่ะท่าน  


ไม่แน่ใจเหมือนกันครับ แต่ผมว่านอกจากเก่งแล้ว ก็คือเห็นโมเดลจากพวกเจ้าตลาดเก่าๆนั้นแหละ เลยเอามาพัฒนาต่อง่ายกว่า
0
0
หากโดน 40 เรื้อน จะถูกแบน
ออฟไลน์
นักเตะตำบล
Status:
: 0 ใบ : 0 ใบ
เข้าร่วม: 21 Dec 2009
ตอบ: 3174
ที่อยู่:
โพสเมื่อ: Tue Jan 28, 2025 21:26
[RE: ขอคนสาย Tech อธิบายที [Deepseek]]
devildog พิมพ์ว่า:
PuiNaJa พิมพ์ว่า:
ซักพักเมกาบอกเอไอตัวนี้มีความเชื่อมโยงรัฐบาลจีน เพราะงั้นต้องถุกแบน  


เป็นงั้นได้ง่ายแบบนั้นก็สบายเลย แต่ประเด็นมันไม่ใช่แบบนั้นอะสิครับ

total resources อาจจะหลอกกันได้ ซึ่งก็อาจจะใช่ก็ได้ และส่วนตัวก็เชื่อไปทางนั้นด้วย

แต่ "last" training run มันจะทำได้ไง แค่ไป replicated และ verified ก็ได้คำตอบแล้ว

ซึ่งคอนเซปมันก็ง่ายๆคือ ตลาดโลกบอกผมมีน้ำมัน95 มาขายลิตรละ 40บาท

จีนบอกผมขายให้ 4บาทละกัน คุณภาพก็เหมือนๆกันแถวๆนั้นแหละ จะไปตรวจสอบไรก็ตามใจ

เมกาแบนบอกห้ามซื้อจากจีน มันก็นะ

ส่วน total resources ผมก็มองว่าจีนอย่างโม้ อะไรมันจะเทพปานนั้น

แต่ก็ไม่ใช่ประเด็นอะ มันจะลงทุนไป 5ล้านล้านล้านล้านเหรียญ ก็เรื่องมัน

แต่น้ำมันลิตรนึง 4บาท กะ 40บาท คุณภาพแถวๆเดียวกัน ลื้อจะเอาไร ก็ทำนองนั้นอะครับ  



ไม่หรอกครับ ที่ผ่านมาจีนมันถูกเมกาแบนนั่นนี่ ไม่เคยมีเหตุผลที่ถูกต้องใดๆอยู่แล้วครับ

มันแค่ต้องการเตะตัดขาสกัดจีนไม่ให้โตกว่ามันเท่านั้นเอง

เพราะงั้นถ้าเอไอจีนเจริญกว่าดีกว่า สุดท้ายก็เตะตัดขาทิ้งแบบที่หัวเหว่ยเจอมา
0
0
หากโดน 40 เรื้อน จะถูกแบน
ไปหน้าที่ 1, 2, 3
ไปที่หน้า
GO
ตั้งกระทู้ใหม่
กรุณาระบุเหตุผลที่จะแจ้งความ
ผู้ต้องหา:
ข้อความ:
Submit
Cancel
กรุณาเลือก Forum และ ประเภทกระทู้
Forum:

ประเภท:
Submit
Cancel