ดีฟซีก บริษัท AI จากจีน เปิดตัว DeepSeek-V3-0324 โมเดลภาษาใหญ่รุ่นล่าสุดบน Hugging Face แบบเงียบๆ แต่ทรงพลัง จุดเด่นคือ ใช้งานฟรีเชิงพาณิชย์ภายใต้ MIT License และที่น่าทึ่งคือ รันบนคอมพิวเตอร์ทั่วไปได้เลย
โมเดล V3 ล้ำหน้า รันเร็ว ประสิทธิภาพจัดเต็ม
- รันบน Mac Studio M3 Ultra ได้เร็วกว่า 20 tokens/s
- แรงสวนทางเทรนด์ – ไม่ต้องใช้เซิร์ฟเวอร์ยักษ์ก็ใช้งานได้
- ทดสอบแล้วอาจเหนือกว่า Claude Sonnet 3.5 ในบางงาน
ใช้ Mixture-of-Experts (MoE) โดยเลือกใช้พารามิเตอร์เพียง 37B จาก 685B ทำให้รันเร็วและประหยัดพลังงาน แต่ยังคงความแม่นยำสูง พร้อมฟีเจอร์ Multi-Head Latent Attention (MLA) และ Multi-Token Prediction (MTP) ที่ช่วยให้เข้าใจบริบทและตอบได้เร็วขึ้น
The new Deep Seek V3 0324 in 4-bit runs at > 20 toks/sec on a 512GB M3 Ultra with mlx-lm! pic.twitter.com/wFVrFCxGS6
— Awni Hannun (@awnihannun) March 24, 2025
สามารถทดลองใช้ได้แล้ววันนี้!
ผ่าน Hugging Face, OpenRouter API, แชตของ ดีฟซีก หรือ inferencing จาก Hyperbolic Labs
tags : composio.dev
Facebook