หัวข้อข่าว

เปิดตัวโมเดล DeepSeek-V3 ตัวใหม่ ใช้งานฟรี

DeepSeek-V3

ดีฟซีก บริษัท AI จากจีน เปิดตัว DeepSeek-V3-0324 โมเดลภาษาใหญ่รุ่นล่าสุดบน Hugging Face แบบเงียบๆ แต่ทรงพลัง จุดเด่นคือ ใช้งานฟรีเชิงพาณิชย์ภายใต้ MIT License และที่น่าทึ่งคือ รันบนคอมพิวเตอร์ทั่วไปได้เลย

โมเดล V3 ล้ำหน้า รันเร็ว ประสิทธิภาพจัดเต็ม

  •  รันบน Mac Studio M3 Ultra ได้เร็วกว่า 20 tokens/s
  •  แรงสวนทางเทรนด์ – ไม่ต้องใช้เซิร์ฟเวอร์ยักษ์ก็ใช้งานได้
  • ทดสอบแล้วอาจเหนือกว่า Claude Sonnet 3.5 ในบางงาน

ใช้ Mixture-of-Experts (MoE) โดยเลือกใช้พารามิเตอร์เพียง 37B จาก 685B ทำให้รันเร็วและประหยัดพลังงาน แต่ยังคงความแม่นยำสูง พร้อมฟีเจอร์ Multi-Head Latent Attention (MLA) และ Multi-Token Prediction (MTP) ที่ช่วยให้เข้าใจบริบทและตอบได้เร็วขึ้น

สามารถทดลองใช้ได้แล้ววันนี้!

ผ่าน Hugging Face, OpenRouter API, แชตของ ดีฟซีก หรือ inferencing จาก Hyperbolic Labs

tags : composio.dev

Facebook

ใส่ความเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *