หมดยุคคุยคนละภาษา! Google ดัน AI แปลเสียงสดแบบเรียลไทม์
Google เปิดตัว Gemini 3.5 Live Translate เทคโนโลยีแปลเสียงพูดรุ่นใหม่ที่สามารถแปลจาก “เสียงเป็นเสียง” ได้แบบเกือบเรียลไทม์ รองรับมากกว่า 70 ภาษา พร้อมความสามารถในการตรวจจับภาษาอัตโนมัติ ช่วยให้การสื่อสารข้ามภาษาเป็นเรื่องง่ายกว่าที่เคย ความพิเศษคือระบบไม่จำเป็นต้องรอให้ผู้พูดพูดจบก่อนเหมือนเครื่องแปลภาษาแบบเดิม แต่สามารถฟัง แปล และพูดออกมาได้ต่อเนื่อง ทำให้บทสนทนาเป็นธรรมชาติและลื่นไหลมากขึ้น
แปลได้ทั้งคำพูดและอารมณ์ของผู้พูด
Gemini 3.5Live Translate ไม่ได้แปลแค่เนื้อหาเท่านั้น แต่ยังพยายามรักษาน้ำเสียง จังหวะการพูด และอารมณ์ของผู้พูดต้นฉบับเอาไว้ด้วย Google ระบุว่าโมเดลใหม่นี้ยังสามารถทำงานได้ดีในสภาพแวดล้อมที่มีเสียงรบกวน เช่น ร้านอาหาร ถนน หรือพื้นที่สาธารณะ รวมถึงรองรับการสนทนาหลายภาษาในเวลาเดียวกัน โดยไม่ต้องตั้งค่าภาษาล่วงหน้า
Google Meet อัปเกรดครั้งใหญ่ รองรับกว่า 2,000 คู่ภาษา
หนึ่งในจุดเปลี่ยนสำคัญคือการนำ Gemini 3.5 Live Translate เข้ามาใช้งานใน Google Meet
จากเดิมที่รองรับเพียง 5 ภาษา ตอนนี้ขยายเป็นมากกว่า 70 ภาษา และสามารถแปลการประชุมได้มากกว่า 2,000 คู่ภาษา ช่วยให้ผู้เข้าร่วมประชุมจากหลายประเทศสามารถสื่อสารกันได้โดยตรง ไม่จำเป็นต้องใช้ภาษาอังกฤษเป็นตัวกลางอีกต่อไป
ใช้ได้แล้วบน Google Translate และเปิดให้นักพัฒนาต่อยอด
Google เริ่มทยอยปล่อยฟีเจอร์ Live Translate ให้กับผู้ใช้งานแอป Google Translate ทั้งบน Android และ iOS
ผู้ใช้ Android ยังได้รับฟีเจอร์ Listening Mode ที่สามารถยกมือถือแนบหูเหมือนคุยโทรศัพท์ แล้วฟังคำแปลแบบสด ๆ ได้ทันที ขณะที่ฝั่งนักพัฒนาก็สามารถนำเทคโนโลยีนี้ไปต่อยอดผ่าน Gemini Live API เพื่อสร้างแอปพลิเคชันล่ามสด การเรียนออนไลน์ หรือระบบแปลภาษาสำหรับงานอีเวนต์ได้เช่นกัน
ทุกเสียงที่ AI สร้าง มีลายน้ำดิจิทัลป้องกันการปลอมแปลง
เพื่อรับมือกับความเสี่ยงด้าน Deepfake และข้อมูลเท็จ Google ได้ฝังเทคโนโลยี SynthID ลงในทุกเสียงที่สร้างโดย AI ลายน้ำดิจิทัลดังกล่าวไม่สามารถได้ยินด้วยหูมนุษย์ แต่สามารถใช้ตรวจสอบย้อนหลังได้ว่าไฟล์เสียงนั้นถูกสร้างขึ้นโดย AI ช่วยเพิ่มความโปร่งใสและความปลอดภัยในการใช้งาน
tags Anthropic