Google ได้ปล่อยอัปเดตครั้งสำคัญให้กับตระกูล Gemini เพื่อยกระดับความเร็ว ความฉลาด และปรับปรุงอินเทอร์เฟซการใช้งานให้มีความยืดหยุ่นมากยิ่งขึ้น นี่คือสรุปฟีเจอร์และสิ่งใหม่ทั้งหมดที่คุณต้องรู้เกี่ยวกับการอัปเดตล่าสุดนี้
1. Gemini 3.5 Flash: ทรงพลังระดับเรือธง ในความเร็วสายฟ้าแลบ
โมเดลรุ่นใหม่ล่าสุดที่เปิดตัวมาเพื่อปฏิวัติวงการ AI Agent และการเขียนโค้ดโดยเฉพาะ
- เร็วขึ้น 4 เท่า: มีความเร็วในการส่งข้อมูล (Output Tokens) สูงกว่าโมเดลระดับแนวหน้าทั่วไปถึง 4 เท่า
- ความสามารถระดับสูง (Agentic Tasks): ออกแบบมาเพื่อทำงานที่ซับซ้อนและมีหลายขั้นตอนได้อย่างลื่นไหล เช่น การรักษาความปลอดภัยโค้ด หรือการตรวจเอกสารการเงินจำนวนมาก
- เหนือกว่ารุ่น Pro เดิม: ผลทดสอบด้านการเขียนโค้ดและการทำงานแบบ Agent (Terminal-Bench 2.1) สามารถทำคะแนนชนะ Gemini 3.1 Pro ได้อย่างโดดเด่น
- สร้าง UI และกราฟิกดีขึ้น: รองรับการสร้างหน้าเว็บอินเทอร์เฟซ (Interactive Web UIs) และกราฟิกที่สมบูรณ์แบบกว่าเดิม
2. Gemini 3.1 Flash-Lite: เบา คล่องตัว และประหยัดขั้นสุด
โมเดลน้องเล็กที่เน้นความคุ้มค่าและความเร็วขั้นสูงสุด สำหรับงานที่ต้องการการตอบสนองแบบเรียลไทม์
- เร็วกว่าเดิม 45%: เมื่อเทียบกับรุ่น 2.5 Flash พร้อมทั้งตอบสนองคำแรก (Time to First Token) เร็วขึ้นถึง 2.5 เท่า
- ราคาประหยัดและกินพลังงานต่ำ: เหมาะสำหรับงานแปลภาษา คัดกรองเนื้อหา (Content Moderation) และงานแชตบอตปริมาณมหาศาล
- ประสิทธิภาพเกินตัว: รองรับ Context Window สูงถึง 1 ล้านท็อกเก็น และสามารถปรับระดับการคิดวิเคราะห์ (Thinking Levels) ได้เช่นกัน
3. ระบบคิดวิเคราะห์แบบใหม่: Standard vs. Extended Thinking
ผู้ใช้งานสามารถเลือกปรับระดับการ “คิด” ของ Gemini ให้เหมาะสมกับแต่ละงานได้แล้ว:
- Standard Thinking (โหมดเริ่มต้น): ตอบคำถามทั่วไปได้อย่างรวดเร็วและมีประสิทธิภาพสูง ประหยัดพลังงานประมวลผล
- Extended Thinking (โหมดวิเคราะห์ลึก): โมเดลจะใช้เวลาคิดทบทวนเพื่อหาเหตุผลก่อนตอบ เหมาะสำหรับการแก้โจทย์คณิตศาสตร์ การดีบั๊กโค้ดที่ซับซ้อน หรือการทำงานวิจัยเชิงลึก
- (สำหรับผู้ใช้บริการระดับท็อปอย่าง AI Ultra จะได้รับฟีเจอร์ Deep Think ที่ประมวลผลเชิงลึกขนานใหญ่ร่วมด้วย)
4. ระบบโควตาแบบคำนวณจริง (Compute-Based Limits) และจุดเปลี่ยนสำคัญ!
นี่คือสิ่งที่ผู้ใช้ทุกคนต้องรู้ Google ได้ยกเลิกการปล่อยให้ใช้งานแบบ “ไม่จำกัด” กับโมเดลรุ่นเล็กแล้ว และเปลี่ยนมาใช้ระบบคำนวณผ่าน “พลังงานสมองที่ใช้จริง” (Compute-Based Limits) ร่วมกันทั้งหมด:
- จำกัดการใช้งานทุกโมเดล (ไม่มีข้อยกเว้น): ตอนนี้ทุกโมเดลแชร์ “ถังพลังงานประมวลผล” เดียวกันทั้งหมด ไม่มีการปล่อยให้แชตฟรีแบบไร้ขีดจำกัดเหมือนแต่ก่อน แม้แต่โมเดลน้องเล็กอย่าง Flash-Lite ก็มีโควตากำกับเช่นกัน
- ความซับซ้อนมีผลต่อความไวของโควตา:
- โมเดลกินพลังงานสูง: หากใช้ฟีเจอร์หนักๆ เช่น Extended Thinking, Deep Research, การสร้างรูปภาพ/วิดีโอ หรือสั่งรันโค้ด เปอร์เซ็นต์การใช้งานในแถบจะลดลงอย่างรวดเร็ว
- โมเดลกินพลังงานต่ำ: หากสลับมาคุยกับ Flash-Lite หรือใช้ Standard Thinking แถบพลังงานจะลดลงช้ามากจนเกือบเหมือนไม่จำกัด (แต่หากพิมพ์คุยหนักๆ หรือส่งไฟล์ใหญ่ต่อเนื่อง โควตาก็ลดลงได้เช่นกัน)
- หน้าแดชบอร์ดตรวจสอบสด (Live Tracker): ตรวจสอบสถานะการใช้งานได้ที่เมนู Settings > Usage Limits ซึ่งจะแสดงข้อมูล 3 ส่วนสำคัญ:
- แถบแสดงเปอร์เซ็นต์ (%) การใช้งานที่เหลืออยู่ ณ ปัจจุบัน
- ระบบรีเซ็ตทุก 5 ชั่วโมง: แถบนับเวลาถอยหลังที่จะค่อยๆ คืนโควตาประมวลผลให้คุณในทุกๆ 5 ชั่วโมง
- ขีดจำกัดรายสัปดาห์ (Weekly Limit): เกณฑ์รวมรายสัปดาห์เพื่อความเสถียรของระบบทั้งหมด
- ระบบสลับโมเดลอัตโนมัติ: หากคุณใช้โควตาหลัก (สำหรับโมเดลใหญ่อย่าง Gemini 3.5 Flash) หมดลง ระบบจะสลับไปให้คุณคุยกับโมเดลประหยัดพลังงานอย่าง Flash-Lite ต่อได้ทันที เพื่อไม่ให้การทำงานของคุณสะดุด
บทสรุป
การปรับเปลี่ยนครั้งนี้ของ Google ชี้ให้เห็นว่ายุคของ “การคุยฟรีไม่มีอั้น” ได้สิ้นสุดลงแล้ว และเปลี่ยนเข้าสู่ยุคที่ทุกอย่างถูกคำนวณเป็นพลังงานประมวลผล (Compute) ที่มีความชัดเจนและโปร่งใส อย่างไรก็ตาม ข้อดีคือการที่ระบบสลับไปใช้ Flash-Lite อัตโนมัติเมื่อโควตาหลักหมด จะช่วยให้ผู้ใช้งานทั่วไปยังคงทำงานได้ต่อเนื่องโดยไม่ต้องกังวลว่าจะถูกปิดกั้นการเข้าถึงระบบโดยสิ้นเชิงในระหว่างวัน