อัปเดตใหญ่ Google Gemini

Google ได้ปล่อยอัปเดตครั้งสำคัญให้กับตระกูล Gemini เพื่อยกระดับความเร็ว ความฉลาด และปรับปรุงอินเทอร์เฟซการใช้งานให้มีความยืดหยุ่นมากยิ่งขึ้น นี่คือสรุปฟีเจอร์และสิ่งใหม่ทั้งหมดที่คุณต้องรู้เกี่ยวกับการอัปเดตล่าสุดนี้

1. Gemini 3.5 Flash: ทรงพลังระดับเรือธง ในความเร็วสายฟ้าแลบ

โมเดลรุ่นใหม่ล่าสุดที่เปิดตัวมาเพื่อปฏิวัติวงการ AI Agent และการเขียนโค้ดโดยเฉพาะ

  • เร็วขึ้น 4 เท่า: มีความเร็วในการส่งข้อมูล (Output Tokens) สูงกว่าโมเดลระดับแนวหน้าทั่วไปถึง 4 เท่า
  • ความสามารถระดับสูง (Agentic Tasks): ออกแบบมาเพื่อทำงานที่ซับซ้อนและมีหลายขั้นตอนได้อย่างลื่นไหล เช่น การรักษาความปลอดภัยโค้ด หรือการตรวจเอกสารการเงินจำนวนมาก
  • เหนือกว่ารุ่น Pro เดิม: ผลทดสอบด้านการเขียนโค้ดและการทำงานแบบ Agent (Terminal-Bench 2.1) สามารถทำคะแนนชนะ Gemini 3.1 Pro ได้อย่างโดดเด่น
  • สร้าง UI และกราฟิกดีขึ้น: รองรับการสร้างหน้าเว็บอินเทอร์เฟซ (Interactive Web UIs) และกราฟิกที่สมบูรณ์แบบกว่าเดิม

2. Gemini 3.1 Flash-Lite: เบา คล่องตัว และประหยัดขั้นสุด

โมเดลน้องเล็กที่เน้นความคุ้มค่าและความเร็วขั้นสูงสุด สำหรับงานที่ต้องการการตอบสนองแบบเรียลไทม์

  • เร็วกว่าเดิม 45%: เมื่อเทียบกับรุ่น 2.5 Flash พร้อมทั้งตอบสนองคำแรก (Time to First Token) เร็วขึ้นถึง 2.5 เท่า
  • ราคาประหยัดและกินพลังงานต่ำ: เหมาะสำหรับงานแปลภาษา คัดกรองเนื้อหา (Content Moderation) และงานแชตบอตปริมาณมหาศาล
  • ประสิทธิภาพเกินตัว: รองรับ Context Window สูงถึง 1 ล้านท็อกเก็น และสามารถปรับระดับการคิดวิเคราะห์ (Thinking Levels) ได้เช่นกัน

3. ระบบคิดวิเคราะห์แบบใหม่: Standard vs. Extended Thinking

ผู้ใช้งานสามารถเลือกปรับระดับการ “คิด” ของ Gemini ให้เหมาะสมกับแต่ละงานได้แล้ว:

  • Standard Thinking (โหมดเริ่มต้น): ตอบคำถามทั่วไปได้อย่างรวดเร็วและมีประสิทธิภาพสูง ประหยัดพลังงานประมวลผล
  • Extended Thinking (โหมดวิเคราะห์ลึก): โมเดลจะใช้เวลาคิดทบทวนเพื่อหาเหตุผลก่อนตอบ เหมาะสำหรับการแก้โจทย์คณิตศาสตร์ การดีบั๊กโค้ดที่ซับซ้อน หรือการทำงานวิจัยเชิงลึก
  • (สำหรับผู้ใช้บริการระดับท็อปอย่าง AI Ultra จะได้รับฟีเจอร์ Deep Think ที่ประมวลผลเชิงลึกขนานใหญ่ร่วมด้วย)

4. ระบบโควตาแบบคำนวณจริง (Compute-Based Limits) และจุดเปลี่ยนสำคัญ!

นี่คือสิ่งที่ผู้ใช้ทุกคนต้องรู้ Google ได้ยกเลิกการปล่อยให้ใช้งานแบบ “ไม่จำกัด” กับโมเดลรุ่นเล็กแล้ว และเปลี่ยนมาใช้ระบบคำนวณผ่าน “พลังงานสมองที่ใช้จริง” (Compute-Based Limits) ร่วมกันทั้งหมด:

  • จำกัดการใช้งานทุกโมเดล (ไม่มีข้อยกเว้น): ตอนนี้ทุกโมเดลแชร์ “ถังพลังงานประมวลผล” เดียวกันทั้งหมด ไม่มีการปล่อยให้แชตฟรีแบบไร้ขีดจำกัดเหมือนแต่ก่อน แม้แต่โมเดลน้องเล็กอย่าง Flash-Lite ก็มีโควตากำกับเช่นกัน
  • ความซับซ้อนมีผลต่อความไวของโควตา:
    • โมเดลกินพลังงานสูง: หากใช้ฟีเจอร์หนักๆ เช่น Extended Thinking, Deep Research, การสร้างรูปภาพ/วิดีโอ หรือสั่งรันโค้ด เปอร์เซ็นต์การใช้งานในแถบจะลดลงอย่างรวดเร็ว
    • โมเดลกินพลังงานต่ำ: หากสลับมาคุยกับ Flash-Lite หรือใช้ Standard Thinking แถบพลังงานจะลดลงช้ามากจนเกือบเหมือนไม่จำกัด (แต่หากพิมพ์คุยหนักๆ หรือส่งไฟล์ใหญ่ต่อเนื่อง โควตาก็ลดลงได้เช่นกัน)
  • หน้าแดชบอร์ดตรวจสอบสด (Live Tracker): ตรวจสอบสถานะการใช้งานได้ที่เมนู Settings > Usage Limits ซึ่งจะแสดงข้อมูล 3 ส่วนสำคัญ:
    1. แถบแสดงเปอร์เซ็นต์ (%) การใช้งานที่เหลืออยู่ ณ ปัจจุบัน
    2. ระบบรีเซ็ตทุก 5 ชั่วโมง: แถบนับเวลาถอยหลังที่จะค่อยๆ คืนโควตาประมวลผลให้คุณในทุกๆ 5 ชั่วโมง
    3. ขีดจำกัดรายสัปดาห์ (Weekly Limit): เกณฑ์รวมรายสัปดาห์เพื่อความเสถียรของระบบทั้งหมด
  • ระบบสลับโมเดลอัตโนมัติ: หากคุณใช้โควตาหลัก (สำหรับโมเดลใหญ่อย่าง Gemini 3.5 Flash) หมดลง ระบบจะสลับไปให้คุณคุยกับโมเดลประหยัดพลังงานอย่าง Flash-Lite ต่อได้ทันที เพื่อไม่ให้การทำงานของคุณสะดุด

บทสรุป

การปรับเปลี่ยนครั้งนี้ของ Google ชี้ให้เห็นว่ายุคของ “การคุยฟรีไม่มีอั้น” ได้สิ้นสุดลงแล้ว และเปลี่ยนเข้าสู่ยุคที่ทุกอย่างถูกคำนวณเป็นพลังงานประมวลผล (Compute) ที่มีความชัดเจนและโปร่งใส อย่างไรก็ตาม ข้อดีคือการที่ระบบสลับไปใช้ Flash-Lite อัตโนมัติเมื่อโควตาหลักหมด จะช่วยให้ผู้ใช้งานทั่วไปยังคงทำงานได้ต่อเนื่องโดยไม่ต้องกังวลว่าจะถูกปิดกั้นการเข้าถึงระบบโดยสิ้นเชิงในระหว่างวัน