เทคนิคการเขียน Prompt ให้ตรงใจ (The Recipe for Success)

การสร้างวิดีโอด้วย Gemini (ผ่านโมเดล Veo) เป็นนวัตกรรมที่เปลี่ยนจินตนาการให้กลายเป็นภาพเคลื่อนไหวได้ในไม่กี่วินาที เพื่อให้ได้วิดีโอที่ตรงใจที่สุด คุณจำเป็นต้องรู้วิธี “สื่อสาร” กับ AI และเข้าใจขีดจำกัดของมันดังนี้ครับ

การบอกแค่ว่า “อยากได้วิดีโอคนเดิน” นั้นกว้างเกินไป AI จะสุ่มองค์ประกอบส่วนที่เหลือเอง เพื่อให้ได้งานที่เนียนตา คุณควรระบุ 4 ส่วนสำคัญนี้:

  • ระบุตัวละครและสิ่งที่ทำ (Subject & Action): บอกรายละเอียดรูปร่าง หน้าตา เสื้อผ้า และสิ่งที่กำลังทำอยู่ให้ชัดเจน
    • ตัวอย่าง: “ผู้หญิงผมสีบลอนด์สวมชุดเดรสสีขาวกำลังเดินช้าๆ บนหาดทรายขาว”
  • ระบุสถานที่และบรรยากาศ (Setting & Atmosphere): ระบุเวลา แสง และโทนสี
    • ตัวอย่าง: “ในช่วงเวลาพระอาทิตย์ตกดิน แสงสีส้มทองสะท้อนผิวน้ำ ท้องฟ้ามีสีชมพูอมม่วง”
  • ระบุภาษาภาพยนตร์ (Cinematic Language): ระบุุมุมกล้องหรือการเคลื่อนที่ของกล้อง
    • ตัวอย่าง: “ถ่ายด้วยมุมกล้องโดรน (Drone shot) ค่อยๆ บินตามจากด้านหลัง, ภาพชัดลึก (Depth of field) ฉากหลังเบลอ”
  • ระบุสไตล์งาน (Style): ระบุว่าต้องการแนวไหน เช่น สมจริง (Photorealistic), อนิเมชั่น 3D, หรือภาพวาดสีน้ำ

2. การใช้ “ภาพอ้างอิง” (Reference Images)

นี่คือฟีเจอร์เด่นของ Gemini 3 (Veo) ที่ช่วยให้งานตรงโจทย์มากขึ้น:

  • ใช้ภาพตั้งต้น (Image-to-Video): คุณสามารถอัปโหลดภาพนางแบบหรือสินค้าของคุณ แล้วสั่งว่า “ช่วยทำให้นางแบบในภาพนี้ยิ้มและพยักหน้า” AI จะรักษาลักษณะใบหน้าและชุดเดิมไว้ได้ดี
  • การคุมสไตล์ (Style Reference): คุณสามารถอัปโหลดภาพที่มีโทนสีหรือสไตล์ที่คุณชอบ แล้วสั่งให้ AI สร้างวิดีโอใหม่ในสไตล์เดียวกับภาพนั้น
  • First & Last Frame: สำหรับผู้ใช้ระดับสูง (ผ่าน API หรือเครื่องมือเฉพาะ) คุณสามารถระบุภาพเริ่มต้นและภาพจบเพื่อให้ AI สร้างการเคลื่อนไหว (Transition) เชื่อมระหว่างสองภาพนั้นได้

3. ข้อจำกัด: สิ่งที่ทำได้ และ ทำไม่ได้

สิ่งที่ทำได้ (Capabilities)สิ่งที่ทำไม่ได้ / ข้อจำกัด (Constraints)
สร้างวิดีโอสั้นความยาวประมาณ 8 วินาที (ในโหมดปกติ)ไม่สามารถสร้างวิดีโอยาวแบบภาพยนตร์ในคำสั่งเดียว
สร้าง เสียงประกอบ (Native Audio) ให้เข้ากับวิดีโอห้ามสร้างบุคคลสำคัญทางการเมือง หรือบุคคลที่มีชื่อเสียงระดับโลก
ขยายวิดีโอเดิม (Scene Extension) ต่อออกไปได้จำกัดจำนวนครั้งต่อวัน (Quota) ตามแพ็กเกจที่คุณใช้งาน
รองรับความละเอียดสูงถึง 1080pอาจมีปัญหาเรื่อง “การบิดเบี้ยว” (Artifacts) ในการเคลื่อนไหวที่ซับซ้อนมาก

4. กฎเหล็กและจริยธรรม (Safety Filters)

AI ของ Google มีระบบความปลอดภัยที่เข้มงวด:

  • ห้ามเนื้อหาอันตราย: ความรุนแรง, เนื้อหาทางเพศ, หรือการละเมิดสิทธิผู้อื่น
  • ลายน้ำดิจิทัล (SynthID): ทุกวิดีโอที่สร้างจะมีการฝังลายน้ำที่มองไม่เห็นด้วยตาเปล่าเพื่อระบุว่าเป็นวิดีโอจาก AI เพื่อป้องกันการนำไปใช้ในทางที่ผิดหรือสร้าง Fake News

ตัวอย่าง Prompt ที่สมบูรณ์แบบ:

“สร้างวิดีโอแนวภาพยนตร์ (Cinematic) ของนักบินอวกาศเดินบนพื้นผิวดาวอังคารที่มีพายุฝุ่นสีแดงพัดผ่าน แสงอาทิตย์ริบหรี่จากขอบฟ้า ถ่ายด้วยมุมกล้องต่ำ (Low angle shot) แสดงให้เห็นความยิ่งใหญ่ของพื้นที่ วิดีโอมีความสมจริงระดับ 4K”