Tất cả tin tức AI
Tin tức AI · Gemini

Gemini Omni rollout

X (Twitter) — @GeminiApp, @GoogleDeepMind

Tại Google I/O 2026 đầu tháng 5, Gemini Omni được giới thiệu như "world model" — model không chỉ tạo video mà còn hiểu được vật lý thế giới thật. Khi đó nó vẫn là một bản preview. Đến 19/5, Google âm thầm bật công tắc cho hàng trăm triệu subscriber. Không phát biểu, không sự kiện — chỉ một tweet ngắn từ tài khoản chính thức Gemini App.

Thông báo: gọn và rộng

Creating, remixing, and editing a video is easier than ever. Google AI Plus, Pro, and Ultra subscribers around the world can try Gemini Omni today right in the Gemini app. Drop your Gemini Omni creations in the replies once it hits your app!

— @GeminiApp (Tài khoản Gemini App chính thức)

Ba từ khoá đáng để ý ở đây: creating, remixing, editing. Đây là lần đầu Google đặt cả ba từ trong cùng một câu. Vì với Omni, ba việc này không còn tách riêng. Video không phải file cố định; nó là tài liệu có thể sửa từng đoạn bằng prompt, như cách bạn sửa văn bản trong Google Docs.

Chiến lược khác hẳn OpenAI Sora

Sora 2 của OpenAI có studio riêng, app riêng, mạng xã hội riêng. Google chọn con đường ngược lại: Omni được nhúng thẳng vào Gemini app (đã có hàng trăm triệu user), Google Flow (workflow video editor), và sắp tới là YouTube Shorts cùng YouTube Create. Không có app mới để cài. Không có account riêng. Chỉ có "Tạo video" trong cùng thanh menu chứa "Tạo ảnh" và "Hỏi câu hỏi".

Đối với người dùng VN, đây là điểm cực quan trọng. Hầu hết người Việt đã có account Gmail; nâng cấp Google One AI Plus (gói rẻ nhất, có thanh toán VND, hỗ trợ thẻ ATM nội địa) là đủ để chạm tay vào Omni. Trong khi đó, để dùng Sora 2 cần ChatGPT Plus + sống ở Mỹ + có Apple ID Mỹ — ba rào cản chồng nhau.

Phía sau Omni — góc nhìn DeepMind

Demis Hassabis và đội ngũ DeepMind nhiều lần nhấn mạnh: Omni không phải "video generation" như Runway hay Pika. Nó là "world model" — mô phỏng vật lý. Trên X, GoogleDeepMind từng úp tin trước khi Omni ra cho công chúng:

Our latest image model has enhanced reasoning from Gemini 3. It can connect to Google Search's vast knowledge base to help visualize anything using real-time information — from an infographic for a recipe, to an illustrative physics diagram.

— @GoogleDeepMind

Tinh thần đó tiếp tục với Omni: kết nối realtime Google Search, kế thừa reasoning Gemini 3, và quan trọng nhất — hiểu được mối quan hệ vật lý giữa các vật thể trong cùng khung hình. Đoạn video sinh ra không phải ảnh nối ảnh; nó tuân theo luật trọng lực, ánh sáng, viễn cận.

Use case thực tế đầu tiên ở VN

Vấn đề chưa được nói tới

Google không công bố giới hạn số clip mỗi tháng cho từng gói. Trong những ngày đầu sau rollout, nhiều user trên Reddit r/GeminiAI báo Omni Flash trả ra clip 8-10 giây với resolution 720p — đẹp nhưng chưa "cinema-grade" như demo I/O. Phiên bản full resolution (1080p+, 30s+) nhiều khả năng dành cho gói Ultra ($249/tháng). Người Việt dùng Plus ($19) phải làm quen với cảnh giới hạn rõ ràng.

Vấn đề thứ hai — trùng đường mà Sora 2 đang gặp — là bản quyền và deepfake. Google đặt watermark SynthID lên mọi clip Omni; nhưng watermark này vô hình. Người dùng phổ thông không nhìn thấy, không phân biệt được. Trách nhiệm tiếp tục được đẩy về phía nền tảng phân phối (YouTube, TikTok, Facebook), thay vì người tạo ra.

Cho người dùng VN — nên dùng thế nào?

Năm 2024, AI tạo video là novelty trên Twitter. Năm 2025, AI tạo video bắt đầu đi vào quảng cáo. Năm 2026 — với Omni nhúng thẳng vào ecosystem 3 tỷ người — AI tạo video sẽ thành công cụ làm việc bình thường, ngang Excel hay Photoshop. Câu hỏi không còn là "có dùng không" mà là "dùng vào việc gì".

Nguồn gốc: X (Twitter) — @GeminiApp, @GoogleDeepMindBài này là bản tổng hợp + biên tập tiếng Việt từ nguồn trên. Khuyến nghị đọc bản gốc để có thông tin đầy đủ.