Gemini-SQL2: Google biến câu hỏi tiếng tự nhiên thành SQL chạy ngay được, lập kỷ lục benchmark BIRD

Text-to-SQL là một trong những bài toán bị "đánh giá thấp" nhất trong AI — dễ nói "AI viết được SQL" trên slide, nhưng đụng schema doanh nghiệp thật thì model nào cũng vỡ trận. Google Research vừa cho biết Gemini-SQL2 đã chinh phục được benchmark khó nhất.

Google Research công bố trên X

Introducing Gemini-SQL2, our breakthrough text-to-SQL capability powered by Gemini 3.1 Pro! We've achieved state-of-the-art results on the highly competitive BIRD benchmark, translating natural language into execution-ready SQL queries.

— @GoogleResearch (6.6K likes, 656K views)

Vì sao text-to-SQL khó?

Schema doanh nghiệp lớn: hàng trăm bảng, hàng nghìn cột — model dễ lạc.
Tên cột mơ hồ: "orders" vs "purchases" vs "transactions" — câu nào dùng cái nào?
JOIN logic phức tạp: 4-5 bảng nối nhau, một sai là kết quả lệch hoàn toàn.
Business context: "doanh thu" nghĩa là gross hay net? Định nghĩa khác nhau từng công ty.

Cách Gemini-SQL2 xử lý

Theo paper kèm theo: Gemini-SQL2 dùng schema linking thông minh (hiểu cột nào liên quan câu hỏi), tự verify SQL bằng dry-run trên sample data trước khi return, và biết hỏi lại user khi câu hỏi mơ hồ thay vì đoán bừa. BIRD benchmark vốn nổi tiếng vì test trên schema thực, không phải toy dataset.

Cho doanh nghiệp Việt Nam

Leader hỏi data trực tiếp không qua data team: "doanh thu Q2 theo chi nhánh" → SQL → dashboard.
Tích hợp vào BI tools (Looker, Power BI) đã hỗ trợ qua Vertex AI.
Cẩn trọng RBAC: model query được data nhạy cảm — cần row-level security trước khi mở rộng.
Bắt đầu nhỏ: thử trên data warehouse staging, đo độ chính xác trước khi đẩy production.

Nguồn gốc: X (Twitter) — @GoogleResearch — Bài này là bản tổng hợp + biên tập tiếng Việt từ nguồn trên. Khuyến nghị đọc bản gốc để có thông tin đầy đủ.

Tác giả: Matrix Academy · 12/06/2026

Gemini-SQL2 SOTA

Google Research công bố trên X

Vì sao text-to-SQL khó?

Cách Gemini-SQL2 xử lý

Cho doanh nghiệp Việt Nam