Gemini-SQL2: AI viết câu SQL từ tiếng Anh — Google đạt 93.3% trên BIRD benchmark, viết được câu truy vấn complex chỉ trong vài giây

Trong 10 năm qua, một câu hỏi tưởng đơn giản đã ám ảnh ngành công nghệ: làm thế nào để người không biết code có thể "hỏi data"? Mỗi công ty đều có hàng nghìn bảng SQL. Mỗi analyst đều phải viết câu truy vấn. Mỗi non-tech founder đều phải đi gặp data team mỗi lần muốn xem một con số. Trưa 12/6/2026, Google Research công bố một bước đột phá khả năng có thể thay đổi cảnh tượng đó: Gemini-SQL2 đạt 93.3% trên BIRD benchmark — đứng đầu thị trường.

Thông cáo từ Google Research

Introducing Gemini-SQL2, our breakthrough text-to-SQL capability powered by Gemini 3.1 Pro! We've achieved state-of-the-art results on the highly competitive BIRD benchmark, translating natural language into execution-ready SQL queries.

— @GoogleResearch (Tài khoản chính thức — 6.714 likes)

BIRD benchmark là gì?

BIRD (Big Industry-level Real-world Database) là benchmark cứng nhất trong text-to-SQL hiện tại. Nó gồm các câu hỏi thực tế từ doanh nghiệp thực tế, với database lớn (hàng trăm bảng, hàng triệu dòng), schema phức tạp, và yêu cầu join nhiều bảng. Trước Gemini-SQL2, model cao nhất chỉ đạt 86-89%. 93.3% là bước nhảy đáng kể.

Quan trọng: BIRD không phải benchmark đồ chơi. Nó gồm câu hỏi như "Doanh thu Q3/2024 của các chi nhánh miền Bắc có lợi nhuận cao hơn trung bình toàn công ty, sắp xếp theo % tăng trưởng vs cùng kỳ" — câu mà analyst thường phải viết 30-50 dòng SQL với 5-7 JOIN. Gemini-SQL2 viết được trong vài giây, đúng cú pháp, đúng kết quả.

Ý nghĩa với người dùng VN

Cho BA / Marketer / Founder không biết SQL

Đây có thể là tin lớn nhất trong 2026 cho bạn. Trước đây mỗi lần muốn xem "doanh thu phẩm A theo khu vực Q1/2024 vs Q1/2025", phải nhờ data team — chờ 1-2 ngày, nhiều khi đợi cả tuần. Với Gemini-SQL2, bạn gõ câu hỏi tiếng Anh (hoặc Việt), nhận câu SQL ngay, chạy thẳng trên BigQuery / Postgres / MySQL.

Cho data analyst VN

Đừng lo bị thay thế. Gemini-SQL2 tốt cho query đơn giản đến trung bình. Khi gặp business logic phức tạp (definition của "active user" có 5 điều kiện, hoặc data quality bug cần handle), analyst có kinh nghiệm vẫn cần. Nhưng workflow sẽ thay đổi: bạn không còn viết SQL từ 0 nữa — bạn review, sửa, optimize câu Gemini đã viết. Như developer dùng Copilot.

Cho data team senior

Đầu tư MCP server cho database công ty — kết nối Gemini-SQL2 / Deep Research vào database internal. Sau setup, mọi nhân viên không-tech đều có thể "hỏi data" mà không bị bottleneck ở data team. Phổ cập analytics trong công ty.

Use case thực tế tại VN

E-commerce VN (Shopee/Lazada seller analyst): hỏi "doanh thu sản phẩm top 10 7 ngày qua, breakdown theo tỉnh thành" — Gemini viết SQL chạy trên data warehouse của bạn.
Banking analyst: "Khách hàng có balance giảm 20%+ trong 30 ngày qua, có lịch sử giao dịch quốc tế" — query phức tạp, Gemini-SQL2 viết được.
HR / People analytics: "Nhân viên onboard sau 2024 có tenure trung bình vs trước 2024" — câu hỏi business, không phải câu SQL.
Marketing: "ROI Facebook Ads phân theo creative type và audience cohort" — multi-join, Gemini xử lý.

Sẵn sàng triển khai chưa?

Gemini-SQL2 hiện available qua Gemini API + Vertex AI. Có thể dùng trực tiếp trong Gemini app (chế độ Code/Data). Cho doanh nghiệp lớn: dễ tích hợp qua Vertex AI, có audit log, compliance HIPAA/SOC2. Cho dev cá nhân: gọi API thông thường.

Bài học rộng hơn

Text-to-SQL là một trong những "đỉnh núi khó" của AI suốt nhiều năm. Lý do: ngôn ngữ tự nhiên cực kỳ ambiguous, nhưng SQL cực kỳ chặt — sai một dấu phẩy là không chạy. Để translate giữa hai thế giới này cần model vừa hiểu ngữ nghĩa, vừa hiểu cấu trúc dữ liệu, vừa biết quy tắc cú pháp tuyệt đối.

Việc Gemini đạt 93.3% trên BIRD không chỉ là tin về SQL. Nó là chỉ dấu cho năng lực reasoning + structured output của LLM đã chạm ngưỡng "đủ để production". Trong 12 tháng tới, kỳ vọng thấy nhiều khả năng "natural language to structured X" khác — text-to-formula trong Excel, text-to-config trong DevOps, text-to-API call trong sản phẩm software. Mỗi cái đều có thể giúp một triệu non-tech user thoát khỏi rào cản kỹ thuật.

Nguồn gốc: X (Twitter) — @GoogleResearch (chính chủ, 6.714 likes) — Bài này là bản tổng hợp + biên tập tiếng Việt từ nguồn trên. Khuyến nghị đọc bản gốc để có thông tin đầy đủ.

Tác giả: Matrix Academy · 12/06/2026

Gemini-SQL2 text-to-SQL