Tin tức AI — ChatGPT, Claude, Gemini
So sánh 3 model Q2/2026
Sau 2 tháng quan sát X discussion: ChatGPT thắng cảm nhận tự nhiên, Claude thắng code phức tạp, Gemini thắng benchmark + đọc tài liệu dài. Không còn "model duy nhất dẫn đầu" — user nâng cao đang dùng cả 3.
Liu 2024 + classroom seq
Trên X, @ScholarshipfPhd tóm tắt paper Liu et al 2024: sinh viên dùng ChatGPT 5 ngày làm creative task → tốt hơn rõ. Nhưng khi gỡ AI ngày 7 và đo lại sau 30 ngày — lợi thế biến mất. Còn lại "homogeneity": ý tưởng các em vẫn AI-like. Đề xuất trình tự lớp học: tự sinh → AI thử thách → so sánh.
Phát hiện GPT trong bài
Một post 648 upvote trên r/Teachers liệt kê 10 dấu hiệu ChatGPT để giúp giáo viên nhận ra bài học sinh dùng AI: từ emoji trong header, "let's dive in", "____ energy", đến cấu trúc claim → pro/con → juxtaposition. Có ví dụ phân tích đoạn văn cụ thể.
Admin ép AI thay GV
Một post trên r/Teachers ("Why waste time writing lesson plans. Just use AI!") đạt 1119 upvote và 236 comments khi giáo viên kể chuyện admin ra lệnh dùng ChatGPT thay lesson plan, kể cả "podcast AI" thay mini-lesson. Cảnh báo: AI có thể là cớ để cắt giờ + cắt raise của giáo viên.
GV dùng GPT đúng cách
Trên r/Teachers, post "Hot take: Using AI for lesson planning doesn't make you a bad teacher" của DarwinF1nch thu hút 126 comments với góc nhìn cân bằng: AI không khiến bạn dạy giỏi hơn, nhưng tiết kiệm hàng giờ planning. Kèm prompt "Personal AI Tutor" từ @IamKhanPhD có thể dùng ngay.
Gemini-SQL2 SOTA
Google Research giới thiệu Gemini-SQL2 — khả năng text-to-SQL chạy trên Gemini 3.1 Pro, đạt state-of-the-art trên BIRD benchmark (bộ test text-to-SQL khó nhất hiện nay). Mô hình dịch câu hỏi tự nhiên thẳng ra câu SQL có thể thực thi.
Gemini for SMB
Google công bố loạt tính năng Gemini App mới cho doanh nghiệp nhỏ: kết nối Google Business Profile để Gemini trở thành trợ lý hiểu bối cảnh kinh doanh thực; ra mắt Business Notebooks — không gian tập trung quản lý thông tin chat, website, hồ sơ doanh nghiệp.
GPT-5.6 lộ codename
Trên X, dev cộng đồng AI bắt được chuỗi "gpt-5.6" trong log Codex của OpenAI, kèm các codename nội bộ iris-alpha, ember-alpha, beacon-alpha. AILeaksAndNews, Meng Li và Pankaj Kumar lần lượt confirm dấu hiệu này. OpenAI vẫn chưa lên tiếng.
Managed Agents v2
ClaudeDevs vừa bổ sung 2 tính năng quan trọng vào Claude Managed Agents: scheduled deployments (chạy task theo lịch) và environment variables (expose vault credentials cho CLI). Đây là bước đưa "agent quản lý" tiến gần hơn với DevOps thực thụ.
Gemini Live Translate
Sau 20 năm cộng dồn Google Translate, Google ra mắt Gemini 3.5 Live Translate — mô hình audio dịch speech-to-speech thời gian thực qua hơn 70 ngôn ngữ. Mỗi tháng hệ sinh thái Google đã dịch hơn 1.000 tỷ từ cho hơn 1 tỷ người.
Opus 4.7 — chia rẽ
Hai tháng sau khi ra mắt, Opus 4.7 đang trở thành chủ đề tranh cãi trên X. Anthropic nói thắng 12/14 benchmark vs 4.6, nhưng nhiều dev trên GitHub và X kêu performance thực tế kém hơn 4.6. Tokenizer mới tăng 12-18% chi phí.
ChatGPT Lockdown Mode
Dane Stuckey — CISO của OpenAI — vừa thông báo trên X: Lockdown Mode đã rollout cho mọi user trên mọi gói. Tính năng vô hiệu hoá các công cụ có thể bị lợi dụng để rò data qua prompt injection. Gizmodo gọi đây là "feature đáng lo nhưng cần thiết".
Mythos 64% > human
Anthropic chia sẻ một thí nghiệm thú vị: cho Claude "Mythos Preview" xem session làm việc của nhà nghiên cứu đến đoạn ra quyết định sai, rồi hỏi nên làm gì tiếp. Mô hình chọn được hướng đi tốt hơn người 64% — tăng từ 22% năm 2024.
Open-ended +50pt
Trên các bài toán coding không có đáp án chuẩn, tỉ lệ thành công của Claude vọt từ ~26% lên 76% chỉ trong nửa năm. Anthropic cho rằng chất lượng code đã ngang con người và sẽ vượt trong năm 2026.
8x code per quarter
Anthropic công bố số liệu nội bộ: trung bình mỗi quý, một kỹ sư của công ty đưa ra lượng code gấp 8 lần so với giai đoạn 2021-2025. Đòn bẩy chính là Claude — và mức cải thiện chất lượng được dự đoán còn lớn hơn trong năm 2026.
Codex remote Mac
Trong loạt cập nhật "Codex Thursday", OpenAI công bố Codex có thể truy cập app trên Mac từ điện thoại của bạn — kể cả khi Mac đã khóa và tắt màn hình. Đây là bước đầu biến Codex thành "remote agent" thực sự cho dev.
Google I/O 2026: Spark + Omni
Sundar Pichai, Jeff Dean, Demis Hassabis cùng đẩy tweet ngày 19/5: Gemini có thêm Spark (AI agent cá nhân), Omni (video model thế hệ mới), Deep Think upgrade với benchmark IMO/ICPC Gold Medal. Tin nóng nhất I/O 2026 từ chính các tài khoản chính chủ trên X.
Futures Class 2026
OpenAI vinh danh lứa sinh viên đầu tiên có ChatGPT đồng hành suốt 4 năm đại học. 26 gương mặt đã dùng AI để lập bản đồ 1,5 triệu thiên thể chưa biết, phát hiện nạn nhân thiên tai qua tường, làm 100M+ ảnh thiên hà có thể tìm kiếm, lưu giữ ngôn ngữ thiểu số…
GPT-5.5 Instant
OpenAI vừa ra mắt GPT-5.5 Instant với cải thiện đáng kể về độ chính xác factual, đặc biệt ở các lĩnh vực nhạy cảm như y khoa, pháp lý, tài chính. Mô hình cũng mạnh hơn ở việc đọc ảnh, trả lời STEM và biết khi nào cần tìm web.
Opus 4.7 + Claude Design
Tài khoản chính chủ @claudeai và CEO Anthropic công bố Opus 4.7 trên X kèm Claude Design. Cùng giá $5/$25 với 4.6, tăng 6.8 điểm SWE-bench, vision phân giải cao hơn. Cộng đồng có người gọi đây là "bước nhảy thật", Open Design (bản open source) cũng đã chạm 20k stars sau 6 ngày.