Tin tức AI — ChatGPT, Claude, Gemini
Managed Agents v2
ClaudeDevs vừa bổ sung 2 tính năng quan trọng vào Claude Managed Agents: scheduled deployments (chạy task theo lịch) và environment variables (expose vault credentials cho CLI). Đây là bước đưa "agent quản lý" tiến gần hơn với DevOps thực thụ.
Pro plan đáng bao nhiêu?
Đầu tháng 6, SemiAnalysis (một trong những research firm khắt khe nhất ngành chip + AI) công bố nghiên cứu họ làm thật: mua một subscription Pro của mỗi nhà cung cấp, chạy task long-horizon cho đến khi hết weekly limit. Kết quả gây sốc — Pro plan thực ra rộng rãi hơn người ta nghĩ. Vì sao? Câu trả lời tiết lộ chiến lược sâu của Anthropic và OpenAI.
MiMo Code V0.1
Đầu tháng 6/2026, Xiaomi (Mi Mo team) tung MiMo Code V0.1 — terminal AI coding tool + model multimodal 1 triệu token miễn phí. Đặc biệt: tương thích full với Claude Code (load skill, MCP server, API config). Trung Quốc tiếp tục đẩy mạnh "thay thế Claude Code" cho dev quốc tế.
Gemini Live Translate
Sau 20 năm cộng dồn Google Translate, Google ra mắt Gemini 3.5 Live Translate — mô hình audio dịch speech-to-speech thời gian thực qua hơn 70 ngôn ngữ. Mỗi tháng hệ sinh thái Google đã dịch hơn 1.000 tỷ từ cho hơn 1 tỷ người.
Opus 4.7 — chia rẽ
Hai tháng sau khi ra mắt, Opus 4.7 đang trở thành chủ đề tranh cãi trên X. Anthropic nói thắng 12/14 benchmark vs 4.6, nhưng nhiều dev trên GitHub và X kêu performance thực tế kém hơn 4.6. Tokenizer mới tăng 12-18% chi phí.
ChatGPT Lockdown Mode
Dane Stuckey — CISO của OpenAI — vừa thông báo trên X: Lockdown Mode đã rollout cho mọi user trên mọi gói. Tính năng vô hiệu hoá các công cụ có thể bị lợi dụng để rò data qua prompt injection. Gizmodo gọi đây là "feature đáng lo nhưng cần thiết".
ChatGPT lost media bug
Đầu tháng 6, dev @PenguinWeb3 phát hiện một prompt kỳ lạ: yêu cầu ChatGPT "khôi phục bức ảnh đính kèm" trong khi không upload ảnh nào. Model bắt đầu "tự bịa" — và kết quả là loạt ảnh giống "lost media" khủng khiếp: chân dung bị méo, không gian sai, ánh sáng ma quái. Tweet vọt 34.680 lượt thích, 17 triệu lượt xem. Đằng sau bug nhỏ là câu hỏi lớn về cách AI thực sự "hiểu" ảnh.
Mythos 64% > human
Anthropic chia sẻ một thí nghiệm thú vị: cho Claude "Mythos Preview" xem session làm việc của nhà nghiên cứu đến đoạn ra quyết định sai, rồi hỏi nên làm gì tiếp. Mô hình chọn được hướng đi tốt hơn người 64% — tăng từ 22% năm 2024.
Open-ended +50pt
Trên các bài toán coding không có đáp án chuẩn, tỉ lệ thành công của Claude vọt từ ~26% lên 76% chỉ trong nửa năm. Anthropic cho rằng chất lượng code đã ngang con người và sẽ vượt trong năm 2026.
8x code per quarter
Anthropic công bố số liệu nội bộ: trung bình mỗi quý, một kỹ sư của công ty đưa ra lượng code gấp 8 lần so với giai đoạn 2021-2025. Đòn bẩy chính là Claude — và mức cải thiện chất lượng được dự đoán còn lớn hơn trong năm 2026.
Codex tự lái Windows
Cuối tháng 5/2026, OpenAI bổ sung Computer Use cho Windows trong Codex. Từ ChatGPT mobile (iOS/Android) hoặc Mac, dev có thể giao việc cho máy Windows ở văn phòng — Codex tự mở browser, click, gõ phím, chạy code, sau đó báo cáo lại. Một nhân viên OpenAI thậm chí đã đăng tweet thông báo tính năng bằng chính Codex điều khiển trình duyệt Windows từ điện thoại.
Opus 4.8 ra mắt
Cuối tháng 5/2026, Anthropic tung Opus 4.8 — phiên bản tiếp theo của dòng Opus. Tweet công bố vọt 67 nghìn lượt thích trong 24 giờ. Anthropic định vị 4.8 là model "biết khi nào nên nhận, khi nào nên từ chối": có thể chạy task autonomous lâu hơn 4.7, đồng thời thành thật hơn về tiến độ thực sự thay vì giả vờ đang xong.