TIN TỨC AI · TRANG 3/5

Tin tức AI — ChatGPT, Claude, Gemini

Managed Agents v2

ClaudeDevs vừa bổ sung 2 tính năng quan trọng vào Claude Managed Agents: scheduled deployments (chạy task theo lịch) và environment variables (expose vault credentials cho CLI). Đây là bước đưa "agent quản lý" tiến gần hơn với DevOps thực thụ.

Đọc tin →11/06/2026

Tổng quan

Pro plan đáng bao nhiêu?

X (Twitter) — @SemiAnalysis_ (research firm)

Đầu tháng 6, SemiAnalysis (một trong những research firm khắt khe nhất ngành chip + AI) công bố nghiên cứu họ làm thật: mua một subscription Pro của mỗi nhà cung cấp, chạy task long-horizon cho đến khi hết weekly limit. Kết quả gây sốc — Pro plan thực ra rộng rãi hơn người ta nghĩ. Vì sao? Câu trả lời tiết lộ chiến lược sâu của Anthropic và OpenAI.

Đọc tin →10/06/2026

Tổng quan

MiMo Code V0.1

X (Twitter) — @XiaomiMiMo (chính chủ, 2.813 likes)

Đầu tháng 6/2026, Xiaomi (Mi Mo team) tung MiMo Code V0.1 — terminal AI coding tool + model multimodal 1 triệu token miễn phí. Đặc biệt: tương thích full với Claude Code (load skill, MCP server, API config). Trung Quốc tiếp tục đẩy mạnh "thay thế Claude Code" cho dev quốc tế.

Đọc tin →10/06/2026

Gemini

Gemini Live Translate

X (Twitter) — @Google

Sau 20 năm cộng dồn Google Translate, Google ra mắt Gemini 3.5 Live Translate — mô hình audio dịch speech-to-speech thời gian thực qua hơn 70 ngôn ngữ. Mỗi tháng hệ sinh thái Google đã dịch hơn 1.000 tỷ từ cho hơn 1 tỷ người.

Đọc tin →09/06/2026

Claude

Opus 4.7 — chia rẽ

X + GitHub + Hacker News (thảo luận cộng đồng)

Hai tháng sau khi ra mắt, Opus 4.7 đang trở thành chủ đề tranh cãi trên X. Anthropic nói thắng 12/14 benchmark vs 4.6, nhưng nhiều dev trên GitHub và X kêu performance thực tế kém hơn 4.6. Tokenizer mới tăng 12-18% chi phí.

Đọc tin →09/06/2026

ChatGPT

ChatGPT Lockdown Mode

X (Twitter) — @cryps1s (Dane Stuckey, OpenAI CISO), @Gizmodo

Dane Stuckey — CISO của OpenAI — vừa thông báo trên X: Lockdown Mode đã rollout cho mọi user trên mọi gói. Tính năng vô hiệu hoá các công cụ có thể bị lợi dụng để rò data qua prompt injection. Gizmodo gọi đây là "feature đáng lo nhưng cần thiết".

Đọc tin →08/06/2026

ChatGPT

ChatGPT lost media bug

X (Twitter) — @PenguinWeb3 (34.680 likes)

Đầu tháng 6, dev @PenguinWeb3 phát hiện một prompt kỳ lạ: yêu cầu ChatGPT "khôi phục bức ảnh đính kèm" trong khi không upload ảnh nào. Model bắt đầu "tự bịa" — và kết quả là loạt ảnh giống "lost media" khủng khiếp: chân dung bị méo, không gian sai, ánh sáng ma quái. Tweet vọt 34.680 lượt thích, 17 triệu lượt xem. Đằng sau bug nhỏ là câu hỏi lớn về cách AI thực sự "hiểu" ảnh.

Đọc tin →06/06/2026

Claude

Mythos 64% > human

X (Twitter) — @AnthropicAI

Anthropic chia sẻ một thí nghiệm thú vị: cho Claude "Mythos Preview" xem session làm việc của nhà nghiên cứu đến đoạn ra quyết định sai, rồi hỏi nên làm gì tiếp. Mô hình chọn được hướng đi tốt hơn người 64% — tăng từ 22% năm 2024.

Đọc tin →04/06/2026

Claude

Open-ended +50pt

X (Twitter) — @AnthropicAI

Trên các bài toán coding không có đáp án chuẩn, tỉ lệ thành công của Claude vọt từ ~26% lên 76% chỉ trong nửa năm. Anthropic cho rằng chất lượng code đã ngang con người và sẽ vượt trong năm 2026.

Đọc tin →04/06/2026

Claude

8x code per quarter

X (Twitter) — @AnthropicAI

Anthropic công bố số liệu nội bộ: trung bình mỗi quý, một kỹ sư của công ty đưa ra lượng code gấp 8 lần so với giai đoạn 2021-2025. Đòn bẩy chính là Claude — và mức cải thiện chất lượng được dự đoán còn lớn hơn trong năm 2026.

Đọc tin →04/06/2026

ChatGPT

Codex tự lái Windows

X (Twitter) — @OpenAI (chính chủ), @reach_vb (founder mode tại OpenAI)

Cuối tháng 5/2026, OpenAI bổ sung Computer Use cho Windows trong Codex. Từ ChatGPT mobile (iOS/Android) hoặc Mac, dev có thể giao việc cho máy Windows ở văn phòng — Codex tự mở browser, click, gõ phím, chạy code, sau đó báo cáo lại. Một nhân viên OpenAI thậm chí đã đăng tweet thông báo tính năng bằng chính Codex điều khiển trình duyệt Windows từ điện thoại.

Đọc tin →29/05/2026

Claude

Opus 4.8 ra mắt

X (Twitter) — @claudeai (chính chủ)

Cuối tháng 5/2026, Anthropic tung Opus 4.8 — phiên bản tiếp theo của dòng Opus. Tweet công bố vọt 67 nghìn lượt thích trong 24 giờ. Anthropic định vị 4.8 là model "biết khi nào nên nhận, khi nào nên từ chối": có thể chạy task autonomous lâu hơn 4.7, đồng thời thành thật hơn về tiến độ thực sự thay vì giả vờ đang xong.

Đọc tin →28/05/2026