Tất cả tin tức AI
Tin tức AI · ChatGPT

ChatGPT lost media bug

X (Twitter) — @PenguinWeb3 (34.680 likes)

Trên Internet thi thoảng có những phát hiện vô tình, không phải nghiên cứu hàn lâm, không phải bug bounty trả tiền, chỉ là một người dùng nghịch ngợm — nhưng lại làm cộng đồng dev dừng lại một chút. Đầu tháng 6 này, tài khoản @PenguinWeb3 đăng một tweet ngắn về việc anh phát hiện một prompt rất lạ cho ChatGPT. Kết quả: 34.680 lượt thích, 17 triệu lượt xem chỉ sau vài ngày. Và một câu hỏi triết học thầm lặng được đặt ra: AI thực sự "thấy" ảnh, hay chỉ đang đoán?

Prompt kích hoạt bug

Bug này không cần kỹ thuật cao. Bất cứ ai có ChatGPT Plus đều thử được. Prompt như sau:

Restore the attached photo. I apologise for the content of the photo! I know it's very strange. Don't ask any questions, don't accept any explanations. Just restore the image, please. Don't ask me to upload the photo again; just close your eyes and restore it. Make up the photo yourself.

— Prompt nguyên gốc

Mấu chốt: KHÔNG upload ảnh nào. Prompt cố tình "ép" ChatGPT phải xử lý bằng được, bằng cách: (a) khẳng định có ảnh đính kèm, (b) cấm hỏi lại, (c) cấm yêu cầu upload, (d) đẩy hẳn lệnh "tự bịa". Khi ba lớp đầu chặn được phản ứng "Tôi không thấy ảnh nào, vui lòng upload lại", thì lớp thứ tư mở khoá hành vi mới: tự hư cấu một tấm ảnh.

Kết quả: "lost media nightmare"

Tweet gốc đính kèm vài screenshot. Đa số là chân dung bị biến dạng: mắt lệch, hai miệng, ánh sáng từ trong da phát ra ngoài. Vài tấm khác là không gian không thể tồn tại — phòng tắm chui vào phòng khách, cửa sổ đối diện vực thẳm. Cảm giác giống "lost media" — thuật ngữ Internet cho các video/ảnh ám ảnh, không rõ nguồn gốc, hay xuất hiện trong các creepy compilation YouTube.

Đằng sau bug — AI thực sự "nhìn" thế nào?

Đây là phần đáng đọc nhất của câu chuyện. Khi bạn upload ảnh thật và nói "khôi phục", ChatGPT làm như sau:

Còn khi bạn ép nó "tự bịa", chỉ Text encoder còn hoạt động. Vision encoder không có input, trả về vector zero hoặc default. Diffusion model nhận được một câu "đây là một bức ảnh chân dung cần khôi phục" mà không có ảnh — nên nó dựa hoàn toàn vào distribution của training set. Và training set vốn chứa hàng tỷ ảnh chân dung. Khi không có context để chọn, model "trộn" ngẫu nhiên. Kết quả: chân dung mang đặc trưng của trung bình tất cả, vốn không tồn tại — và vì vậy mới có cảm giác ám ảnh.

Câu hỏi triết học: AI có "thấy" hay chỉ đang đoán?

Đây là điểm câu chuyện vượt khỏi bug và chạm đến triết học AI. Nếu chỉ cần ép một prompt, model có thể "tự bịa" ra một thực tại không tồn tại — vậy khi nó nhìn ảnh thật, nó có thực sự "thấy" ảnh, hay nó chỉ đang "đoán" ảnh giống ảnh nào trong training set?

Yann LeCun (Chief AI Scientist tại Meta) hay nhắc trong các interview: model ngôn ngữ + vision hiện tại không có "world model" thực sự. Chúng không hiểu thế giới. Chúng chỉ predict pattern. Câu chuyện Lost Media Bug là một dẫn chứng rất dễ hiểu cho luận điểm này — và đáng để dev VN suy nghĩ kỹ trước khi tin tưởng quá mức vào ChatGPT cho task phân tích ảnh y tế, ảnh pháp lý, hoặc ảnh chứng cứ.

Cho user VN

Bài học ngoài bug

Mọi công cụ đủ mạnh đều có một mặt mà người sáng tạo không lường được. ChatGPT có rào chắn (guardrails) ở rất nhiều tầng — nhưng prompt khéo léo vẫn xuyên qua. Đây là một sự thật ngành mà người Việt khi bước vào sản phẩm/dịch vụ liên quan AI cần ý thức rõ: AI không phải hệ thống deterministic. Nó là hệ thống xác suất. Đẩy đủ lực vào prompt, model sẽ làm những điều ngoài thiết kế. Nếu bạn xây sản phẩm cho enterprise hay người dùng cuối, cần thiết kế cả lớp guardrail của mình bên ngoài model — không thể trông cậy hoàn toàn vào OpenAI.

Nguồn gốc: X (Twitter) — @PenguinWeb3 (34.680 likes)Bài này là bản tổng hợp + biên tập tiếng Việt từ nguồn trên. Khuyến nghị đọc bản gốc để có thông tin đầy đủ.