Trong khi cộng đồng AI quốc tế đang lo về việc Mỹ cấm xuất khẩu Fable 5 và Mythos 5, các đối thủ Trung Quốc không ngồi yên. Sáng 12/6, Moonshot AI (công ty mẹ của Kimi) phát hành Kimi K2.7 Code — open source, free. Tweet công bố 13.854 likes, 2.4 triệu lượt xem. Đây là model coding mạnh nhất từ Trung Quốc tính đến hiện tại.
Thông cáo chính chủ
Kimi-K2.7-Code, our latest coding model, is now released and open-sourced! Improved coding & agent performance over K2.6: +21.8% on Kimi Code Bench v2, +11.0% on Program Bench, and +31.5% on MLS Bench Lite. Reasoning efficiency: Less overthinking, with 30% lower reasoning-token usage compared to K2.6. Long-horizon coding: Improved instruction following, higher end-to-end coding task success rates. 6x High-Speed Mode coming soon! Available today via Kimi API and Kimi Code.
"Less overthinking" — khẩu hiệu đáng chú ý
Điều gây tranh luận trong tweet không phải số benchmark — là cụm "less overthinking, 30% lower reasoning-token usage". Đây là tagline đối nghịch với Claude và Anthropic. Claude Opus 4.7-4.8 được Anthropic huấn luyện để think kỹ trước khi trả lời — đây là điểm mạnh nhưng cũng là điểm tốn token. Kimi đi ngược: huấn luyện model để think NGẮN hơn nhưng vẫn ra đúng kết quả.
Đây không phải lý thuyết mới. Cộng đồng nghiên cứu reasoning đã biết: chain-of-thought dài không luôn đồng nghĩa kết quả tốt hơn. Sau ngưỡng 3-5 reasoning steps, return giảm dần — và đôi khi reasoning quá dài dẫn đến "đi lạc" (drift), kết quả tệ hơn. Kimi K2.7 áp dụng insight này vào training.
"Open-source" — nghĩa thực sự là gì?
Cụm này quan trọng cần làm rõ. Moonshot công bố Kimi K2.7 weights trên Hugging Face. Tức là bạn có thể tải về, host trên máy mình, không phụ thuộc Moonshot. Nhưng:
- File model rất nặng (vài chục đến vài trăm GB), cần GPU mạnh — không chạy trên laptop bình thường.
- Self-host yêu cầu inference stack (vLLM, TGI, SGLang) — kỹ thuật.
- License cụ thể: Modified Apache 2.0 — cho phép thương mại nhưng có một số restriction về use case.
Đối với dev VN cá nhân, đường truy cập đơn giản nhất vẫn là Kimi API (kimi.com) hoặc Kimi Code CLI. Self-host phù hợp cho doanh nghiệp lớn lo về privacy + chi phí dài hạn.
Kimi Code: rival của Claude Code
Cùng với model, Moonshot tung Kimi Code — CLI tool tương tự Claude Code của Anthropic. Cùng tinh thần: agent autonomous, refactor multi-file, run test, fix bug. Khác biệt:
- Kimi Code chạy local + cloud hybrid: agent logic local, model inference qua Kimi API.
- Compatible với Claude Code skill files — bạn có thể migrate skill collection từ Claude Code sang Kimi Code không sửa.
- Giá: gói cá nhân $20/tháng (1/10 giá Claude Max).
- Yếu hơn Claude Code ở: vision (đọc screenshot), long-context (32k vs 200k của Claude).
Cho dev VN
Đang dùng Claude Code và lo về Mythos/Fable ban
Kimi Code là backup khả thi. Dùng song song — Claude Code cho task chính, Kimi Code cho task phụ. Skill files migrate dễ. Nếu có ngày Claude Max không truy cập được cho user VN, Kimi sẵn sàng.
Đang dùng GitHub Copilot ($10/tháng)
Kimi Code free tier (qua web) đủ để thay thế. Bạn chỉ cần ChatGPT-style chat để generate code, không cần CLI nâng cao.
Đang xây sản phẩm code AI cho thị trường VN
Self-host Kimi K2.7 trên VPS riêng — chi phí inference ~$0.20-0.50 cho 1M token, rẻ hơn Claude/OpenAI 10-20 lần. Phù hợp cho mobile app, education, code completion.
Bài học rộng
Câu chuyện Kimi K2.7 cho thấy: open-source AI đang dần đuổi kịp đóng. Khoảng cách giữa model frontier (Opus, GPT-5.4) và model open-source tốt nhất (Kimi K2.7, DeepSeek V4, Qwen 3.5) đã thu hẹp xuống còn 5-15% trên benchmark — không còn 50-70% như 2024.
Đối với dev VN, đây là tin cực tốt. Trong 12 tháng tới, sẽ có thêm nhiều model open-source ra. Kết hợp với Fusion API của OpenRouter và Kimi Code, dev VN có thể xây sản phẩm AI quy mô lớn mà KHÔNG phụ thuộc vào Anthropic hay OpenAI. Đây là lựa chọn quan trọng, đặc biệt trong bối cảnh địa chính trị bất ổn của ngành AI hiện tại.