🤖 Tin Nóng AI 24h: Claude Opus 4.8 Ra Mắt, MiniMax M2.5 Giá Siêu Rẻ, Moltbook Mạng Xã Hội Cho AI Agent
Tổng hợp những tin tức AI nổi bật nhất trong 24h qua từ các nguồn uy tín. Cập nhật lúc: 29/05/2026
1️⃣ Anthropic Ra Mắt Claude Opus 4.8 — Mô Hình Mạnh Nhất Của Anthropic
Ngày 28/05/2026, Anthropic chính thức phát hành Claude Opus 4.8 — bản nâng cấp trực tiếp từ Opus 4.7 với cùng mức giá ($5/$25 per 1M tokens) nhưng mạnh mẽ hơn đáng kể.
Điểm nổi bật:
- 88.6% trên SWE-bench Verified — gần đạt ngưỡng 90%
- 74.6% trên Terminal-Bench 2.1 — tăng 5.4 điểm
- 93.6% trên GPQA Diamond — gần như đạt trần
- 1890 Elo trên GDPval-AA — dẫn đầu bảng xếp hạng
- Fast Mode 2.5x — tốc độ gấp 2.5 lần với giá gấp đôi ($10/$50)
- Dynamic Workflows — Claude Code có thể spawn parallel subagents để xử lý các tác vụ quy mô lớn
- Mid-task system messages — cập nhật instruction giữa chừng mà không phá vỡ prompt cache
Điều thú vị nhất:
Opus 4.8 trung thực hơn 4x so với Opus 4.7 khi tự đánh giá code của chính mình, và trung thực hơn 17x so với Sonnet 4.6 trong việc tóm tắt kết quả agentic coding. Đây là bước tiến quan trọng cho các hệ thống AI hoạt động tự chủ.
📌 Model ID: claude-opus-4-8 | Có sẵn trên Claude API, Amazon Bedrock, Google Vertex AI, Microsoft Foundry
2️⃣ MiniMax M2.5 — Mô Hình AI Giá Siêu Rẻ, Hiệu Suất Cận Frontier
Startup Trung Quốc MiniMax đã ra mắt M2.5 và M2.5-Lightning — hai mô hình ngôn ngữ với hiệu suất gần bằng Claude Opus 4.6 nhưng giá rẻ hơn tới 20 lần.
Con số ấn tượng:
| Thông số | Giá trị |
|---|---|
| Tổng parameters | 230 tỷ (MoE) |
| Active parameters/token | 10 tỷ |
| SWE-bench Verified | 80.2% |
| BrowseComp | 76.3% |
| Giá M2.5-Lightning | $0.30 input / $2.40 output per 1M tokens |
| Tốc độ Lightning | ~100 tokens/giây |
Tại sao quan trọng?
MiniMax tuyên bố 80% code mới tại công ty được tạo bởi M2.5, và chi phí chạy liên tục chỉ khoảng $1/giờ so với $15-20/giờ của Claude Opus. Đây có thể là dấu hiệu cho sự thay đổi kinh tế AI: mô hình hiệu suất cao với giá cực thấp, mở ra kỷ nguyên AI agent chạy liên tục 24/7.
3️⃣ Moltbook — Mạng Xã Hội Dành Riêng Cho AI Agent
Moltbook là một thí nghiệm xã hội độc đáo: một nền tảng giống Reddit nhưng chỉ dành cho AI agent. Con người được "mời quan sát" nhưng không thể tham gia.
Những con số đáng kinh ngạc:
- 37,000+ AI agent đã tham gia trong chưa đầy 1 tuần
- 1 triệu+ người ghé qua để quan sát
- 10,000+ bài viết trong 48 giờ đầu tiên
- 200+ cộng đồng con (Submolts) được tạo
Điều gì đang diễn ra?
Các AI agent tự động đăng bài, tranh luận triết học, hỗ trợ nhau, thậm chí… tự tìm và sửa bug của chính nền tảng. Một agent tên Nexus đã công khai báo cáo lỗi của Moltbook và nhận được 200+ phản hồi từ các agent khác — hoàn toàn không có sự can thiệp của con người.
⚠️ Rủi ro: Nhiều agent được kết nối với hệ thống thực (dữ liệu cá nhân, messaging, công cụ thực thi), tạo ra nguy cơ bảo mật đáng kể nếu bị tấn công prompt injection.
4️⃣ Google I/O 2026: Gemini 3.5, Omni Models, Spark Agent
Google đã có một Google I/O hoành tráng với loạt sản phẩm AI mới:
- Gemini 3.5 — thế hệ model mới nhất
- Gemini Omni — mô hình anything-to-anything generation
- Gemini 3.5 Flash — đã GA, tốc độ gấp 4x các model tương đương, giá $1.50/$9 per 1M tokens
- Spark Agent — đẩy mạnh agentic AI
- Google Search AI Overhaul — tái tưởng tượng hoàn toàn thanh tìm kiếm
Gemini 3.5 Flash đạt 76.2% trên Terminal-Bench 2.1, vượt qua Gemini 3.1 Pro về coding và agents.
5️⃣ Stanford AI Index 2026: AI Tiến Nhanh Nhưng Niềm Tin Công Chúng Giảm
Báo cáo Stanford AI Index 2026 vừa được công bố với những phát hiện đáng chú ý:
Tiến bộ:
- AI đạt hoặc vượt khả năng con người trên nhiều tác vụ khoa học, coding, toán học
- Agent AI giải quyết tác vụ thực tế tăng từ 20% (2025) lên 77.3% trên Terminal-Bench
- Năng suất tăng 14-26% trong customer support và software development, 72% trong marketing
- Generative AI đạt 53% dân số trong 3 năm — nhanh hơn PC và Internet
Lo ngại:
- 72,816 tấn CO2 — lượng khí thải từ training Grok 4
- Chỉ 10% người Mỹ hào hứng hơn là lo lắng về AI
- Gen Z: tỉ lệ hào hứng giảm từ 36% (2025) xuống 22% (2026)
- Việc làm developer trẻ (22-25 tuổi) giảm gần 20% từ 2024
- Khoảng cách U.S.-China thu hẹp: Anthropic chỉ dẫn đầu 2.7%
6️⃣ OpenAI ChatGPT Images 2.0 — Tạo Ảnh Với Visual Reasoning
OpenAI phát hành ChatGPT Images 2.0 với bước đột phá: reasoning trước khi tạo ảnh.
Cải tiến chính:
- ✅ Text trong ảnh rõ ràng hơn — hỗ trợ đa ngôn ngữ (tiếng Việt, Trung, Nhật, Hàn, Hindi, Arabic…)
- ✅ Layout có cấu trúc — poster, infographic, slide, bản đồ
- ✅ Đa ảnh liên tục — tạo tới 8 ảnh cùng nhân nhân vật/phong cách
- ✅ Aspect ratio linh hoạt — từ 3:1 đến 1:3, hỗ trợ tới 4K
- ✅ Làm việc với file upload — dùng PowerPoint làm context để tạo poster
Sam Altman mô tả đây là "bước tiến khổng lồ" — "như đi từ GPT-3 lên GPT-5 cùng lúc."
7️⃣ ByteDance Seedance 2.0 — AI Video 15 Giây Kèm Âm Thanh, Hollywood Phản Đối
Seedance 2.0 từ ByteDance cho phép tạo video 15 giây với âm thanh đồng bộ, kết hợp text + 9 ảnh + 3 video + 3 audio.
Tranh cãi:
- Clip AI mô phỏng Tom Cruise & Brad Pitt đánh nhau trên mái nhà lan truyền nhanh chóng
- Disney gửi cease-and-desist vì vi phạm bản quyền nhân vật (Spider-Man, Darth Vader, Grogu)
- MPA và SAG-AFTRA yêu cầu ByteDance "ngay lập tức dừng" hoạt động
- Disney đã ký deal 3 năm với OpenAI — cho thấy hướng đi: hợp tác có kiểm soát thay vì tự do sử dụng
📊 Bảng Tổng Hợp Nhanh
| Tin tức | Công ty | Điểm nhấn |
|---|---|---|
| Claude Opus 4.8 | Anthropic | 88.6% SWE-bench, Fast Mode 2.5x |
| MiniMax M2.5 | MiniMax | Giá rẻ hơn 20x, 80% code AI-generated |
| Moltbook | OpenClaw | 37K AI agent social network |
| Gemini 3.5 | Omni model, 3.5 Flash GA | |
| Stanford AI Index 2026 | Stanford | AI tiến nhanh, niềm tin giảm |
| ChatGPT Images 2.0 | OpenAI | Visual reasoning, đa ngôn ngữ |
| Seedance 2.0 | ByteDance | AI video + audio, Hollywood kiện |
📰 Nguồn: theaitrack.com, llm-stats.com, thisweekinai.io
📝 Bài viết được tổng hợp và biên tập tự động bởi AI, đã qua kiểm tra thông tin.