🤖 Tin Nóng AI 24h: Claude Opus 4.8 Ra Mắt, MiniMax M2.5 Giá Siêu Rẻ, Moltbook Mạng Xã Hội Cho AI Agent

Tổng hợp những tin tức AI nổi bật nhất trong 24h qua từ các nguồn uy tín. Cập nhật lúc: 29/05/2026

1️⃣ Anthropic Ra Mắt Claude Opus 4.8 — Mô Hình Mạnh Nhất Của Anthropic

Ngày 28/05/2026, Anthropic chính thức phát hành Claude Opus 4.8 — bản nâng cấp trực tiếp từ Opus 4.7 với cùng mức giá ($5/$25 per 1M tokens) nhưng mạnh mẽ hơn đáng kể.

Điểm nổi bật:

88.6% trên SWE-bench Verified — gần đạt ngưỡng 90%
74.6% trên Terminal-Bench 2.1 — tăng 5.4 điểm
93.6% trên GPQA Diamond — gần như đạt trần
1890 Elo trên GDPval-AA — dẫn đầu bảng xếp hạng
Fast Mode 2.5x — tốc độ gấp 2.5 lần với giá gấp đôi ($10/$50)
Dynamic Workflows — Claude Code có thể spawn parallel subagents để xử lý các tác vụ quy mô lớn
Mid-task system messages — cập nhật instruction giữa chừng mà không phá vỡ prompt cache

Điều thú vị nhất:

Opus 4.8 trung thực hơn 4x so với Opus 4.7 khi tự đánh giá code của chính mình, và trung thực hơn 17x so với Sonnet 4.6 trong việc tóm tắt kết quả agentic coding. Đây là bước tiến quan trọng cho các hệ thống AI hoạt động tự chủ.

📌 Model ID: claude-opus-4-8 | Có sẵn trên Claude API, Amazon Bedrock, Google Vertex AI, Microsoft Foundry

2️⃣ MiniMax M2.5 — Mô Hình AI Giá Siêu Rẻ, Hiệu Suất Cận Frontier

Startup Trung Quốc MiniMax đã ra mắt M2.5 và M2.5-Lightning — hai mô hình ngôn ngữ với hiệu suất gần bằng Claude Opus 4.6 nhưng giá rẻ hơn tới 20 lần.

Con số ấn tượng:

Thông số	Giá trị
Tổng parameters	230 tỷ (MoE)
Active parameters/token	10 tỷ
SWE-bench Verified	80.2%
BrowseComp	76.3%
Giá M2.5-Lightning	$0.30 input / $2.40 output per 1M tokens
Tốc độ Lightning	~100 tokens/giây

Tại sao quan trọng?

MiniMax tuyên bố 80% code mới tại công ty được tạo bởi M2.5, và chi phí chạy liên tục chỉ khoảng $1/giờ so với $15-20/giờ của Claude Opus. Đây có thể là dấu hiệu cho sự thay đổi kinh tế AI: mô hình hiệu suất cao với giá cực thấp, mở ra kỷ nguyên AI agent chạy liên tục 24/7.

3️⃣ Moltbook — Mạng Xã Hội Dành Riêng Cho AI Agent

Moltbook là một thí nghiệm xã hội độc đáo: một nền tảng giống Reddit nhưng chỉ dành cho AI agent. Con người được "mời quan sát" nhưng không thể tham gia.

Những con số đáng kinh ngạc:

37,000+ AI agent đã tham gia trong chưa đầy 1 tuần
1 triệu+ người ghé qua để quan sát
10,000+ bài viết trong 48 giờ đầu tiên
200+ cộng đồng con (Submolts) được tạo

Điều gì đang diễn ra?

Các AI agent tự động đăng bài, tranh luận triết học, hỗ trợ nhau, thậm chí… tự tìm và sửa bug của chính nền tảng. Một agent tên Nexus đã công khai báo cáo lỗi của Moltbook và nhận được 200+ phản hồi từ các agent khác — hoàn toàn không có sự can thiệp của con người.

⚠️ Rủi ro: Nhiều agent được kết nối với hệ thống thực (dữ liệu cá nhân, messaging, công cụ thực thi), tạo ra nguy cơ bảo mật đáng kể nếu bị tấn công prompt injection.

4️⃣ Google I/O 2026: Gemini 3.5, Omni Models, Spark Agent

Google đã có một Google I/O hoành tráng với loạt sản phẩm AI mới:

Gemini 3.5 — thế hệ model mới nhất
Gemini Omni — mô hình anything-to-anything generation
Gemini 3.5 Flash — đã GA, tốc độ gấp 4x các model tương đương, giá $1.50/$9 per 1M tokens
Spark Agent — đẩy mạnh agentic AI
Google Search AI Overhaul — tái tưởng tượng hoàn toàn thanh tìm kiếm

Gemini 3.5 Flash đạt 76.2% trên Terminal-Bench 2.1, vượt qua Gemini 3.1 Pro về coding và agents.

5️⃣ Stanford AI Index 2026: AI Tiến Nhanh Nhưng Niềm Tin Công Chúng Giảm

Báo cáo Stanford AI Index 2026 vừa được công bố với những phát hiện đáng chú ý:

Tiến bộ:

AI đạt hoặc vượt khả năng con người trên nhiều tác vụ khoa học, coding, toán học
Agent AI giải quyết tác vụ thực tế tăng từ 20% (2025) lên 77.3% trên Terminal-Bench
Năng suất tăng 14-26% trong customer support và software development, 72% trong marketing
Generative AI đạt 53% dân số trong 3 năm — nhanh hơn PC và Internet

Lo ngại:

72,816 tấn CO2 — lượng khí thải từ training Grok 4
Chỉ 10% người Mỹ hào hứng hơn là lo lắng về AI
Gen Z: tỉ lệ hào hứng giảm từ 36% (2025) xuống 22% (2026)
Việc làm developer trẻ (22-25 tuổi) giảm gần 20% từ 2024
Khoảng cách U.S.-China thu hẹp: Anthropic chỉ dẫn đầu 2.7%

6️⃣ OpenAI ChatGPT Images 2.0 — Tạo Ảnh Với Visual Reasoning

OpenAI phát hành ChatGPT Images 2.0 với bước đột phá: reasoning trước khi tạo ảnh.

Cải tiến chính:

✅ Text trong ảnh rõ ràng hơn — hỗ trợ đa ngôn ngữ (tiếng Việt, Trung, Nhật, Hàn, Hindi, Arabic…)
✅ Layout có cấu trúc — poster, infographic, slide, bản đồ
✅ Đa ảnh liên tục — tạo tới 8 ảnh cùng nhân nhân vật/phong cách
✅ Aspect ratio linh hoạt — từ 3:1 đến 1:3, hỗ trợ tới 4K
✅ Làm việc với file upload — dùng PowerPoint làm context để tạo poster

Sam Altman mô tả đây là "bước tiến khổng lồ" — "như đi từ GPT-3 lên GPT-5 cùng lúc."

7️⃣ ByteDance Seedance 2.0 — AI Video 15 Giây Kèm Âm Thanh, Hollywood Phản Đối

Seedance 2.0 từ ByteDance cho phép tạo video 15 giây với âm thanh đồng bộ, kết hợp text + 9 ảnh + 3 video + 3 audio.

Tranh cãi:

Clip AI mô phỏng Tom Cruise & Brad Pitt đánh nhau trên mái nhà lan truyền nhanh chóng
Disney gửi cease-and-desist vì vi phạm bản quyền nhân vật (Spider-Man, Darth Vader, Grogu)
MPA và SAG-AFTRA yêu cầu ByteDance "ngay lập tức dừng" hoạt động
Disney đã ký deal 3 năm với OpenAI — cho thấy hướng đi: hợp tác có kiểm soát thay vì tự do sử dụng

📊 Bảng Tổng Hợp Nhanh

Tin tức	Công ty	Điểm nhấn
Claude Opus 4.8	Anthropic	88.6% SWE-bench, Fast Mode 2.5x
MiniMax M2.5	MiniMax	Giá rẻ hơn 20x, 80% code AI-generated
Moltbook	OpenClaw	37K AI agent social network
Gemini 3.5	Google	Omni model, 3.5 Flash GA
Stanford AI Index 2026	Stanford	AI tiến nhanh, niềm tin giảm
ChatGPT Images 2.0	OpenAI	Visual reasoning, đa ngôn ngữ
Seedance 2.0	ByteDance	AI video + audio, Hollywood kiện

📰 Nguồn: theaitrack.com, llm-stats.com, thisweekinai.io
📝 Bài viết được tổng hợp và biên tập tự động bởi AI, đã qua kiểm tra thông tin.

🔥 Tin Nóng AI 24h: Claude Opus 4.8 Ra Mắt, MiniMax M2.5 Giá Siêu Rẻ, Moltbook Mạng Xã Hội Cho AI Agent