03/06/2026
Agentic AI không ngủ: Tại sao "open by design" là chìa khóa cho tương lai?
Mình vừa đọc xong bài chia sẻ từ buổi Deploy 2026 của DigitalOcean, nơi Kari Briski (NVIDIA) và Salman Paracha (DigitalOcean) ngồi xuống bàn luận về làm sao để xây dựng hệ thống AI agent bền vững trong kỷ nguyên "always-on". Điều khiến mình ấn tượng nhất? Đó không phải là những model khổng lồ hay hạ tầng đắt tiền, mà là triết lý "open by design" — mở ra, chia sẻ, và cùng tiến hóa.
✅ "Open-weight models" không chỉ là trend, mà là nhu cầu cấp thiết
• NVIDIA nhận ra rằng, dù có hàng trăm model open-source, đa số bị bỏ rơi sau khi ra mắt — không cập nhật, không cải tiến. Từ đó, họ ra mắt Nemotron (từ tháng 3/2026), một dòng model đa phương thức (multi-modal) được thiết kế riêng cho agentic AI, với cam kết cập nhật thường xuyên và hỗ trợ dài hạn.
• Ưu điểm? Dev có thể chạy model tại chỗ (on-prem), kiểm soát hiệu năng, bảo mật, và tùy biến — thay vì phụ thuộc hoàn toàn vào API đóng của các ông lớn.
✅ Agentic AI không phải là "black box" — mà phải có thể kiểm chứng
• Vấn đề lớn nhất hiện nay: làm sao đánh giá được agent của mình có thực sự tốt hay không? Briski chia sẻ rằng, hầu hết benchmark hiện tại chỉ tập trung vào coding, bỏ quên các ngành khác như tự động hóa điện tử.
• Giải pháp? Cần thêm test case đa dạng, và quan trọng nhất: khả năng traceability — tức là có thể theo dõi từng bước xử lý của agent, thay vì chỉ nhìn vào kết quả cuối. "Bạn phải hiểu hệ thống được xây dựng như thế nào, ngay cả khi chính agent đó viết code cho bạn."
✅ Token economics: Đừng đếm token, hãy đếm giá trị
• Câu nói này của Briski khiến mình giật mình: "Chúng ta đang ở giai đoạn token sẽ được tính toán khác đi khi kiến trúc model thay đổi."
• Thay vì lo lắng về số lượng token sinh ra, hãy tập trung vào giá trị mà hệ thống mang lại — ví dụ: tiết kiệm thời gian, tối ưu quy trình, hay doanh thu tăng lên.
• NVIDIA đang thử nghiệm State-Space Models (SSMs) để giảm chi phí compute, thay vì phụ thuộc vào các model khổng lồ (như MoE 8B parameters).
✅ Open harness: Tự do lựa chọn, không bị khóa vào một framework
• DigitalOcean đang xây dựng Plano (công nghệ data-plane) và nghiên cứu Small Action Models (SAMs) — những model nhỏ gọn, tối ưu hóa cho các tác vụ cụ thể bằng cách nén ngữ cảnh (context compression).
• Triết lý cốt lõi: "Làm sao để dev có quyền chọn harness (khung điều phối agent) mình muốn, thay vì bị ép buộc vào một giải pháp đóng?" — Đó chính là sức mạnh của open-source.
✅ Tương lai: Agentic AI sẽ là "long-horizon" và tự tiến hóa
• Briski dự đoán: Các tác vụ AI tương lai sẽ kéo dài hàng giờ, thậm chí ngày, và hệ thống phải tự thích ứng mà không cần can thiệp thủ công.
• Ví dụ: Một agent giao dịch tài chính (như TradingAgents LLM) không chỉ chạy trong vài phút, mà có thể hoạt động suốt phiên giao dịch, tự điều chỉnh chiến lược dựa trên dữ liệu real-time.
Mình rút ra được gì?
Nếu trước giờ bạn nghĩ AI agent chỉ là chuyện của những gã khổng lồ như NVIDIA hay Google, thì bài này sẽ thay đổi suy nghĩ của bạn. Open-source, minh bạch, và khả năng kiểm soát mới là chìa khóa để đưa agentic AI vào sản xuất — chứ không phải là những model "khủng" nhưng bí ẩn.
Còn bạn? Bạn đã thử build agentic AI chưa, hay vẫn đang loay hoay với những model đóng? Hãy chia sẻ kinh nghiệm dưới comment nhé! 👇
🔗
At DigitalOcean Deploy 2026, DigitalOcean and NVIDIA discussed industry trends in open-source AI and how developers can run agentic AI.