Chính sách Cosmos của NVIDIA giúp robot dự đoán điều gì sẽ xảy ra tiếp theo

Nguồn: interestingengineering

Tác giả: @IntEngineering

Ngày đăng: 29/1/2026

Để đọc nội dung đầy đủ, vui lòng truy cập vào bài viết gốc.

NVIDIA đã giới thiệu Cosmos Policy, một khung điều khiển robot mới sử dụng các mô hình dự đoán video được huấn luyện trước lớn nhằm đơn giản hóa việc ra quyết định trong lĩnh vực robot. Khác với các chính sách robot truyền thống dựa vào các mô-đun nhận thức, lập kế hoạch và điều khiển riêng biệt và đòi hỏi dữ liệu chuyên biệt cho từng nhiệm vụ, Cosmos Policy tiến hành huấn luyện bổ sung một mô hình thế giới video đã được huấn luyện trước (Cosmos Predict) trên dữ liệu trình diễn robot. Cách tiếp cận này tích hợp các hành động của robot, trạng thái vật lý và kết quả nhiệm vụ vào một biểu diễn thời gian thống nhất, cho phép mô hình dự đoán đồng thời các hành động tiếp theo của robot, các trạng thái tương lai và thành công của nhiệm vụ trong cùng một kiến trúc. Điều này giảm bớt sự phức tạp về kiến trúc và nhu cầu về lượng lớn dữ liệu huấn luyện đặc thù cho robot. Các bài kiểm tra chuẩn cho thấy Cosmos Policy đạt tỷ lệ thành công cao trong các nhiệm vụ thao tác robot đa bước, thường xuyên đạt hoặc vượt trội hơn các phương pháp hiện có trong khi sử dụng ít dữ liệu huấn luyện trình diễn hơn đáng kể. Một lợi thế then chốt là khả năng lập kế hoạch trong thời gian suy luận, cho phép mô hình tạo ra và đánh giá nhiều chuỗi hành động ứng viên và chọn ra những chuỗi có kết quả dự đoán tốt nhất trong khoảng thời gian dài hơn. Việc lập kế hoạch chiến lược này giúp robot thực hiện các nhiệm vụ phức tạp.

Thẻ

roboticsrobot-controlAI-in-roboticsNVIDIA-Cosmos-Policyrobot-planningvideo-prediction-modelsrobotic-manipulation