Vị Trí Thống Trị Phần Cứng AI Của NVIDIA Bị Thách Thức Khi OpenAI Sử Dụng Dịch Vụ Của Google TPU

Sự thống trị về phần cứng AI của NVIDIA bị thách thức khi phòng thí nghiệm AI hàng đầu thế giới, OpenAI, khai thác phần cứng Google TPU, cho thấy những nỗ lực đáng kể để thoát khỏi các giải pháp của một nhà cung cấp duy nhất. Vào tháng 6 năm 2025, OpenAI bắt đầu thuê Bộ xử lý Tensor của Google Cloud để xử lý khối lượng công việc suy luận ngày càng tăng của ChatGPT. Đây là lần đầu tiên OpenAI dựa vào chip không phải của NVIDIA trong sản xuất quy mô lớn.

Cho đến gần đây, GPU NVIDIA cung cấp năng lượng cho cả đào tạo mô hình và suy luận cho các sản phẩm của OpenAI. Đào tạo các mô hình ngôn ngữ lớn trên các thẻ đó vẫn tốn kém, nhưng đó là một quá trình định kỳ. Ngược lại, suy luận chạy liên tục và có chi phí đáng kể riêng. ChatGPT hiện phục vụ hơn 100 triệu người dùng hoạt động hàng ngày, bao gồm 25 triệu người đăng ký trả phí. Các hoạt động suy luận chiếm gần một nửa trong ngân sách tính toán hàng năm ước tính là 40 tỷ đô la của OpenAI. TPU của Google, như v6e “Trillium” cung cấp giải pháp tiết kiệm chi phí hơn cho suy luận trạng thái ổn định, vì chúng được thiết kế dành riêng cho thông lượng cao và độ trễ thấp.

Show Full Article
Home Tin tức