Tech

Google’s thế hệ tiếp theo của TPUs hứa hẹn tăng hiệu suất lên tới 4.7 lần

Tại hội nghị phát triển Google I/O, vào thứ Ba, Google đã công bố thế hệ tiếp theo của Tensor Processing Units (TPU), chip AI trung tâm dữ liệu của mình. Thế hệ thứ sáu của các chip này, được đặt tên là Trillium, sẽ ra mắt vào cuối năm nay.

'Google đã được xây dựng cho khoảnh khắc này. Chúng tôi đã đi tiên phong trong việc phát triển GPU trong hơn một thập kỷ', CEO của Google Sundar Pichai cho biết trong cuộc họp báo trước hội nghị.

Việc công bố thế hệ tiếp theo của TPUs đã trở thành một truyền thống tại I/O, ngay cả khi các chip chỉ được tung ra trong năm. Khi chúng ra mắt, chúng sẽ có một mức tăng hiệu suất lên đến 4.7 lần trong hiệu suất tính toán mỗi chip so với thế hệ thứ năm, theo Pichai.

Một phần lớn, Google đã đạt được điều này thông qua việc mở rộng các đơn vị nhân ma trận của chip (MXUs) và bằng cách đẩy tốc độ đồng hồ tổng thể. Ngoài ra, Google cũng đã gấp đôi băng thông bộ nhớ cho các chip Trillium.

Cái quan trọng hơn có lẽ là, Trillium có thế hệ thứ ba của SparseCore, mà Google mô tả là 'một bộ xử lý tăng tốc chuyên biệt để xử lý nhúng cực lớn phổ biến trong khối lượng công việc xếp hạng và đề xuất tiên tiến'. Theo công ty, điều này sẽ cho phép TPUs Trillium huấn luyện mô hình nhanh hơn và phục vụ chúng với độ trễ thấp hơn.

Pichai cũng mô tả các chip mới là 'TPUs tiết kiệm năng lượng nhất' của Google cho đến nay, điều quan trọng khi nhu cầu về chip AI tiếp tục tăng một cách đáng kể. 'Nhu cầu của ngành công nghiệp về tính toán ML đã tăng gấp đôi trong 6 năm qua, cỡ số lớn tăng khoảng mười lần mỗi năm', ông nói. Điều đó không thể duy trì nếu không đầu tư vào việc giảm yêu cầu về năng lượng của các chip này. Google hứa rằng TPUs mới chỉ tiêu tốn 67% năng lượng hiệu quả hơn so với các chip thế hệ thứ năm.

Một số loại TPUs của Google gần đây đã xuất hiện với một số biến thể. Cho đến nay, Google vẫn chưa cung cấp bất kỳ thông tin bổ sung nào về các chip mới, hoặc chi phí sử dụng chúng trên Google Cloud.

Trước đó trong năm nay, Google cũng thông báo rằng họ sẽ là một trong những nhà cung cấp đám mây đầu tiên cung cấp quyền truy cập vào chip Blackwell thế hệ tiếp theo của Nvidia. Điều này vẫn đồng nghĩa với việc nhà phát triển sẽ phải đợi đến đầu năm 2025 để truy cập vào những chip này.

'Chúng tôi sẽ tiếp tục đầu tư vào cơ sở hạ tầng để cung cấp sức mạnh cho phát triển AI của chúng tôi và chúng tôi sẽ tiếp tục phá vỡ những giới hạn mới', Pichai nói.

Chúng tôi đang ra mắt một bản tin thông tin AI! Đăng ký tại đây để bắt đầu nhận nó trong hộp thư của bạn vào ngày 5 tháng 6.

Related Articles

Back to top button Back to top button