Đang tải...
Intel giới thiệu các giải pháp AI tích hợp Xeon 6 và Gaudi 3
Trong bối cảnh AI thay đổi nhanh chóng, các doanh nghiệp cần hạ tầng hiệu quả và triển khai nhanh. Đáp ứng nhu cầu này, Intel giới thiệu Xeon 6 với các nhân hiệu năng cao và bộ tăng tốc AI Gaudi 3, mang lại hiệu suất tối ưu và chi phí thấp hơn.
Intel Xeon 6 với P-core và bộ tăng tốc AI Gaudi 3
Intel mang đến những cải tiến mới về công nghệ cho cơ sở hạ tầng AI thông qua hai sản phẩm mới trong danh mục trung tâm dữ liệu:
Intel Xeon 6 với P-core: Được thiết kế để chạy các ứng dụng đòi hỏi sức mạnh tính toán cao với hiệu quả sử dụng điện vượt trội, Xeon 6 mang đến hiệu năng gấp đôi so với thế hệ tiền nhiệm. Dòng vi xử lý mới của Intel có số lượng nhân nhiều hơn, băng thông bộ nhớ gấp đôi và khả năng tăng tốc AI được tích hợp trong mọi nhân.
Bộ vi xử lý này được thiết kế để đáp ứng các yêu cầu về hiệu năng của AI từ các thiết bị vùng biên đến trung tâm dữ liệu và môi trường đám mây. Thông qua mối quan hệ hợp tác chiến lược với Intel, Google Cloud có thể cung cấp giải pháp với hiệu năng và sự linh hoạt theo nhu cầu của doanh nghiệp, bao gồm cả những giải pháp tích hợp Intel Xeon 6 với P-core trong tương lai.
Bộ tăng tốc AI Gaudi 3: Được tối ưu hóa cho các mô hình AI tạo sinh quy mô lớn, Gaudi 3 có 64 nhân xử lý Tensor (TPC) và 8 công cụ nhân ma trận (MME) để tăng tốc khả năng tính toán của mạng thần kinh nhân tạo (deep neural network). Bộ tăng tốc AI của Intel bao gồm bộ nhớ HBM2e 128 gigabyte (GB) cho việc huấn luyện và suy luận và 24 cổng Ethernet 200 Gigabit (Gb) cho khả năng mở rộng mạng.
Gaudi 3 cũng cung cấp khả năng tương thích mượt mà với framework PyTorch và các mô hình transformer và diffuser tiên tiến từ Hugging Face. IBM và Intel đang hợp tác để cung cấp dịch vụ Gaudi 3 nhằm hỗ trợ khách hàng tận dụng tốt sức mạnh của AI. Thông qua sự hợp tác này, Intel và IBM đặt mục tiêu giảm tổng chi phí sở hữu để tận dụng và mở rộng quy mô AI, đồng thời nâng cao hiệu năng xử lý.
Tăng cường các hệ thống AI với nhiều lợi ích từ tổng chi phí sở hữu
Việc triển khai AI trên quy mô lớn đòi hỏi doanh nghiệp phải cân nhắc đến nhiều yếu tố, như các tùy chọn triển khai có đủ linh hoạt để đáp ứng nhu cầu, tỉ lệ hiệu năng trên giá thành có thực sự cạnh tranh, và các công nghệ AI có thể sử dụng được.
Hạ tầng x86 mạnh mẽ và hệ sinh thái mã nguồn mở rộng lớn của Intel hỗ trợ các doanh nghiệp xây dựng các hệ thống AI mang lại giá trị cao với tổng chi phí sở hữu và hiệu năng trên mỗi watt điện được tối ưu. Đáng chú ý, 73% các máy chủ tăng tốc bằng GPU đều sử dụng Intel Xeon làm CPU chính.
Intel hợp tác với các OEM hàng đầu bao gồm Dell Technologies và Supermicro để đồng thiết kế các hệ thống phù hợp với nhiều nhu cầu cụ thể của khách hàng nhằm triển khai AI hiệu quả.
Thu hẹp khoảng cách từ nguyên mẫu cho đến thành phẩm qua các nỗ lực hợp tác đồng thiết kế
Việc chuyển đổi giải pháp Gen AI từ nguyên mẫu sang sản xuất gặp nhiều thách thức như giám sát, xử lý lỗi, bảo mật và khả năng mở rộng. Intel hợp tác với các OEM và đối tác để cung cấp các giải pháp tạo sinh tăng cường truy xuất (retrieval-augmented generation, viết tắt là RAG) ổn định và sẵn sàng cho sản xuất.
Các giải pháp này, dựa trên nền tảng mở dành cho AI doanh nghiệp (Open Platform for Enterprise AI, viết tắt là OPEA), tích hợp vào hệ thống RAG có khả năng mở rộng và được tối ưu cho AI chạy trên Xeon và Gaudi. Hệ thống hỗ trợ doanh nghiệp dễ dàng tích hợp các ứng dụng từ Kubernetes, Red Hat OpenShift AI và Red Hat Enterprise Linux AI.
Mở rộng khả năng truy xuất các ứng dụng AI cấp doanh nghiệp
Danh mục Tiber của Intel cung cấp các giải pháp giúp doanh nghiệp giải quyết các thách thức như khả năng truy cập, chi phí, độ phức tạp, bảo mật, tiết kiệm điện năng, và khả năng mở rộng trên các môi trường AI, điện toán đám mây và thiết bị vùng biên.
Intel Tiber Developer Cloud hiện cung cấp các hệ thống xem trước của Intel Xeon 6 để doanh nghiệp có thể đánh giá và thử nghiệm công nghệ. Ngoài ra, một số khách hàng sẽ được tiếp cận Intel Gaudi 3 sớm để xác thực các phương án triển khai mô hình AI khi các cụm Gaudi 3 sẽ bắt đầu được triển khai trong quý tới cho quá trình sản xuất trên quy mô lớn.
Nhiều dịch vụ mới sẽ được ra mắt, nổi bật có SeekrFlow, một nền tảng AI đầu cuối từ Seekr để phát triển các ứng dụng AI đáng tin cậy. Các bản cập nhật phần mềm mới nhất bao gồm bản mới nhất của Synpase, các notebook của Jupyter được cài sẵn PyTorch 2.4 và Intel oneAPI, cũng như các công cụ AI 202.2 với các tính năng tăng tốc AI mới và hỗ trợ các bộ vi xử lý Xeon 6.