เมื่อปรับใช้ GPU ในสภาพแวดล้อมการประมวลผลประสิทธิภาพสูง (HPC) ลูกค้าต้องเผชิญกับอุปสรรคและความไร้ประสิทธิภาพที่เกิดจากความจําเป็นในการพอร์ตและรหัสทนไฟ ความพยายามของพวกเขาถูกขัดขวางโดยสภาพแวดล้อมการเขียนโปรแกรม GPU ที่เป็นกรรมสิทธิ์ซึ่งห้ามการพกพาระหว่างผู้จําหน่าย GPU และมักจะส่งผลให้เกิดความไม่สอดคล้องกันระหว่างการใช้งาน CPU และ GPU ความต้องการแบนด์วิดธ์หน่วยความจําระดับ GPU ในวงกว้างและการลงทุนรหัสร่วมกันระหว่าง CPU และ GPU เพื่อเรียกใช้งานเวิร์กโหลดส่วนใหญ่ในสภาพแวดล้อมที่คู่ขนานกันได้กลายเป็นสิ่งจําเป็น
ซีรีส์ Intel Data Center GPU Max ออกแบบมาสําหรับประสิทธิภาพสูงสุดในรูปแบบการประมวลผลที่ต้องใช้ข้อมูลมากที่ใช้ใน AI และ HPC จากสถาปัตยกรรม Xe HPC ที่ใช้ทั้งเทคโนโลยีการบรรจุ EMIB 2.5D และ Foveros เพื่อรวมไทล์แบบ Active 47 ตัวเข้ากับ GPU เดียว ซึ่งประดิษฐ์ขึ้นบนโหนดกระบวนการที่แตกต่างกันห้าโหนด GPU ซีรีส์ Intel Max ช่วยให้ GPU มีความยืดหยุ่นและการแยกส่วนมากขึ้นในการก่อสร้าง SOC
คุณสมบัติบล็อคการประมวลผล GPU พื้นฐานของ Intel:
- แคช L2 สูงสุด 408 MB บนเทคโนโลยี SRAM แบบแยก, แคช L1 ขนาด 64 MB และหน่วยความจําแบนด์วิดธ์สูงสูงสุด 128 GB
- Ray Tracing Unit สูงสุด 128 หน่วยที่มีใน GPU ซีรีส์ Max แต่ละตัวเพื่อเร่งความเร็วการแสดงผลภาพทางวิทยาศาสตร์และภาพเคลื่อนไหว
- Intel® Xe Matrix Extensions (XMX) ที่ขับเคลื่อนด้วย AI พร้อมอาร์เรย์แบบซิสโตลิกแบบลึกที่สนับสนุนความสามารถของเวกเตอร์และเมทริกซ์ในอุปกรณ์เดียว
- oneAPI มีมาตรฐาน การเขียนโปรแกรมและเครื่องมือแบบหลายสถาปัตยกรรม ซึ่งช่วยเพิ่มประสิทธิภาพและประสิทธิภาพการทํางาน และเอาชนะการล็อกโมเดลการเขียนโปรแกรมที่เป็นกรรมสิทธิ์
ประสิทธิภาพสูงสุด 2 เท่า
เพิ่มการแข่งขันในเวิร์คโหลด AI และ HPC เนื่องจากแคช L2 ขนาดใหญ่1
- ประสิทธิภาพที่แข็งแกร่งที่เน้นโดย:
- ประสิทธิภาพเพิ่มขึ้นสูงสุด 12.8 เท่าเมื่อเทียบกับโปรเซสเซอร์ Intel® Xeon® เจนเนอเรชั่น 3 บน LAMMPS (เวิร์คโหลดการจําลองแบบขนานขนาดใหญ่/โมเลกุล) ที่ทํางานบน CPU Xeon Max โดยมีเคอร์เนลออฟโหลดไปยัง GPU ซีรีส์สูงสุดหกตัวและปรับประสิทธิภาพโดยเครื่องมือ Intel oneAPI2
การแก้ปัญหาที่ท้าทายที่สุดในโลก... เร็ว
ความหนาแน่นที่เพิ่มขึ้นและพลังประมวลผลช่วยให้นักวิจัยแก้ไขปัญหาที่ไม่สามารถเข้าถึงได้ในปัจจุบัน เช่น การสร้างแผนที่ 3D ของสมองเมาส์ หรือการสร้างแบบจําลองการไหลเวียนของเลือดเฉพาะผู้ป่วยเพื่อระบุตําแหน่งที่จะใส่หัวใจเต้น
ซูเปอร์คอมพิวเตอร์ Aurora ของกระทรวงพลังงานสหรัฐฯ ที่ Argonne National Laboratory (ANL) คาดว่าเป็นหนึ่งในซูเปอร์คอมพิวเตอร์ตัวแรกของอุตสาหกรรมที่โดดเด่นด้วยประสิทธิภาพความแม่นยําคู่แบบต่อเนื่องมากกว่า 1 exaflop และกว่า 2 exaflops ของประสิทธิภาพความแม่นยําคู่สูงสุด Aurora ยังเป็นรายแรกที่แสดงให้เห็นถึงพลังของการจับคู่ GPU ซีรีส์ Max และ CPU ในระบบเดียวที่มีเบลดมากกว่า 10,000 ใบ แต่ละตัวมี GPU ซีรีส์สูงสุดหกตัวและซีพียู Xeon Max สองตัว
เร่งความเร็วเวิร์กโหลด HPC และ AI ในสถาปัตยกรรมต่างๆ
โมเดล AI ต้องการชุดข้อมูลขนาดใหญ่อย่างต่อเนื่องเพื่อการฝึกอบรมที่มีประสิทธิภาพมากขึ้น ยิ่งคุณประมวลผลข้อมูลได้เร็วขึ้น คุณก็จะสามารถฝึกฝนและปรับใช้โมเดลได้เร็วขึ้นเท่านั้น GPU เร่งความเร็วไปป์ไลน์ AI และการวิเคราะห์ข้อมูลแบบครบวงจรด้วยไลบรารีที่ปรับมาให้เหมาะกับสถาปัตยกรรม Intel และการกําหนดค่าที่ปรับมาสําหรับเวิร์คโหลด HPC และ AI อุปกรณ์จัดเก็บข้อมูลที่มีความจุสูงและหน่วยความจําที่มีแบนด์วิดธ์สูง
ตระกูลผลิตภัณฑ์ Intel Max ซีรี่ส์ทั้งหมดเป็นหนึ่งเดียวโดย oneAPI สําหรับรูปแบบการเขียนโปรแกรมที่ใช้มาตรฐานเปิดทั่วไปเพื่อปลดปล่อยประสิทธิภาพและประสิทธิผล เครื่องมือ Intel oneAPI ประกอบด้วยคอมไพเลอร์ขั้นสูง ไลบรารี ตัวสร้างโปรไฟล์ และเครื่องมือการย้ายรหัสเพื่อย้ายรหัส CUDA เพื่อเปิด C++ ด้วย SYCL ได้อย่างง่ายดาย นักพัฒนาสามารถใช้การเร่งความเร็วแบบ Drop-in สําหรับการวิเคราะห์ข้อมูลและเวิร์กโฟลว์การเรียนรู้ของเครื่องด้วยการใช้เฟรมเวิร์กการเรียนรู้เชิงลึกที่ปรับให้เหมาะสมกับ oneAPI และไลบรารีการเรียนรู้ของเครื่อง
แนวทางมาตรฐานแบบเปิดที่ใช้งานง่ายช่วยลดเวลาในการพัฒนา ความซับซ้อนและค่าใช้จ่าย และช่วยให้นักพัฒนาสามารถเอาชนะข้อจํากัดของสภาพแวดล้อมที่เป็นกรรมสิทธิ์ที่จํากัดความสามารถในการพกพาของโค้ด
สําหรับเครื่องมือสําหรับนักพัฒนาซอฟต์แวร์ HPC และ AI ล่าสุด โปรดไปที่ ซอฟต์แวร์สําหรับ Intel Data Center GPU ซีรีส์ GPU Max
ผลิตภัณฑ์ Intel Data Center Max Series และความยืดหยุ่นของฟอร์มแฟคเตอร์
GPU ซีรีส์ Intel Max มีให้เลือกหลายฟอร์มแฟคเตอร์:
- Intel® Data Center Max 1100 GPU: การ์ด PCIe กว้าง 300 วัตต์พร้อม 56 Xe Core และหน่วยความจํา HBM2E ขนาด 48 GB สามารถเชื่อมต่อการ์ดหลายใบผ่าน Intel Xe Link Bridges ได้
- Intel® Data Center Max 1350 GPU: โมดูล OAM ขนาด 450 วัตต์ที่มี 112 Xe Core และ HBM ขนาด 96 GB
- Intel® Data Center Max 1550 GPU: โมดูล OAM ขนาด 600 วัตต์ประสิทธิภาพสูงสุดของ Intel พร้อม 128 Xe Core และ HBM ขนาด 128 GB
- ระบบย่อย Intel® Data Center Max พร้อมบอร์ดผู้ให้บริการ x4 GPU OAM และ Intel Xe Link เพื่อเปิดใช้งานการสื่อสารหลาย GPU ภายในระบบย่อย