โปรเซสเซอร์ Intel® Xeon® Scalable และ Intel® Advanced Matrix Extensions
เวิร์กโหลดการเรียนรู้เชิงลึก เช่น งานที่ต้องอาศัย AI เชิงการสร้าง โมเดลภาษาขนาดใหญ่ (LLM) และคอมพิวเตอร์วิทัศน์ อาจมีการประมวลผลที่เข้มข้นอย่างไม่น่าเชื่อ โดยต้องการประสิทธิภาพในระดับสูง และมักจะต้องใช้ฮาร์ดแวร์พิเศษเพิ่มเติมเพื่อให้แน่ใจว่าการปรับใช้ AI จะประสบความสำเร็จ ต้นทุนที่เกี่ยวข้องของข้อกำหนดเหล่านี้อาจเพิ่มขึ้นอย่างรวดเร็ว และการเพิ่มโซลูชันฮาร์ดแวร์แยกสามารถสร้างชั้นของปัญหาความซับซ้อนและความเข้ากันได้ที่ไม่จำเป็น
เพื่อช่วยให้เวิร์กโหลดการเรียนรู้เชิงลึกของคุณมีประสิทธิภาพและคุ้มค่ามากขึ้น ตลอดจนฝึกอบรมและปรับใช้ได้ง่ายขึ้น Intel® AMX บนโปรเซสเซอร์ปรับขนาดได้ Intel® Xeon® มอบการเร่งความเร็วสำหรับการอนุมานและการฝึกอบรม ในขณะเดียวกันก็ลดความจำเป็นในการใช้ฮาร์ดแวร์พิเศษให้เหลือน้อยที่สุด
Intel® AMX เป็นหนึ่งในสองเอนจิน Intel® AI ที่รวมอยู่ในโปรเซสเซอร์ Intel Xeon เจนเนอเรชั่น 4, Intel Xeon เจนเนอเรชั่น 5 และ Intel® Xeon® 6 ที่มี P-core ที่สามารถช่วยให้คุณใช้ CPU ให้เกิดประโยชน์สูงสุดเพื่อขับเคลื่อนการฝึกอบรม AI และการอนุมานเวิร์กโหลดในวงกว้างเพื่อประโยชน์ต่างๆ รวมถึงประสิทธิภาพที่ดีขึ้น การอนุมานลดลง การฝึกอบรม และ ต้นทุนการใช้งาน และต้นทุนรวมในการเป็นเจ้าของ (TCO) ที่ลดลง เนื่องจากเป็นตัวเร่งความเร็วในตัวซึ่งอยู่บนแต่ละคอร์ของ CPU และวางไว้ใกล้กับหน่วยความจำระบบ Intel® AMX มักจะมีความซับซ้อนในการใช้งานน้อยกว่าตัวเร่งความเร็วแบบแยก ซึ่งส่งผลให้ใช้เวลาในการประเมินค่าเร็วขึ้น
แม้ว่าจะมีหลายวิธีที่องค์กรสามารถรองรับปริมาณงาน AI ขั้นสูงได้ รากฐานที่ใช้โปรเซสเซอร์ที่ปรับขนาดได้ Intel® Xeon® พร้อมตัวเร่งความเร็ว AI ที่ทรงพลังและบูรณาการสามารถช่วยให้คุณบรรลุการฝึกอบรมและการอนุมานวัตถุประสงค์ด้านประสิทธิภาพ ในขณะเดียวกันก็ลดความซับซ้อนของระบบและการปรับใช้และต้นทุนการดำเนินงานสำหรับผลตอบแทนในธุรกิจที่มากขึ้น
วิธีการทำงานของ Intel® AMX
Intel® AMX คือบล็อกฮาร์ดแวร์เฉพาะที่พบในคอร์โปรเซสเซอร์ปรับขนาดได้ Intel® Xeon® Scalable ที่ช่วยเพิ่มประสิทธิภาพและเร่งการฝึกอบรมการเรียนรู้เชิงลึกและการอนุมานเวิร์กโหลดที่ต้องอาศัยคณิตศาสตร์เมทริกซ์
Intel® AMX ช่วยให้เวิร์กโหลด AI ทำงานบน CPU แทนที่จะถ่ายโอนไปยังตัวเร่งความเร็วแบบแยก ซึ่งช่วยเพิ่มประสิทธิภาพได้อย่างมาก2 สถาปัตยกรรมของ Intel® AMX รองรับประเภทข้อมูล BF16 (การฝึกอบรม/การอนุมาน) และ int8 (การอนุมาน) และประกอบด้วยองค์ประกอบหลักสองประการ:
- ไทล์: ประกอบด้วยรีจิสเตอร์สองมิติจำนวนแปดรายการ โดยแต่ละเรจิสเตอร์มีขนาด 1 กิโลไบต์ ซึ่งจัดเก็บข้อมูลชิ้นใหญ่
- การคูณเมทริกซ์ไทล์ (TMUL): TMUL เป็นเอนจิ้นตัวเร่งความเร็วที่ติดอยู่กับไทล์ที่ทำการคำนวณการคูณเมทริกซ์สำหรับ AI
ส่วนประกอบเหล่านี้ร่วมกันช่วยให้ Intel® AMX สามารถจัดเก็บข้อมูลได้มากขึ้นในแต่ละคอร์ และคำนวณเมทริกซ์ขนาดใหญ่กว่าในการดำเนินการเดียว นอกจากนี้ Intel® AMX ยังได้รับการออกแบบทางสถาปัตยกรรมให้ขยายและปรับขนาดได้อย่างเต็มที่
ข้อดีของ Intel® AMX สำหรับผลลัพธ์ทางธุรกิจที่ดีขึ้น
Intel® AMX ช่วยให้โปรเซสเซอร์ปรับขนาดได้ Intel® Xeon® เพิ่มประสิทธิภาพการฝึกอบรมการเรียนรู้เชิงลึกและการอนุมานเวิร์กโหลดโดยสร้างสมดุลการอนุมาน ซึ่งเป็นกรณีการใช้งานที่โดดเด่นที่สุดสำหรับ CPU ในแอปพลิเคชัน AI พร้อมความสามารถที่มากขึ้นสำหรับการฝึกอบรม
ลูกค้า Intel จำนวนมากใช้ประโยชน์จาก Intel® AMX เพื่อสร้างผลลัพธ์ที่ดีขึ้นสำหรับองค์กรของตน โปรเซสเซอร์ Intel® Xeon® 6 พร้อม P-core สามารถมอบประสิทธิภาพ GPT-J-6B (bf16) ที่สูงขึ้น 2 เท่าเมื่อเทียบกับ Intel Xeon เจนเนอเรชั่น 5 โดยมุ่งเน้นไปที่เวิร์กโหลด GenAI3 ประสบการณ์ Intel® Xeon® เจนเนอเรชั่น 5 ช่วยให้ลูกค้าสามารถใช้งานการฝึก และการอนุมานที่ดีขึ้นสูงสุด 14 เท่า เมื่อเทียบกับโปรเซสเซอร์ Intel® Xeon® เจนเนอเรชั่น 34
ข้อดีหลักของ Intel® AMX ประกอบด้วย:
- ประสิทธิภาพดีขึ้น
การเร่งความเร็วที่ใช้ CPU สามารถปรับปรุงประสิทธิภาพการใช้พลังงานและทรัพยากร จึงทำให้คุณได้รับประสิทธิภาพมากขึ้นในราคาเท่าเดิม
ตัวอย่างเช่น Intel® Xeon® Platinum 8592+ เจนเนอเรชั่น 5 ที่ใช้งาน Intel® AMX BF16 มีประสิทธิภาพการอนุมานการรู้จำเสียงแบบเรียลไทม์สูงสุด 10.7 เท่า (RNN-T) และมีประสิทธิภาพ/วัตต์สูงกว่า 7.9 เท่า เมื่อเทียบกับโปรเซสเซอร์ Intel® Xeon® เจนเนอเรชั่น 3 ที่ใช้งาน FP325 - ต้นทุนโดยรวมในการเป็นเจ้าของที่ลดลง (TCO)
โปรเซสเซอร์ปรับขนาดได้ Intel® Xeon® พร้อมด้วย Intel® AMX ช่วยให้สามารถปรับปรุงประสิทธิภาพได้หลายอย่าง ซึ่งจะช่วยลดต้นทุน ลด TCO และทำให้เป้าหมายด้านความยั่งยืนรุดหน้า
ในฐานะตัวเร่งความเร็วแบบผสานรวมบนโปรเซสเซอร์ปรับขนาดได้ Intel® Xeon® ที่คุณอาจมีอยู่แล้ว Intel® AMX ช่วยให้คุณเพิ่มการลงทุนที่คุณได้ทำไปแล้วให้สูงสุดและรับประโยชน์เพิ่มเติมจาก CPU ของคุณ โดยขจัดต้นทุนและความซับซ้อนที่มักเกี่ยวข้องกับการเพิ่มตัวเร่งความเร็วแบบแยกส่วน
โปรเซสเซอร์ Intel® Xeon® แบบปรับขนาดได้ พร้อมด้วย Intel® AMX ยังสามารถมอบสถาปัตยกรรมเซิร์ฟเวอร์ที่คุ้มค่ากว่า เมื่อทียบกับตัวเลือกอื่นๆ ที่มีให้เลือก โดยให้ประโยชน์ทั้งในด้านพลังงานและการลดการปล่อยก๊าซเรือนกระจก
เมื่อเปรียบเทียบกับเซิร์ฟเวอร์ AMD Genoa 9654 โปรเซสเซอร์ Intel® Xeon® Platinum เจนเนอเรชั่น 5 ที่ใช้งาน Intel® AMX ส่งมอบประสิทธิภาพการอนุมานการประมวลผลภาษาตามธรรมชาติแบบชุด (BERT-Large) ได้สูงกว่าสูงสุด 2.69 เท่า และประสิทธิภาพ/วัตต์สูงกว่า 2.96 เท่า6 - เวลาการพัฒนาลดลง
เพื่อลดความซับซ้อนของกระบวนการพัฒนาแอปพลิเคชันการเรียนรู้เชิงลึก เราทำงานอย่างใกล้ชิดกับชุมชนโอเพ่นซอร์ส รวมถึงโครงการ TensorFlow และ PyTorch เพื่อปรับเฟรมเวิร์กให้เหมาะสมสำหรับฮาร์ดแวร์ Intel® อัปสตรีมการเพิ่มประสิทธิภาพและคุณสมบัติใหม่ล่าสุดของเรา เพื่อให้พร้อมใช้งานสำหรับนักพัฒนาโปรแกรมโดยทันที สิ่งนี้ช่วยให้คุณสามารถใช้ประโยชน์จากข้อดีด้านประสิทธิภาพของ Intel® AMX ด้วยการเพิ่มโค้ดไม่กี่บรรทัด ซึ่งช่วยลดเวลาในการพัฒนาโดยรวม
เรายังให้การเข้าถึงเครื่องมือ ไลบรารี และทรัพยากรสำหรับการพัฒนาของ Intel® ฟรีอีกด้วย
กรณีการใช้งานการเรียนรู้เชิงลึก Intel® AMX
Intel® AMX สามารถนำไปใช้ในกรณีการใช้งานการเรียนรู้เชิงลึกที่หลากหลาย เพื่อเพิ่มประสิทธิภาพที่สำคัญ ซึ่งส่งผลให้ผู้ใช้ปลายทางและมูลค่าทางธุรกิจมากขึ้น
- ระบบผู้แนะนำ: ใช้ Intel® AMX เป็นโซลูชันที่คุ้มค่ากว่าสำหรับโมเดลผู้แนะนำ AI ที่เพิ่มการตอบสนองของผลิตภัณฑ์ เนื้อหา และคำแนะนำด้านบริการสำหรับกรณีการใช้งาน รวมถึงอีคอมเมิร์ซ โซเชียลมีเดีย การสตรีมความบันเทิง และการธนาคารส่วนบุคคล ตัวอย่างเช่น ผู้ให้บริการเนื้อหามักใช้ Intel® AMX เพื่อเร่งการส่งมอบคำแนะนำภาพยนตร์หรือหนังสือเป้าหมายและโฆษณา หรือเพื่อส่งมอบระบบผู้แนะนำการเรียนรู้เชิงลึกที่คำนึงถึงสัญญาณพฤติกรรมผู้ใช้แบบเรียลไทม์และคุณสมบัติบริบท เช่น เวลาและสถานที่ในบริเวณใกล้เคียง - เรียลไทม์ โปรเซสเซอร์ Intel® Xeon® เจนเนอเรชั่น 5 ส่งมอบประสิทธิภาพการอนุมานระบบการแนะนำ (DLRM) แบบชุดที่สูงกว่าสูงสุดถึง 8.7 เท่า และประสิทธิภาพ/วัตต์ที่สูงกว่าถึง 6.2 เท่า เมื่อเทียบกับโปรเซสเซอร์ Intel® Xeon® เจนเนอเรชั่น 3 ที่ใช้งาน FP327
- การประมวลผลภาษาธรรมชาติ (NLP): เร่งกรณีการใช้งานแบบข้อความเพื่อรองรับและปรับขนาดแอปพลิเคชัน NLP เช่น ที่ใช้ในการดูแลสุขภาพและวิทยาศาสตร์ชีวภาพเพื่อดึงข้อมูลเชิงลึกจากบันทึกทางคลินิกหรือประมวลผลข้อมูลทางการแพทย์จำนวนมาก เพื่อช่วยในการตรวจหาปัญหาสุขภาพตั้งแต่เนิ่นๆ และปรับปรุงการให้การดูแล ในบริการทางการเงิน สามารถใช้ Intel® AMX เพื่อปรับปรุงการตอบสนองของแชทบอทออนไลน์ เพื่อช่วยเชื่อมต่อลูกค้ากับข้อมูลที่พวกเขาต้องการได้รวดเร็วยิ่งขึ้น ในขณะเดียวกันก็ให้พนักงานที่มีจำนวนจำกัดสามารถจัดการกับคำขอที่ซับซ้อนมากขึ้นได้
เช่นเดียวกับสิทธิประโยชน์ในการประหยัดต้นทุนสำหรับระบบผู้แนะนำ Intel® AMX อาจเป็นโซลูชันที่คุ้มต้นทุนมากกว่าสำหรับ NLP ตัวอย่างเช่น ในขณะที่ปรับใช้โมเดลภาษาธรรมชาติ AI BERT-Large นั้น Intel® AMX บนโปรเซสเซอร์ Intel® Xeon® เจนเนอเรชั่น 4 จะช่วยประหยัดต้นทุนได้สูงสุดถึง 79 เปอร์เซ็นต์ เมื่อเทียบกับ AMD Genoa 93548 - AI เชิงการสร้าง: ใช้ประโยชน์จาก Intel® AMX เพื่อเร่งประสิทธิภาพของการฝึกอบรมการเรียนรู้เชิงลึกและเวิร์คโหลดการอนุมานสำหรับกรณีการใช้งาน AI เชิงการสร้าง เช่น การสร้างเนื้อหา รวมถึงรูปภาพ วิดีโอ และเสียง การแปลภาษา การเพิ่มข้อมูล และการสรุป ตัวอย่างเช่น การประเมินประสิทธิภาพของโปรเซสเซอร์ Intel® Xeon® Platinum 8480+ พร้อมด้วย Intel® AMX สำหรับประเภทข้อมูล BF16 เมื่อเปรียบเทียบกับโปรเซสเซอร์ Intel® Xeon® Platinum 8380 สำหรับประเภทข้อมูล FP32 ลดเวลาการสร้างข้อความ Stable Diffusion เป็นรูปภาพเหลือน้อยกว่าห้าวินาที และ การปรับแต่งโมเดล Stable Diffusion ให้ละเอียดเหลือน้อยกว่า 5 นาที9
- คอมพิวเตอร์วิทัศน์: ลดเวลาตั้งแต่การจับภาพวิดีโอและรูปภาพ ไปจนถึงข้อมูลเชิงลึกและการดำเนินการเพื่อมอบประสบการณ์ที่ยอดเยี่ยมให้กับลูกค้า และช่วยให้ธุรกิจของคุณปรับปรุงประสิทธิภาพและลดต้นทุนการดำเนินงาน ตัวอย่างเช่น ในร้านค้าปลีก Intel® AMX สามารถช่วยลดเวลาการทำธุรกรรมให้กับลูกค้าที่ใช้การชำระเงินที่ราบรื่นซึ่งเปิดใช้งานคอมพิวเตอร์วิทัศน์ และสนับสนุนการตรวจสอบชั้นวางแบบเรียลไทม์เพื่อติดตามข้อมูลสินค้าคงคลังและแจ้งพนักงานทันทีเมื่อสินค้าหมด ในการผลิต การวิเคราะห์วิดีโอแบบเร่งด่วนจากกล้องคอมพิวเตอร์วิทัศน์บนแขนหุ่นยนต์สามารถช่วยประหยัดเวลาและต้นทุนด้วยความสามารถในการตรวจจับข้อบกพร่องแบบอัตโนมัติ
หากต้องการค้นหาตัวอย่างเพิ่มเติมว่าลูกค้า Intel® ใช้ Intel® AMX เพื่อขับเคลื่อนผลลัพธ์ทางธุรกิจที่ดีขึ้นได้อย่างไร โปรดไปที่ไลบรารีสปอตไลต์ลูกค้าของเรา
เริ่มต้นด้วย Intel® AMX
เรานำเสนอทรัพยากรการพัฒนาที่หลากหลายเพื่อช่วยให้คุณใช้ประโยชน์จากตัวเร่ง Intel® AMX ในตัวในโปรเซสเซอร์ปรับขนาดได้ Intel® Xeon® ของคุณ
ในการเริ่มต้น ให้อ่านคำแนะนำทีละขั้นตอนเพื่อเพิ่มประสิทธิภาพด้วย Intel® AMX ในคู่มือต่อไปนี้:
- คู่มือเริ่มต้นใช้งานด่วนสำหรับการเพิ่มประสิทธิภาพ Intel® AI: ให้คำแนะนำในการปรับปรุงประสิทธิภาพเวิร์กโหลด AI ด้วยไลบรารีและเฟรมเวิร์ก AI ที่ปรับให้เหมาะสมของ Intel® คู่มือนี้ประกอบด้วยคำแนะนำทีละขั้นตอนสำหรับ TensorFlow, XGBoost, PyTorch และอื่นๆ
- คู่มือการปรับแต่งเพื่อปรับปรุงประสิทธิภาพ AI การเรียนรู้เชิงลึก: เสนอคำแนะนำการปรับแต่งโปรเซสเซอร์สำหรับชุดเครื่องมือ AI ที่ปรับให้เหมาะสมที่สุดของ Intel® เพื่อให้ได้ประสิทธิภาพที่ดีที่สุดเท่าที่จะเป็นไปได้
สำหรับข้อมูลทางเทคนิคเชิงลึก บทช่วยสอน ตัวอย่างโค้ด และโมดูลการทดสอบ ให้เข้าไปที่:
- เฟรมเวิร์ก Intel® AMX AI
- ชุดอุปกรณ์อ้างอิง Intel® AMX AI
- คู่มืออ้างอิงสำหรับนักพัฒนาโปรแกรม Intel® AMX
- ตัวอย่างโค้ด Intel® AMX
คุณสามารถเข้าถึงคู่มือการปรับแต่งทั้งหมดของเราสำหรับโปรเซสเซอร์ปรับขนาดได้ Intel® Xeon® ใน แค็ตตาล็อกเครื่องมือซอฟต์แวร์สำหรับนักพัฒนาโปรแกรมของเรา
เพื่อช่วยคุณปรับปรุงความพยายามในการพัฒนา AI เราขอเสนอชุดเครื่องมือ Intel® oneAPI ส่วนประกอบ และการเพิ่มประสิทธิภาพ ซึ่งรวมถึง:
- ชุดเครื่องมือวิเคราะห์ AI Intel® oneAPI
- Intel® oneAPI Math Kernel Library
- Intel® Extension for TensorFlow
- การปรับประสิทธิภาพ PyTorch จาก Intel
ทดลองใช้ Intel® AMX วันนี้
นอกเหนือจากการอ่านเอกสารอ้างอิงของเรา คุณยังสามารถทดลองใช้ฮาร์ดแวร์ Intel®, Intel® AMX และคุณลักษณะการเร่งความเร็วแบบรวมอื่นๆ โดยใช้ Intel® Developer Cloud
แพลตฟอร์มออนไลน์ฟรีสำหรับการเรียนรู้ การสร้างต้นแบบ การทดสอบ และการรันเวิร์กโหลดนี้ยังรวมถึงการสนับสนุนชุดเครื่องมือ เครื่องมือ และไลบรารีการพัฒนาซอฟต์แวร์ของ Intel® จำนวนหนึ่ง
ขยายและปรับปรุงความสามารถ AI บน CPU ของคุณด้วย Intel® AMX
ในขณะที่องค์กรของคุณมองหาโซลูชันตอบสนองความต้องการด้านคอมพิวเตอร์ที่เพิ่มขึ้นเพื่อรองรับการฝึกอบรมการเรียนรู้เชิงลึกและการอนุมานเวิร์กโหลด, Intel® AMX สามารถช่วยเพิ่มประสิทธิภาพโดยใช้ฮาร์ดแวร์ Intel® ที่คุณอาจเป็นเจ้าของอยู่แล้ว โดยไม่มีค่าใช้จ่ายและความซับซ้อนที่มาพร้อมกับฮาร์ดแวร์พิเศษเพิ่มเติมและในเวลาการพัฒนาน้อยกว่าอย่างเห็นได้ชัด โดยใช้การเพิ่มประสิทธิภาพของ Intel® ในเฟรมเวิร์กโอเพ่นซอร์สยอดนิยม และการเข้าถึงเครื่องมือและทรัพยากรการพัฒนาของ Intel® ฟรี