เอฟพีจีเอเทียบกับ GPU

เอฟพีจีเอเทียบกับ GPU ในด้านการเรียนรู้เชิงลึก

เอฟพีจีเอเป็นตัวเลือกที่ยอดเยี่ยมสำหรับแอปพลิเคชั่นการเรียนรู้เชิงลึกที่ต้องการความหน่วงแฝงต่ำและความยืดหยุ่น

ข้อดีของการเรียนรู้เชิงลึกเอฟพีจีเอ:

  • เอฟพีจีเอส่งมอบความยืดหยุ่น และประหยัดพลังงานได้อย่างน่าทึ่งด้วยวงจรที่สามารถตั้งโปรแกรมใหม่ให้ใช้งานได้หลากหลายฟังก์ชั่น

  • เมื่อเปรียบเทียบกับ GPU เอฟพีจีเอสามารถส่งมอบประสิทธิภาพที่เหนือชั้นในแอปพลิเคชั่นการเรียนรู้เชิงลึกที่จำเป็นต้องมีความหน่วงแฝงต่ำ

  • เอฟพีจีเอรองรับการปรับแต่งอย่างละเอียดเพื่อให้เกิดความสมดุลระหว่างสมรรถนะการใช้พลังงานและข้อกำหนดด้านประสิทธิภาพ

author-image

โดย

FPGA คืออะไร

Field Programmable Gate Array (FPGA) เป็นวงจรในตัวที่มีแฟบริกฮาร์ดแวร์ที่ตั้งโปรแกรมได้ วงจรภายในชิปเอฟพีจีเอแตกต่างจากหน่วยประมวลผลกราฟิก (GPU) หรือ ASIC ตรงที่ไม่ได้มีการสลักไว้อย่างแน่นหนา ซึ่งช่วยให้สามารถตั้งโปรแกรมใหม่ได้ตามต้องการ ขีดความสามารถนี้ทำให้เอฟพีจีเอเป็นตัวเลือกที่ยอดเยี่ยมแทน ASIC ซึ่งต้องใช้เวลาในการพัฒนาที่ยาวนาน และต้องมีการลงทุนจำนวนมากในการออกแบบและผลิต

อุตสาหกรรมเทคโนโลยีได้นำเอฟพีจีเอมาปรับใช้สำหรับการเรียนรู้ของเครื่องและการเรียนรู้เชิงลึกเมื่อเร็วๆ นี้ ในปี 2010 Microsoft Research ได้แสดงให้เห็นถึงกรณีการใช้งานครั้งแรกของ AI ใน FPGAs ซึ่งเป็นส่วนหนึ่งของความพยายามในการเร่งการค้นหา1เว็บFPGAs นําเสนอการผสมผสานระหว่างความเร็ว ความสามารถในการตั้งโปรแกรม และความยืดหยุ่น ซึ่งให้ประสิทธิภาพโดยไม่มีค่าใช้จ่ายและความซับซ้อนของการพัฒนาวงจรรวมเฉพาะแอพพลิเคชั่น (ASIC) แบบกําหนดเอง ห้าปีต่อมา Bing เครื่องมือค้นหาของ Microsoft ได้ใช้เอฟพีจีเอในการผลิต ซึ่งพิสูจน์คุณค่าของเอฟพีจีเอสำหรับแอปพลิเคชั่นการเรียนรู้เชิงลึก ด้วยการใช้ FPGAs เพื่อเร่งอันดับการค้นหา Bing ตระหนักถึงอัตราความเร็วที่เพิ่มขึ้น 50 เปอร์เซ็นต์

ทำไมถึงเลือกเอฟพีจีเอสำหรับการเรียนรู้เชิงลึก

เวิร์กโหลด AI ในระยะเริ่มแรก เช่น การรู้จำรูปภาพ จำเป็นต้องใช้การประมวลผลแบบขนานอย่างมาก ทั้งนี้เนื่องจาก GPU ได้รับการออกแบบมาเพื่อเรนเดอร์วิดีโอและกราฟิกโดยเฉพาะ การใช้ GPU สำหรับการเรียนรู้ของเครื่องและการเรียนรู้เชิงลึกจึงได้รับความนิยมขึ้นมา GPU เชี่ยวชาญในการประมวลผลแบบขนาน โดยดำเนินการทางคณิตศาสตร์จำนวนมากในแบบขนาน กล่าวอีกนัยหนึ่งก็คือ GPU สามารถส่งมอบการเร่งความเร็วได้อย่างเหลือเชื่อ ในกรณีที่ต้องดำเนินการเวิร์กโหลดเดียวกันหลายครั้งติดต่อกันอย่างรวดเร็ว

อย่างไรก็ตาม การเรียกใช้ AI บน GPU ก็มีข้อจำกัด GPU ไม่ได้ส่งมอบประสิทธิภาพมากเท่ากับ ASIC ซึ่งเป็นชิปที่สร้างขึ้นมาเพื่อเวิร์กโหลดการเรียนรู้เชิงลึกดังกล่าว

เอฟพีจีเอนำเสนอการปรับแต่งฮาร์ดแวร์ที่มี AI ในตัว และสามารถตั้งโปรแกรมเพื่อส่งมอบพฤติกรรมเดียวกันกับ GPU หรือ ASIC ได้ ธรรมชาติของเอฟพีจีเอที่ตั้งโปรแกรมและกำหนดค่าใหม่ได้ช่วยให้ภูมิทัศน์ของ AI มีการพัฒนาอย่างรวดเร็ว พร้อมกับช่วยให้นักออกแบบสามารถทดสอบอัลกอริธึมและออกสู่ตลาดได้อย่างรวดเร็ว เอฟพีจีเอมีข้อดีหลายประการสำหรับแอปพลิเคชันการเรียนรู้เชิงลึกและเวิร์กโหลด AI อื่นๆ:

ประสิทธิภาพที่ยอดเยี่ยมพร้อมอัตรารับส่งที่สูงและความหน่วงต่ํา: FPGAs อย่างแท้จริงสามารถมอบความหน่วงแฝงต่ํา รวมทั้งเวลาแฝงที่กําหนดได้สําหรับแอปพลิเคชันแบบเรียลไทม์ เช่น การสตรีมวิดีโอ การถอดเสียง และการจดจําการกระทําโดยการส่งวิดีโอเข้า FPGA โดยตรง เป็นการข้าม CPU นักออกแบบสามารถสร้างโครงข่ายประสาทเทียมตั้งแต่ต้นจนจบ และจัดโครงสร้างเอฟพีจีเอให้เหมาะสมกับโมเดลที่สุดได้
คุ้มค่าและค่าใช้จ่ายที่ยอดเยี่ยม: FPGAs สามารถตั้งโปรแกรมใหม่สําหรับฟังก์ชันการทํางานและประเภทข้อมูลที่แตกต่างกันได้ ทําให้เป็นหนึ่งในตัวเลือกฮาร์ดแวร์ที่คุ้มค่าที่สุดที่มี นอกจากนี้ เอฟพีจีเอยังสามารถนำไปใช้งานอื่นๆ นอกเหนือจาก AI ได้ การผสานรวมขีดความสามารถเพิ่มเติมเข้ากับชิปตัวเดียวกันช่วยให้นักออกแบบสามารถประหยัดต้นทุนและพื้นที่บอร์ดได้ เอฟพีจีเอมีอายุการใช้งานผลิตภัณฑ์ที่ยาวนาน ดังนั้น การออกแบบฮาร์ดแวร์ที่ใช้งานเอฟพีจีเอสามารถมีอายุการใช้งานที่ยาวนานในหลักหลายปีหรือหลักทศวรรษ คุณลักษณะนี้ทำให้เอฟพีจีเอเหมาะสำหรับใช้ในด้านตลาดอุตสาหกรรมการป้องกัน การแพทย์ และยานยนต์
การใช้พลังงานต่ํา: 1.5% ด้วย FPGAs นักออกแบบสามารถปรับแต่งฮาร์ดแวร์ให้เข้ากับแอปพลิเคชันได้ ซึ่งช่วยตอบสนองความต้องการด้านการประหยัดพลังงาน เอฟพีจีเอยังรองรับฟังก์ชันได้หลากหลาย และช่วยประหยัดพลังงานจากชิปได้มากขึ้น โดยสามารถใช้ส่วนหนึ่งของเอฟพีจีเอสำหรับฟังก์ชันหนึ่งๆ แทนที่จะใช้ทั้งชิป ซึ่งช่วยให้เอฟพีจีเอสามารถโฮสต์ฟังก์ชันต่างๆ ในแบบขนานได้

แอปพลิเคชั่น AI และการเรียนรู้เชิงลึกบนเอฟพีจีเอ

เอฟพีจีเอยังนำเสนอข้อได้เปรียบด้านประสิทธิภาพที่เหนือกว่า GPU เมื่อแอปพลิเคชันต้องการความหน่วงแฝงต่ำและขนาดแบตช์ต่ำ ตัวอย่างเช่น เวิร์กโหลดการรู้จำเสียงพูดและการประมวลผลภาษาธรรมชาติอื่นๆ ทั้งนี้เนื่องจากเอฟพีจีเอมีอินเทอร์เฟซ I/O ที่ตั้งโปรแกรมได้และแฟบริคที่มีความยืดหยุ่นสูง เอฟพีจีเอจึงเหมาะอย่างยิ่งสำหรับงานต่อไปนี้:

พิชิตคอขวด I/O เอฟพีจีเอมักถูกนำมาใช้เมื่อข้อมูลต้องเดินทางผ่านหลายเครือข่ายที่แตกต่างกันโดยมีความหน่วงแฝงต่ำ เอฟพีจีเอมีประโยชน์อย่างน่าทึ่งในการกำจัดการบัฟเฟอร์หน่วยความจำ และเอาชนะปัญหาคอขวดของ I/O ซึ่งเป็นหนึ่งในปัจจัยที่จำกัดที่สุดในประสิทธิภาพของระบบ AI การเร่งการนำเข้าข้อมูลช่วยให้เอฟพีจีเอสามารถเร่งความเร็วเวิร์กโฟลว์ AI ทั้งหมดได้
การรวม AI เข้ากับเวิร์กโหลด การใช้เอฟพีจีเอช่วยให้นักออกแบบสามารถเพิ่มขีดความสามารถของ AI เช่น การตรวจสอบแพ็คเก็ตเชิงลึก หรือการตรวจจับการฉ้อโกงทางการเงินให้กับเวิร์กโหลดที่มีอยู่
การเปิดใช้การรวมเซ็นเซอร์ เอฟพีจีเอมีความเชี่ยวชาญ ในขณะจัดการอินพุตข้อมูลจากเซ็นเซอร์หลายตัว เช่น กล้อง, LIDAR และเซ็นเซอร์เสียง ขีดความสามารถนี้มีคุณค่าอย่างยิ่งในการออกแบบยานยนต์ไร้คนขับ หุ่นยนต์ และอุปกรณ์อุตสาหกรรม
ส่งมอบการเร่งความเร็วสำหรับคลัสเตอร์ High Performance Computing (HPC) FPGAs สามารถช่วยอํานวยความสะดวกในการรวมตัวของ AI และ HPC โดยทําหน้าที่เป็นตัวเร่งความเร็วที่ตั้งโปรแกรมได้สําหรับการอนุมาน 2
การเพิ่มขีดความสามารถเพิ่มเติมนอกเหนือจาก AI เอฟพีจีเอช่วยให้สามารถเพิ่มความปลอดภัย I/O ระบบเครือข่าย หรือขีดความสามารถก่อน/หลังการประมวลผลได้โดยไม่ต้องใช้ชิปเพิ่มเติม

ซอฟต์แวร์และฮาร์ดแวร์ของ Intel® FPGA

หนึ่งในอุปสรรคไม่กี่ประการที่ต้องเอาชนะ ขณะใช้งานเอฟพีจีเอก็คือ ฮาร์ดแวร์มักจะต้องอาศัยความเชี่ยวชาญด้านการเขียนโปรแกรมเฉพาะทาง Intel กำลังลดระดับความเชี่ยวชาญที่จำเป็นต้องใช้ด้วยโมเดลการเขียนโปรแกรมแบบใช้ซอฟต์แวร์ โมเดลการเขียนโปรแกรมเอฟพีจีเอที่มีระดับสูงกว่านี้ช่วยให้นักวิทยาศาสตร์ข้อมูล หรือนักพัฒนาโมเดลสามารถสร้างโครงข่ายประสาทเทียมโดยใช้เฟรมเวิร์ก AI ทั่วไป เช่น TensorFlow หรือ Caffe และปรับใช้บนเอฟพีจีเอโดยไม่ทราบรายละเอียดของสถาปัตยกรรมเอฟพีจีเอได้ Intel ได้พัฒนาเครื่องมือหลายอย่างที่ทำให้การเขียนโปรแกรมเอฟพีจีเอง่ายขึ้นอย่างมาก:

Intel® ดิสทริบิวชันของชุดเครื่องมือ OpenVINO™ ช่วยให้นักพัฒนาโปรแกรมคอมพิวเตอร์วิทัศน์มีเครื่องมือในการเร่งความเร็วโมเดลบนแพลตฟอร์มฮาร์ดแวร์หลายรายการ รวมถึง เอฟพีจีเอ
Intel® FPGA AI Suite ส่งมอบเครื่องมือ และสถาปัตยกรรมที่ได้รับการปรับปรุงเพื่อเร่งการอนุมานด้วย Intel® FPGA ซึ่งจะอนุมานกับชุดเครื่องมือ OpenVINO™ เพื่อส่งมอบขีดความสามารถในการปรับขนาดเพื่อสนับสนุนเครือข่ายแบบกำหนดเอง
Open FPGA Stack (OFS) เป็นซอฟต์แวร์โอเพ่นซอร์สและโครงสร้างพื้นฐานฮาร์ดแวร์ที่ส่งมอบเฟรมเวิร์กสำหรับแพลตฟอร์มที่ใช้เอฟพีจีเอ และการพัฒนาเวิร์กโหลดแบบกำหนดเอง ซอร์สโค้ดทั้งหมดมีอยู่บน GitHub

โซลูชันเทคโนโลยีการเรียนรู้เชิงลึก Intel® FPGA ครอบคลุมกลุ่มผลิตภัณฑ์และเครื่องมือซอฟต์แวร์ที่หลากหลายเพื่อช่วยลดเวลาและต้นทุนในการพัฒนา ผลิตภัณฑ์ฮาร์ดแวร์ต่อไปนี้มีคุณค่าสำหรับกรณีการใช้งานการเรียนรู้เชิงลึก:

เอฟพีจีเอ Intel Agilex® 5 และ SoC เป็นเอฟพีจีเอระดับกลางที่มีบล็อก DSP ที่ได้รับการปรับปรุงตัวแรกของอุตสาหกรรมพร้อม AI Tensor ซึ่งมอบฟังก์ชัน AI และการประมวลผลสัญญาณดิจิทัล (DSP) ที่มีประสิทธิภาพสูง ตระกูลผลิตภัณฑ์นี้มอบประสิทธิภาพแฟบริกที่สูงขึ้นโดยเฉลี่ย 50% และการใช้พลังงานรวมที่ต่ํากว่าสูงสุด 42% เมื่อเทียบกับ FPGAs Intel® เจนเนอเรชั่นก่อนหน้า3

กลุ่มผลิตภัณฑ์ Intel สำหรับ AI

ในขณะที่มีการนำ AI มาใช้เพิ่มมากขึ้น แอปพลิเคชันและสภาพแวดล้อมที่หลากหลายตั้งแต่อุปกรณ์ปลายทางไปจนถึงเซิร์ฟเวอร์ Edge ไปจนถึงศูนย์ข้อมูล จะมีความหลากหลายอย่างน่าเหลือเชื่อ ไม่มีสถาปัตยกรรม ชิป หรือฟอร์มแฟคเตอร์ตัวใดตัวหนึ่งที่จะมีคุณสมบัติตรงตามข้อกำหนดของแอปพลิเคชัน AI ทั้งหมด สถาปนิกโครงสร้างพื้นฐานจะสามารถเข้าถึงสถาปัตยกรรมที่ตนเลือกได้

Intel มีชิปประมวลผลสี่ประเภทที่ช่วยให้ AI แพร่หลายได้อย่างกว้างขวาง: เอฟพีจีเอ, GPU และ ASIC สำหรับการเร่งความเร็ว และ CPU สำหรับการประมวลผลทั่วไป สถาปัตยกรรมแต่ละรายการตอบสนองความต้องการที่แตกต่างกัน ดังนั้นสถาปนิกโครงสร้างพื้นฐานจึงสามารถเลือกสถาปัตยกรรมที่ต้องการเพื่อสนับสนุนแอปพลิเคชัน AI ใดๆ ได้ พวกเขาจะได้รับเครื่องมือที่เหมาะสมสำหรับงานเสมอ ด้วยประเภทการประมวลผลที่หลากหลายที่ได้รับการปรับให้เหมาะสมสำหรับพลังงานและประสิทธิภาพ