ID บทความ: 000088030 ประเภทข้อมูล: การแก้ไขปัญหา การตรวจสอบครั้งล่าสุด: 15/05/2023

ทําไมการใช้น้ําหนักที่แตกต่างกันกับรุ่นจึงส่งผลต่อประสิทธิภาพการอนุมาน

BUILT IN - ARTICLE INTRO SECOND COMPONENT
สรุปข้อมูล

การแลกเปลี่ยนการใช้รูปแบบข้อมูลและน้ําหนักที่แตกต่างกัน

คำอธิบาย
  1. สร้างไฟล์ IR สองไฟล์ (ไฟล์ .xml เดียวกัน แต่สร้างไฟล์ .bin ที่แตกต่างกัน)
  2. โมเดลที่คล้ายกันที่มีน้ําหนักต่างกันทํางานที่ fps ต่างกัน ( 27fps และ 6fps)
  3. น้ําหนักที่มีความหลากหลายมากขึ้นส่งผลต่อประสิทธิภาพการอนุมานใน Myriad X หรือไม่
ความละเอียด

น้ําหนักและความแม่นยําของรุ่น (FP32, FP16, INT8) ส่งผลต่อประสิทธิภาพการอนุมาน

การใช้รูปแบบ FP32 จะส่งผลให้มีการกระจายน้ําหนักทั้งหมดและเป็นที่รู้จักในชื่อ Single Precision Floating Point

ในขณะเดียวกัน รูปแบบ FP16 และ INT8 ก็เป็นทั้งรูปแบบน้ําหนักที่ถูกบีบอัดเมื่อถูกบีบเพื่อให้มีขนาดเล็กลง การแลกเปลี่ยนสําหรับการบีบอัดเหล่านี้เป็นความแม่นยําของรุ่นหรือที่เรียกว่า ข้อผิดพลาดของ Quantization

บิตที่จัดสรรให้แสดงถึงข้อมูลมากขึ้น ช่วงที่กว้างขึ้นที่พวกเขาสามารถแสดงถึงและอาจมีความเที่ยงตรงที่ดีกว่าของรุ่น อย่างไรก็ตาม ข้อมูลที่ใหญ่ขึ้นต้องใช้พื้นที่หน่วยความจําที่ใหญ่ขึ้นสําหรับอุปกรณ์จัดเก็บข้อมูล และแบนด์วิดธ์หน่วยความจําที่สูงขึ้นที่จําเป็นในการถ่ายโอนข้อมูลไปรอบๆ และทรัพยากรการประมวลผลและเวลาที่ใช้มากขึ้น

ผลลัพธ์การวัดประสิทธิภาพ Intel® ดิสทริบิวชันของชุดเครื่องมือ OpenVINO™แสดงถึงความแตกต่างที่ชัดเจนในแง่ของประสิทธิภาพระหว่างรูปแบบน้ําหนักหรือความแม่นยําที่แตกต่างกัน

ผลิตภัณฑ์ที่เกี่ยวข้อง

บทความนี้จะนำไปใช้กับ 2 ผลิตภัณฑ์

เนื้อหาในหน้านี้เป็นการผสมผสานระหว่างการแปลเนื้อหาต้นฉบับภาษาอังกฤษโดยมนุษย์และคอมพิวเตอร์ เนื้อหานี้จัดทำขึ้นเพื่อความสะดวกของคุณและเพื่อเป็นข้อมูลทั่วไปเท่านั้นและไม่ควรอ้างอิงว่าสมบูรณ์หรือถูกต้อง หากมีความขัดแย้งใด ๆ ระหว่างเวอร์ชันภาษาอังกฤษของหน้านี้กับคำแปล เวอร์ชันภาษาอังกฤษจะมีผลเหนือกว่าและควบคุม ดูเวอร์ชันภาษาอังกฤษของหน้านี้