ทําไมรูปแบบโมเดล Quantized จึงยังคงใช้ FP32 แทน INT8
ประเภทข้อมูล: ข้อมูลผลิตภัณฑ์และเอกสารประกอบ | ID บทความ: 000095064 | การตรวจสอบครั้งล่าสุด: 13/06/2023
ในระหว่างการแบ่งปริมาณเฉพาะการดําเนินงานที่จําเป็นในมุมมองของประสิทธิภาพกําลังถูกวัดปริมาณ การดําเนินการที่เหลืออยู่จะยังคงเป็น FP32 ในเอาต์พุต