ขั้นตอนด่วนเพื่อปรับปรุงเวลาในการโหลดโมเดลบน GPU
การโหลด Intermediate Representation (IR) ของโมเดลอินพุตไปยัง GPU ใช้เวลานานกว่าการโหลดรุ่นเดียวกันไปยัง CPU
สร้างไดเรกทอรี cl_cache ด้วยตนเองในไดเรกทอรีการทํางานของแอปพลิเคชันของคุณ
ไดรเวอร์จะใช้ไดเรกทอรีนี้เพื่อจัดเก็บตัวแทนไบนารีของเคอร์เนลที่คอมไพล์แล้ว การดําเนินการนี้จะทํางานได้กับระบบปฏิบัติการที่รองรับทั้งหมด
โปรดดู บทความนี้สําหรับข้อมูลเพิ่มเติมเกี่ยวกับการจัดการ cl_cache
การโหลดรูปแบบอินพุตของคุณในรูปแบบ Intermediate Representation (IR) ไปยัง GPU ใช้เวลานานกว่าการโหลดรุ่นเดียวกันไปยัง CPU เนื่องจากสแต็ก GPU อิงตาม OpenCL* เวลาโหลดขึ้นอยู่กับเวลาคอมไพล์ของเคอร์เนล OpenCL*
เมื่อคุณเปิดใช้งาน cl_cache ในครั้งแรกที่คุณโหลดโมเดล เคอร์เนล OpenCL* จะคอมไพล์ อย่างไรก็ตาม แต่ละโหลดของรุ่นเดียวกันจะเร็วขึ้นมาก