ข้ามไปที่เนื้อหาหลัก
ฐานความรู้เกี่ยวกับการสนับสนุน

ทําไมเวลาโหลดโมเดลถึง GPU นานกว่า CPU

ประเภทเนื้อหา: การบำรุงรักษาและประสิทธิภาพ   |   ID บทความ: 000057525   |   การตรวจสอบครั้งล่าสุด: 05/03/2026

สิ่งแวดล้อม

ชุดเครื่องมือ OpenVINO™ ปลั๊กอิน GPU ปลั๊กอิน CPU

คำอธิบาย

การโหลด Intermediate Representation (IR) ของโมเดลอินพุตไปยัง GPU ใช้เวลานานกว่าการโหลดโมเดลเดียวกันไปยัง CPU

ความละเอียด

สร้างไดเรกทอรีcl_cacheด้วยตนเองในไดเรกทอรีที่ใช้งานได้ของแอปพลิเคชันของคุณ

ไดรเวอร์จะใช้ไดเรกทอรีนี้เพื่อเก็บการแสดงไบนารีของเคอร์เนลที่คอมไพล์ การดําเนินการนี้จะได้กับระบบปฏิบัติการที่รองรับทั้งหมด

หรือตั้งค่าตัวแปรสภาพแวดล้อม:

export INTEL_OPENCL_CACHE=1

ข้อมูลเพิ่มเติม

โปรดดูบทความนี้สําหรับภาพรวมการแคชโมเดลเพื่อเพิ่มประสิทธิภาพสําหรับความหน่วงแฝง

การโหลดรูปแบบอินพุตของคุณในรูปแบบ Intermediate Representation (IR) ไปยัง GPU ใช้เวลานานกว่าการโหลดโมเดลเดียวกันไปยัง CPU เนื่องจากสแต็ค GPU เป็นไปตาม OpenCL* เวลาการโหลดขึ้นอยู่กับเวลาการคอมไพล์ของเคอร์เนล OpenCL*

เมื่อคุณเปิดใช้งาน cl_cache ในครั้งแรกที่คุณโหลดแบบจําลอง ไฟล์นั้นจะยังใช้เวลานานเนื่องจากเคอร์เนล OpenCL* จะคอมไพล์ อย่างไรก็ตามการโหลดที่ตามมาของแต่ละรุ่นจะเร็วขึ้นมาก

สําหรับการกําหนดค่าแคชที่ตั้งโปรแกรมใน OpenVINO™ 2026.0:
core.set_property("GPU", {"CACHE_DIR": "./cl_cache"})

ข้อมูลที่เกี่ยวข้อง

เอกสารประกอบปลั๊กอิน OpenVINO™ 2026.0 GPU

ผลิตภัณฑ์ที่เกี่ยวข้อง

บทความนี้จะนำไปใช้กับผลิตภัณฑ์ 1 รายการ

ข้อสงวนสิทธิ์

เนื้อหาในหน้านี้เป็นการผสมผสานระหว่างการแปลเนื้อหาต้นฉบับภาษาอังกฤษโดยมนุษย์และคอมพิวเตอร์ เนื้อหานี้จัดทำขึ้นเพื่อความสะดวกของคุณและเพื่อเป็นข้อมูลทั่วไปเท่านั้นและไม่ควรอ้างอิงว่าสมบูรณ์หรือถูกต้อง หากมีความขัดแย้งใด ๆ ระหว่างเวอร์ชันภาษาอังกฤษของหน้านี้กับคำแปล เวอร์ชันภาษาอังกฤษจะมีผลเหนือกว่าและควบคุม ดูเวอร์ชันภาษาอังกฤษของหน้านี้

ต้องการความช่วยเหลือเพิ่มเติมหรือไม่

ติดต่อฝ่ายสนับสนุน
ติดต่อฝ่ายสนับสนุน