ความหน่วงแฝงจะวัดเวลาการอนุมานที่ต้องใช้ในการประมวลผลอินพุตเดียวหากอนุมานซิงโครนัส
เมื่อเรียกใช้งานการวัดประสิทธิภาพ OpenVINO™ด้วยพารามิเตอร์เริ่มต้น จะเป็นการละเมิดในโหมดอะซิงโครนัส ดังนั้นความหน่วงแฝงที่เกิดขึ้นจะวัดเวลาการอนุมานทั้งหมดที่จําเป็นในการประมวลผลจํานวนคําขอการอนุมาน
นอกจากนี้ เมื่อเรียกใช้งานแอพการวัดประสิทธิภาพบน CPU ที่มีพารามิเตอร์เริ่มต้น จะมีการสร้างคําขอการอนุมาน 4 รายการ ในขณะที่มีการสร้างคําขอการอนุมาน 16 คําขอหากเรียกใช้งานแอป Benchmark บน GPU ด้วยพารามิเตอร์เริ่มต้น ดังนั้น ความหน่วงแฝงที่เกิดขึ้นของการอนุมานบน GPU จึงสูงกว่า CPU
ระบุ จํานวนคําขอการอนุมานเท่ากันเมื่อใช้งานแอพวัดประสิทธิภาพบน CPU และ GPU เพื่อการเปรียบเทียบอย่างเป็นธรรม:
benchmark_app.exe -m model.xml -d CPU -nireq 4
benchmark_app.exe -m model.xml -d CPU -nireq 4