บทนำ
แพ็คเกจนี้มี Intel® Distribution ซอฟต์แวร์ OpenVINO™ Toolkit เวอร์ชัน 2025.4 สําหรับ Linux*, Windows* และ macOS*
การดาวน์โหลดที่พร้อมให้บริการ
- macOS*
- ขนาด: 43.2 MB
- SHA256: 918A20A6613AA2C690A69CF753403D84970D1787986B1F01C5B951AF9EEFD8EC
- macOS*
- ขนาด: 52.4 MB
- SHA256: 8A5209B22006B1320D28212E825182A4CB5D2B12F318111181044273F91F0471
- Linux*
- ขนาด: 33 MB
- SHA256: 76C1361A31BC0972AB5A2BAB6EFC2CD449D49B728DE4AA7F33EBC0F5895764A9
- ขนาด: 57.5 MB
- SHA256: AD8D73B4B0776761633D8FE40167BB3373605AB59998EFC2C2DA428D3DE028DB
- Linux*
- ขนาด: 70.5 MB
- SHA256: D14B59C695312663764903277BC445CBBC0EBBD2789B85905B9273CA269942BE
- Linux*
- ขนาด: 36.7 MB
- SHA256: D51ED6EB38933AD5E6424DEBE734568B758D0FD9B9DF1B21098CFB3F20D20CD3
- Linux*
- ขนาด: 63.8 MB
- SHA256: 0C30763175A0906CDA365751C1B7A986A313FB10A0CEF4E7637FF5034D954034
- Linux*
- ขนาด: 58.6 MB
- SHA256: C57BC759A04BF316D66DC42D644433CF3BD590AD640933630A0616EFB380A630
- Microsoft Windows*
- ขนาด: 125.6 MB
- SHA256: 995A88DC1E34DF841CC4DB5AB118A87147608C3E4B67F7D9D86BEF1B311A273E
- Microsoft Windows*
- ขนาด: 682.1 MB
- SHA256: 74B072736A803846EFF819BE353709ADBEA60020DC5D41AAF4B509C3697FEF5A
คำอธิบายโดยละเอียด
มีอะไรใหม่
- การผสานรวมความครอบคลุมและเฟรมเวิร์ก Gen AI ที่มากขึ้นเพื่อลดการเปลี่ยนแปลงรหัส
- รุ่นใหม่ที่รองรับ:
- บน CPU และ GPU: Qwen3-Embedding-0.6B, Qwen3-Reranker-0.6B, Mistral-Small-24B-Instruct-2501
- บน NPU: Gemma-3-4b-it และ Qwen2.5-VL-3B-Instruct
- ดูตัวอย่าง: ผสมผสานระหว่างโมเดลผู้เชี่ยวชาญ (MoE) ที่ปรับให้เหมาะสําหรับ CPU และ GPU ที่ผ่านการตรวจสอบสําหรับ Qwen3-30B-A3B
- การผสานรวมไปป์ไลน์ GenAI: Qwen3-Embedding-0.6B และ Qwen3-Reranker-0.6B สําหรับการเรียก/การจัดอันดับที่ได้รับการปรับปรุง และ Qwen2.5VL-7B สําหรับไปป์ไลน์วิดีโอ
- รุ่นใหม่ที่รองรับ:
- รองรับโมเดล LLM ที่กว้างขึ้นและเทคนิคการบีบอัดแบบจําลองมากขึ้น
- การรองรับ Gold สําหรับ Windows ML* ช่วยให้นักพัฒนาสามารถปรับใช้โมเดล AI และแอปพลิเคชันได้ง่ายดายบน CPU, GPU และ NPU บนพีซี AI ที่ขับเคลื่อนด้วยโปรเซสเซอร์ Intel® Core™ Ultra
- Neural Network Compression Framework (NNCF) ONNX backend ตอนนี้รองรับ INT8 static post-training quantization (PTQ) และการบีบอัดเฉพาะน้ําหนัก INT8/INT4 เพื่อให้มั่นใจในความถูกต้องพาริตี้ด้วยรูปแบบ IR OpenVINO เพิ่มการรองรับอัลกอริธึม SmoothQuant สําหรับการกําหนดปริมาณ INT8
- การสร้างโทเค็นหลายโทเค็นที่เร่งความเร็วสําหรับ GenAI โดยใช้ประโยชน์จากเคอร์เนล GPU ที่ปรับให้เหมาะสมเพื่อมอบการอนุมานที่เร็วขึ้น การใช้แคช KV-แคชที่ชาญฉลาดยิ่งขึ้น และประสิทธิภาพ LLM ที่ปรับขนาดได้
- การอัพเดทปลั๊กอิน GPU รวมถึงประสิทธิภาพที่ดีขึ้นด้วยการแคชคํานําหน้าสําหรับสถานการณ์ประวัติการแชทและความแม่นยําของ LLM ที่ปรับปรุงใหม่พร้อมรองรับการใช้ปริมาณแบบไดนามิกสําหรับ INT8
- ความสามารถในการพกพาและประสิทธิภาพที่มากขึ้นเพื่อใช้งาน AI ที่ Edge ในระบบคลาวด์หรือในพื้นที่
- ประกาศการสนับสนุนโปรเซสเซอร์ Intel® Core™ Ultra ซีรีส์ 3
- เพิ่มการรองรับรูปแบบ Blob ที่เข้ารหัสเพื่อการปรับใช้โมเดลที่ปลอดภัยด้วย OpenVINO™ GenAI น้ําหนักและสิ่งประดิษฐ์ของแบบจําลองจะถูกจัดเก็บและส่งในรูปแบบที่เข้ารหัส ซึ่งช่วยลดความเสี่ยงของการโจรกรรม IP ในระหว่างการปรับใช้ นักพัฒนาสามารถปรับใช้การเปลี่ยนแปลงโค้ดน้อยที่สุดโดยใช้ OpenVINO ไปป์ไลน์ GenAI
- ตอนนี้ OpenVINO™ Model Server และ OpenVINO™ GenAI ได้ขยายการสนับสนุนสถานการณ์ AI แบบ Agentic พร้อมคุณสมบัติใหม่ๆ เช่น การแยกวิเคราะห์เอาต์พุตและเทมเพลตแชทที่ดีขึ้นสําหรับการโต้ตอบแบบมัลติเลี้ยวที่เชื่อถือได้ และฟังก์ชั่นการแสดงตัวอย่างสําหรับรุ่น Qwen3-30B-A3B OVMS ยังแนะนําตัวอย่างสําหรับอุปกรณ์ปลายทางเสียง
- การปรับใช้ NPU ทําได้ง่ายขึ้นด้วยการรองรับแบบชุดช่วยให้สามารถดําเนินการแบบจําลองที่ราบรื่นบนโปรเซสเซอร์ Intel® Core™ Ultra ในขณะที่ขจัดการอ้างอิงไดรเวอร์ โมเดลจะถูกปรับใช้ใหม่ batch_size=1 ก่อนการคอมไพล์
- การรวม NVIDIA Triton Server* ที่ปรับปรุงใหม่กับ OpenVINO Backend ช่วยให้นักพัฒนาสามารถใช้ประโยชน์จาก Intel GPU หรือ NPU สําหรับการปรับใช้ได้
ดูรายละเอียดทั้งหมด ดูบันทึกประจํารุ่น 2025.4
คําแนะนําในการติดตั้ง
คุณสามารถเลือกวิธีการติดตั้ง OpenVINO™ Runtime จาก Archive* ตามระบบปฏิบัติการของคุณ:
- ติดตั้ง OpenVINO Runtime บน Linux*
- ติดตั้ง OpenVINO Runtime บน Windows*
- ติดตั้ง OpenVINO Runtime บน macOS*
สิ่งที่รวมอยู่ในแพ็คเกจดาวน์โหลด (Archive File)
- เสนอทั้ง C/C++ และ Python APIs
- นอกจากนี้ ยังมีตัวอย่างโค้ดด้วย
ลิงก์ที่เป็นประโยชน์
โน้ต: ลิงก์จะเปิดขึ้นในหน้าต่างใหม่
ข้อสงวนสิทธิ์1
ข้อมูลผลิตภัณฑ์และประสิทธิภาพ
Intel กำลังดำเนินการลบภาษาที่ไม่รวมทุกเพศออกจากเอกสาร อินเทอร์เฟซผู้ใช้ และโค้ดปัจจุบันของเรา โปรดทราบว่าการเปลี่ยนแปลงย้อนหลังอาจไม่สามารถทำได้เสมอไป และอาจยังคงมีภาษาที่ไม่รวมทุกเพศบางส่วนอยู่ในเอกสาร อินเทอร์เฟซผู้ใช้ และโค้ดที่เก่ากว่า
เนื้อหาในหน้านี้เป็นการผสมผสานระหว่างการแปลเนื้อหาต้นฉบับภาษาอังกฤษโดยมนุษย์และคอมพิวเตอร์ เนื้อหานี้จัดทําขึ้นเพื่อความสะดวกของคุณและเพื่อเป็นข้อมูลทั่วไปเท่านั้นและไม่ควรพึ่งพาความสมบูรณ์หรือความถูกต้อง หากมีความขัดแย้งใด ๆ ระหว่างเวอร์ชันภาษาอังกฤษของหน้านี้กับคําแปล เวอร์ชันภาษาอังกฤษจะมีผลบังคับและควบคุม ดูเวอร์ชันภาษาอังกฤษของหน้านี้