Intel® Distribution ของชุดเครื่องมือ OpenVINO™

753640
12/1/2025

บทนำ

แพ็คเกจนี้มี Intel® Distribution ซอฟต์แวร์ OpenVINO™ Toolkit เวอร์ชัน 2025.4 สําหรับ Linux*, Windows* และ macOS*

การดาวน์โหลดที่พร้อมให้บริการ

  • macOS*
  • ขนาด: 43.2 MB
  • SHA256: 918A20A6613AA2C690A69CF753403D84970D1787986B1F01C5B951AF9EEFD8EC
  • macOS*
  • ขนาด: 52.4 MB
  • SHA256: 8A5209B22006B1320D28212E825182A4CB5D2B12F318111181044273F91F0471
  • Linux*
  • ขนาด: 33 MB
  • SHA256: 76C1361A31BC0972AB5A2BAB6EFC2CD449D49B728DE4AA7F33EBC0F5895764A9
  • ขนาด: 57.5 MB
  • SHA256: AD8D73B4B0776761633D8FE40167BB3373605AB59998EFC2C2DA428D3DE028DB
  • Linux*
  • ขนาด: 70.5 MB
  • SHA256: D14B59C695312663764903277BC445CBBC0EBBD2789B85905B9273CA269942BE
  • Linux*
  • ขนาด: 36.7 MB
  • SHA256: D51ED6EB38933AD5E6424DEBE734568B758D0FD9B9DF1B21098CFB3F20D20CD3
  • Linux*
  • ขนาด: 63.8 MB
  • SHA256: 0C30763175A0906CDA365751C1B7A986A313FB10A0CEF4E7637FF5034D954034
  • Linux*
  • ขนาด: 58.6 MB
  • SHA256: C57BC759A04BF316D66DC42D644433CF3BD590AD640933630A0616EFB380A630
  • Microsoft Windows*
  • ขนาด: 125.6 MB
  • SHA256: 995A88DC1E34DF841CC4DB5AB118A87147608C3E4B67F7D9D86BEF1B311A273E
  • Microsoft Windows*
  • ขนาด: 682.1 MB
  • SHA256: 74B072736A803846EFF819BE353709ADBEA60020DC5D41AAF4B509C3697FEF5A

คำอธิบายโดยละเอียด

มีอะไรใหม่

  • การผสานรวมความครอบคลุมและเฟรมเวิร์ก Gen AI ที่มากขึ้นเพื่อลดการเปลี่ยนแปลงรหัส
    • รุ่นใหม่ที่รองรับ:
      • บน CPU และ GPU: Qwen3-Embedding-0.6B, Qwen3-Reranker-0.6B, Mistral-Small-24B-Instruct-2501
      • บน NPU: Gemma-3-4b-it และ Qwen2.5-VL-3B-Instruct
    • ดูตัวอย่าง: ผสมผสานระหว่างโมเดลผู้เชี่ยวชาญ (MoE) ที่ปรับให้เหมาะสําหรับ CPU และ GPU ที่ผ่านการตรวจสอบสําหรับ Qwen3-30B-A3B
    • การผสานรวมไปป์ไลน์ GenAI: Qwen3-Embedding-0.6B และ Qwen3-Reranker-0.6B สําหรับการเรียก/การจัดอันดับที่ได้รับการปรับปรุง และ Qwen2.5VL-7B สําหรับไปป์ไลน์วิดีโอ
  • รองรับโมเดล LLM ที่กว้างขึ้นและเทคนิคการบีบอัดแบบจําลองมากขึ้น
    • การรองรับ Gold สําหรับ Windows ML* ช่วยให้นักพัฒนาสามารถปรับใช้โมเดล AI และแอปพลิเคชันได้ง่ายดายบน CPU, GPU และ NPU บนพีซี AI ที่ขับเคลื่อนด้วยโปรเซสเซอร์ Intel® Core™ Ultra
    • Neural Network Compression Framework (NNCF) ONNX backend ตอนนี้รองรับ INT8 static post-training quantization (PTQ) และการบีบอัดเฉพาะน้ําหนัก INT8/INT4 เพื่อให้มั่นใจในความถูกต้องพาริตี้ด้วยรูปแบบ IR OpenVINO เพิ่มการรองรับอัลกอริธึม SmoothQuant สําหรับการกําหนดปริมาณ INT8
    • การสร้างโทเค็นหลายโทเค็นที่เร่งความเร็วสําหรับ GenAI โดยใช้ประโยชน์จากเคอร์เนล GPU ที่ปรับให้เหมาะสมเพื่อมอบการอนุมานที่เร็วขึ้น การใช้แคช KV-แคชที่ชาญฉลาดยิ่งขึ้น และประสิทธิภาพ LLM ที่ปรับขนาดได้
    • การอัพเดทปลั๊กอิน GPU รวมถึงประสิทธิภาพที่ดีขึ้นด้วยการแคชคํานําหน้าสําหรับสถานการณ์ประวัติการแชทและความแม่นยําของ LLM ที่ปรับปรุงใหม่พร้อมรองรับการใช้ปริมาณแบบไดนามิกสําหรับ INT8
  • ความสามารถในการพกพาและประสิทธิภาพที่มากขึ้นเพื่อใช้งาน AI ที่ Edge ในระบบคลาวด์หรือในพื้นที่
    • ประกาศการสนับสนุนโปรเซสเซอร์ Intel® Core™ Ultra ซีรีส์ 3
    • เพิ่มการรองรับรูปแบบ Blob ที่เข้ารหัสเพื่อการปรับใช้โมเดลที่ปลอดภัยด้วย OpenVINO™ GenAI น้ําหนักและสิ่งประดิษฐ์ของแบบจําลองจะถูกจัดเก็บและส่งในรูปแบบที่เข้ารหัส ซึ่งช่วยลดความเสี่ยงของการโจรกรรม IP ในระหว่างการปรับใช้ นักพัฒนาสามารถปรับใช้การเปลี่ยนแปลงโค้ดน้อยที่สุดโดยใช้ OpenVINO ไปป์ไลน์ GenAI
    • ตอนนี้ OpenVINO™ Model Server และ OpenVINO™ GenAI ได้ขยายการสนับสนุนสถานการณ์ AI แบบ Agentic พร้อมคุณสมบัติใหม่ๆ เช่น การแยกวิเคราะห์เอาต์พุตและเทมเพลตแชทที่ดีขึ้นสําหรับการโต้ตอบแบบมัลติเลี้ยวที่เชื่อถือได้ และฟังก์ชั่นการแสดงตัวอย่างสําหรับรุ่น Qwen3-30B-A3B OVMS ยังแนะนําตัวอย่างสําหรับอุปกรณ์ปลายทางเสียง
    • การปรับใช้ NPU ทําได้ง่ายขึ้นด้วยการรองรับแบบชุดช่วยให้สามารถดําเนินการแบบจําลองที่ราบรื่นบนโปรเซสเซอร์ Intel® Core™ Ultra ในขณะที่ขจัดการอ้างอิงไดรเวอร์ โมเดลจะถูกปรับใช้ใหม่ batch_size=1 ก่อนการคอมไพล์
    • การรวม NVIDIA Triton Server* ที่ปรับปรุงใหม่กับ OpenVINO Backend ช่วยให้นักพัฒนาสามารถใช้ประโยชน์จาก Intel GPU หรือ NPU สําหรับการปรับใช้ได้

ดูรายละเอียดทั้งหมด ดูบันทึกประจํารุ่น 2025.4

คําแนะนําในการติดตั้ง

คุณสามารถเลือกวิธีการติดตั้ง OpenVINO™ Runtime จาก Archive* ตามระบบปฏิบัติการของคุณ:

สิ่งที่รวมอยู่ในแพ็คเกจดาวน์โหลด (Archive File)

  • เสนอทั้ง C/C++ และ Python APIs
  • นอกจากนี้ ยังมีตัวอย่างโค้ดด้วย

ลิงก์ที่เป็นประโยชน์

โน้ต: ลิงก์จะเปิดขึ้นในหน้าต่างใหม่

เนื้อหาในหน้านี้เป็นการผสมผสานระหว่างการแปลเนื้อหาต้นฉบับภาษาอังกฤษโดยมนุษย์และคอมพิวเตอร์ เนื้อหานี้จัดทําขึ้นเพื่อความสะดวกของคุณและเพื่อเป็นข้อมูลทั่วไปเท่านั้นและไม่ควรพึ่งพาความสมบูรณ์หรือความถูกต้อง หากมีความขัดแย้งใด ๆ ระหว่างเวอร์ชันภาษาอังกฤษของหน้านี้กับคําแปล เวอร์ชันภาษาอังกฤษจะมีผลบังคับและควบคุม ดูเวอร์ชันภาษาอังกฤษของหน้านี้