Intel® Data Center Diagnostic Toolสําหรับโปรเซสเซอร์ Intel® Xeon®

เอกสาร

การบำรุงรักษาและประสิทธิภาพ

000058107

23/06/2022

แนะ นำ

Intel® Data Center Diagnostic Tool เป็นเครื่องมือซอฟต์แวร์วินิจฉัยที่สามารถทํางานบนแพลตฟอร์มศูนย์ข้อมูลของคุณเพื่อ:

  • ตรวจสอบฟังก์ชันการทํางานของคอร์ทั้งหมดภายในโปรเซสเซอร์ Intel® Xeon®
  • ใช้เป็นส่วนหนึ่งในโปรแกรมการบํารุงรักษาระบบปกติ

ความเชื่อถือได้และความพร้อมใช้งานสูงในศูนย์ข้อมูลต้องการเครื่องมือที่เหมาะสมและความมุ่งมั่นในการบํารุงรักษา Intel เชื่อว่านี่เป็นแนวทางปฏิบัติที่ดีที่สุดในอุตสาหกรรมในการใช้เครื่องมือบํารุงรักษา เช่น สําหรับการปรับใช้เบื้องต้นและการทดสอบเป็นระยะๆ เพื่อช่วยให้แน่ใจว่าได้ประสบการณ์ใช้งานระบบที่ดีที่สุด

    หมาย เหตุโครงสร้างพื้นฐานการประมวลผลสมัยใหม่นําความต้องการด้านพลังประมวลผลที่เพิ่มขึ้นมารวมกับความคาดหวังของธุรกิจในด้านคุณภาพบริการและความพร้อมใช้งานที่สูง (และการรับประกันตามข้อตกลงระดับบริการ [SLAs] โดยทั่วไป) ความคาดหวังเหล่านี้เน้นความจําเป็นสําหรับเครื่องมือซอฟต์แวร์ที่มีประสิทธิภาพที่สามารถช่วยคาดการณ์ ระบุ และลดข้อผิดพลาดของระบบที่ไม่คาดคิดที่อาจส่งผลกระทบต่อคุณภาพหรือเวลาทํางานของบริการ อ่าน เอกสารจาก IDC ที่ครอบคลุมความต้องการเครื่องมือวินิจฉัยรวมถึงIntel® Data Center Diagnostic Tool

    ความต้องการของระบบ

    Intel Data Center Diagnostic Toolเป็นแอปพลิเคชัน Linux* ที่สามารถติดตั้งและเรียกใช้ในการเผยแพร่ Linux ในปัจจุบันมากมาย ไม่มีเครื่องมือนี้ในเวอร์ชั่น Windows*

    เพื่อความครอบคลุมที่ดีที่สุด ให้เรียกใช้แอปพลิเคชันในระบบรากของเซิร์ฟเวอร์ เป็นไปได้ที่จะเรียกใช้งานภายในคอนเทนเนอร์หรือ Virtual Machine แต่โปรดทราบว่าอาจมีการปิดใช้งานฟังก์ชันบางอย่าง

    โปรเซสเซอร์ที่รองรับ:

    • โปรเซสเซอร์ Intel® Xeon® แบบปรับขนาดได้ เจนเนอเรชั่น 3 (ก่อนหน้านี้Ice LakeและCooper Lake)
    • โปรเซสเซอร์ Intel® Xeon® Scalable เจนเนอเรชั่น 2 (ก่อนหน้านี้Cascade Lake)
    • โปรเซสเซอร์ Intel® Xeon® Scalable เจนเนอเรชั่น 1 (ชื่อรหัสเดิม Skylake)
    • โปรเซสเซอร์ Intel® Xeon® ตระกูล E5 v4 (ชื่อรหัสเดิม Broadwell)
    • โปรเซสเซอร์ Intel® Xeon® ตระกูล E7 v4 (ชื่อรหัสเดิม Broadwell)
    หมาย เหตุ
    • สําหรับนักพัฒนา: Intel เริ่ม Open Data Center Diagnostic Project ซึ่งจะเปิดเฟรมเวิร์กการวินิจฉัยศูนย์ข้อมูลของ Intel และให้การทดสอบที่เลือก ซึ่งช่วยให้นักพัฒนามีกรอบการพัฒนาการทดสอบที่สอดคล้องกันซึ่งเชิญความคิดสร้างสรรค์ของชุมชนโอเพนซอร์สเพื่อปรับปรุงการจัดการกลุ่มคลาวด์ผ่านการพัฒนาหน้าจอทดสอบเฉพาะและโซลูชันที่เป็นนวัตกรรมอื่น ๆ สําหรับข้อมูลเพิ่มเติมและการเข้าถึงเฟรมเวิร์กและการทดสอบนี้

    ติด ตั้ง

    หมาย เหตุ
    • รายละเอียดเพิ่มเติมมีอยู่ในไฟล์ /usr/share/doc/dcdiag/README.rst รวมอยู่ในการติดตั้ง
    • เราขอแนะนําให้ใช้ขั้นตอนต่างๆ ในส่วนด้านล่างเพื่อเชื่อมโยงไปยังคลังข้อมูล ซึ่งทําให้มั่นใจได้ว่าคุณจะได้รับIntel® Data Center Diagnostic Toolเวอร์ชันล่าสุด อย่างไรก็ตาม หากคุณต้องการไบนารีที่ดาวน์โหลดได้ ให้ใช้ไฟล์ RPM หรือไฟล์ DEB

     

    Debian*/Ubuntu*

    ในการติดตั้งแพคเกจซอฟต์แวร์ Intel® Data Center Diagnostic Tool บนการเผยแพร่ที่ใช้ Debian* ให้เพิ่มคลังข้อมูลแพคเกจIntel softwareและติดตั้งแพ็คเกจที่เหมาะสม

    ก่อนที่จะคัดลอก+วางไปยังคอนโซลของคุณ คุณอาจต้องการใช้งาน sudo ls และป้อนรหัสผ่านของคุณเพื่อป้องกันไม่ให้คําสั่งถูกใช้งานโดยพรอมท์รหัสผ่าน sudo :

    ตั้งค่าคีย์เพื่อตรวจสอบข้อความแสดงความคมกริบของบรรจุภัณฑ์

    curl https://repositories.intel.com/dcdt/dcdiag.pub | sudo apt-key add -

    ตั้งค่าคลังข้อมูล

    sudo apt-add-repository 'deb [arch=amd64] https://repositories.intel.com/dcdt/debian stable main'

    ติดตั้งแพ็คเกจ

    sudo apt-get update
    sudo apt-get install dcdiag

    Fedora*/CentOS*/RHEL*

    ในการติดตั้งแพคเกจซอฟต์แวร์ Intel Data Center Diagnostic Tool บนการกระจายที่อิงกับ Fedora ให้เพิ่มคลังข้อมูลแพคเกจIntel softwareและติดตั้งแพ็คเกจ

    ครั้งแรกที่คุณติดตั้ง YUM หรือ DNF จะแจ้งให้คุณยอมรับคีย์การเซ็นชื่อ ตรวจสอบว่าลายนิ้วมือเป็นดังนี้ แล้วยอมรับ:
    Userid: "CN=Release Key"
    Fingerprint: 6226 CA48 AAB6 0900 2093 C7C4 0A04 4B42 CF00 5B79

    ก่อนที่จะคัดลอก+วางไปยังคอนโซลของคุณ คุณอาจต้องการใช้งาน sudo ls และป้อนรหัสผ่านของคุณเพื่อป้องกันไม่ให้คําสั่งถูกใช้งานโดยพรอมท์รหัสผ่าน sudo :

    ติดตั้งไฟล์ที่เก็บ

    sudo yum install https://repositories.intel.com/dcdt/dcdiag-repo.rpm

    ติดตั้งแพ็คเกจ

    sudo yum install dcdiag

    OpenSUSE*/SUSE Linux Enterprise*:

    ติดตั้งไฟล์ที่เก็บ

    sudo zypper ar https://repositories.intel.com/dcdt/dcdiag.repo

    ติดตั้งแพ็คเกจ

    sudo zypper install dcdiag

    คุณจะได้รับการเตือนว่า ไม่มีลายเซ็นของ respond.xml ตอบกลับใช่เพื่อดําเนินการต่อ คุณจะได้รับโอกาสอีกครั้งในการตรวจสอบบรรจุภัณฑ์ที่เป็นของจริง ตรวจสอบว่าลายนิ้วมือเป็นดังนี้ แล้วยอมรับ:

    Repository: dcdiag
    Key Name: CN=Release Key
    Key Fingerprint: 6226CA48 AAB60900 2093C7C4 0A044B42 CF005B79
    Key Created: Tue 24 Nov 2020 01:47:38 PM PST
    Key Expires: Sat 25 Nov 2023 01:47:38 PM PST
    Rpm Name: gpg-pubkey-cf005b79-5fbd7f7a

     

    วิธีทดสอบโปรเซสเซอร์ Intel® Xeon®

    เมื่อติดตั้งแล้ว Intel Data Center Diagnostic Tool จะเปิดใช้งานโดยอัตโนมัติสําหรับการดําเนินการพื้นหลัง คุณสามารถตรวจสอบว่าสิ่งนี้สําเร็จด้วยคําสั่งต่อไปนี้:

    # systemctl status dcdiag
    ● dcdiag.service - Intel® Data Center Diagnostic Tool
    Loaded: loaded (/usr/lib/systemd/system/dcdiag.service; enabled; vendor preset: disabled)
    Active: active (running) since Fri 2021-02-19 11:24:17 MST; 4 days ago
    Docs: file:///usr/share/doc/dcdiag/README.rst
    Main PID: 8777 (dcdiag)
    CGroup: /system.slice/dcdiag.service
    └─8777 /usr/bin/dcdiag --service

    หมาย เหตุ

    หากคุณต้องการปิดใช้งานการดําเนินการพื้นหลังของIntel Data Center Diagnostic Tool ให้เรียกใช้:

    systemctl disable --now dcdiag

    สําหรับข้อมูลเพิ่มเติมเกี่ยวกับการใช้คําสั่ง systemctl(1) โปรดดู หน้าคู่มือ Linux*

    หากตรวจพบข้อผิดพลาดใดๆ ในขณะที่Intel Data Center Diagnostic Toolดําเนินการในพื้นหลัง เครื่องมือจะล็อกอินเข้าสู่บันทึกของระบบ เครื่องมือยังสามารถสืบค้นได้ว่ามีการตรวจพบข้อผิดพลาดใดๆ ในการสแกนพื้นหลังโดยใช้ส่วนแสดง --query หรือไม่

    # dcdiag --query
    Intel® Data Center Diagnostic Tool Version 506
    Test completed successfully. No issues detected.

    เครื่องมือนี้ยังสามารถทํางานได้ด้วยตนเองในเบื้องหน้าโดยดําเนินการที่พรอมท์คําสั่ง Linux:

    # dcdiag

    การทดสอบด้วยตนเองจะใช้เวลาประมาณ 45 นาที และมีการใช้งาน CPU สูง

    เมื่อการวิเคราะห์เสร็จสมบูรณ์ ระบบจะส่งคืนข้อความใดข้อความหนึ่งต่อไปนี้:

    • การทดสอบเสร็จสมบูรณ์ ไม่พบปัญหา
       
    • การทดสอบเสร็จสมบูรณ์ เกิดข้อผิดพลาดในการตรวจสอบเครื่องอย่างน้อยหนึ่งรายการ โปรดตรวจสอบบันทึกของระบบ
       
    • เครื่องมือรุ่นนี้ไม่รองรับโปรเซสเซอร์นี้

      ตรวจสอบรุ่นและเวอร์ชันของโปรเซสเซอร์ของระบบ ข้อความนี้จะปรากฏขึ้นหากIntel Data Center Diagnostic Toolตรวจไม่พบโปรเซสเซอร์ที่รองรับเวอร์ชันการผลิต เครื่องมือนี้ไม่รองรับตัวอย่างทางวิศวกรรม

      ค้นหาความช่วยเหลือในการระบุโปรเซสเซอร์
       
    • การทดสอบเสร็จสมบูรณ์ ไม่สามารถสรุปผลลัพธ์ได้เนื่องจากไมโครโค้ดเวอร์ชันที่ล้าสมัย

      ไมโครโค้ดเวอร์ชันล่าสุดจัดการกับปัญหาที่ทราบแล้ว โปรดอัพเดต การอัปเดต Microcode มักจะถูกส่งโดยผู้จําหน่าย Linux ของคุณ ควบคู่ไปกับการแก้ไขความปลอดภัยและการอัพเดทเฟิร์มแวร์อื่นๆ สําหรับส่วนประกอบต่างๆ หากระบบของคุณไม่ได้เปิดใช้งานการอัปเดตเหล่านี้ ไว้ เราขอแนะนําให้คุณเปิดใช้งาน ไมโครโค้ดจะถูกโหลดโดยอัตโนมัติโดยเคอร์เนล Linux ในทุกการบูทและสามารถโหลดใหม่ได้ที่รันไทม์ด้วยคําสั่งต่อไปนี้เป็นรูท:

      echo 1 > /sys/devices/system/cpu/microcode
       
    • การทดสอบเสร็จสมบูรณ์ ผลลัพธ์ไม่สามารถสรุปได้เนื่องจากระบบเกินขีดจํากัดอุณหภูมิ

      ซึ่งอาจเกิดจากปัญหาต่างๆ กับระบบที่ไม่มีการระบายความร้อนที่เพียงพอสําหรับ CPU ให้ทํางานภายในขีดจํากัดอุณหภูมิที่กําหนด เราขอแนะนําให้ตรวจสอบระบบของคุณเพื่อให้แน่ใจว่าระบบระบายความร้อนที่จําเป็นทํางานอย่างถูกต้อง ซึ่งอาจรวมถึงพัดลมที่ผิดพลาด การไหลเวียนของอากาศที่ไม่ถูกต้อง หรือปัญหาด้านสิ่งแวดล้อมอื่นๆ
       
    • การทดสอบเสร็จสมบูรณ์ ผลลัพธ์ไม่สามารถสรุปได้ เกิดข้อผิดพลาดในการตรวจสอบเครื่องอย่างน้อยหนึ่งอย่าง

      ตรวจสอบบันทึกของระบบ
       
    • การทดสอบล้มเหลว ติดต่อผู้ผลิตระบบหรือผู้จําหน่ายโปรเซสเซอร์ของคุณสําหรับการสนับสนุน

      หากผลลัพธ์การทดสอบแสดงล้มเหลว ให้ตรวจสอบว่าโปรเซสเซอร์ของโหนดเซิร์ฟเวอร์ของคุณยังอยู่ในการรับประกันหรือไม่:

      • หากคุณมีโปรเซสเซอร์ Intel® Xeon® แบบบรรจุกล่องยังคงอยู่ภายใต้การรับประกัน 3 ปี โปรดติดต่อฝ่ายสนับสนุนลูกค้าของ Intel เพื่อขอความช่วยเหลือ
      • หากคุณมีโปรเซสเซอร์แบบถาด ให้ติดต่อผู้จําหน่ายระบบหรือโปรเซสเซอร์ของคุณ หรือสถานที่ซื้อเพื่อตรวจสอบว่าโปรเซสเซอร์ยังอยู่ภายใต้การรับประกันหรือไม่
        หมาย เหตุโปรเซสเซอร์แบบถาดจะขายให้กับผู้ผลิตระบบหรือผู้แทนจําหน่ายที่ได้รับอนุญาตจาก Intel โดยตรง Intel ไม่ได้ให้การรับประกันโดยตรงกับผู้ใช้จริงสําหรับโปรเซสเซอร์แบบถาด เว้นแต่จะติดตั้งระบบเซิร์ฟเวอร์ Intel® Data Center Block (Intel® DCB) ไว้ล่วงหน้า ยกเว้นระบบIntel DCB การรับประกันของโปรเซสเซอร์แบบถาดมาจากผู้จําหน่ายหรือสถานที่ซื้อโปรเซสเซอร์หรือระบบหากมีการติดตั้งโปรเซสเซอร์ไว้ล่วงหน้า Intel แนะนําให้ซื้อจากผู้แทนจําหน่ายที่ได้รับอนุญาต ซัพพลายเออร์ที่ได้รับอนุญาตจาก Intel และผู้ค้าปลีกผลิตภัณฑ์ Intel®
      • โปรดทราบว่า Intel ไม่มีโปรแกรมการเปลี่ยนสินค้าที่ไม่อยู่ในการรับประกัน
         
    • การทดสอบล้มเหลว

      การทดสอบเสร็จสมบูรณ์ และตรวจพบข้อผิดพลาดในโปรเซสเซอร์ทางกายภาพที่มี /sys/อุปกรณ์/ระบบ/cpu/cpuXX

      ติดต่อผู้ผลิตระบบหรือผู้จําหน่ายโปรเซสเซอร์ของคุณสําหรับการสนับสนุน

    • การทดสอบล้มเหลว

      การทดสอบไม่สามารถระบุได้ว่าโปรเซสเซอร์ทางกายภาพใดที่ทําให้เกิดความล้มเหลว

      ติดต่อผู้ผลิตระบบหรือผู้จําหน่ายโปรเซสเซอร์ของคุณสําหรับการสนับสนุน
       

    ประวัติเวอร์ชัน

    วันเวอร์ชันคำ อธิบาย
    7 กรกฎาคม 2021540เวอร์ชันเริ่มต้น

     

    หัวข้อที่เกี่ยวข้อง
    เว็บไซต์ศูนย์สนับสนุนIntel® Xeon®
    คู่มือการรับประกันสําหรับโปรเซสเซอร์ Intel®