Intel® Data Center Diagnostic Toolสําหรับโปรเซสเซอร์ Intel® Xeon®

เอกสาร

การบำรุงรักษาและประสิทธิภาพ

000058107

15/09/2021

แนะ นำ

Intel® Data Center Diagnostic Tool เป็นเครื่องมือซอฟต์แวร์วินิจฉัยที่สามารถทํางานบนแพลตฟอร์มศูนย์ข้อมูลของคุณเพื่อ:

  • ตรวจสอบฟังก์ชันการทํางานของคอร์ทั้งหมดภายในโปรเซสเซอร์ Intel® Xeon®
  • ใช้เป็นส่วนหนึ่งในโปรแกรมการบํารุงรักษาระบบปกติ

ความน่าเชื่อถือและความพร้อมใช้งานสูงในศูนย์ข้อมูลต้องการเครื่องมือที่เหมาะสมและความมุ่งมั่นในการบํารุงรักษา Intel เชื่อว่านี่เป็นแนวทางปฏิบัติที่ดีที่สุดในอุตสาหกรรมในการใช้เครื่องมือบํารุงรักษา เช่น สําหรับการปรับใช้เบื้องต้นและการทดสอบเป็นระยะๆ เพื่อช่วยให้แน่ใจว่าได้ประสบการณ์ใช้งานระบบที่ดีที่สุด

ความต้องการของระบบ

Intel Data Center Diagnostic Tool เป็นแอปพลิเคชัน Linux* ที่สามารถติดตั้งและทํางานบน Linux Distributions ปัจจุบันมากมาย ไม่มีเครื่องมือนี้ในเวอร์ชั่น Windows*

เพื่อความครอบคลุมที่ดีที่สุด ให้เรียกใช้แอปพลิเคชันในระบบรากของเซิร์ฟเวอร์ เป็นไปได้ที่จะเรียกใช้งานภายในคอนเทนเนอร์หรือ Virtual Machine แต่โปรดทราบว่าอาจมีการปิดใช้งานฟังก์ชันบางอย่าง

โปรเซสเซอร์ที่รองรับ:

  • โปรเซสเซอร์ Intel® Xeon® แบบปรับขนาดได้ เจนเนอเรชั่น 3 (ก่อนหน้านี้Ice LakeและCooper Lake)
  • โปรเซสเซอร์ Intel® Xeon® Scalable เจนเนอเรชั่น 2 (ก่อนหน้านี้Cascade Lake)
  • โปรเซสเซอร์ Intel® Xeon® Scalable เจนเนอเรชั่น 1 (ชื่อรหัสเดิม Skylake)
  • โปรเซสเซอร์ Intel® Xeon® ตระกูล E5 v4 (ชื่อรหัสเดิม Broadwell)
  • โปรเซสเซอร์ Intel® Xeon® ตระกูล E7 v4 (ชื่อรหัสเดิม Broadwell)

ติด ตั้ง

หมาย เหตุ
  • รายละเอียดเพิ่มเติมมีอยู่ในไฟล์ /usr/share/doc/dcdiag/README.rst รวมอยู่ในการติดตั้ง
  • เราขอแนะนําให้ใช้ขั้นตอนต่างๆ ในส่วนด้านล่างเพื่อเชื่อมโยงไปยังคลังข้อมูล ซึ่งทําให้มั่นใจได้ว่าคุณจะได้รับIntel® Data Center Diagnostic Toolเวอร์ชันล่าสุด อย่างไรก็ตาม หากคุณต้องการไบนารีที่ดาวน์โหลดได้ ให้ใช้ไฟล์RPM หรือไฟล์ DEB

 

Debian*/Ubuntu*

ในการติดตั้งแพคเกจซอฟต์แวร์ Intel® Data Center Diagnostic Tool บนการเผยแพร่แบบใช้ Debian* ให้เพิ่มคลังข้อมูลแพคเกจ Intel software และติดตั้งแพ็คเกจที่เหมาะสม

ก่อนที่จะคัดลอก+วางไปยังคอนโซลของคุณ คุณอาจต้องการใช้งานsudo ls และป้อนรหัสผ่านของคุณเพื่อป้องกันไม่ให้คําสั่งถูกใช้งานโดยพรอมท์รหัสผ่านsudo:

ตั้งค่าคีย์เพื่อตรวจสอบข้อความแสดงความคมกริบของบรรจุภัณฑ์

curl https://repositories.intel.com/dcdt/dcdiag.pub | sudo apt-key add -

ตั้งค่าคลังข้อมูล

sudo apt-add-repository 'deb https://repositories.intel.com/dcdt/debian stable main'

ติดตั้งแพ็คเกจ

sudo apt-get update
sudo apt-get install dcdiag

Fedora*/CentOS*/RHEL*

ในการติดตั้งแพ็คเกจซอฟต์แวร์ Intel Data Center Diagnostic Tool บนการกระจายที่อิงกับ Fedora ให้เพิ่มคลังข้อมูลแพคเกจIntel softwareและติดตั้งแพ็คเกจ

ครั้งแรกที่คุณติดตั้ง YUM หรือ DNF จะแจ้งให้คุณยอมรับคีย์การเซ็นชื่อ ตรวจสอบว่าลายนิ้วมือเป็นดังนี้ แล้วยอมรับ:
Userid: "CN=Release Key"
Fingerprint: 6226 CA48 AAB6 0900 2093 C7C4 0A04 4B42 CF00 5B79

ก่อนที่จะคัดลอก+วางไปยังคอนโซลของคุณ คุณอาจต้องการใช้งานsudo ls และป้อนรหัสผ่านของคุณเพื่อป้องกันไม่ให้คําสั่งถูกใช้งานโดยพรอมท์รหัสผ่านsudo:

ติดตั้งไฟล์ที่เก็บ

sudo yum install https://repositories.intel.com/dcdt/dcdiag-repo.rpm

ติดตั้งแพ็คเกจ

sudo yum install dcdiag

OpenSUSE*/SUSE Linux Enterprise*:

ติดตั้งไฟล์ที่เก็บ

sudo zypper ar https://repositories.intel.com/dcdt/dcdiag.repo

ติดตั้งแพ็คเกจ

sudo zypper install dcdiag

คุณจะได้รับการเตือนว่า ไม่มีลายเซ็นของ respond.xml ตอบกลับใช่เพื่อดําเนินการต่อ คุณจะได้รับโอกาสอีกครั้งในการตรวจสอบบรรจุภัณฑ์ที่เป็นของจริง ตรวจสอบว่าลายนิ้วมือเป็นดังนี้ แล้วยอมรับ:

Repository: dcdiag
Key Name: CN=Release Key
Key Fingerprint: 6226CA48 AAB60900 2093C7C4 0A044B42 CF005B79
Key Created: Tue 24 Nov 2020 01:47:38 PM PST
Key Expires: Sat 25 Nov 2023 01:47:38 PM PST
Rpm Name: gpg-pubkey-cf005b79-5fbd7f7a

 

วิธีทดสอบโปรเซสเซอร์ Intel Xeon

เมื่อติดตั้งแล้ว Intel Data Center Diagnostic Tool จะเปิดใช้งานโดยอัตโนมัติสําหรับการดําเนินการพื้นหลัง คุณสามารถตรวจสอบว่าสิ่งนี้สําเร็จด้วยคําสั่งต่อไปนี้:

# systemctl status dcdiag
● dcdiag.service - Intel® Data Center Diagnostic Tool
Loaded: loaded (/usr/lib/systemd/system/dcdiag.service; enabled; vendor preset: disabled)
Active: active (running) since Fri 2021-02-19 11:24:17 MST; 4 days ago
Docs: file:///usr/share/doc/dcdiag/README.rst
Main PID: 8777 (dcdiag)
CGroup: /system.slice/dcdiag.service
└─8777 /usr/bin/dcdiag --service

หากตรวจพบข้อผิดพลาดใดๆ เครื่องมือจะล็อกอินเข้าสู่บันทึกของระบบ เครื่องมือยังสามารถสืบค้นได้ว่ามีการตรวจพบข้อผิดพลาดใดๆ ในการสแกนพื้นหลังโดยใช้ส่วนแสดง --query หรือไม่

# dcdiag --query
Intel® Data Center Diagnostic Tool Version 506
Test completed successfully. No issues detected.

เครื่องมือนี้ยังสามารถทํางานได้ด้วยตนเองในเบื้องหน้าโดยดําเนินการที่พรอมท์คําสั่ง Linux:

# dcdiag

การทดสอบด้วยตนเองจะใช้เวลาประมาณ 45 นาที และมีการใช้งาน CPU สูง

เมื่อการวิเคราะห์เสร็จสมบูรณ์ ระบบจะส่งคืนข้อความใดข้อความหนึ่งต่อไปนี้:

  • การทดสอบเสร็จสมบูรณ์ ไม่พบปัญหา
     
  • การทดสอบเสร็จสมบูรณ์ เกิดข้อผิดพลาดในการตรวจสอบเครื่องอย่างน้อยหนึ่งรายการ โปรดตรวจสอบบันทึกของระบบ
     
  • เครื่องมือรุ่นนี้ไม่รองรับโปรเซสเซอร์นี้

    ตรวจสอบรุ่นและเวอร์ชันของโปรเซสเซอร์ของระบบ ข้อความนี้จะปรากฏขึ้นหากIntel Data Center Diagnostic Toolตรวจไม่พบโปรเซสเซอร์ที่รองรับเวอร์ชันการผลิต เครื่องมือนี้ไม่รองรับตัวอย่างทางวิศวกรรม

    ค้นหาความช่วยเหลือในการระบุโปรเซสเซอร์
     
  • การทดสอบเสร็จสมบูรณ์ ไม่สามารถสรุปผลลัพธ์ได้เนื่องจากไมโครโค้ดเวอร์ชันที่ล้าสมัย

    ไมโครโค้ดเวอร์ชันล่าสุดจัดการกับปัญหาที่ทราบแล้ว โปรดอัพเดต การอัปเดต Microcode มักจะถูกส่งโดยผู้จําหน่าย Linux ของคุณ ควบคู่ไปกับการแก้ไขความปลอดภัยและการอัพเดทเฟิร์มแวร์อื่นๆ สําหรับส่วนประกอบต่างๆ หากระบบของคุณไม่ได้เปิดใช้งานการอัปเดตเหล่านี้ ไว้ เราขอแนะนําให้คุณเปิดใช้งาน ไมโครโค้ดจะถูกโหลดโดยอัตโนมัติโดยเคอร์เนล Linux ในทุกการบูทและสามารถโหลดใหม่ได้ที่รันไทม์ด้วยคําสั่งต่อไปนี้เป็นรูท:

    echo 1 > /sys/devices/system/cpu/microcode
     
  • การทดสอบเสร็จสมบูรณ์ ผลลัพธ์ไม่สามารถสรุปได้เนื่องจากระบบเกินขีดจํากัดอุณหภูมิ

    ซึ่งอาจเกิดจากปัญหาต่างๆ กับระบบที่ไม่มีการระบายความร้อนที่เพียงพอสําหรับ CPU ให้ทํางานภายในขีดจํากัดอุณหภูมิที่กําหนด เราขอแนะนําให้ตรวจสอบระบบของคุณเพื่อให้แน่ใจว่าระบบระบายความร้อนที่จําเป็นทํางานอย่างถูกต้อง ซึ่งอาจรวมถึงพัดลมที่ผิดพลาด การไหลเวียนของอากาศที่ไม่ถูกต้อง หรือปัญหาด้านสิ่งแวดล้อมอื่นๆ
     
  • การทดสอบเสร็จสมบูรณ์ ผลลัพธ์ไม่สามารถสรุปได้ เกิดข้อผิดพลาดในการตรวจสอบเครื่องอย่างน้อยหนึ่งอย่าง

    ตรวจสอบบันทึกของระบบ
     
  • การทดสอบล้มเหลว ติดต่อผู้ผลิตระบบหรือผู้จําหน่ายโปรเซสเซอร์ของคุณสําหรับการสนับสนุน

    หากผลลัพธ์การทดสอบแสดงล้มเหลว ให้ตรวจสอบว่าโปรเซสเซอร์ของโหนดเซิร์ฟเวอร์ของคุณยังอยู่ในการรับประกันหรือไม่:

    • หากคุณยังคงมีโปรเซสเซอร์ Intel® Xeon® แบบบรรจุกล่องภายใต้การรับประกัน 3 ปี โปรดติดต่อฝ่ายสนับสนุนลูกค้าของ Intel เพื่อขอความช่วยเหลือ
    • หากคุณมีโปรเซสเซอร์แบบถาด ให้ติดต่อผู้จําหน่ายระบบหรือโปรเซสเซอร์ของคุณ หรือสถานที่ซื้อเพื่อตรวจสอบว่าโปรเซสเซอร์ยังอยู่ภายใต้การรับประกันหรือไม่
      หมาย เหตุโปรเซสเซอร์แบบถาดจะขายให้กับผู้ผลิตระบบหรือผู้แทนจําหน่ายที่ได้รับอนุญาตจาก Intel โดยตรง Intel ไม่ได้ให้การรับประกันโดยตรงกับผู้ใช้จริงสําหรับโปรเซสเซอร์แบบถาด เว้นแต่จะมีการติดตั้งระบบเซิร์ฟเวอร์ Intel® Data Center Block (Intel® DCB) ไว้ล่วงหน้า ยกเว้นระบบIntel DCB การรับประกันของโปรเซสเซอร์แบบถาดมาจากผู้จําหน่ายหรือสถานที่ซื้อโปรเซสเซอร์หรือระบบหากมีการติดตั้งโปรเซสเซอร์ไว้ล่วงหน้า Intel แนะนําให้ซื้อจากผู้แทนจําหน่ายที่ได้รับอนุญาต ซัพพลายเออร์ที่ได้รับอนุญาตจากIntel และผู้ค้าปลีกผลิตภัณฑ์ Intel®
    • โปรดทราบว่า Intel ไม่มีโปรแกรมการเปลี่ยนสินค้าที่ไม่อยู่ในการรับประกัน
       
  • การทดสอบล้มเหลว

    การทดสอบเสร็จสมบูรณ์ และตรวจพบข้อผิดพลาดในโปรเซสเซอร์ทางกายภาพที่มี/sys/อุปกรณ์/ระบบ/cpu/cpuXX

    ติดต่อผู้ผลิตระบบหรือผู้จําหน่ายโปรเซสเซอร์ของคุณสําหรับการสนับสนุน

  • การทดสอบล้มเหลว

    การทดสอบไม่สามารถระบุได้ว่าโปรเซสเซอร์ทางกายภาพใดที่ทําให้เกิดความล้มเหลว

    ติดต่อผู้ผลิตระบบหรือผู้จําหน่ายโปรเซสเซอร์ของคุณสําหรับการสนับสนุน
     

ประวัติเวอร์ชัน

วันเวอร์ชันคำ อธิบาย
7 กรกฎาคม 2021540เวอร์ชันเริ่มต้น