Intel® Data Center Diagnostic Toolสําหรับโปรเซสเซอร์ Intel® Xeon®
แนะ นำ
Intel® Data Center Diagnostic Tool เป็นเครื่องมือซอฟต์แวร์วินิจฉัยที่สามารถทํางานบนแพลตฟอร์มศูนย์ข้อมูลของคุณเพื่อ:
- ตรวจสอบฟังก์ชันการทํางานของคอร์ทั้งหมดภายในโปรเซสเซอร์ Intel® Xeon®
- ใช้เป็นส่วนหนึ่งในโปรแกรมการบํารุงรักษาระบบปกติ
ความเชื่อถือได้และความพร้อมใช้งานสูงในศูนย์ข้อมูลต้องการเครื่องมือที่เหมาะสมและความมุ่งมั่นในการบํารุงรักษา Intel เชื่อว่านี่เป็นแนวทางปฏิบัติที่ดีที่สุดในอุตสาหกรรมในการใช้เครื่องมือบํารุงรักษา เช่น สําหรับการปรับใช้เบื้องต้นและการทดสอบเป็นระยะๆ เพื่อช่วยให้แน่ใจว่าได้ประสบการณ์ใช้งานระบบที่ดีที่สุด
หมาย เหตุ | โครงสร้างพื้นฐานการประมวลผลสมัยใหม่นําความต้องการด้านพลังประมวลผลที่เพิ่มขึ้นมารวมกับความคาดหวังของธุรกิจในด้านคุณภาพบริการและความพร้อมใช้งานที่สูง (และการรับประกันตามข้อตกลงระดับบริการ [SLAs] โดยทั่วไป) ความคาดหวังเหล่านี้เน้นความจําเป็นสําหรับเครื่องมือซอฟต์แวร์ที่มีประสิทธิภาพที่สามารถช่วยคาดการณ์ ระบุ และลดข้อผิดพลาดของระบบที่ไม่คาดคิดที่อาจส่งผลกระทบต่อคุณภาพหรือเวลาทํางานของบริการ อ่าน เอกสารจาก IDC ที่ครอบคลุมความต้องการเครื่องมือวินิจฉัยรวมถึงIntel® Data Center Diagnostic Tool |
ความต้องการของระบบ
Intel Data Center Diagnostic Toolเป็นแอปพลิเคชัน Linux* ที่สามารถติดตั้งและเรียกใช้ในการเผยแพร่ Linux ในปัจจุบันมากมาย ไม่มีเครื่องมือนี้ในเวอร์ชั่น Windows*
เพื่อความครอบคลุมที่ดีที่สุด ให้เรียกใช้แอปพลิเคชันในระบบรากของเซิร์ฟเวอร์ เป็นไปได้ที่จะเรียกใช้งานภายในคอนเทนเนอร์หรือ Virtual Machine แต่โปรดทราบว่าอาจมีการปิดใช้งานฟังก์ชันบางอย่าง
โปรเซสเซอร์ที่รองรับ:
- โปรเซสเซอร์ Intel® Xeon® แบบปรับขนาดได้ เจนเนอเรชั่น 3 (ก่อนหน้านี้Ice LakeและCooper Lake)
- โปรเซสเซอร์ Intel® Xeon® Scalable เจนเนอเรชั่น 2 (ก่อนหน้านี้Cascade Lake)
- โปรเซสเซอร์ Intel® Xeon® Scalable เจนเนอเรชั่น 1 (ชื่อรหัสเดิม Skylake)
- โปรเซสเซอร์ Intel® Xeon® ตระกูล E5 v4 (ชื่อรหัสเดิม Broadwell)
- โปรเซสเซอร์ Intel® Xeon® ตระกูล E7 v4 (ชื่อรหัสเดิม Broadwell)
หมาย เหตุ |
|
ติด ตั้ง
หมาย เหตุ |
|
Debian*/Ubuntu* |
ในการติดตั้งแพคเกจซอฟต์แวร์ Intel® Data Center Diagnostic Tool บนการเผยแพร่ที่ใช้ Debian* ให้เพิ่มคลังข้อมูลแพคเกจIntel softwareและติดตั้งแพ็คเกจที่เหมาะสม ก่อนที่จะคัดลอก+วางไปยังคอนโซลของคุณ คุณอาจต้องการใช้งาน sudo ls และป้อนรหัสผ่านของคุณเพื่อป้องกันไม่ให้คําสั่งถูกใช้งานโดยพรอมท์รหัสผ่าน sudo : ตั้งค่าคีย์เพื่อตรวจสอบข้อความแสดงความคมกริบของบรรจุภัณฑ์ curl https://repositories.intel.com/dcdt/dcdiag.pub | sudo apt-key add - ตั้งค่าคลังข้อมูล sudo apt-add-repository 'deb [arch=amd64] https://repositories.intel.com/dcdt/debian stable main' ติดตั้งแพ็คเกจ sudo apt-get update |
Fedora*/CentOS*/RHEL* |
ในการติดตั้งแพคเกจซอฟต์แวร์ Intel Data Center Diagnostic Tool บนการกระจายที่อิงกับ Fedora ให้เพิ่มคลังข้อมูลแพคเกจIntel softwareและติดตั้งแพ็คเกจ ครั้งแรกที่คุณติดตั้ง YUM หรือ DNF จะแจ้งให้คุณยอมรับคีย์การเซ็นชื่อ ตรวจสอบว่าลายนิ้วมือเป็นดังนี้ แล้วยอมรับ: ก่อนที่จะคัดลอก+วางไปยังคอนโซลของคุณ คุณอาจต้องการใช้งาน sudo ls และป้อนรหัสผ่านของคุณเพื่อป้องกันไม่ให้คําสั่งถูกใช้งานโดยพรอมท์รหัสผ่าน sudo : ติดตั้งไฟล์ที่เก็บ sudo yum install https://repositories.intel.com/dcdt/dcdiag-repo.rpm ติดตั้งแพ็คเกจ sudo yum install dcdiag |
OpenSUSE*/SUSE Linux Enterprise*: |
ติดตั้งไฟล์ที่เก็บ sudo zypper ar https://repositories.intel.com/dcdt/dcdiag.repo ติดตั้งแพ็คเกจ sudo zypper install dcdiag คุณจะได้รับการเตือนว่า ไม่มีลายเซ็นของ respond.xml ตอบกลับใช่เพื่อดําเนินการต่อ คุณจะได้รับโอกาสอีกครั้งในการตรวจสอบบรรจุภัณฑ์ที่เป็นของจริง ตรวจสอบว่าลายนิ้วมือเป็นดังนี้ แล้วยอมรับ: Repository: dcdiag |
วิธีทดสอบโปรเซสเซอร์ Intel® Xeon®
เมื่อติดตั้งแล้ว Intel Data Center Diagnostic Tool จะเปิดใช้งานโดยอัตโนมัติสําหรับการดําเนินการพื้นหลัง คุณสามารถตรวจสอบว่าสิ่งนี้สําเร็จด้วยคําสั่งต่อไปนี้:
# systemctl status dcdiag
● dcdiag.service - Intel® Data Center Diagnostic Tool
Loaded: loaded (/usr/lib/systemd/system/dcdiag.service; enabled; vendor preset: disabled)
Active: active (running) since Fri 2021-02-19 11:24:17 MST; 4 days ago
Docs: file:///usr/share/doc/dcdiag/README.rst
Main PID: 8777 (dcdiag)
CGroup: /system.slice/dcdiag.service
└─8777 /usr/bin/dcdiag --service
หมาย เหตุ | หากคุณต้องการปิดใช้งานการดําเนินการพื้นหลังของIntel Data Center Diagnostic Tool ให้เรียกใช้: systemctl disable --now dcdiag สําหรับข้อมูลเพิ่มเติมเกี่ยวกับการใช้คําสั่ง systemctl(1) โปรดดู หน้าคู่มือ Linux* |
หากตรวจพบข้อผิดพลาดใดๆ ในขณะที่Intel Data Center Diagnostic Toolดําเนินการในพื้นหลัง เครื่องมือจะล็อกอินเข้าสู่บันทึกของระบบ เครื่องมือยังสามารถสืบค้นได้ว่ามีการตรวจพบข้อผิดพลาดใดๆ ในการสแกนพื้นหลังโดยใช้ส่วนแสดง --query หรือไม่
# dcdiag --query
Intel® Data Center Diagnostic Tool Version 506
Test completed successfully. No issues detected.
เครื่องมือนี้ยังสามารถทํางานได้ด้วยตนเองในเบื้องหน้าโดยดําเนินการที่พรอมท์คําสั่ง Linux:
# dcdiag
การทดสอบด้วยตนเองจะใช้เวลาประมาณ 45 นาที และมีการใช้งาน CPU สูง
เมื่อการวิเคราะห์เสร็จสมบูรณ์ ระบบจะส่งคืนข้อความใดข้อความหนึ่งต่อไปนี้:
- การทดสอบเสร็จสมบูรณ์ ไม่พบปัญหา
- การทดสอบเสร็จสมบูรณ์ เกิดข้อผิดพลาดในการตรวจสอบเครื่องอย่างน้อยหนึ่งรายการ โปรดตรวจสอบบันทึกของระบบ
- เครื่องมือรุ่นนี้ไม่รองรับโปรเซสเซอร์นี้
ตรวจสอบรุ่นและเวอร์ชันของโปรเซสเซอร์ของระบบ ข้อความนี้จะปรากฏขึ้นหากIntel Data Center Diagnostic Toolตรวจไม่พบโปรเซสเซอร์ที่รองรับเวอร์ชันการผลิต เครื่องมือนี้ไม่รองรับตัวอย่างทางวิศวกรรม
ค้นหาความช่วยเหลือในการระบุโปรเซสเซอร์
- การทดสอบเสร็จสมบูรณ์ ไม่สามารถสรุปผลลัพธ์ได้เนื่องจากไมโครโค้ดเวอร์ชันที่ล้าสมัย
ไมโครโค้ดเวอร์ชันล่าสุดจัดการกับปัญหาที่ทราบแล้ว โปรดอัพเดต การอัปเดต Microcode มักจะถูกส่งโดยผู้จําหน่าย Linux ของคุณ ควบคู่ไปกับการแก้ไขความปลอดภัยและการอัพเดทเฟิร์มแวร์อื่นๆ สําหรับส่วนประกอบต่างๆ หากระบบของคุณไม่ได้เปิดใช้งานการอัปเดตเหล่านี้ ไว้ เราขอแนะนําให้คุณเปิดใช้งาน ไมโครโค้ดจะถูกโหลดโดยอัตโนมัติโดยเคอร์เนล Linux ในทุกการบูทและสามารถโหลดใหม่ได้ที่รันไทม์ด้วยคําสั่งต่อไปนี้เป็นรูท:
echo 1 > /sys/devices/system/cpu/microcode
- การทดสอบเสร็จสมบูรณ์ ผลลัพธ์ไม่สามารถสรุปได้เนื่องจากระบบเกินขีดจํากัดอุณหภูมิ
ซึ่งอาจเกิดจากปัญหาต่างๆ กับระบบที่ไม่มีการระบายความร้อนที่เพียงพอสําหรับ CPU ให้ทํางานภายในขีดจํากัดอุณหภูมิที่กําหนด เราขอแนะนําให้ตรวจสอบระบบของคุณเพื่อให้แน่ใจว่าระบบระบายความร้อนที่จําเป็นทํางานอย่างถูกต้อง ซึ่งอาจรวมถึงพัดลมที่ผิดพลาด การไหลเวียนของอากาศที่ไม่ถูกต้อง หรือปัญหาด้านสิ่งแวดล้อมอื่นๆ
- การทดสอบเสร็จสมบูรณ์ ผลลัพธ์ไม่สามารถสรุปได้ เกิดข้อผิดพลาดในการตรวจสอบเครื่องอย่างน้อยหนึ่งอย่าง
ตรวจสอบบันทึกของระบบ
- การทดสอบล้มเหลว ติดต่อผู้ผลิตระบบหรือผู้จําหน่ายโปรเซสเซอร์ของคุณสําหรับการสนับสนุน
หากผลลัพธ์การทดสอบแสดงล้มเหลว ให้ตรวจสอบว่าโปรเซสเซอร์ของโหนดเซิร์ฟเวอร์ของคุณยังอยู่ในการรับประกันหรือไม่:
- หากคุณมีโปรเซสเซอร์ Intel® Xeon® แบบบรรจุกล่องยังคงอยู่ภายใต้การรับประกัน 3 ปี โปรดติดต่อฝ่ายสนับสนุนลูกค้าของ Intel เพื่อขอความช่วยเหลือ
- หากคุณมีโปรเซสเซอร์แบบถาด ให้ติดต่อผู้จําหน่ายระบบหรือโปรเซสเซอร์ของคุณ หรือสถานที่ซื้อเพื่อตรวจสอบว่าโปรเซสเซอร์ยังอยู่ภายใต้การรับประกันหรือไม่
หมาย เหตุ โปรเซสเซอร์แบบถาดจะขายให้กับผู้ผลิตระบบหรือผู้แทนจําหน่ายที่ได้รับอนุญาตจาก Intel โดยตรง Intel ไม่ได้ให้การรับประกันโดยตรงกับผู้ใช้จริงสําหรับโปรเซสเซอร์แบบถาด เว้นแต่จะติดตั้งระบบเซิร์ฟเวอร์ Intel® Data Center Block (Intel® DCB) ไว้ล่วงหน้า ยกเว้นระบบIntel DCB การรับประกันของโปรเซสเซอร์แบบถาดมาจากผู้จําหน่ายหรือสถานที่ซื้อโปรเซสเซอร์หรือระบบหากมีการติดตั้งโปรเซสเซอร์ไว้ล่วงหน้า Intel แนะนําให้ซื้อจากผู้แทนจําหน่ายที่ได้รับอนุญาต ซัพพลายเออร์ที่ได้รับอนุญาตจาก Intel และผู้ค้าปลีกผลิตภัณฑ์ Intel® - โปรดทราบว่า Intel ไม่มีโปรแกรมการเปลี่ยนสินค้าที่ไม่อยู่ในการรับประกัน
การทดสอบล้มเหลว
การทดสอบเสร็จสมบูรณ์ และตรวจพบข้อผิดพลาดในโปรเซสเซอร์ทางกายภาพที่มี /sys/อุปกรณ์/ระบบ/cpu/cpuXX
ติดต่อผู้ผลิตระบบหรือผู้จําหน่ายโปรเซสเซอร์ของคุณสําหรับการสนับสนุน
การทดสอบล้มเหลว
การทดสอบไม่สามารถระบุได้ว่าโปรเซสเซอร์ทางกายภาพใดที่ทําให้เกิดความล้มเหลว
ติดต่อผู้ผลิตระบบหรือผู้จําหน่ายโปรเซสเซอร์ของคุณสําหรับการสนับสนุน
ประวัติเวอร์ชัน
วัน | เวอร์ชัน | คำ อธิบาย |
7 กรกฎาคม 2021 | 540 | เวอร์ชันเริ่มต้น |
หัวข้อที่เกี่ยวข้อง |
เว็บไซต์ศูนย์สนับสนุนIntel® Xeon® |
คู่มือการรับประกันสําหรับโปรเซสเซอร์ Intel® |