การแก้ไขปัญหาเนื้อหาเพื่อช่วยค้นหาโมดูลหน่วยความจําที่ชํารุด
ฉันจะระบุตําแหน่งของหน่วยประมวลผลกลาง (CPU) ที่เหมาะสม (1 หรือ 2) และโมดูลหน่วยความจําแบบ Dual in-line (DIMM) เมื่อมีโมดูลหน่วยความจําที่บกพร่องและสงสัยได้อย่างไร
ดําเนินการต่อตามที่ระบุไว้ด้านล่าง ซึ่งอ้างอิงตามขั้นตอนการวิเคราะห์ในการค้นหา DIMM ที่ทําให้เกิด IErr ECC_error:
หมาย เหตุ | ตรวจสอบให้แน่ใจว่ามีการโหลดเครื่องมือ ipmitool (ดู IPMI, V2.0, เครื่องมือทดสอบคําสั่ง) หรือพร้อมใช้งานบนโหนดนั้น ซึ่งจะช่วยให้คุณสามารถตรวจสอบบันทึกเหตุการณ์ระบบ (ซึ่งเป็นไบนารี) |
หมาย เหตุ |
ตรวจสอบบันทึกเหตุการณ์ของระบบโดยดูรายการเพิ่มเติมด้วยวิธีนี้:
| ipmitool sel #sudo น้อย กว่า
| 1c 08/24/2018 | 22:51:49 | |เซ็นเซอร์ Mmry ECC ของหน่วยความจํา | ECC ที่ไม่สามารถแก้ไขได้ ตามที่ได้มา
| 1d 08/24/2018 | 22:51:49 | |เซ็นเซอร์ Mmry ECC ของหน่วยความจํา | ECC ที่ไม่สามารถแก้ไขได้ ตามที่ได้มา จากนั้นคุณสามารถตรวจสอบรายการใดๆ ในบันทึกเหตุการณ์ระบบโดยอ้างถึงค่า Hexadecimal (HEX) ในคอลัมน์แรก: #sudo ipmitool sel รับ0x1c
รหัสบันทึก SEL : 001c ประเภทบันทึก : 02 ประทับเวลา : 08/24/2018 22:51:48 ID ผู้สร้าง : 0033 การปรับปรุงแก้ไข EvM : 04 ประเภทเซ็นเซอร์ : หน่วยความจํา หมายเลขเซ็นเซอร์ : 02 ประเภทกิจกรรม : Descrete เฉพาะเซ็นเซอร์ ทิศทางของกิจกรรม : อีเวนต์มั่นใจ ข้อมูลกิจกรรม (RAW) : a10103 การตีความเหตุการณ์ : ขาดหายไป คําอธิบาย : ECC ที่ไม่สามารถแก้ไขได้ ID เซ็นเซอร์ : เซ็นเซอร์ Mmry ECC (0x2) รหัสหน่วยงาน : 32.1 (อุปกรณ์หน่วยความจํา) ประเภทเซ็นเซอร์ : หน่วยความจํา (0x0c) |
ดีบักตําแหน่งล็อกของข้อมูลเหตุการณ์ (RAW)
- ใส่หมายเลขดังกล่าวลงในเครื่องคํานวณ:
- ดูค่า Binary (BIN) โดยเฉพาะอย่างยิ่ง 8 ไบต์สุดท้าย ในภาพด้านบน ให้ดูบิตที่เหมาะสมที่สุด (ตามที่ไฮไลต์ไว้)
- แปลงให้เป็นแบบเทียบเท่าและตามตารางด้านล่างแสดงให้เห็นว่าบิตด้านขวาที่สุดแสดงถึงค่าซ็อกเก็ต DIMM: 0=A, 1=B, 2=C,3=D และอื่นๆ
บิตด้านขวาสุดตัวที่สองแสดงถึงซ็อกเก็ต CPU
ในกรณีนี้ b0000 = CPU1 b0001 จะเท่ากับ CPU2
เมื่อใช้ IPMI จะไม่สามารถรับระดับรายละเอียดตามที่แสดงไว้ใน Baseboard Management Controller (BMC) Web Graphical User Interface (GUI)ได้ อย่างไรก็ตาม คุณสามารถใช้ Redfish ได้โดยเรียกใช้คําสั่งถัดไป: curl -k -u : https:///redfish/v1/Systems//LogServices/SEL/Entries?$skiptoken=0.
หมาย เหตุ |
skiptoken เป็นจุดเริ่มต้นของ โดยปกติโปรแกรมจะส่งคืน 50 บันทึก ดังนั้น skiptoken จะเป็น 0, 50, 100 และอื่นๆ ในตอนท้ายของคําตอบ จะบอกให้คุณทราบว่าควรอ่าน ข้ามสิ่ง ใดต่อไป |
หรือคุณสามารถใช้Intel® Server Debug and Provisioning Tool (Intel® SDP Tool)จากระบบตัวจัดการเซิร์ฟเวอร์ของคุณที่ใช้SDPtool debuglog command