วิธีการกู้คืนจากข้อผิดพลาดภายใน (IERR) สําหรับบอร์ดเซิร์ฟเวอร์ Intel®

เอกสาร

การแก้ไขปัญหา

000006043

17/07/2023

สิ่งที่ฉันเห็นคืออะไร

IERR เป็นข้อผิดพลาดที่รุนแรงที่รายงานโดยโปรเซสเซอร์ แต่โดยทั่วไปเกิดจากอุปกรณ์ภายนอกคอร์โปรเซสเซอร์ (เช่น หน่วยความจํา PCIe)

  • การดําเนินการของโปรเซสเซอร์หยุดทํางานเนื่องจากเหตุการณ์นอกโปรเซสเซอร์มักจะเกิดขึ้น
  • ปัญหานี้มักจะมาพร้อมกับเหตุการณ์ CATERR ซึ่งสามารถข้ามการอ้างอิงไขว้สําหรับข้อมูลเพิ่มเติม

วิธีแก้ไข:

ทําตามขั้นตอนเหล่านี้ตามลําดับ:

  1. ดู บันทึกเหตุการณ์ของระบบ (SEL) สําหรับเหตุการณ์ รหัสการแก้ไขข้อผิดพลาด (ECC) หน่วยความจําที่ชํารุดสามารถกระตุ้น IERR ได้
  2. ตรวจสอบ SEL สําหรับกิจกรรม PCIe ใดๆ อุปกรณ์ PCIe ที่ทํางานผิดปกติสามารถเรียกใช้งาน IERR ได้
  3. ตรวจสอบให้แน่ใจ ว่าไดรเวอร์ระบบปฏิบัติการ (OS) มีความทันสมัยสําหรับเซิร์ฟเวอร์และสําหรับอุปกรณ์ฮาร์ดแวร์ที่เพิ่งเพิ่มเข้ามา ไดรเวอร์ระบบปฏิบัติการที่ล้าสมัยสามารถเรียกใช้งาน IERR ได้
  4. ตรวจสอบ บันทึกระบบปฏิบัติการสําหรับรายการสถาปัตยกรรมการตรวจสอบเครื่อง (MCA) ที่อาจบ่งบอกถึงความผิดพลาดของฮาร์ดแวร์ที่อาจก่อให้เกิด IERR
  5. ยืนยัน ว่าคุณมี BIOS ล่าสุด สําหรับระบบเซิร์ฟเวอร์
  6. ไปที่ Baseboard Management Controller Web Console > Configuration > Memory Configuration >ประเภท PPR และ ตั้งค่า การตั้งค่า PPR เป็น Hard
  7. หากรายการบันทึกยืนยันว่ามีโมดูลหน่วยความจําเฉพาะที่อาจทําให้เกิดปัญหา ให้ดําเนินการต่อเพื่อแก้ไขแท่งหน่วยความจําและตรวจสอบเซิร์ฟเวอร์เป็นเวลา 24 ชั่วโมง

หัวข้อที่เกี่ยวข้อง
เซิร์ฟเวอร์ของฉันล้มเหลวและแสดงข้อผิดพลาดนี้: CPU Machine Chk ของโปรเซสเซอร์
สําหรับเคล็ดลับการอัปเดตเฟิร์มแวร์และการแก้ไขปัญหา
คู่มือการแก้ไขปัญหาบันทึกเหตุการณ์ระบบสําหรับบอร์ดเซิร์ฟเวอร์ Intel®