วิธีการกู้คืนจากข้อผิดพลาดภายใน (IERR) สําหรับบอร์ดเซิร์ฟเวอร์ Intel®
สิ่งที่ฉันเห็นคืออะไร
IERR เป็นข้อผิดพลาดที่รุนแรงที่รายงานโดยโปรเซสเซอร์ แต่โดยทั่วไปเกิดจากอุปกรณ์ภายนอกคอร์โปรเซสเซอร์ (เช่น หน่วยความจํา PCIe)
- การดําเนินการของโปรเซสเซอร์หยุดทํางานเนื่องจากเหตุการณ์นอกโปรเซสเซอร์มักจะเกิดขึ้น
- ปัญหานี้มักจะมาพร้อมกับเหตุการณ์ CATERR ซึ่งสามารถข้ามการอ้างอิงไขว้สําหรับข้อมูลเพิ่มเติม
วิธีแก้ไข
ทําตามขั้นตอนเหล่านี้ตามลําดับ:
- ดู บันทึกเหตุการณ์ของระบบ (SEL) สําหรับเหตุการณ์ รหัสการแก้ไขข้อผิดพลาด (ECC) หน่วยความจําที่ชํารุดสามารถกระตุ้น IERR ได้
- ตรวจสอบ SEL สําหรับกิจกรรม PCIe ใดๆ อุปกรณ์ PCIe ที่ทํางานผิดปกติสามารถเรียกใช้งาน IERR ได้
- ตรวจสอบให้แน่ใจ ว่าไดรเวอร์ระบบปฏิบัติการ (OS) มีความทันสมัยสําหรับเซิร์ฟเวอร์และสําหรับอุปกรณ์ฮาร์ดแวร์ที่เพิ่งเพิ่มเข้ามา ไดรเวอร์ระบบปฏิบัติการที่ล้าสมัยสามารถเรียกใช้งาน IERR ได้
- ตรวจสอบ บันทึกระบบปฏิบัติการสําหรับรายการสถาปัตยกรรมการตรวจสอบเครื่อง (MCA) ที่อาจบ่งบอกถึงความผิดพลาดของฮาร์ดแวร์ที่อาจก่อให้เกิด IERR
- ยืนยัน ว่าคุณมี BIOS ล่าสุด สําหรับระบบเซิร์ฟเวอร์
- หากรายการบันทึกยืนยันว่ามีโมดูลหน่วยความจําเฉพาะที่อาจทําให้เกิดปัญหา ให้ดําเนินการต่อเพื่อแก้ไขแท่งหน่วยความจําและตรวจสอบเซิร์ฟเวอร์เป็นเวลา 24 ชั่วโมง