ความผิดปกติของการบูต (FRB) ทำงานอย่างไรบนบอร์ดเซิร์ฟเวอร์ Intel®และระบบเซิร์ฟเวอร์ Intel®

เอกสาร

ข้อมูลผลิตภัณฑ์และเอกสารประกอบ

000007197

31/10/2017


อาการ:
  • FRB คืออะไร
  • ฉันจะทราบได้อย่างไรว่ากำลังทำงานอยู่หรือไม่
  • ความผิดพลาดในการบูตแบบยืดหยุ่นบนเซิร์ฟเวอร์ Intel®

โซลูชัน:

ความผิดพลาดในการบูตที่ยืดหยุ่น

มี BMC (คอนโทรลเลอร์การจัดการ Baseboard) ประมวลผลระดับ FRB 1, 2, และ3 หากโปรเซสเซอร์ bootstrap เริ่มต้น (BSP) ไม่สามารถทำกระบวนการ boot ได้ FRB จะพยายามบู๊ตโดยใช้โปรเซสเซอร์สำรอง

  • FRB level 1 มีวัตถุประสงค์เพื่อกู้คืนจากความล้มเหลวของ BIST ที่ตรวจพบระหว่างการโพสต์ การกู้คืน FRB นี้จะได้รับการจัดการอย่างเต็มที่ด้วยรหัส BIOS
  • FRB level 2 มีวัตถุประสงค์เพื่อกู้คืนจากหมดเวลา watchdog ในระหว่างการโพสต์ ตัวจับเวลา watchdog สำหรับ FRB level 2 ถูกนำไปใช้ใน BMC
  • FRB level 3 มีวัตถุประสงค์เพื่อกู้คืนจาก watchdog timeout บนฮาร์ดรีเซ็ตหรือเปิดเครื่อง ซึ่งจะให้การทำงานของฮาร์ดแวร์สำหรับ FRB ระดับนี้

FRB-1

ในระบบมัลติโปรเซสเซอร์ต่างๆ BIOS จะลงทะเบียนโปรเซสเซอร์แอพพลิเคชั่นในตารางแบบหลายโปรเซสเซอร์ (MP) และตาราง ACPI APIC เมื่อเริ่มทำงานโดย BSP หากโปรเซสเซอร์แอพพลิเคชั่น (AP) ล้มเหลวในการเริ่มต้นใช้งานภายในเวลาที่กำหนดไม่ได้ หาก BIOS ตรวจพบว่าโปรเซสเซอร์แอพพลิเคชั่นล้มเหลว BIST หรือไม่ทำงานก็ขอให้ปิดใช้งานโปรเซสเซอร์ดังกล่าว

จากนั้นจะสร้างระบบรีเซ็ตขณะปิดใช้งานโปรเซสเซอร์ BIOS จะไม่เห็นโปรเซสเซอร์ที่ล้มเหลวในรอบการเริ่มระบบครั้งถัดไป AP ที่ล้มเหลวไม่ได้อยู่ในตาราง MP, หรือในตาราง ACPI APIC และจะมองไม่เห็นด้วยระบบปฏิบัติการ หาก BIOS ตรวจพบว่า BSP ล้มเหลว BIST จะส่งคำขอไปยัง BMC เพื่อปิดใช้งานโปรเซสเซอร์ปัจจุบัน หากไม่มีโปรเซสเซอร์สำรองให้ใช้งานจะมีเสียงเตือนและหยุดทำงานของลำโพง หาก BMC สามารถค้นหาโปรเซสเซอร์อื่นความเป็นเจ้าของ BSP จะถูกโอนไปยังโปรเซสเซอร์ดังกล่าวผ่านการรีเซ็ตระบบ

FRB-2

ตัวจับเวลา watchdog ที่สอง (FRB-2) ใน BMC ถูกตั้งค่าไว้ที่ประมาณ6นาทีโดย BIOS และได้รับการออกแบบมาเพื่อรับประกันว่าระบบจะทำการโพสต์ BIOS ให้เสร็จสมบูรณ์ เปิดใช้งานตัวจับเวลา FRB-2 ก่อนที่ตัวจับเวลา FRB-3 จะถูกปิดใช้งานเพื่อป้องกันไม่ให้มีหน้าต่างที่ไม่มีการ ป้องกันของเวลา ใกล้สิ้นสุดโพสต์ก่อนที่รอมตัวเลือกจะถูกเตรียมใช้งาน BIOS จะปิดใช้งานตัวจับเวลา FRB-2 ใน BMC

หากระบบมีหน่วยความจำมากกว่า 1 GB และผู้ใช้เลือกที่จะทดสอบหน่วยความจำทั้งหมด DWORD watchdog timer ถูกปิดใช้งานก่อนที่การทดสอบหน่วยความจำขยายจะเริ่มขึ้นเนื่องจากการทดสอบหน่วยความจำอาจใช้เวลามากกว่า6นาทีภายใต้การกำหนดค่านี้ หากระบบแฮงค์ระหว่างการโพสต์ BIOS จะไม่ปิดใช้งานตัวจับเวลาใน BMC ซึ่งจะสร้างระบบแบบอะซิงโครนัส (ASR)

FRB-3

ตัวจับเวลาแรก (FRB-3) เริ่มนับถอยหลังเมื่อใดก็ตามที่ระบบออกมาจากฮาร์ดรีเซ็ตซึ่งโดยปกติแล้วจะอยู่ที่ประมาณ5วินาที หาก BSP รีเซ็ตและเริ่มต้นดำเนินการ BIOS จะปิดใช้งานตัวจับเวลา FRB-3 ใน BMC โดย de-ยืนยันสัญญาณ FRB_TIMER_HLT (GPIO) และระบบยังคงอยู่พร้อมกับโพสต์ หากตัวจับเวลาหมดอายุเนื่องจากความล้มเหลวของ BSP ในการดึงหรือรันรหัส BIOS จะมีการรีเซ็ตระบบและปิดใช้งานโปรเซสเซอร์ที่ล้มเหลว

ระบบยังคงเปลี่ยนแปลง BSP จนกว่า BIOS จะได้รับการปิดใช้งานตัวจับเวลา FRB-3 ใน BMC รหัสสัญญาณเตือนเสียงบี๊บบนลำโพงหากไม่พบโปรเซสเซอร์ที่ดี กระบวนการของการขี่จักรยานผ่านโปรเซสเซอร์ทั้งหมดจะถูกทำซ้ำเมื่อระบบรีเซ็ตหรือวงจรไฟฟ้า