ประสิทธิภาพในยามสำคัญ

Intel® Optane™ SSD มอบประสิทธิภาพสูงสุดที่ Queue Depth ซึ่งเกี่ยวข้องกับแอปในโลกความเป็นจริง ไม่ใช่ตามเกณฑ์มาตรฐานเชิงสังเคราะห์ ซึ่งแตกต่างจาก NAND SSD

คุณต้องการไดรฟ์ Solid State (SSD) ที่ทำงานเร็วที่สุดสำหรับคุณและสำหรับเวิร์คโหลดของคุณ เพราะคุณกำลังอ่านบทความนี้ จึงเป็นการดีที่คุณจะศึกษาข้อมูลจำเพาะประสิทธิภาพของ SSD เมื่อต้องเลือก SSD สำหรับระบบของคุณ เมื่อคุณอ่านข้อมูลจำเพาะ คุณจะเห็นอัตรารับส่ง (หรือที่รู้จักกันในอีกชื่อว่า แบนด์วิดธ์) ถูกกำหนดไว้สำหรับทั้งการอ่านและเขียน และคุณจะเห็นการเข้าถึงสูงสุดตามกำหนดต่อวินาที (มักเรียกกันว่าการดำเนินการอินพุต/เอาต์พุตต่อวินาที [IOPS]) ด้วยเช่นกัน คุณอาจรู้สึกประหลาดใจที่รับรู้ว่าข้อมูลจำเพาะเหล่านี้วางหลักจากสถานการณ์การทดสอบในอุดมคติอย่างมาก สถานการณ์เหล่านี้อาจจะไม่ (ซึ่งที่จริงก็มักจะไม่) ตรงกับแอปพลิเคชันที่เราต้องการเรียกใช้อย่างรวดเร็ว

ในบทความนี้ เราจะสำรวจบทบาทที่การเข้าถึงอันเด่นชัดจำนวนหนึ่ง (มักเรียกกันว่า Queue Depth [QD] ของเวิร์คโหลด) มีต่อประสิทธิภาพของ SSD เราจะศึกษาประเภทของ QD ที่มักจะพบเห็นกับแอปพลิเคชันจริงๆ ด้วย

กล่าวง่ายๆ คือ แอปพลิเคชันส่วนใหญ่จะมี QD ที่ค่อนข้างต่ำ ส่วน NAND SSD ต้องใช้ QD ที่สูงเพื่อส่งมอบประสิทธิภาพออกมาอย่างเต็มที่ ด้วยความหน่วงแฝงที่ต่ำ Intel® Optane™ SSD จึงส่งมอบประสิทธิภาพสูงที่ QD ต่ำได้ ดังนั้น Intel® Optane™ SSD จึงส่งมอบประสิทธิภาพสูงสำหรับแอปพลิเคชันในวงกว้างได้มากกว่ามาก

ความแพร่หลายของแอปพลิเคชันแบบ QD ต่ำ

QD ไม่ใช่สิ่งที่ผู้คนส่วนใหญ่จะนึกถึงทุกวัน การเปรียบเปรยสามารถช่วยอธิบาย QD, แสดงถึงความสัมพันธ์ของ QD กับความหน่วงแฝงและอัตรารับส่ง, และช่วยอธิบายว่าเหตุใดการมี QD ต่ำจึงสำคัญ

ลองนึกว่าเพิงเก็บของของคุณเกิดไฟไหม้ คุณไม่มีสายฉีดน้ำ แต่คุณมีถังและก๊อกน้ำอยู่อีกฝั่งหนึ่งของสนามย่อมๆ คุณจึงรีบเปิดก๊อกเติมน้ำจนเต็มถัง ปิดก๊อก วิ่งข้ามสนาม แล้วราดน้ำลงไปบนกองไฟ จากนั้นก็วิ่งกลับไปยังก๊อกน้ำแล้วทำตามขั้นตอนเดิม

ในตัวอย่างนี้ (รูป 1) QD เท่ากับหนึ่ง (QD=1) เพราะมีเพียงคนเดียวและถังเดียว อัตรารับส่งจะเท่ากับอัตราค่าเฉลี่ยของน้ำที่ปล่อยออกมาจากก๊อกน้ำแล้วใช้ราดใส่กองไฟ (ตัวอย่างเช่น 12 ครั้งต่อชั่วโมง) ความหน่วงแฝงในตัวอย่างนี้ก็คือเวลาตั้งแต่ที่ใช้ราดน้ำลงบนกองไฟจากถังหนึ่งจนหมดสิ้นกระทั่งถังน้ำถังถัดมาเทราดใส่กองไฟ (เช่น ห้านาที)

จะเห็นได้ว่ามีความสัมพันธ์ระหว่างความหน่วงแฝงกับอัตรารับส่งน้ำลงบนกองไฟ ถ้าสนามมีขนาดกว้างใหญ่ขึ้น ก็ต้องใช้เวลาขนน้ำนานขึ้น ดังนั้นความหน่วงแฝงของถังน้ำที่ไปขนมาก็จะเพิ่มขึ้น และอัตรารับส่งน้ำก็จะลดน้อยถอยลง

รูป 1 อัตรารับส่งจะขึ้นอยู่กับความหน่วงแฝง (เวลาเดินทางไปกลับ) และ QD (จำนวนของถังน้ำ)

ถ้าเราสามารถลดขนาดของสนามลงได้ (รูป 2) โดยเคลื่อนก๊อกน้ำเข้าไปใกล้เพิงเก็บของ ก็จะทำให้เราวิ่งข้ามสนามได้เร็วขึ้นและนำนำ้ไปเทใส่กองไฟได้ไวขึ้น ในกรณีนี้ เราลดความหน่วงแฝงลง และแม้ว่าจะเป็น QD=1 เราก็ยังเพิ่มอัตรารับส่งและประสิทธิภาพของการดับเพลิงได้

รูป 2: ถ้าคุณย่นระยะทาง ความหน่วงแฝงก็จะลดลงและอัตรารับส่งก็จะเพิ่มขึ้น

การลดความหน่วงแฝงฟังดูเหมือนเป็นเรื่องอัศจรรย์ แล้วมีวิธีการอื่นอีกไหม ลองดูตัวอย่างของ QD= 2 นี้ เราต้องใช้อีกถังหนึ่งและเพื่อนสักคนมาช่วยเรา คราวนี้นักดับเพลิงสองคนวิ่งสวนกันในสนาม คนหนึ่งตรงไปที่กองไฟ อีกคนตรงไปยังก็อกน้ำ ความหน่วงแฝงไม่ได้เปลี่ยนไปเพราะขนาดของสนามยังเท่าเดิม แต่ด้วย QD=2 ทำให้อัตรารับส่งของเราเพิ่มเป็นสองเท่า นั่นคือ น้ำใช้เทราดลงกองไฟได้เร็วขึ้น (รูป 3)

รูป 3 อีกวิธีการหนึ่งของการเพิ่มอัตรารับส่งก็คือการเพิ่ม QD

เราสามารถดำเนินการเพิ่มอัตรารับส่งน้ำไปราดใส่กองไฟได้โดยเพิ่ม QD กระทั่งเราไม่เหลือถังน้ำและเพื่อนอีก เมื่อเราเพิ่มจำนวนของนักดับเพลิงที่วิ่งข้ามสนามกันไปมา เราก็จะเริ่มวิ่งชนกัน (รูป 4) กล่าวคือ เรานำเอาความไร้ประสิทธิผลเข้ามา ตอนนี้ผู้ที่มาช่วยเพิ่มแต่ละคนจะไม่ส่งผลช่วยมากเท่ากับผู้ที่มาช่วยคนแรก พอถึงจุดหนึ่งเราจะพบว่าก๊อกน้ำจะไม่มีการปิดอีก เพราะจะมีใครบางคนกำลังเปิดน้ำใส่ถังอยู่ตลอด ณ จุดนี้เราจะเข้าสู่ภาวะจุดอิ่มตัว (อัตรารับส่งสูงสุดสำหรับก๊อกน้ำ) และการเพิ่มจำนวนถังขึ้น (QD ที่สูงขึ้น) ก็จะไม่ช่วยอะไรอีก

รูปที่ 4 ในท้ายที่สุดการเพิ่ม QD ก็จะถึงจุดที่ผลตอบแทนตกลงเพราะความอิ่มตัวทำให้เกิดความแออัด

ระบบของหน่วยจัดเก็บข้อมูลก็ทำงานดังตัวอย่างข้างต้น แอปพลิเคชันที่รันอยู่บนโปรเซสเซอร์คือเพิงเก็บของที่ไฟไหม้อยู่ กล่าวคือ มันต้องการถังข้อมูลที่จะมาช่วยเคลื่อนการประมวลผลให้เดินหน้า แอปพลิเคชันหรือระบบปฏิบัติการที่รันอยู่บนโปรเซสเซอร์ต่างก็จะทำการร้องขอข้อมูลจาก SSD และข้อมูลที่ได้กลับมาก็จะใช้เคลื่อนการประมวลผลให้เดินหน้า จำนวนรายการข้อมูลที่แอปพลิเคชันจะร้องขอได้พร้อมๆ กัน (ตัว QD หรือจำนวนของถัง) จะขึ้นอยู่กับการประมวลผลข้อมูลแบบขนานและความสามารถของแอปพลิเคชัน ความหน่วงแฝงสำหรับการเข้าถึงแต่ละครั้งจะขึ้นอยู่กับความหน่วงแฝงของ SSD และเส้นทางของระบบไปยัง SSD นั้น ดังนั้นอัตรารับส่งจะขึ้นอยู่กับทั้งแอปพลิเคชันและ SSD ที่ใช้นั้น

แอปพลิเคชันและเกณฑ์มาตรฐาน QD

โดยปกติการวัดประสิทธิภาพ SSD จะใช้เกณฑ์มาตรฐาน เช่น FIO (Linux) หรือ CrystalDiskMark (Windows) เกณฑ์มาตรฐานเหล่านี้สามารถวัด QD สูงได้ FIO สามารถกำหนดค่าโดยคำนึงถึง QD ได้โดยสมบูรณ์ เพียงแค่ระบุ QD ที่คุณต้องการ การทดสอบ FIO กับ QD โดยเท่ากับ 128 หรือ 256 ถือเป็นเรื่องปกติเมื่อทำการรายงานประสิทธิภาพของ SSD CrystalDiskMark รวมกับการทดสอบกับ 16 เธรด โดยแต่ละเธรดกับ QD ที่ 32 สำหรับจำนวน QD ทั้งหมดที่ 512 QD ที่สูงเช่นนี้จะเหมาะกับการทดสอบ SSD อย่างเต็มรูปแบบ และเพื่อเป็นการอวดถึงประสิทธิภาพสูงสุดที่เป็นไปได้ในแง่ของ IOPS และอัตรารับส่ง

อย่างไรก็ตาม ตัวเลขประสิทธิภาพสูงเหล่านั้น และการอิงกับ QD ที่สูง ไม่ได้เป็นการสะท้อนถึงประสบการณ์จริงที่ได้รับในแต่ละวันภายในศูนย์ข้อมูลและบนพีซีของผู้ใช้ส่วนใหญ่ ในสถานการณ์แห่งโลกความเป็นจริง QD ที่สูงแทบจะไม่เกิดขึ้นและคงรักษาไว้ได้ การทดสอบภายในของ Intel ต่อเวิร์คโหลดจริงของศูนย์ข้อมูลได้เผยให้เห็นว่าแอปพลิเคชันส่วนใหญ่จะอยู่ในช่วง 1 ถึง 9 QD (รูป 5).1ที่จริงแล้ว มีเพียงการปฏิบัติใช้เกณฑ์มาตรฐานเชิงธุรกรรม (เช่น TPC-H) ที่สามารถได้ QD ปริมาณมากได้

รูปที่ 5 เวิร์คโหลดระดับองค์กรมากมายเกิดขึ้นในช่วง QD ต่ำ1

รูปที่ 6 เวิร์คโหลดของไคลเอนต์หลายตัวและ QD ที่เกี่ยวข้อง เวิร์คโหลดที่วัดทั้งหมดปฏิบัติงานที่ QD ต่ำเป็นหลัก2

สถานการณ์ยิ่งหนักหน่วงสำหรับแอปพลิเคชันบนพีซี จากการวัดค่าของเราเอง เราพบว่าแอปพลิเคชันบนเดสก์ท็อปหลายตัวรองรับ QD เพียงหนึ่ง สอง หรือสี่เท่านั้น อย่างที่ในรูป 6 แสดงไว้ เวิร์คโหลดในโลกความเป็นจริงสำหรับแอปพลิเคชันยอดนิยมส่วนใหญ่หลายตัวเกิดขึ้นน้อยกว่าที่ QD=3

รูป 5 และ 6 แสดงไว้ชัดเจนถึงความไม่เชื่อมโยงกันระหว่างการวัดได้ QD สูงที่ใช้กับเอกสารข้อมูลจำเพาะของ SSD และความต้องการของแอปพลิเคชันในโลกความเป็นจริง เกณฑ์มาตรฐาน SSD มีถังมากมายให้เคลื่อนข้อมูล ขณะที่แอปพลิเคชันให้เพียงน้อยนิด จากพื้นฐานข้อมูลนี้ ให้เราหันไปพิจารณาที่ประสิทธิภาพของ NAND และ Intel® Optane™ SSD เทียบกับ QD

ประสิทธิภาพของ NAND SSD

ไม่ใช่เรื่องแปลกใจที่ NAND SSD ถูกสร้างขึ้นจากหน่วยความจำ NAND NAND SSD เดียวประกอบด้วยวงจรรวม NAND มากมาย ความหน่วงแฝงสำหรับการอ่านข้อมูลจากวงจรรวม NAND ตัวมันเองก็ครอบงำความหน่วงแฝง SSD สำหรับความหน่วงแฝงส่วนท้ายทั้งหมดยกเว้นที่ไม่เกิดขึ้นบ่อย3 เนื่องจากความหน่วงแฝงการอ่านของ NAND นี้ NAND SSD รุ่นใหม่จึงมักมีค่าเฉลี่ยขณะไม่ทำงานอยู่ที่ประมาณ 80 ไมโครวินาที (µs).4 สำหรับ 3 GHz CPU เดียวที่แปลออกเป็น 240,000 คำสั่งของโปรเซสเซอร์ ถือว่าเป็นการวิ่งแบกถังน้ำข้ามสนามกว้างใหญ่

เพราะความหน่วงแฝงที่ค่อนข้างสูงนี้ ประสิทธิภาพของ QD ต่ำจึงเป็นปัญหาสำหรับ NAND SSD ลองคำนวณดูสักหน่อย—4,096 ไบต์ x (1/80 µs) = 50 MB/วิ—แสดงให้เห็นว่าอัตรารับส่งจะเชื่องช้าเพียงใด แน่นอนการถ่ายโอนปริมาณมากขึ้น (ถังใหญ่ขึ้น) จะเพิ่มอัตรารับส่งนี้ เพราะเหตุนี้คุณจึงเห็นเกณฑ์มาตรฐาน SSD ใช้การถ่ายโอนปริมาณมากเพื่อทำการวัดอัตรารับส่ง โปรดทราบว่ามีเพียงบางแอปพลิเคชันเท่านั้นที่สามารถใช้การถ่ายโอนปริมาณมากได้

ลองคำนวณดูอีกสักหน่อย—(1/80 µs) = 12K IOPS—แสดงให้เห็นว่า IOPS จะต่ำเพียงใดสำหรับ QD=1 จำนวน QD สูงขึ้นก็จะเพิ่มอัตรานี้ขึ้น เพราะเหตุนี้คุณจึงเห็นการวัด QD ปริมาณมากขึ้นสำหรับค่าเหล่านี้ การถ่ายโอนปริมาณมากขึ้นจะเพิ่มตัวเลขอัตรารับส่งขึ้นด้วย เพราะเหตุนี้คุณจะได้เห็นระดับ QD สูงเพื่อการวัด IOPS สำหรับ SSD

ยังมีผลกระทบชั้นรองมากมายต่อประสิทธิภาพของ NAND SSD ที่ทำให้จำเป็นต้องมี QD สูงขึ้นด้วยเพื่อให้ได้ประสิทธิภาพสูงสุดของ NAND SSD ผลกระทบเดียวที่ควรกล่าวถึงไว้ตรงนี้คือ เอฟเฟกต์ Yahtzee ชื่อซึ่งได้มาจาก Knut Grimsrud เพื่อนร่วมงานใน Intel คนหนึ่ง วงจรรวม (IC) แต่ละวงจรของ NAND สามารถรคงไว้ซึ่งการอ่านเดียวตลอดความหน่วงแฝงทั้งหมดของตน ดังนั้นการจะให้ได้ประสิทธิภาพที่สูงขึ้น NAND SSD ต้องมีหลาย IC และการอ่านแต่ละครั้งต้องใช้ IC ที่แตกต่างกัน แต่ข้อมูลจะคงถือไว้บน IC หนึ่งๆ ดังนั้นการขอเข้าถึงที่กำลังเข้ามาอาจชนกับการขอเข้าถึงก่อนหน้าสำหรับ IC หนึ่งๆ และต้องรอก่อน แม้ว่า IC อื่นๆ ไม่ทำงานอยู่ก็ตาม ราวกับว่าเรามีหลายๆ ก๊อกน้ำ แต่แต่ละก๊อกปล่อยน้ำช้า และแต่ละถังจะต้องเติมน้ำจากก๊อกน้ำหนึ่งๆ เท่านั้น เมื่อ QD เพิ่มขึ้น โอกาสที่การอ่านจะชนกันสำหรับ IC หนึ่งก็เพิ่มขึ้น เป็นเหตุให้ประสิทธิภาพเพิ่มขึ้นได้ช้ากว่า QD เพราะเหตุนี้เอกสารข้อมูลจำเพาะของ SSD จะระบุ QD ปริมาณมากเพื่อแสดง IOPS สูง ส่วน Intel® Optane™ SSD ไม่ได้รับผลจากเอฟเฟกต์ Yahtzee เนื่องจากมีสถาปัตยกรรมของหน่วยความจำและ SSD ที่มีศักยภาพมากกว่า

Intel® Optane™ SSD ทำงานได้เหนือชั้นกว่า NAND SSD ในการปฏิบัติงานตามโลกความเป็นจริงของศูนย์ข้อมูลอย่างไร

Intel® Optane™ SSD ได้รับการออกแบบมาให้มีประสิทธิภาพสูงสุดที่ QD ในโลกความเป็นจริง โดยใช้สถาปัตยกรรมปฏิวัติวงการของหน่วยความจำและ SSD ที่มอบความหน่วงแฝงต่ำแบบเสมอต้นเสมอปลาย ซึ่งแตกต่างจาก NAND SSD ความหน่วงแฝงต่ำของสื่อหน่วยความจำ Intel® Optane™ ช่วยให้ SSD สามารถมีความหน่วงแฝงต่ำลงมากๆ ได้ (สำหรับ SSD) ที่ประมาณ ~8 µs (วิ่งข้ามสนามขนาดเล็กลงมาก) นอกจากนี้ ความหน่วงแฝงของ Intel® Optane™ SSD ไม่ได้ถูกครอบงำด้วยความหน่วงแฝงของหน่วยความจำและไม่ได้รับผลกระทบจากเอฟเฟกต์ Yahtzee ซึ่งแตกต่างจาก NAND SSD Intel® Optane™ SSD จะรวบรวมแม้แต่การอ่าน 4 KB เดียวจากหลายๆ IC ของสื่อหน่วยความจำ Intel® Optane™ และ IC เหล่านั้นก็พร้อมที่จะทำการอ่านถัดไปได้อย่างรวดเร็ว Intel® Optane™ SSD จะเลี่ยงตำแหน่งและการชนกันแบบยึดตามที่อยู่ที่ NAND SSD แสดงออกมา ราวกับว่า Intel® Optane™ SSD ใช้หลายๆ ก๊อกน้ำพร้อมๆ กันเพื่อเติมน้ำในถังเดียว ทำให้พร้อมที่จะเติมน้ำในถังถัดไปได้อย่างรวดเร็วมาก นี่หมายความว่าสื่อหน่วยความจำ Intel® Optane™ พร้อมที่จะทำการอ่านถัดไปในเวลาที่น้อยกว่า NAND SSD มาก จึงไม่ต้องใช้การทำงานแบบขนานของอินพุต/เอาต์พุต (I/O) เพื่อให้ได้ IOPS สูงๆ

กล่าวง่ายๆ ก็คือ Intel® Optane™ SSD ส่งมอบประสิทธิภาพสูงสุด ณ QD ที่สอดคล้องกับ QD ที่ต่ำกว่าซึ่งแอปพลิเคชันส่วนใหญ่ใช้ทำงาน โดยปกติ NAND SSD ต้องใช้ช่วง QD ที่ 128 หรือมากกว่าเพื่อส่งมอบประสิทธิภาพสูงสุด ขณะที่ Intel® Optane™ SSD สามารถทำงานได้มีประสิทธิภาพเต็มที่ด้วย QD ที่ปริมาณน้อยกว่ามากซึ่งมักพบเห็นในแอปพลิเคชันจริงๆ (ดูรูป 7)5 แผนภูมินี้ก็แสดงความแตกต่างของประสิทธิภาพระหว่าง NAND SSD (Intel® SSD P4610) และ Intel® Optane™ SSD (Intel® Optane™ SSD P4800X) ผลที่ได้บ่งบอกถึงข้อได้เปรียบด้านความเร็วในโลกความเป็นจริงของ Intel® Optane™ SSD อยู่ที่สี่ถึงห้าเท่าของประสิทธิภาพที่เกี่ยวข้องในโลกความเป็นจริงของ Intel® NAND SSD ที่ทำการทดสอบ

รูป 7 Intel® Optane™ SSD ส่งมอบประสิทธิภาพสูงสุด ณ QD ที่ต่ำกว่า ซึ่งแอปพลิเคชันส่วนใหญ่ใช้ทำงาน โดยปกติ NAND SSD ต้องใช้ช่วง QD ที่ 128 หรือมากกว่าเพื่อส่งมอบประสิทธิภาพสูงสุด6

แม้ว่านี่จะเป็นแผนภูมิที่สำคัญ แต่ก็ยังไม่ใช่ภาพแสดงเรื่องราวทั้งหมด รูป 8 แสดงเวิร์คโหลดเดียวกัน แต่นำไปวาดไว้เพื่อแสดงจุดปฏิบัติการของระบบในแง่ของทั้งอัตรารับส่งที่ส่งมอบ (x-axis) และผลลัพธ์ความหน่วงแฝงต่อการอ่าน I/O (y-axis) QD แสดงประกอบไว้เป็นตัวเลขบนเส้นของ NAND และ Intel® Optane™ SSD สมมติว่าเรามีแอปพลิเคชันที่สามารถดำเนินการ QD=4 ได้ Intel® Optane™ SSD จะให้แอปพลิเคชันนั้นสามารถปฏิบัติการที่อัตรารับส่งมากกว่า 1.2 GB/วิ ด้วยความหน่วงแฝงต่อ I/O การอ่านที่ประมาณ 10 µs เท่านั้น ในทางกลับกัน NAND SSD จะให้แอปพลิเคชันนั้นมีจุดปฏิบัติการที่น้อยกว่า 0.3 GB/วิ และความหน่วงแฝงต่อ I/O การอ่านที่ประมาณ 100 µs จุดปฏิบัติการที่แตกต่างกันอย่างมากเหล่านี้จะส่งผลให้เกิดประสิทธิภาพของแอปพลิเคชันที่แตกต่างกันอย่างมากเช่นกัน

รูป 8 ณ QD ที่ต่ำกว่า Intel® Optane™ SSD จะให้แบนด์วิดธ์ที่สูงกว่าและความหน่วงแฝงที่ต่ำกว่า NAND SSD6

โปรดสังเกตในรูป 8 ด้วยว่า NAND SSD จะต้องใช้ QD ที่ 128 หรือ แม้แต่ 256 เพื่อให้ได้ประสิทธิภาพเต็มที่ ถึงแม้แอปพลิเคชันของคุณจะสามารถไปถึงจุดปฏิบัตการนั้นได้ ก็ต้องแลกกับการมีความหน่วงแฝงที่สูงขึ้นสำหรับการอ่าน ถึงตอนนี้คุณคงเห็นแล้วว่าเหตุใดประสิทธิภาพสูงสุดของ NAND SSD จึงระบุให้ QD สูงเช่นนั้น และทำไมคุณควรถามถึงความหน่วงแฝงสำหรับการอ่านที่จุดปฏิบัติการนั้น ด้วยเหตุผลนี้เอง หลายเกณฑ์มาตรฐาน เช่น CrystalDiskMark จึงรวมการวัดค่า QD=1 เป็นส่วนหนึ่งในชุดการทดสอบของตนด้วย Intel® Optane™ SSD สามารถสร้างประสิทธิภาพเต็มที่สำหรับ QD หนึ่งเพียงแค่เกิน 8 เท่านั้น อีกทั้งยังรักษาความหน่วงแฝงต่ำของการอ่านที่จุดปฏิบัติการนั้นได้ สำหรับ QD ของแอปพลิเคชันตามจริงแล้ว Intel® Optane™ SSD จะส่งมอบอัตรารับส่งสูงและความหน่วงแฝงต่ำได้พร้อมๆ กัน เมื่อถึงเวลาต้องดับเพลิง ผมก็ต้องการ Intel® Optane™ SSD ในระบบของผม

ข้อดีแถมพิเศษของ Intel® Optane™ SSD ที่มีประสิทธิภาพความหน่วงแฝงต่ำ คือ เขียนโค้ดง่ายกว่า

ดังที่ David Clark จาก MIT เคยกล่าวไว้ว่า “ปัญหาของแบนด์วิดธ์สามารถแก้ได้ด้วยเงิน ปัญหาของความหน่วงแฝงแก้ยากกว่าเพราะแสงมีความเร็วตายตัว คุณไม่สามารถติดสินบนพระเจ้าได้"7 ถึงแม้ Clark กำลังพูดถึงระบบเครือข่าย แต่นั่นก็เป็นจริงกับหน่วยจัดเก็บข้อมูล ความหน่วงแฝงต่ำสร้างผลกระทบในวงกว้างมากได้ เราสังเกตเห็นลักษณะที่เกิดขึ้นซ้ำๆ นี้ขณะที่เราทำงานกับนักพัฒนาระบบปฏิบัติการและแอปพลิเคชันเพื่อผนวกรวม Intel® Optane™ SSD ความหน่วงแฝงต่ำเข้าไปในระบบ นักพัฒนาเหล่านี้ก่อให้เกิดต้นทุนในรูปแบบของเวลาการพัฒนา การเขียนโค้ดเพิ่มพิเศษ และวัฐจักรการประมวลผลเพิ่มพิเศษเพื่อเอาชนะความหน่วงแฝงสูงของหน่วยจัดเก็บข้อมูล ตลอดหลายปีที่นักพัฒนาระบบปฏิบัติการและแอปพลิเคชันศูนย์ข้อมูลหลักได้พยายามเพิ่มอัตรารับส่งของแอปพลิเคชันแม้ว่าจะได้รับความหน่วงแฝงสูงของ NAND SSD ก็ตาม (และแม้แต่ฮาร์ดดิสก์ไดรฟ์ [HDD]) การเขียนโค้ดที่สำคัญและวิธีการหาหลายคำตอบที่ซับซ้อนได้รับการพัฒนาขึ้นเพื่อร่นเวลารอนานที่เกิดขึ้นเมื่อทำการถ่ายโอนข้อมูลไปและจากหน่วยจัดเก็บข้อมูล ด้วย Intel® Optane™ SSD ก็ไม่จำเป็นต้องมีการเขียนโค้ดเพิ่มพิเศษและเวลาของนักพัฒนาเพิ่มพิเศษนี้อีกต่อไป ความหน่วงแฝงต่ำที่ Intel® Optane™ SSD มีให้ช่วยแก้ไขที่รากของปัญหา นั่นคือ การเข้าถึงข้อมูลได้รวดเร็ว

เพื่ออธิบายแนวคิดนี้ ให้ดูที่ TPC-C เกณฑ์มาตรฐานด้านฐานข้อมูลที่มีความสำคัญในเชิงพานิชย์ Jeff Smits เพื่อนร่วมงานอีกคนที่ Intel ได้ทำการทดลองอย่างเข้มข้นโดยเปรียบเทียบประสิทธิภาพของ NAND SSD กับประสิทธิภาพของ Intel® Optane™ SSD TPC-C เน้นย้ำที่เรื่องของอัตรารับส่ง—ธุรกรรมต่อวินาที (TPS) การใช้งานฐานข้อมูลของ TPC-C ได้รับการปรับประสิทธิภาพอย่างยิ่งยวดที่ระดับโค้ดและระบบ Jeff พบว่าการแค่ใส่ Intel® Optane™ SSD เข้าไปในระบบไม่ได้ทำให้เกิดประโยชน์อย่างเต็มเม็ดเต็มหน่วย เขาต้องลดจำนวนของธุรกรรมที่ค้างอยู่เนื่องจากระบบที่ได้รับการปรับประสิทธิภาพอย่างยิ่งยวดนี้ผลิตขึ้น เมื่อเขาทำแล้ว ก็พบว่าประสิทธิภาพในระดับแอปพลิเคชันเพิ่มขึ้นอย่างเห็นได้ชัด ระบบรับเอาหน่วยจัดเก็บข้อมูลที่มีความหน่วงแฝงสูง จึงรวมโค้ดแบบซับซ้อนที่สามารถผลิตธุรกรรมขึ้นพร้อมๆ กันจำนวนมากได้ ที่น่าสนใจคือการลดจำนวนธุรกรรมที่ค้างอยู่ยังช่วยให้แคชของ CPU ทำงานได้อย่างมีประสิทธิภาพมากขึ้นด้วย เพราะขนาดชุดการทำงานของแอปพลิเคชันลดลง เราได้เห็นการปรับให้เรียบง่ายทำนองเดียวกันนี้มีโอกาสเพิ่มประสิทธิภาพให้การแบ่งหน้าหน่วยความจำเสมือนของระบบปฏิบัติการเช่นกัน

ดังนั้นข้อดีแถมพิเศษของ Intel® Optane™ SSD ก็คือการลดความซับซ้อนของโค้ดและชุดการทำงานให้เล็กลง เนื่องจากความซับซ้อนที่ลดลงนั้นทำให้เราเห็นประสิทธิภาพของระบบเพิ่มขึ้นด้วย ถ้าคุณเป็นนักพัฒนา ลองนึกถึงแอปพลิเคชันของคุณและวิธีที่คุณจะทำให้เรียบง่ายเพื่อให้ได้ประสิทธิภาพและผลิตภาพสูงขึ้นโดยใช้ Intel® Optane™ SSD

ประสิทธิภาพใน "โลกความเป็นจริง" เท่านั้นที่สำคัญจริงๆ

คำว่า "โลกความเป็นจริง" มีใช้กระจายอยู่ทั่วบทความนี้ อย่างที่ควรจะเป็น ท้ายที่สุดแล้ว สถิติแสดงประสิทธิภาพที่เผยแพร่นั้น ไม่สำคัญว่าจะน่าประทับใจเพียงใดก็ตาม จะมีผลพวงเพียงเล็กน้อยเท่านั้นหากผลลัพธ์เดียวกันไม่อาจเกิดขึ้นในการใช้งานจริงได้ ในขณะที่สถิติแสดงประสิทธิภาพของ NAND SSD อาจทำให้รู้สึกทึ่งเมื่อไล่ดูในโบรชัวร์การขาย แต่ประสิทธิภาพของ Intel® Optane™ SSD จะสร้างความประทับใจได้ตลอดทุกวันของการดำเนินงานในศูนย์ข้อมูลและแอปพลิเคชันบนพีซีในโลกความเป็นจริง8 9 10 11 12 13

เกี่ยวกับผู้เขียน: Frank Hady

Frank Hady เป็น Intel Fellow และ Chief Optane Systems Architect ใน Non-Volatile Memory Solutions Group (NSG) ของ Intel เขาเป็นผู้นำการวิจัยและกำหนดขอบเขตผลิตภัณฑ์เทคโนโลยี Intel® Optane™ และการผนวกเข้ากับระบบคอมพิวเตอร์

Frank ได้:

  • ทำหน้าที่หัวหน้าสถาปนิกแพลตฟอร์ม I/O ของ Intel
  • วางรากฐานการวิจัยต่อ Intel® QuickAssist Technology (Intel® QAT)
  • เขียนหรือร่วมเขียนงานวิจัยตีพิมพ์ 30 ฉบับว่าด้วยการวางเครือข่าย อุปกรณ์จัดเก็บข้อมูล และนวัตกรรม I/O
  • มีมากกว่า 30 สิทธิบัตรสหรัฐ
  • จบปริญญาโทด้านวิศวกรรมจาก University of Virginia และปริญญาเอกจาก University of Maryland

เรียนรู้เพิ่มเติม

เรียนรู้เพิ่มเติมว่าเทคโนโลยีของ Intel® Optane™ กำลังพลิกโฉมหน้าลำดับชั้นหน่วยความจำและอุปกรณ์จัดเก็บข้อมูลในศูนย์ข้อมูลอย่างไรโดยสำรวจงานวิจัยอื่นๆ ในซีรีส์ทางเทคนิคของหน่วยความจำและอุปกรณ์จัดเก็บข้อมูล

เรียนรู้เพิ่มเติมเกี่ยวกับหน่วยความจำแบบคงอยู่ Intel® Optane™ ได้โดยไปที่:

https://www.thailand.intel.com/content/www/th/th/products/memory-storage/optane-dc-persistent-memory.html

เรียนรู้เพิ่มเติมเกี่ยวกับ Intel® Optane™ SSD ไปที่:

https://www.thailand.intel.com/content/www/th/th/products/memory-storage/solid-state-drives/data-center-ssds/optane-dc-ssd-series.html

อ่านข้อมูลเพิ่มเติม – เทคโนโลยี Intel® Optane™:หน่วยความจำหรืออุปกรณ์จัดเก็บข้อมูล? เป็นทั้งสองอย่าง

https://www.thailand.intel.com/content/www/th/th/products/docs/memory-storage/optane-technology/what-is-optane-technology-brief.html

ข้อมูลผลิตภัณฑ์และประสิทธิภาพ

1Intel "การวางเกณฑ์มาตรฐานประสิทธิภาพสำหรับไดรฟ์ Solid-State ระดับองค์กร PCIe* และ NVMe*" กุมภาพันธ์ 2015 intel.com/content/dam/www/public/us/en/documents/white-papers/performance-pcie-nvme-enterprise-ssds-white-paper.pdf.
2ที่มา: การทดสอบของ Intel เมื่อเดือนกรกฎาคม 2018 การกำหนดค่าของระบบ: CPU: โปรเซสเซอร์ Intel® Core™ i7 8086K; BIOS เวอร์ชัน 9008 (x64) วันสร้าง: 5/16/2018, EC เวอร์ชัน MBEC-Z370-0203, เฟิร์มแวร์ Intel® Management Engine (Intel® ME) เวอร์ชัน 11.8.50.3399; เมนบอร์ด: ASUS Z370-A; ระบบปฏิบัติการ: Windows* 10 RS4 1803; ไดรเวอร์: Microsoft* Inbox Driver; DRAM: 8 GB x 2 Corsair Vengeance LPX DDR4 (โมเดล: CMK16GX4M2A2666C16R); ฮาร์ดดิสก์ไดรฟ์ (HDD) 1 TB WD Blue 2.5” (โมเดล: WD10JPVX); หน่วยความจำ 32 GB Intel® Optane™, 118 GB Intel® Optane™ SSD 800P; 900P; SATA SSD: 512 GB Intel® SSD 545s; NVM Express (NVMe) SSD: 512 GB Intel® SSD 760p PCIe, M.2, NVMe SSD; ทั้งหมดได้รับการทดสอบจากภายในโดย Intel
3Intel "มีค่าความหน่วงแฝงต่ำที่สอดคล้องกันสำหรับเวิร์กโหลดที่เน้นใช้งานหน่วยจัดเก็บข้อมูลของคุณ" ธันวาคม 2019 thailand.intel.com/content/www/th/th/architecture-and-technology/optane-technology/low-latency-for-storage-intensive-workloads-tech-brief.html
4ตามการทดสอบของ Intel เมื่อวันที่ 24 กรกฎาคม 2018 ความหน่วงแฝงการอ่านโดยเฉลี่ยวัดที่ Queue Depth 1 ระหว่างเวิร์คโหลดการเขียนแบบสุ่ม 4K วัดโดยใช้ FIO 3.1 เปรียบเทียบ Intel Reference Platform กับ 375 GB Intel® Optane™ SSD P4800X และ 1.6 TB Intel® SSD P4600 เปรียบเทียบกับ SSD ที่มีวางขายเมื่อวันที่ 1 กรกฎาคม 2018
5ทดสอบโดย Intel: ประสิทธิภาพการอ่าน/เขียน 4K 70/30 ที่ Queue Depth ต่ำ การทดสอบและการกำหนดค่าของระบบ: CPU: โปรเซสเซอร์ Intel® Xeon® Gold 6140 FC-LGA14B (2.3 GHz, 24.75 MB, 140 W, 18 คอร์), CD8067303405200, ซ็อกเก็ต CPU: 2, ความจุ RAM: 32 GB, โมเดล RAM: DDR4, RAM stuffing: NA, การเติมสล็อต DIMM: 2 สล็อต, PCIe attach: CPU (ไม่ใช่เลน PCH attach), ชิปเซ็ต: ชิปเซ็ต Intel ซีรีส์ C620 BIOS: SE5C620.86B.00.01.0013.030920180427, switch/retimer โมเดล/ผู้จำหน่าย: สายเคเบิล OCuLink 800 mm แบบตรง SFF-8611 เอียงมุมขวา SFF-8611 Intel AXXCBL800CVCR, ระบบปฏิบัติการ: CentOS 7.5, เคอร์เนล: 4.14.50 (LTS), เวอร์ชัน FIO: 3.5; ไดรฟ์เวอร์ NVMe: inbox, C-states: ปิดใช้งาน, เทคโนโลยี Intel® Hyper-Threading (เทคโนโลยี Intel® HT): ปิดใช้งาน, ตัวควบคุมการทำงานของ CPU (ผ่านระบบปฏิบัติการ): โหมดประสิทธิภาพ Enhanced Intel SpeedStep® Technology (EIST), Intel® Turbo Boost Technology: ปิดใช้งาน, และ P-states: เปิดใช้งาน
6ยึดตามการทดสอบของ Intel เมื่อวันที่ 15 พฤศจิกายน 2018: วัดค่าโดยใช้ FIO 3.1 การกำหนดค่าพื้นฐาน: ระบบเซิร์ฟเวอร์ Intel 2U, CentOS 7.5, เคอร์เนล 4.17.6-1.el7.x86_64, 2 x โปรเซสเซอร์ Intel® Xeon® 6154 Gold ที่ 3.0 GHz (18 คอร์), 256 GB DDR4 RAM ที่ 2,666 MHz การกำหนดค่า: 375 GB Intel® Optane™ SSD P4800X และ 3.2 TB Intel® SSD P4610 Intel® microcode: 0x2000043; BIOS ระบบ: 00.01.0013; Intel® Management Engine (Intel® ME) เฟิร์มแวร์: 04.00.04.294; เฟิร์มแวร์ตัวควบคุมการจัดการเบสบอร์ด (BMC): 1.43.91f76955; FRUSDR: 1.43
7ยกให้เป็นคำกล่าวของ David Clark, Massachusetts Institute of Technology (MIT)
8ซอฟต์แวร์และเวิร์คโหลดที่ใช้ในการทดสอบประสิทธิภาพอาจได้รับการปรับให้มีประสิทธิภาพเหมาะสมบนไมโครโปรเซสเซอร์ของ Intel เท่านั้น
9การทดสอบประสิทธิภาพ เช่น SYSmark และ MobileMark ให้คะแนนโดยใช้ระบบคอมพิวเตอร์ ส่วนประกอบ ซอฟต์แวร์ การใช้งาน และฟังก์ชันที่เฉพาะเจาะจง การเปลี่ยนแปลงปัจจัยอันใดอันหนึ่ง อาจส่งผลให้เกิดผลลัพธ์แตกต่างกัน คุณควรศึกษาข้อมูลอื่นๆ ร่วมกับการทดสอบประสิทธิภาพ เพื่อช่วยให้คุณประเมินผลประกอบการตัดสินใจซื้อได้อย่างรอบคอบ รวมถึงประสิทธิภาพของผลิตภัณฑ์ดังกล่าวเมื่อทำงานร่วมกับผลิตภัณฑ์อื่น ดูข้อมูลทั้งหมดได้ที่ thailand.intel.com/benchmarks
10ผลลัพธ์ประสิทธิภาพตามการทดสอบในวันที่ที่ระบุไว้ในการกำหนดค่าและอาจจะไม่เป็นการแสดงถึงอัปเดตที่เผยแพร่ต่อสาธารณะทั้งหมด ดูการสำรองข้อมูลสำหรับรายละเอียดการกำหนดค่า ไม่มีผลิตภัณฑ์หรือส่วนประกอบใดที่จะปลอดภัยอย่างสมบูรณ์แบบ
11ค่าใช้จ่ายและความต้องการอาจแตกต่างกัน
12เทคโนโลยี Intel อาจต้องมีการเปิดใช้ฮาร์ดแวร์ ซอฟต์แวร์ หรือบริการ
13© Intel Corporation Intel, โลโก้ Intel และเครื่องหมาย Intel อื่น ๆ เป็นเครื่องหมายการค้าของบริษัท Intel Corporation หรือบริษัทในเครือ ชื่อและแบรนด์อื่นอาจถูกอ้างกรรมสิทธิ์โดยบุคคลอื่น ตีพิมพ์ในสหรัฐอเมริกา