Get More Performance for Every Dollar You Spend on AWS*, with Your Data on Intel

Discover the advantage of choosing instances based on Intel® Xeon® Scalable processors.

Key Takeaways

  • AWS* instances based on Intel® processors offer higher performance per dollar for key workloads

  • For example, Intel® Xeon® Scalable processor-based instances are 4.15x better value for money for high-performance computing (HPC) workloads than instances based on AMD EPYC*1

  • Databases, memory intensive workloads, and web-based workloads also deliver better value on Intel

BUILT IN - ARTICLE INTRO SECOND COMPONENT

Are you getting the best value from your AWS* investment?

The cloud gives you the scalability, reliability, and flexibility you need, but not all clouds are created equal: Some instances deliver much more value than others. To understand the optimal choice for your workloads, you have to look at how those specific workloads perform. A generic performance statistic might not tell you much about the results you’ll actually see, especially if you’re running workloads that are compute-intensive or data-intensive. Similarly, knowing the price per instance doesn’t tell you much about the price per transaction, or any other real business or performance metric. You have to look closer.

For example, did you know that AWS* instances based on Intel® Xeon® Scalable processors can offer up to 4.15x higher performance per dollar for high-performance computing (HPC) workloads1, compared to instances based on AMD EPYC* processors, according to the High-performance Linpack* benchmark? They offer up to 2.19x higher performance per dollar according to the LAMMPS* benchmark.1 For database workloads on AWS, Intel® Xeon® Scalable processors can deliver up to 2.84x the higher performance per dollar2; and for memory bandwidth intensive workloads, they can enable up to 2.25x higher performance per dollar.3 If you’re running web-based workloads such as server-side Java* or Wordpress PHP/HHVM*, you might find they give you up to 1.74x higher performance per dollar running on Intel.4

If you’re already using Intel® processors, you could also make a saving by moving to a more modern instance, based on the Intel® Xeon® Scalable processor, too. TSO Logic delivers data-driven recommendations to right-size and right-cost compute across public and private cloud. It studied millions of data points across its 100,000-instance repository of anonymized AWS customer data. The conclusion? 19 percent of current instances could save money by moving to newer, smaller Amazon EC2* instance types that offer equivalent performance, at lower cost. For example, migrating from older C4.8XLarge to newer C5.4XLarge instances can save up to 50% of your cloud costs, over $3000 per instance.5 What’s more, the savings can add up fast if you’re licensing software per core. TSO Logic found that one workload could be delivered using 40 fewer cores running on newer instances based on the 2nd Generation Intel® Xeon® Scalable processor.5 If you run a commercial database licensed at $1,800 per core, you could save $72,000 per year by cutting the core count by 40.5

The Intel® Xeon® Scalable processors and 2nd Generation Intel® Xeon® Scalable processors have a number of optimizations built in to accelerate your workloads. The INT8 number format enables unnecessary detail to be discarded to accelerate machine learning; and Intel® Deep Learning Boost (Intel® DL Boost) provides a new processor instruction to speed up inference in applications such as image classification, speech recognition, language translation, and object detection. Intel® Advanced Vector Extensions 512 (Intel® AVX-512) provides 512-bit vector instructions to accelerate floating point calculations, including scientific simulations. Intel® Turbo Boost Technology enables you to run cores faster than the base operating frequency to give you extra performance when you need it most. To help protect your data, Intel® Advanced Encryption Standard New Instructions (Intel® AES-NI) provides processor instructions to accelerate encryption and decryption.

Notices and Disclaimers:

Software and workloads used in performance tests may have been optimized for performance only on Intel® microprocessors. Performance tests, such as SYSmark* and MobileMark*, are measured using specific computer systems, components, software, operations, and functions. Any change to any of those factors may cause the results to vary. You should consult other information and performance tests to assist you in fully evaluating your contemplated purchases, including the performance of that product when combined with other products. For more complete information visit www.thailand.intel.com/benchmarks.

Performance results are based on testing as of the date set forth in the Configurations and may not reflect all publicly available security updates. See configuration disclosure for details. No product or component can be absolutely secure.
Intel does not control or audit third-party data. You should review this content, consult other sources, and confirm whether referenced data are accurate.

Cost reduction scenarios described are intended as examples of how a given Intel®-based product, in the specified circumstances and configurations, may affect future costs and provide cost savings. Circumstances will vary. Intel does not guarantee any costs or cost reduction.

Intel® technologies' features and benefits depend on system configuration and may require enabled hardware, software, or service activation. Performance varies depending on system configuration. Check with your system manufacturer or retailer or learn more at thailand.intel.com.

Intel, the Intel logo, and Xeon are trademarks of Intel Corporation or its subsidiaries in the U.S. and/or other countries.

*Other names and brands may be claimed as the property of others. 
© Intel Corporation

ข้อมูลผลิตภัณฑ์และประสิทธิภาพ

1

ผลลัพธ์ได้รับการคำนวณโดย Intel ที่ใช้ราคา AWS (ดอลลาร์สหรัฐฯ/ชั่วโมง, ระยะเวลามาตรฐาน 1 ปี, ไม่มีการจ่ายล่วงหน้า) เมื่อวันที่ 12 มกราคม 2019
การทดสอบประสิทธิภาพต่อดอลลาร์ที่ทำในอินสแตนซ์ AWS* EC2 M5 และ M5a (https://aws.amazon.com/ec2/instance-types/) เมื่อเปรียบเทียบประสิทธิภาพต่อดอลลาร์ของโปรเซสเซอร์ Intel® Xeon® Scalable 96 vCPU กับประสิทธิภาพต่อดอลลาร์ของโปรเซสเซอร์ AMD EPYC*

เวิร์คโหลด: LAMMPS*
ผลลัพธ์: ประสิทธิภาพต่อดอลลาร์ของ AMD EPYC = ค่ามาตรฐานที่ 1, ประสิทธิภาพต่อดอลลาร์ของโปรเซสเซอร์ Intel® Xeon® Scalable = 2.19X (สูงกว่าคือดีกว่า)
HPC Materials Science – LAMMPS (สูงกว่าคือดีกว่า):
อินสแตนซ์ AWS M5.24xlarge (Intel), เวอร์ชั่น LAMMPS: 2018-08-22 (รหัส: https://lammps.sandia.gov/download.html), เวิร์คโหลด: Water – 512K Particles, Intel ICC 18.0.3.20180410, Intel® MPI Library สำหรับ Linux* OS, Version 2018 Update 3 Build 20180411, 48 MPI Ranks, Red Hat* Enterprise Linux 7.5, Kernel 3.10.0-862.el7.x86_64, OMP_NUM_THREADS=2, คะแนน 137.5 timestep/วินาที วัดผลโดย Intel เมื่อวันที่ 31/10/2018
อินสแตนซ์ AWS M5a.24xlarge (AMD), เวอร์ชั่น LAMMPS: 2018-08-22 (รหัส: https://lammps.sandia.gov/download.html), เวิร์คโหลด: Water – 512K Particles, Intel ICC 18.0.3.20180410, Intel® MPI Library สำหรับ Linux* OS, Version 2018 Update 3 Build 20180411, 48 MPI Ranks, Red Hat* Enterprise Linux 7.5, Kernel 3.10.0-862.el7.x86_64, OMP_NUM_THREADS=2, คะแนน 55.8 timestep/วินาที วัดผลโดย Intel เมื่อวันที่ 11/7/18
การเปลี่ยนแปลงสำหรับ AMD เพื่อสนับสนุน AVX2 (AMD สนับสนุน AVX2 เท่านั้น การเปลี่ยนแปลงเหล่านี้จึงมีความจำเป็น):
sed -i 's/-xHost/-xCORE-AVX2/g' Makefile.intel_cpu_intelmpi
sed -i 's/-qopt-zmm-usage=high/-xCORE-AVX2/g' Makefile.intel_cpu_intelmpi

เวิร์คโหลด: High-performance Linpack*
ผลลัพธ์: ประสิทธิภาพต่อดอลลาร์ของ AMD EPYC = ค่ามาตรฐานที่ 1, ประสิทธิภาพต่อดอลลาร์ของโปรเซสเซอร์ Intel® Xeon® Scalable = 4.15X (สูงกว่าคือดีกว่า)
HPC Linpack (สูงกว่าคือดีกว่า):
อินสแตนซ์ AWS M5.24xlarge (Intel), HP Linpack เวอร์ชั่น 2.2 (https://software.intel.com/en-us/articles/intel-mkl-benchmarks-suite ไดเร็กทอรี่: benchmarks_2018.3.222/linux/mkl/benchmarks/mp_linpack/bin_intel/intel64), Intel ICC 18.0.3.20180410 ที่มี AVX512, Intel® MPI Library สำหรับ Linux* OS, Version 2018 Update 3 Build 20180411, Red Hat* Enterprise Linux 7.5, Kernel 3.10.0-862.el7.x86_64, OMP_NUM_THREADS=24, 2 การประมวลผล MPI, คะแนน 3152 Gb/s วัดผลโดย Intel เมื่อวันที่ 31/10/2018
อินสแตนซ์ AWS M5a.24xlarge (AMD), HP Linpack เวอร์ชั่น 2.2, (HPL Source: http://www.netlib.org/benchmark/hpl/hpl-2.2.tar.gz, Version 2.2, icc (ICC) ใช้ 18.0.2 20180210 เพื่อคอมไพล์และลิงค์ไปที่ BLIS library version 0.4.0, https://github.com/flame/blis, เครื่องหมายคอมไพเลอร์เพิ่มเติม: -O3 -funroll-loops -W -Wall –qopenmp; make arch=zen OMP_NUM_THREADS=8, 6 การประมวลผล MPI), Intel ICC 18.0.3.20180410 ที่มี AVX2, Intel® MPI Library สำหรับ Linux* OS, Version 2018 Update 3 Build 20180411, Red Hat* Enterprise Linux 7.5, Kernel 3.10.0-862.el7.x86_64, OMP_NUM_THREADS=8, 6 การประมวลผล MPI, คะแนน 677.7 Gb/s วัดผลโดย Intel เมื่อวันที่ 11/7/18

2

ผลลัพธ์ได้รับการคำนวณโดย Intel ที่ใช้ราคา AWS (ดอลลาร์สหรัฐฯ/ชั่วโมง, ระยะเวลามาตรฐาน 1 ปี, ไม่มีการจ่ายล่วงหน้า) เมื่อวันที่ 12 มกราคม 2019
การทดสอบประสิทธิภาพต่อดอลลาร์ที่ทำในอินสแตนซ์ AWS* EC2 R5 และ R5a (https://aws.amazon.com/ec2/instance-types/) เมื่อเปรียบเทียบประสิทธิภาพต่อดอลลาร์ของโปรเซสเซอร์ Intel® Xeon® Scalable 96 vCPU กับประสิทธิภาพต่อดอลลาร์ของโปรเซสเซอร์ AMD EPYC*

เวิร์คโหลด: HammerDB* PostgreSQL*
ผลลัพธ์: ประสิทธิภาพต่อดอลลาร์ของ AMD EPYC = ค่ามาตรฐานที่ 1, ประสิทธิภาพต่อดอลลาร์ของโปรเซสเซอร์ Intel® Xeon® Scalable = 1.85X (สูงกว่าคือดีกว่า)
ฐานข้อมูล: HammerDB – PostgreSQL (สูงกว่าคือดีกว่า):
อินสแตนซ์ AWS R5.24xlarge (Intel), HammerDB 3.0 PostgreSQL 10.2, หน่วยความจำ: 768GB, Hypervisor: KVM; ประเภทอุปกรณ์จัดเก็บข้อมูล: EBS io1, ขนาดดิสก์ 200GB, พื้นที่จัดเก็บข้อมูลทั้งหมด 200GB, เวอร์ชั่น Docker: 18.06.1-ce, Red Hat* Enterprise Linux 7.6, 3.10.0-957.el7.x86_64, 6400MB shared_buffer, 256 คลังข้อมูล, 96 ผู้ใช้ คะแนน “NOPM” 439931 วัดผลโดย Intel เมื่อวันที่ 11/12/2018-14/12/2018
อินสแตนซ์ AWS R5a.24xlarge (AMD), HammerDB 3.0 PostgreSQL 10.2, หน่วยความจำ: 768GB, Hypervisor: KVM; ประเภทอุปกรณ์จัดเก็บข้อมูล: EBS io1, ขนาดดิสก์ 200GB, พื้นที่จัดเก็บข้อมูลทั้งหมด 200GB, เวอร์ชั่น Docker: 18.06.1-ce, Red Hat* Enterprise Linux 7.6, 3.10.0-957.el7.x86_64, 6400MB shared_buffer, 256 คลังข้อมูล, 96 ผู้ใช้ คะแนน “NOPM” 212903 วัดผลโดย Intel เมื่อวันที่ 12/20/18

เวิร์คโหลด: MongoDB*
ผลลัพธ์: ประสิทธิภาพต่อดอลลาร์ของ AMD EPYC = ค่ามาตรฐานที่ 1, ประสิทธิภาพต่อดอลลาร์ของโปรเซสเซอร์ Intel® Xeon® Scalable = 2.84X (สูงกว่าคือดีกว่า)
ฐานข้อมูล: MongoDB (สูงกว่าคือดีกว่า):
อินสแตนซ์ AWS R5.24xlarge (Intel), MongoDB v4.0, ปิดใช้งานเจอร์นัล, ปิดใช้งานการซิงค์ไปที่อินสแตนซ์ไฟล์, wiredTigeCache=27GB, maxPoolSize = 256, 7 อินสแตนซ์ MongoDB, 14 VM ไคลเอนต์, 1 ไคลเอนต์ YCSB ต่อ VM, 96 เธรดต่อไคลเอนต์ YCSB, Red Hat* Enterprise Linux 7.5, Kernel 3.10.0-862.el7.x86_64, คะแนน 1229288 ops/วินาที วัดผลโดย Intel เมื่อวันที่ 10/12/2018
อินสแตนซ์ AWS R5a.24xlarge (AMD), MongoDB v4.0, ปิดใช้งานเจอร์นัล, ปิดใช้งานการซิงค์ไปที่อินสแตนซ์ไฟล์, wiredTigeCache=27GB, maxPoolSize = 256, 7 อินสแตนซ์ MongoDB, 14 VM ไคลเอนต์, 1 ไคลเอนต์ YCSB ต่อ VM, 96 เธรดต่อไคลเอนต์ YCSB, Red Hat* Enterprise Linux 7.5, Kernel 3.10.0-862.el7.x86_64, คะแนน 388596 ops/วินาที วัดผลโดย Intel เมื่อวันที่ 10/12/2018
ดูรายละเอียดเพิ่มเติมได้ที่ www.thailand.intel.com/benchmarks

3

อินสแตนซ์ AWS M5.4xlarge (Intel), McCalpin Stream (เวอร์ชั่น OMP), (แหล่งที่มา: https://www.cs.virginia.edu/stream/FTP/Code/stream.c); Intel ICC 18.0.3 20180410 ที่มี AVX512, -qopt-zmm-usage=high, -DSTREAM_ARRAY_SIZE=134217728 -DNTIMES=100 -DOFFSET=0 –qopenmp, -qopt-streaming-stores always -o $OUT stream.c, Red Hat* Enterprise Linux 7.5, Kernel 3.10.0-862.el7.x86_64, OMP_NUM_THREADS: 8, KMP_AFFINITY: proclist=[0-7:1], granularity=thread, explicit, คะแนน 81216.7 MB/s, วัดผลโดย Intel เมื่อวันที่ 6/12/2018
อินสแตนซ์ AWS M5a.4xlarge (AMD), McCalpin Stream (เวอร์ชั่น OMP), (แหล่งที่มา: https://www.cs.virginia.edu/stream/FTP/Code/stream.c); Intel ICC 18.0.3 20180410 ที่มี AVX2, -DSTREAM_ARRAY_SIZE=134217728, -DNTIMES=100 -DOFFSET=0 -qopenmp -qopt-streaming-stores always -o $OUT stream.c, Red Hat* Enterprise Linux 7.5, Kernel 3.10.0-862.el7.x86_64, OMP_NUM_THREADS: 8, KMP_AFFINITY: proclist=[0-7:1], granularity=thread,explicit, คะแนน 32154.4 MB/s, วัดผลโดย Intel เมื่อวันที่ 6/12/2018
ข้อสงวนสิทธิ์ OpenFOAM: ข้อเสนอนี้ไม่ได้อนุมัติหรือสนับสนุนโดย OpenCFD Limited ผู้ผลิตและจัดจำหน่ายซอฟต์แวร์ OpenFOAM ผ่าน www.openfoam.com และเจ้าของ OPENFOAM® และเครื่องหมายการค้าของ OpenCFD®

4

ผลลัพธ์ได้รับการคำนวณโดย Intel ที่ใช้ราคา AWS (ดอลลาร์สหรัฐฯ/ชั่วโมง, ระยะเวลามาตรฐาน 1 ปี, ไม่มีการจ่ายล่วงหน้า) เมื่อวันที่ 12 มกราคม 2019
การทดสอบประสิทธิภาพต่อดอลลาร์ที่ทำในอินสแตนซ์ AWS* EC2 M5 และ M5a (https://aws.amazon.com/ec2/instance-types/) เมื่อเปรียบเทียบประสิทธิภาพต่อดอลลาร์ของโปรเซสเซอร์ Intel® Xeon® Scalable 96 vCPU กับประสิทธิภาพต่อดอลลาร์ของโปรเซสเซอร์ AMD EPYC*

เวิร์คโหลด: Java ฝั่งเซิร์ฟเวอร์* 1 JVM
ผลลัพธ์: ประสิทธิภาพต่อดอลลาร์ของ AMD EPYC = ค่ามาตรฐานที่ 1, ประสิทธิภาพต่อดอลลาร์ของโปรเซสเซอร์ Intel® Xeon® Scalable = 1.74X (สูงกว่าคือดีกว่า)
Java ฝั่งเซิร์ฟเวอร์ (สูงกว่าคือดีกว่า):
อินสแตนซ์ AWS M5.24xlarge (Intel), การวัดประสิทธิภาพเซิร์ฟเวอร์ Java ที่ไม่มีการผูกกับ NUMA, 2JVM, OpenJDK 10.0.1, Red Hat* Enterprise Linux 7.5, Kernel 3.10.0-862.el7.x86_64, คะแนน 101767 รายการ/วินาที วัดผลโดย Intel เมื่อวันที่ 16/11/2018
อินสแตนซ์ AWS M5a.24xlarge (AMD), การวัดประสิทธิภาพเซิร์ฟเวอร์ Java ที่ไม่มีการผูกกับ NUMA, 2JVM, OpenJDK 10.0.1, Red Hat* Enterprise Linux 7.5, Kernel 3.10.0-862.el7.x86_64, คะแนน 52068 รายการ/วินาที วัดผลโดย Intel เมื่อวันที่ 16/11/2018

เวิร์คโหลด: WordPress* PHP/HHVM*
ผลลัพธ์: ประสิทธิภาพต่อดอลลาร์ของ AMD EPYC = ค่ามาตรฐานที่ 1, ประสิทธิภาพต่อดอลลาร์ของโปรเซสเซอร์ Intel® Xeon® Scalable = 1.75X (สูงกว่าคือดีกว่า)
Web Front End WordPress (สูงกว่าคือดีกว่า):
อินสแตนซ์ AWS M5.24xlarge (Intel), oss-performance/wordpress Ver 4.2.0; Ver 10.2.19-MariaDB-1:10.2.19+maria~bionic, เวอร์ชั่นเวิร์คโหลด: u'4.2.0, เธรดไคลเอนต์: 200; PHP 7.2.12-1; perfkitbenchmarker_version="v1.12.0-944-g82392cc; Ubuntu 18.04, Kernel Linux 4.15.0-1025-aws, คะแนน 3626.11 TPS วัดผลโดย Intel เมื่อวันที่ 16/11/2018
อินสแตนซ์ AWS M5a.24xlarge (AMD), oss-performance/wordpress Ver 4.2.0; Ver 10.2.19-MariaDB-1:10.2.19+maria~bionic, เวอร์ชั่นเวิร์คโหลด: u'4.2.0, เธรดไคลเอนต์: 200; PHP 7.2.12-1; perfkitbenchmarker_version="v1.12.0-944-g82392cc; Ubuntu 18.04, Kernel Linux 4.15.0-1025-aws, คะแนน 1838.48 TPS วัดผลโดย Intel เมื่อวันที่ 16/11/2018
ดูรายละเอียดเพิ่มเติมได้ที่ https://www.intel.com/content/www/th/th/benchmarks/benchmark.html

5

แหล่งที่มา: TSO Logic / รายงานวิจัย Intel: การพัฒนาใหม่ๆ โดย Intel, Amazon Web Services, ขับเคลื่อนการประหยัดค่าใช้จ่ายระบบคลาวด์หลัก"