Intel® Xeon Phi™ Product Family

Highly parallel processing to power your breakthrough innovations

Intel® Xeon Phi™ Coprocessor

Power your breakthrough innovations with the highly parallel processing of the Intel® Xeon Phi™ coprocessor. We have packed over a teraFLOPS of double-precision peak performance into every chip.

Life science applications

Life sciences is one of the largest commercial market segments for high-performance computing. Life sciences includes many disciplines, such as chemistry, bio-chemistry, molecular modeling, protein folding, genomics, and statistical analysis to name a few.  Quick simulation and analysis leads to breakthroughs in all areas of the life sciences. BWA maps human genomes. Gromacs simulates particle molecular dynamics. LAMMPS is a versatile large scale atomic simulation package. MPI-HMMER is an open source MPI implementation of the HMMER protein sequence analysis suite. NAMD is a parallel molecular dynamics code for large bio molecular systems. 

Intel measured as of May 2014

Описание конфигураций

BWA: (Burrow-Wheeler Aligner Release bwa-0.5.10)

Platform hosting the coprocessor and platform for two-socket Intel® Xeon® processor baseline:

Two-socket Intel® Software Development Platform: 2x Intel Xeon processor E5-2697 v2 (12 core, 30M cache, 2.7 GHz, 8.0 GT/s Intel® QuickPath Interconnect (Intel® QPI), 130W thermal design power (TDP), Intel® Turbo Boost Technology on, Intel® Hyper-Threading Technology (Intel® HT Technology) on) 64 GB memory at 1600 MHz, Red Hat Enterprise Linux* (RHEL*) 6.2

Coprocessor details:

Intel® Xeon Phi™ coprocessor 7120A: 61 cores, 1.238 GHz, 16 memory channels, 16 GB memory at 5.5 GT/s, 300W TDP C-step (Intel® Turbo Boost Technology off, error-correcting code (ECC) on)

Software stack (Intel Xeon Phi coprocessor):

Intel® Manycore Platform Software Stack (Intel® MPSS) 2.1.6720-21 (Flash*: 2.1.03.0386; coprocessor OS: 2.6.38.8-gefd324e)

Intel® Composer XE 13.3.163.0, Intel® MPI Library 4.1.1.030

Two-socket Intel Xeon processor score: 178.73 seconds

Two-socket Intel Xeon processor + Intel Xeon Phi coprocessor score: 119.17 seconds

Source: Intel Internal Testing TR2093

 

MPIHmmer:

Platform hosting the coprocessor and platform for two-socket Intel® Xeon® processor baseline:

Two-socket Intel Software Development Platform: 2x Intel Xeon processor E5-2670 (8 core, 20M cache, 2.6 GHz, 8.0 GT/s Intel QPI, 115W TDP, Intel Turbo Boost Technology on, Intel HT Technology on) 64 GB memory at 1600 MHz, RHEL 6.4

Coprocessor details:

Intel® Xeon Phi™ coprocessor 7120A: 61 cores, 1.238 GHz, 16 memory channels, 16 GB memory at 5.5 GT/s, 300W TDP C-step (Intel Turbo Boost Technology off, ECC on)

Software stack (Intel Xeon Phi coprocessor):

Intel MPSS 2.1.6720-13 (Flash: 2.1.02.0386; coprocessor OS: 2.6.38.8-g5f2543d)

Intel® Composer XE 2013.3.163

Two-socket Intel Xeon processor score: 89 seconds

Two-socket Intel Xeon processor + Intel Xeon Phi coprocessor score: 57 seconds

Source: Intel Internal Testing TR2051

 

LAMMPS (Production Protein Simulation 474K Stoms, Version 5 April 2014)

Platform hosting the coprocessor and platform for two-socket Intel® Xeon® processor baseline:

Two-socket Intel Software Development Platform: 2x Intel Xeon processor E5-2697 v2 (2x 12 core, 30M cache, 2.7 GHz, 8.0 GT/s Intel QPI, 135W TDP, Intel Turbo Boost Technology on, Intel HT Technology on) 64 GB memory at 1600 MHz, RHEL 6.3

Coprocessor details:

Intel® Xeon Phi™ coprocessor 7120A: 61 cores, 1.238 GHz, 16 memory channels, 16 GB memory at 5.5 GT/s, 300W TDP C-step (Intel Turbo Boost Technology off, ECC on)

Software stack (Intel Xeon Phi coprocessor):

Intel MPSS 2.1.6720-13 (Flash: 2.1.02.0386)

Intel® Compiler 14.0.1; Intel MPI Library 4.1.2.040

 

1 Node

16 Nodes

Two-socket Intel Xeon processor score:

26.84 sec

4.33 seconds

Two-socket Intel Xeon processor + Intel Xeon Phi coprocessor score:

19.10 sec

2.63 seconds

Source: Intel Internal Testing TR2104

 

GROMACS  (Version 5.0-rc1 - Workload 512K H20 with RF Method)

Platform hosting the coprocessor and platform for two-socket Intel® Xeon® processor baseline:

Two-socket Intel Software Development Platform: 2x Intel Xeon processor E5-2697 v2 (12 core, 30M cache, 2.7 GHz, 8.0 GT/s Intel QPI, 130W TDP, Intel Turbo Boost Technology on, Intel HT Technology on) 64 GB memory at 1600 MHz, RHEL 6.4

Coprocessor details:

Intel® Xeon Phi™ coprocessor 7120A: 61 cores, 1.238 GHz, 16 memory channels, 16 GB memory at 5.5 GT/s, 300W TDP C-step (Intel Turbo Boost Technology off, ECC on)

Software stack (Intel Xeon Phi coprocessor):

Intel MPSS 2.1.6720-13 (Flash: 2.1.03.0386; coprocessor OS: 2.6.38.8-gefd324e)

Intel® Composer XE 13.3.163.0, Intel MPI Library 4.1.1.030

Two-socket Intel Xeon processor score: 2.312 ns/day

Two-socket Intel Xeon processor + Intel Xeon Phi coprocessor score: 3.605 ns/day seconds

Source: Intel Internal Testing TR2101

NAMD: (STMV 2.10 pre-release)

Platform hosting the coprocessor and platform for 2S Intel® Xeon® processor baseline:

W2600CR2 platform: 2x Intel Xeon processor E5-2697v2 (12 core, 30M cache, 2.7 GHz, 8.0 GT/s Intel QPI, 130W TDP, Intel Turbo Boost Technology on, Intel HT Technology on)  64 GB memory @ 1600 MHz, RHEL 6.2

Coprocessor details:

Intel® Xeon Phi™ coprocessor 7120A: 61 cores, 1.238 GHz, 16 memory channels, 16 GB memory @ 5.5 GT/s, 300W TDP C-step (Intel Turbo Boost Technology off, ECC on)

Software stack (Xeon Phi):

MPSS 2.1.6720-21 (Flash: 2.1.03.0386; coprocessor OS: 2.6.38.8-gefd324e)

Intel Compiler 13.1.3 20130607

2S Intel Xeon score: 0.513 seconds

2S Intel Xeon + 2 Xeon Phi score: 0.158 seconds

Source: Internal Testing (TR 2100)

 

NAMD STMV 1 node 47 PPN per node

(Version 2.10 pre-release)

STMV (virus) benchmark (1,066,628 atoms, periodic, PME)

Platform hosting the coprocessor:

W2600CR2 platform: 2x Intel Xeon processor E5-2697v2 (12 core, 30M cache, 2.7 GHz, 8.0 GT/s Intel QPI, 130W TDP)  64 GB memory @ 1600 MHz, RHEL 6.4 HT enabled

Intel® Xeon Phi™ coprocessor 7120A: 61 cores, 1.238 GHz, 16 memory channels, 16 GB memory @ 5.5 GT/s, 300W TDP C-step (ECC on, Intel Turbo Boost Technology off)

NVIDIA K40c GPU, 2880 SP cores, 960 DP cores, 745 MHz (nominal) 875 MHz boost, 12 memory channels, 12 GB memory @ 6.0 GT/s, ECC on, 235W TDP

CUDA 5.5.0, Driver 319.82 (boost frequency was not enabled for result)

Software stack:

MPSS 2.1.6720-16 (Flash 1.2.03.0386)

Intel Compiler 13.1.3 20130607 (2013.5.192)

1 Node

2 Nodes

4 Nodes

 

2S Xeon + 1 Xeon Phi score (symmetric):

0.386 Mrps

0.729 Mrps

1.2879 Mrps

(higher is better)

NVIDIA K40c* score:

0.32 Mrps

0.55 Mrps

1.02 Mrps

(higher is better)

Fabric: 36 port switch/rack Mellanox FDR (model MSX6025F-1BFR) Firmware version: 9_2_4002

Source: Internal Testing (TR 2100)

 

NAMD ApoA1 1 node (47 PPN per node)

Version 2.10 pre-release

Platform hosting the coprocessor:

W2600CR2 platform: 2x Intel Xeon processor E5-2697v2 (12 core, 30M cache, 2.7 GHz, 8.0 GT/s Intel QPI, 130W TDP) 64 GB memory @ 1600 MHz, RHEL 6.4 HT enabled

Intel® Xeon Phi™ coprocessor 7120A: 61 cores, 1.238 GHz, 16 memory channels, 16 GB memory @ 5.5 GT/s, 300W TDP C-step (ECC on, Turbo off)

NVIDIA K40c GPU, 2880 SP cores, 960 DP cores, 745 MHz (nominal) 875 MHz boost, 12 memory channels, 12 GB memory @ 6.0GT/s, ECC on, 235W TDP

CUDA 5.5.0, Driver 319.82(boost frequency was not enabled for result)

Software Stack:

MPSS 2.1.6720-16 (Flash 1.2.03.0386)

Intel Compiler 13.1.3 20130607 (2013.5.192)

1 Node

2 Nodes

 

2S Xeon + 1 Xeon Phi score (symmetric):

4.430 Mrps

6.607 Mrps

(higher is better)

NVIDIA K40c score: 

4.08 Mrps

6.16 Mrps

(higher is better)

Fabric: 36 port switch/rack Mellanox FDR (model MSX6025F-1BFR) Firmware version: 9_2_4002

Source: Internal Testing (TR 2100)

Additional information: 1 2 3 4 5

Другие видеоролики - Внимание: в данном разделе могут быть представлены материалы на английском языке.

Другие видеоролики

Информация о продукте и производительности

open

1. Программное обеспечение и рабочие задачи, используемые в тестах оценки производительности, оптимизированы для обеспечения высокой производительности только с микропроцессорами Intel. Тесты производительности, в том числе SYSmark и MobileMark, проводятся с использованием определенных компьютерных систем, компонентов, программного обеспечения, операций и функций. Любые изменения этих параметров могут привести к изменению конечных результатов. При принятии решения о покупке следует обращаться к другим источникам информации и тестам производительности, в том числе к информации о производительности продукции в сравнении с другой продукцией. Дополнительную информацию можно найти по адресу: www.intel.com/performance.

2. Корпорация Intel не контролирует и не проводит проверку конструкции или реализации тестов или веб-сайтов других компаний, упомянутых в настоящем документе. Корпорация Intel рекомендует всем своим клиентам посетить указанные веб-сайты или другие сайты с соответствующими данными для подтверждения точности указанных результатов тестирования и определения производительности приобретаемых систем.

3. Номера процессоров Intel не являются показателем производительности. Номера процессоров указывают на различия характеристик процессоров в пределах семейства, а не на различия между семействами процессоров. Более подробную информацию можно найти на странице www.intel.com/content/www/ua/uk/processors/processor-numbers.html.

4. Компиляторы Intel могут не обеспечивать для процессоров других производителей уровень оптимизации, который не является присущим только процессорам Intel. В число этих оптимизаций входят наборы команд SSE2, SSE3 и SSE3, а также другие оптимизации. Корпорация Intel не гарантирует наличие, функциональность или эффективность оптимизаций микропроцессоров других производителей. Содержащиеся в данной продукции оптимизации, зависящие от микропроцессора, предназначены для использования с микропроцессорами Intel. Некоторые оптимизации, не относящиеся к микроархитектуре Intel, предназначены для микропроцессоров Intel. Более подробную информацию по конкретным наборам команд, рассматриваемых в настоящем уведомлении, см. руководства пользователя соответствующей продукции. Редакция уведомления #20110804

5. Различным аппаратным архитектурам может требоваться разный исходный код. Данные результаты получены с использованием кода, максимально оптимизированного корпорацией Intel для функционирования на всех архитектурах и выполняющего одну и ту же работу. Дальнейшая оптимизация кода может привести к изменению результатов. Оптимизации, зависимые от микропроцессора, в этой продукции предназначены для использования на микропроцессорах Intel®. Некоторые оптимизации, не относящиеся к микроархитектуре Intel®, предназначены для микропроцессоров Intel. Дополнительную информацию о конкретных наборах инструкций, включенных в это уведомление, можно найти в соответствующем руководстве пользователя продукции и в справочном руководстве. Редакция уведомления #20110804