“Milky Way 2” – La súper computadora más rápida del mundo

20130619-204955.jpg

Construida para el National Supercomputing Center en Guangzhou, China, el sistema “Milky Way 2” está equipado por 32.000 de los próximos procesadores Intel Xeon E5-2600 v2 de 12 núcleos basados en la arquitectura Ivy Bridge y por 48.000 coprocesadores Intel Xeon Phi, dándole una potencia total al sistema de 17.8 MW. No sólo es el más rápido, sino también uno de los más eficaces sistemas en el consumo de energía dentro de la lista Top500.

El sistema utiliza una “arquitectura neo-heterogénea”, según la cual el diseño de hardware tiene múltiples tipos de capacidades de procesamiento que se accede por un modelo de programación común, agilizando los procesos de desenvolvimiento y optimización –una ventaja que no es posible al usar una combinación de aceleradores de CPUs y GPUs.
El rendimiento líder del sistema y la eficacia del consumo de energía se logró a través de la utilización de la próxima generación de productos de la familia de procesadores Intel Xeon E5-2600 basada en el proceso de manufactura de 22nm líder de Intel.

Además de equipar el “Milky Way 2”, estos procesadores también equipan a otros dos sistemas de la lista Top500 de Bull*, sistema calificado en 56º con 557 TFlops y en 329º con 139 TFlops, como parte del programa “early ship” de Intel para equipar súper computadoras. Los productos tendrán disponibilidad general a partir del próximo trimestre y contarán con 12 núcleos y velocidades de clock de hasta 2.7 GHz, ofreciendo 259 GFlops por socket, un aumento del 66% en comparación a la generación anterior.

Más del 80% (403 sistemas) de las súper computadoras de la 41ª edición de la lista Top500 son equipadas con los procesadores Intel. De los sistemas que aparecen por primera vez en la lista, los equipados con la tecnología Intel contabilizarán un 98%. La edición de junio de la lista traía 11 sistemas basados en el coprocesador Intel Xeon Phi, incluyendo los sistemas de la clase Petaflops como “Milky Way 2”, con 54.9 PFlops y el “Stampede”, con 8.5 PFlops de pico de rendimiento.
La lista semestral Top500 de súper computadoras es un trabajo de Hans Meuer de la Universidad de Mannheim, Erich Strohmaier y Horst Simon del Centro de Investigaciones Científicas Computacionales del Departamento Nacional de Energía de los Estados Unidos, y Jack Dongarra de la Universidad de Tennessee. El reporte completo está disponible en http://www.top500.org/.

​Intel también anunció la expansión de su actual generación del coprocesador Intel Xeon Phi con la inclusión de cinco nuevos productos que ofrecerán varias opciones de rendimiento, capacidad de memoria, eficacia en el consumo de energía y formatos que ya están disponibles. La familia del coprocesador Intel Xeon Phi 7100 ha sido proyectada y optimizada para ofrecer el mejor rendimiento y la mayor cantidad de recursos, incluyendo 61 núcleos con velocidad de clock de 1.23 GHz, 16 GB de capacidad de memoria (el doble de la cantidad anteriormente disponible en los aceleradores y coprocesadores), y más de 1.2 TFlops de rendimiento de doble precisión. La familia del coprocesador Intel Xeon Phi 3100 ha sido proyectada para un rendimiento con óptima relación de costo-beneficio. La familia cuenta con 57 núcleos, con una velocidad de clock de 11 GHz y 1 TFlops de rendimiento de doble precisión.
​Finalmente, Intel agregó otro producto a la familia del procesador Intel Xeon 5100, anunciada el año pasado, bajo el nombre de Intel Xeon Phi 520D, un coprocesador que está optimizado para ambientes de alta densidad con capacidad para permitir que los sockets sean conectados directamente a una mini-placa para el uso en formatos blade.

​Intel dio a conocer detalles de su segunda generación de productos Intel Xeon Phi direccionados al mayor aumento de sus capacidades para la súper computación. Bajo el nombre clave “Knights Landing”, la próxima generación de productos basados en la Arquitectura Intel MIC estará disponible como un coprocesador o como un procesador (CPU) y será fabricada utilizando el proceso tecnológico de 14nm de Intel con la segunda generación de los transistores 3-D tri-gate.
​Como un coprocesador basado en la PCIe, el “Knights Landing” se encargará de las cargas de trabajo Offload de los procesadores Intel Xeon del sistema y proporcionará un camino de actualización para usuarios de la actual generación de coprocesadores, tal cual como ocurre actualmente. No obstante, como un procesador host instalado directamente en el socket de la Placa Madre se comportará como una CPU y habilitará el próximo salto en la densidad y en el rendimiento por Watt, realizando todas las funciones del procesador principal y del coprocesador especializado al mismo tiempo. Cuando sea usada como CPU, “Knights Landing” también eliminará las complejidades de programación de transferencia de datos en la PCIe, comunes en los aceleradores de la actualidad.
​Para aumentar aún más el rendimiento para cargas de trabajo HPC, Intel aumentará significativamente el ancho de banda de la memoria para todos los productos “Knights Landing” al presentar la memoria DRAM integrada al paquete. Esto permitirá a los clientes el aprovechamiento total de la capacidad del procesamiento disponible sin encontrar los cuellos de botella del ancho de banda de la memoria que suelen encontrarse actualmente.