Tendencias de encapsulado de semiconductores avanzados en IA y HPC

Las tecnologías avanzadas de encapsulado de semiconductores, como la unión híbrida 2,5D y 3D, junto con soluciones emergentes como la fotónica de silicio, son fundamentales para optimizar el rendimiento del sistema y fomentar la próxima ola de innovación en chips de IA y HPC. El informe "Advanced Semiconductor Packaging 2024-2034: Forecasts, Technologies, Applications" (Embalaje avanzado de semiconductores 2024-2034: previsiones, tecnologías y aplicaciones), publicado por IDTechEx, explora el cambiante panorama del encapsulado de semiconductores, con especial atención al embalaje híbrido 2,5D y 3D.
Abarca las tendencias tecnológicas, los retos de la industria y los avances realizados por los principales actores, al tiempo que pronostica las tendencias del mercado en el sector del envasado de semiconductores.
Retos de los grandes modelos lingüísticos (LLM-Large Language Models):
La aparición de los grandes modelos lingüísticos (LLM) marca un hito en la IA, revolucionando el procesamiento del lenguaje natural (PLN) y campos afines. Modelos como la serie GPT de OpenAI demuestran una gran precisión a la hora de comprender, generar y traducir el lenguaje humano. Aunque encuentran diversas aplicaciones, también presentan retos.
Los LLM han experimentado un crecimiento exponencial en el tamaño del modelo, pasando de 340 millones de parámetros en BERT-L en 2019 a 1,76 billones de parámetros en el próximo GPT-4. Esta expansión se traduce en una alta complejidad computacional, ya que GPT-4 requiere más de 1010 petaFLOPS. En comparación con otras redes neuronales, las LLM exigen muchos más recursos computacionales; por ejemplo, el entrenamiento de la GPT-3 requiere 3841 horas de GPU frente a las 11 horas de una ResNet-60 (una red neuronal convolucional utilizada para la clasificación de imágenes). Las LLM tienen una intensidad operativa baja, lo que significa que dependen en gran medida de operaciones matriciales-vectoriales. Esto requiere mover más datos para realizar el mismo número de operaciones aritméticas. Por tanto, el ancho de banda de la memoria es fundamental para su rendimiento.
Formas de mejorar el ancho de banda del sistema:
En los últimos años, se ha producido un desfase entre el rápido aumento de la densidad de cálculo de los procesadores y el incremento más lento del ancho de banda de la memoria. Este problema de "muro de memoria" provoca que los procesadores esperen datos con frecuencia, lo que conduce a una infrautilización y plantea un reto sustancial para futuras mejoras del rendimiento.
NVIDIA y AMD han introducido las tecnologías NVLink e Infinity Fabric, respectivamente, para mejorar la interconectividad entre la CPU y la GPU, lo que resulta crucial para mejorar el ancho de banda entre los componentes lógicos.
La incorporación a las arquitecturas de la nueva generación de memorias de alto ancho de banda (HBM), formadas por múltiples troqueles DRAM apilados verticalmente y conectados mediante vías de silicio (TSV), ofrece un aumento sustancial del ancho de banda entre la lógica y la memoria. Aunque antes se limitaban a las GPU, las HBM se están integrando ahora en las CPU, salvando la brecha de ancho de banda entre éstas y la DRAM tradicional. La Instinct MI300 de AMD ejemplifica esta tendencia al integrar HBM avanzadas con la CPU y la GPU en un único encapsulado. Las tecnologías de empaquetado de semiconductores 2,5D, como Chip on Wafer on Substrate (CoWoS) de TSMC, desempeñan un papel crucial en el aumento del número de puntos de E/S (entrada/salida), al tiempo que reducen la longitud de interconexión entre los componentes lógicos y de memoria, lo que mejora el rendimiento y reduce la latencia. Sin embargo, las nuevas cargas de trabajo de HPC, en particular las relacionadas con el entrenamiento de IA, exigen un ancho de banda de memoria aún mayor (más de 45x) debido a los frecuentes accesos a la memoria. El aumento de la velocidad de E/S puede mejorar el ancho de banda de HBM, pero está limitado por el mayor consumo de energía.
Para solucionar este problema, los nuevos diseños de procesadores se han centrado en aumentar la capacidad de la SRAM en el chip, ya que está situada cerca de los chips de procesamiento, lo que permite un mayor ancho de banda con interconexiones más densas y menor latencia. En las primeras implementaciones se utilizó la tecnología de encapsulado de unión híbrida 3D para unir un dado SRAM sobre un dado lógico en un paso de 9 μm, triplicando la capacidad SRAM. Para mejorar aún más el ancho de banda, el paso de la unión híbrida se redujo de 9 μm a 0,4 μm, lo que multiplicó por más de 300 la densidad del ancho de banda.
La óptica en coencapsulado es otro enfoque que está cobrando gran impulso en los últimos años. La comunicación óptica ofrece varias ventajas sobre la transmisión tradicional de señales eléctricas. Tiene menos pérdidas de transmisión, lo que reduce la degradación de la señal en las distancias. Además, la comunicación óptica es menos susceptible a la diafonía, que se produce cuando las señales interfieren entre sí, provocando errores en los datos. Además, las señales ópticas pueden alcanzar un mayor ancho de banda en comparación con sus homólogas eléctricas, lo que las hace ideales para aplicaciones de datos intensivos.
En resumen, para la próxima generación de sistemas de computación de IA, un gran ancho de banda entre lógica y lógica y entre lógica y memoria son tendencias de desarrollo cruciales. Las tecnologías avanzadas de empaquetado de semiconductores, como la unión híbrida 2,5D y 3D, junto con soluciones emergentes como la comunicación óptica, son fundamentales para permitir este crecimiento y superar los retos computacionales.
Autor: Dr. Yu-Han Chang, analista tecnológico senior de IDTechEx
Articulos Electrónica Relacionados
- Robot que facilita la telepres... La Universitat de Lleida (UdL) ha presentado esta un prototipo de Asistente Personal Robótico (APR), diseñado y desarrollado para facilitar la &ld...
- Tecnología de silicio para los... Poder utilizar la tecnología de silicio para crear la nueva generación de procesadores cuánticos sería un extra bien recibido, ya que permitiría el uso de las l...
- El Comité del PICMG desarrolla... El PICMG anuncia la formación de un subcomité técnico para crear una nueva especificación de factor de forma PICMG llamada ModBlox7. Esta especificación transfo...
- IoT utilizando chips sin fuent... En el contexto de un proyecto financiado por el FSF (Austrian Science Fund), un grupo de investigadores de Graz analizó un IoT basada en chips RFID sin s...
- Inova Semiconductors licencia ... Inova Semiconductors tiene el placer de anunciar que SocioNext es el primer titular de licencia de la última tecnología APIX3 de Inova Semiconduct...
- Guía sobre infraestructura par... El Ministerio de Economía, Industria y Competitividad (MINECO) ha publicado la primera edición de la Guía de la Instrucción Té...
- La industria del plástico apue... El proyecto ENZPLAST se centra en el uso de enzimas para diferentes aplicaciones en el sector del plástico para el desarrollo de nuevos procesos, m&aacut...
- EcoNet, ACORYS y Bound4blue no... El Instituto Europeo de Innovación y Tecnología (EIT) reconoce la labor de 28 emprendedores de toda Europa (cuatro de ellos españoles) nominados para los premio...
- Aditivos inteligentes permitir... El proyecto europeo DECOAT permitirá desviar de vertedero un 75% el volumen de textiles y plásticos con recubrimiento que hasta ahora eran de difícil reciclado....
- Proyecto europeo SHAR-Q para o... Atos ha presentado los resultados del proyecto europeo SHAR-Q cuyo objetivo es optimizar los sistemas de almacenamiento de energía e integrarlos en las redes el...
- Nuevos avances en la integraci... La integración de la electrónica en molde IME (In Mold Electronics) es una nueva forma revolucionaria de integrar la electrónica en los plásticos durante el pro...
- Las pantallas flexibles de baj... A medida que aumenta el número de dispositivos que adquieren funcionalidad electrónica, muchas aplicaciones nuevas requerirán algún tipo de pantalla. Este aumen...