Diseño

La tecnología AiSAQ™ de KIOXIA reduce los requisitos de DRAM en sistemas de IA generativa

Inicio desactivadoInicio desactivadoInicio desactivadoInicio desactivadoInicio desactivado
 

KIOXIA ha anunciado el lanzamiento de código abierto de su nueva tecnología All-in-Storage ANNS with Product Quantization (AiSAQ). El software KIOXIA AiSAQ™[1] (un novedoso algoritmo de búsqueda de "vecino más cercano aproximado" (ANNS) optimizado para unidades SSD) ofrece un rendimiento escalable para la generación de recuperación aumentada (RAG) sin colocar los datos de índice en DRAM, buscándolos directamente en la unidad SSD.

Los sistemas de IA generativa requieren importantes recursos informáticos, de memoria y de almacenamiento. Si bien cuentan con el potencial de impulsar avances transformadores en varios sectores, su implementación a menudo conlleva altos costes. RAG es una fase crítica de la IA que refina grandes modelos de lenguaje (LLM) con datos específicos de la empresa o la aplicación.

Un componente central de RAG es una base de datos vectorial que acumula y convierte datos específicos en vectores de características en la base de datos. RAG también utiliza un algoritmo ANNS, que identifica vectores que mejoran el modelo en función de la similitud entre los vectores acumulados y los vectores objetivo.

Para que RAG sea eficaz, debe recuperar rápidamente la información más relevante para una consulta. Tradicionalmente, los algoritmos ANNS se desplegaban en DRAM para lograr el rendimiento de alta velocidad necesario para estas búsquedas.

La tecnología AiSAQ™ de KIOXIA proporciona una solución ANNS escalable y eficiente para conjuntos de datos a gran escala con un uso de memoria insignificante y un cambio de índice muy rápido.

Característica de la tecnología AiSAQ™ de KIOXIA
Permite que las bases de datos a gran escala funcionen sin depender de recursos DRAM limitados, lo que mejora el rendimiento de los sistemas RAG.

Elimina la necesidad de cargar datos de índice en DRAM, lo que permite que la base de datos vectorial se inicie al instante. Esto permite la conmutación sin interrupciones entre bases de datos específicas del usuario o de la aplicación en el mismo servidor para una prestación eficiente de servicios RAG.

Optimizada para sistemas en la nube mediante el almacenamiento de índices en almacenamiento desagregado para compartirlos entre varios servidores. Este enfoque ajusta dinámicamente el rendimiento de la búsqueda en bases de datos vectoriales para usuarios o aplicaciones específicas y facilita la migración rápida de instancias de búsqueda entre servidores físicos.

"La solución AiSAQ™ de KIOXIA prepara el camino para el escalado casi infinito de las aplicaciones RAG en sistemas de IA generativa basados en unidades SSD flash en el núcleo", dijo Axel Stoermann, vicepresidente y director de tecnología de KIOXIA Europe GmbH. "Al utilizar la tecnologíoa ANNS basada en unidades SSD, reducimos la dependencia en la costosa DRAM al tiempo que satisfacemos las necesidades de rendimiento de las principales soluciones en memoria, mejorando considerablemente el rango de rendimiento de las aplicaciones RAG a gran escala"

Más información 

Articulos Electrónica Relacionados

  • RS Components presenta la plac... RS Components anuncia el lanzamiento de la nueva familia de placas “DesignSpark Synergy”. Las placas son fruto de su continua colaboración con ARM para desarrol... Diseño
  • Altera acelera la productivida... Altera Corporation anuncia su software de desarrollo Quartus® II versión 10.1, el software número uno del mercado para lógica programable en cuanto a prestacion... Diseño
  • Corriente Continua de Alto Vol... En los últimos años, MEAN WELL ha lanzado múltiples productos de corriente continua de alto voltaje (HVDC) para diferentes aplicaciones y sectores de las nuevas... Diseño
  • Mouser dispone en stock de pla... Mouser Electronics, Inc. anuncia la disponibilidad inmediata de los módulos de soporte para el desarrollo de Android™ Open Accessory -kit de inicio Microchip DM... Diseño

Edicion Revista Impresa

1ww   

Para recibir la edición impresa o en PDF durante 1 año (10 ediciones)

Suscripción papel: 180,00.- €  (IVA inc.)

Suscripción PDF: 60,00.- € (IVA inc)

Noticias Populares Electrónica

La tecnología AiSAQ™ de KIOXIA reduce los requisitos de DRAM en sistemas de IA generativa

KIOXIA ha anunciado el lanzamiento de código abierto de su nueva tecnología All-in-Storage ANNS with Product Quantization (AiSAQ). El software...

Una nueva manera de utilizar módulos de potencia para eliminar la circuitería de precarga de alta tensión

La industria del automóvil se halla en plena transición hacia los vehículos eléctricos (VE), de ahí que los ingenieros afronten los desafíos que...

Potenciación de la espectrometría de masas de tiempo de vuelo con ADC de bajo ruido y alta velocidad

La espectrometría de masas por tiempo de vuelo (TOF MS) se ha convertido en un instrumento fundamental para aplicaciones en muchos campos,...

Cómo gestionar la potencia reactiva

En los sistemas de baja tensión, la compensación de potencia reactiva, conocida como PFC (Corrección del Factor de Potencia), desempeña un papel...

Convertronic

Revista © Convertronic Electrónica Profesional Española.Todos los derechos reservados GM2 Publicaciones Técnicas, S.L.
Tel.: +34 91 706 56 69
Poema Sinfónico, 27. Esc B. Planta 1 Pta 5
28054 (Madrid - SPAIN)
e-mail: gm2@gm2publicacionestecnicas.com ó consultas@convertronic.net

Suscríbete a nuestro boletín de noticias

Revista Española de electrónica. Impresa desde hace más de 25 años.

España - Madrid - Todos los derechos reservados Revista © Convertronic Electrónica Profesional Española.

Search