IA

IA, entrenamiento, inferencia y RAG (Generación Aumentada de Recuperación): un nuevo amanecer para la IA

Por: Douglas Wallace, Gerente de Ventas Distrital, América Latina y el Caribe (Excepto Brasil) en Pure Storage

El 30 de noviembre de 2022 fue un día monumental. Ese fue el día en que OpenAI lanzó ChatGPT al mundo, el resto es historia; literalmente. Han pasado dos años desde entonces y hemos visto un aumento meteórico en el interés por la IA. Esto ha llevado a un aumento de casi 10 veces en la capitalización de mercado de Nvidia, el fabricante líder de GPU (unidad de procesamiento gráfico), y predicciones descabelladas sobre la posible inversión total de las empresas en IA, así como el impacto que tendrá en la sociedad.

Esto se siente muy diferente a los amaneceres de IA anteriores que hemos visto en los últimos 70 años, desde la Prueba de Turing, las derrotas de los grandes maestros del ajedrez, hasta la conducción autónoma y ahora la explosión de la IA generativa. El juego ha cambiado por completo, pero todavía se basa en ciertos conceptos fundamentales.

Durante muchos años, los avances de la IA se han basado en tres desarrollos clave: 1) recursos informáticos más potentes, en forma de GPU; 2) algoritmos o modelos mejorados (en el caso de la IA generativa, la arquitectura Transformer y los modelos de lenguaje de gran tamaño, LLM) y, por último, 3) acceso a cantidades masivas de datos. En un nivel muy alto, las fases de un proyecto de IA incluyen la recopilación y preparación de datos, el desarrollo y entrenamiento de modelos y la implementación de modelos, también conocida como inferencia.

Todo es cuestión de datos

La recopilación y preparación de datos no se puede pasar por alto: los datos de buena calidad, relevantes e imparciales son clave para un proyecto de IA exitoso. A menudo se cita que las organizaciones tienen dificultades para comprender sus datos, identificar la propiedad de estos y romper los silos para permitir que esos datos se utilicen de manera efectiva.

Sin acceso a datos de alta calidad, es poco probable que una iniciativa tenga éxito. Cada vez más, las organizaciones utilizan datos multimodales, no solo texto, sino también audio, imágenes e incluso video en sus proyectos de IA. La cantidad de datos y, por lo tanto, los requisitos de almacenamiento subyacentes son significativos.

Entrenamiento del modelo

La fase de entrenamiento generalmente se aborda de una de dos maneras. Entrenamiento del modelo fundamental, que implica aprovechar una gran cantidad de datos, construir un modelo de IA desde cero y entrenar iterativamente ese modelo para producir un modelo general para su uso.

Esto generalmente lo llevan a cabo grandes empresas de tecnología con muchos recursos; Meta ha hablado recientemente sobre el entrenamiento de su modelo Llama 3.1 de código abierto de 405 mil millones de parámetros con más de 15 billones de tokens; se informa que esto llevó alrededor de 40 millones de horas de GPU en 16 000 GPU. Este largo tiempo de entrenamiento del modelo resalta un aspecto clave para el entrenamiento de modelos grandes: puntos de control frecuentes para permitir la recuperación de fallas. Con modelos grandes, es esencial que el almacenamiento utilizado para los puntos de control tenga un rendimiento y una capacidad de escritura muy altos.

El segundo enfoque de entrenamiento es el ajuste fino del modelo. Esto implica tomar un modelo existente, donde otra organización ha hecho el trabajo pesado, y aplicar datos específicos del dominio a ese modelo a través de un entrenamiento adicional. De esta manera, una organización se beneficia de su propio modelo personalizado, pero no necesita entrenarlo desde cero.

Cualquiera sea el enfoque, el entrenamiento requiere un procesamiento paralelo masivo con GPU, lo que requiere un alto rendimiento y velocidades de acceso para manejar grandes conjuntos de datos de manera eficiente. Por lo tanto, el almacenamiento de datos para el entrenamiento de IA debe ofrecer un rendimiento muy alto, sobre todo para mantener las GPU alimentadas con datos, escalabilidad para gestionar grandes conjuntos de datos de entrenamiento y confiabilidad dada la importancia y el costo de los modelos de entrenamiento.

En producción

Una vez que se ha entrenado un modelo y su rendimiento cumple con los requisitos, se lo pone en producción. Esto es cuando el modelo utiliza datos que no ha visto antes para sacar conclusiones o proporcionar información. Esto se conoce como inferencia y es cuando se obtiene valor de una iniciativa de IA. El uso de recursos y el costo asociados con la inferencia eclipsan al del entrenamiento porque la inferencia tiene demandas de computación y almacenamiento de manera constante y potencialmente a gran escala; piensa en millones de usuarios que acceden a un chatbot para el servicio al cliente.

El almacenamiento subyacente para la inferencia debe ofrecer un alto rendimiento, ya que esto es clave para proporcionar resultados oportunos, así como una escalabilidad fácil para cumplir con los requisitos de almacenamiento de los datos que se introducen en el modelo para el mantenimiento de registros y para proporcionar datos de reentrenamiento. La calidad de los resultados de la inferencia está directamente relacionada con la calidad del modelo entrenado y el conjunto de datos de entrenamiento.

La IA generativa proporcionó un giro a la precisión de la inferencia; la naturaleza de la IA generativa significa que las imprecisiones son muy probables, conocidas como alucinaciones. Estas imprecisiones han causado problemas que han aparecido con frecuencia en los titulares.

Mejorar la precisión

Los usuarios de ChatGPT se darán cuenta de la importancia de la consulta introducida en el modelo. Una consulta completa bien estructurada puede dar como resultado una respuesta mucho más precisa que una pregunta cortante. Esto ha dado lugar al concepto de «ingeniería rápida», en el que se proporciona un gran conjunto de datos bien elaborado como consulta al modelo para obtener el resultado óptimo.

Un enfoque alternativo que está adquiriendo cada vez más importancia es la generación aumentada de recuperación, o RAG. RAG aumenta la consulta con los datos propios de una organización en forma de contexto específico del caso de uso que proviene directamente de una base de datos vectorial como Chroma o Milvus.

En comparación con la ingeniería rápida, RAG produce mejores resultados y reduce significativamente la posibilidad de alucinaciones. Igualmente, importante es el hecho de que se pueden utilizar datos actuales y oportunos con el modelo en lugar de limitarse a una fecha límite histórica.

RAG depende de la vectorización de los datos de una organización, lo que permite integrarlos en la arquitectura general. Las bases de datos vectoriales suelen experimentar un crecimiento significativo en el tamaño del conjunto de datos en comparación con la fuente, hasta 10 veces, y son muy sensibles al rendimiento, dado que la experiencia del usuario está directamente relacionada con el tiempo de respuesta de la consulta de la base de datos vectorial. Como tal, el almacenamiento subyacente en términos de rendimiento y escalabilidad juega un papel importante en la implementación exitosa de RAG.

El enigma energético de la IA

En los últimos años, los costos de la electricidad se han disparado en todo el mundo, sin signos de desaceleración. Además, el auge de la IA generativa significa que las necesidades energéticas de los centros de datos se han multiplicado por muchas. De hecho, la IEA estima que el uso de energía de la IA, los centros de datos y las criptomonedas representaron casi el 2% de la demanda energética mundial en 2022, y que estas demandas energéticas podrían duplicarse para 2026.

Esto se debe en parte a las altas demandas de energía de las GPU que sobrecargan los centros de datos, requiriendo 40-50 kilovatios por rack, muy por encima de la capacidad de muchos centros de datos.

Impulsar la eficiencia en todo el centro de datos es esencial, lo que significa que la infraestructura como el almacenamiento de datos all-flash es crucial para administrar la energía y el espacio, ya que cada vatio ahorrado en el almacenamiento puede ayudar a alimentar más GPU.

Con algunas tecnologías de almacenamiento all-flash es posible lograr una reducción de hasta el 85 % en el uso de energía y hasta un 95 % menos de espacio en rack que las ofertas de la competencia, lo que brinda un valor significativo como parte clave del ecosistema de IA.

El almacenamiento de datos es parte del rompecabezas de la IA

El potencial de la IA es casi inimaginable. Sin embargo, para que los modelos de IA funcionen, se necesita un enfoque cuidadoso en todo el entrenamiento, ya sea básico o de ajuste fino, para obtener una inferencia precisa y escalable. La adopción de RAG se puede aprovechar para mejorar aún más la calidad de los resultados.

Está claro que en todas las etapas los datos son un componente clave; el almacenamiento flash es esencial para generar el impacto transformador de la IA en las empresas y la sociedad, ya que ofrece un rendimiento, una escalabilidad y una confiabilidad inigualables. Flash respalda la necesidad de la IA de tener acceso en tiempo real a datos no estructurados, lo que facilita tanto el entrenamiento como la inferencia, al tiempo que reduce el consumo de energía y las emisiones de carbono, lo que lo hace vital para una infraestructura de IA eficiente y sostenible.

www.purestorage.com

purestorage.com/trademarks

Reconocimiento de analistas:

Líder en el Cuadrante mágico de Gartner de 2023 para almacenamiento primario

Líder en el Cuadrante mágico de Gartner de 2023 para sistemas de archivos distribuidos y almacenamiento de objetos

Conecta con Pure

Blog

LinkedIn

Twitter

Facebook

IA, entrenamiento, inferencia y RAG (Generación Aumentada de Recuperación): un nuevo amanecer para la IA Leer más »

El futuro de RRHH en 2025: liderazgo ágil, IA y datos para revolucionar la gestión de personas

Por: Fernando Sollak, Director de Relaciones Humanas de TOTVS y Robson Campos, Director de Productos para RRHH de TOTVS

La transformación en el área de RRHH, es constante. Con el auge del uso de la Inteligencia Artificial, la llegada de la generación Z al mercado laboral, las nuevas oleadas de beneficios y tantas novedades y demandas diarias, ¡2025 da señales de ser un año lleno de cambios! Las prácticas tradicionales se están repensando y es hora de poner en práctica tendencias que ya están cambiando la forma en la que trabajamos.

El liderazgo, por ejemplo, ya no se trata de jerarquías rígidas y control vertical de arriba hacia abajo. Ahora es necesario centrarse en modelos más flexibles y colaborativos, pero aún queda camino por recorrer. El estudio de Gartner “Top 5 priorities for HR leaders in 2025” reveló que los programas actuales de desarrollo de líderes aún no están a la altura de los cambios. Según los encuestados, el 76% de las organizaciones han actualizado significativamente sus programas de desarrollo de liderazgo; sin embargo, sólo el 36% de los líderes de RR.HH. consideran que estos programas son efectivos, afirma Sollak.

Para el futuro, es fundamental preparar líderes altamente adaptables, ágiles y conectados al mundo digital. Estos nuevos líderes deben estar preparados para dar a los equipos más autonomía y fomentar un sentido de propósito compartido. Es importante destacar la agenda de human skills, en la que, además de las habilidades técnicas, es fundamental desarrollar y priorizar habilidades como la inteligencia emocional, la empatía y la capacidad de inspirar a las personas en un entorno de cambio constante.

Todo este escenario se vuelve aún más desafiante cuando pensamos en las relaciones entre diferentes generaciones que trabajan en el lugar de trabajo. Cada generación tiene sus particularidades y visiones del mundo, y el profesional de RR.HH. necesita comprender, responder y hacer converger estas diferencias en favor de una mejor convivencia entre las personas, para lograr un mejor desempeño empresarial, complementa el director de Relaciones Humanas de TOTVS.

Una mirada especial a los beneficios también debe estar en la agenda de RR.HH. en 2025. Hoy, especialmente los más jóvenes, buscan empresas que tengan iniciativas de bienestar, oportunidades de desarrollo y ventajas alineadas con los valores y objetivos de cada individuo.

Con la diversidad de generaciones, habilidades, demandas y necesidades diferentes que entran en juego en la rutina de recursos humanos, es esencial tener coherencia en el enfoque para desarrollar, evaluar y reconocer a los empleados. Es muy importante que desde RR.HH. estén al tanto de las novedades, preste atención a los procesos y actúe en consecuencia de forma humana.

Pasando al tema de la tecnología, en 2024 vimos el avance del uso de la Inteligencia Artificial en nuestra vida diaria, y en 2025 la expectativa es que su aplicación madure aún más. Las herramientas de inteligencia artificial pueden automatizar tareas rutinarias, como la asistencia de bots de chat para responder preguntas de los empleados. Esto libera a los profesionales del área de RR.HH. para centrarse en acciones estratégicas que realmente agreguen valor a la empresa. Para aprovechar el potencial de la IA, RR.HH. debe adoptar la tecnología de forma proactiva, integrando herramientas innovadoras para aumentar la eficiencia, mejorar las decisiones y ofrecer una experiencia más interesante para las personas.

Los datos son el combustible de la IA, por lo que el uso de datos en RR.HH. debe ser cada vez más estratégico. Trabajar con análisis de datos no es un diferenciador, sino una necesidad. Saber utilizar la información para predecir tendencias, mejorar las estrategias de gestión y cuidar el bienestar de las personas es fundamental. El uso de datos, en RRHH y otras áreas, pasa por tres pasos importantes: primero por aculturación y aprendizaje, formación de líderes en el uso de datos; segundo por democratización, haciendo que estos datos sean de autoservicio, con paneles de control para uso de los gestores autorizados a utilizarlos; y por último difusión, junto con el área de gobierno, de una cultura datadriven (impulsado por datos) en la empresa, argumenta Robson Campos director de productos para RRHH de TOTVS.

Pero aquí es importante hacer una salvedad: independientemente del auge de la IA, la conexión humana sigue siendo primordial – de hecho, gana aún más importancia. Deepa Vohra Bahl (coach, mentora y mediadora, y membro de ICF, Forbes Coaches Council) destaca que, dado que muchas tareas son asumidas por la inteligencia artificial, la inteligencia emocional será una habilidad clave para los líderes. La empatía, la adaptabilidad y la capacidad de crear buenas relaciones serán fundamentales para cualquiera que quiera generar confianza y un ambiente de pertenencia para sus equipos, incluso en un mundo cada vez más digital.

Por último, no podemos olvidarnos de hablar de la planificación, que sigue siendo la base del éxito de RRHH. Es fundamental organizar el calendario, entendiendo las principales fechas relacionadas con pagos, impuestos y requisitos legales. Esta postura preventiva reduce los riesgos, garantiza operaciones fluidas y permite a RR.HH. centrar sus esfuerzos en estrategias que impulsen el crecimiento de la empresa.

Con tantos cambios ocurriendo, aprender y adaptarse continuamente es primordial en la agenda de RR.HH. Esta es la manera de que los profesionales de RRHH afronten los retos del futuro y ayuden a sus equipos a alcanzar su máximo potencial, concluye Fernando Sollak, director de Relaciones Humanas de TOTVS.

El futuro de RRHH en 2025: liderazgo ágil, IA y datos para revolucionar la gestión de personas Leer más »

Congreso aprobó, en penúltimo debate, proyecto de ley de datos para impulsar la inteligencia artificial en el país.

Congreso aprobó, en penúltimo debate, proyecto de ley de datos para impulsar la inteligencia artificial en el país

La Comisión Sexta del Senado aprobó, en penúltimo debate, el proyecto de ley de datos, que establece un marco normativo para el uso, intercambio y aprovechamiento de la infraestructura de datos del Estado colombiano (IDEC), y mejorar la interoperabilidad de los sistemas de información entre las entidades públicas.

La aprobación, que se muestra como un paso clave para posicionar a Colombia como líder en tecnología e inteligencia artificial (IA), da vía libre para que lo establecido en la iniciativa se aplique en las entidades públicas, particulares con funciones administrativas, organismos estatales y también a las personas jurídicas privadas que deseen acogerse voluntariamente para producir datos relevantes, sin comprometer la privacidad de los ciudadanos, mediante el uso de datos anónimos o pseudoanónimos.

El ministro de las TIC, Mauricio Lizcano, aseguró que “este proyecto es muy importante porque es transformador. Si queremos ser un país líder en inteligencia artificial, tenemos que ser productores de datos, y que esos datos sean comparables, para lograr que las decisiones de política pública del país se tomen con información actualizada”. 

“Esto nos permitirá definir los modelos de inteligencia artificial. Este proyecto no tiene nada que ver con la Ley de Habeas Data, son datos anónimos, no se trasgreden los datos privados de las personas. La importancia de este proyecto es que, si queremos que Colombia se convierta en un país productor de tecnología, necesitamos datos”, agregó.

La propuesta legislativa, que contempla cuatro capítulos y 35 artículos, establece la supervisión de organismos estatales para impulsar la toma de decisiones, impulsar programas sociales efectivos y fortalecer la privacidad y seguridad de los datos. Además, se mejorará el intercambio de datos entre sistemas públicos y privados, garantizando la interoperabilidad, a través de una gestión de datos maestros, de referencia y abiertos para asegurar una infraestructura segura.

Tras esta aprobación, el Proyecto de Ley de Datos continúa su trámite en la Plenaria de Senado para su último debate y, de tener vía libre, pasará a manos del Presidente de la República para su sanción.

Congreso aprobó, en penúltimo debate, proyecto de ley de datos para impulsar la inteligencia artificial en el país Leer más »

Smile CX Academy, el programa de formación ejecutiva para impulsar la IA Generativa en Colombia

En un esfuerzo colaborativo que busca promover la transformación digital en el sector empresarial, la iniciativa de la multinacional de high-tech Covisian, Smile.CX Academy y la Universidad de los Andes han lanzado un nuevo programa ejecutivo enfocado en la implementación de tecnologías de Inteligencia Artificial Generativa (IAG).

Este curso ha sido concebido para que directivos y líderes empresariales, puedan explorar el impacto de la IA Generativa en la gestión empresarial y comprender cómo ésta fortalece la estrategia del negocio.

Las jornadas académicas que se realizarán en modalidad presencial, iniciarán el martes 17 de septiembre y están dirigidas a directores y responsables de márketing, gestión y experiencia de clientes, ventas a través de canal directo, transformación digital, atención al cliente con un rol relevante en proyectos de alto impacto estratégico y operativos en la relación con el cliente; especialmente en sectores como banca, seguros, e- commerce, telco, utilities, retail y automotriz.

«De la relación con nuestros propios clientes conocemos de primera mano qué les preocupa o qué necesitan las compañías en el campo de la Experiencia del Cliente (CX), en este sentido, el programa busca equipar a los líderes empresariales con las habilidades necesarias para integrar eficazmente la IA Generativa en sus estrategias y operaciones comerciales. Para esto, hemos diseñado un programa de 16 horas de formación en colaboración con Universidad de los Andes, donde exploraremos a fondo la aplicación práctica de estas tecnologías en el entorno empresarial actual”, afirmó Viriginia Mateos, Head of Marketing and Communication para Grupo Covisian, y líder promotora de la iniciativa Smile.CX Academy.

Así mismo, Felipe Samper, director de Programas Corporativos en la Universidad de Los Andes aseguró que esta iniciativa representa una oportunidad única para explorar cómo la Inteligencia Artificial Generativa puede impulsar la innovación y la eficiencia en los negocios modernos. “Estamos entusiasmados de colaborar con Covisian para ofrecer esta formación de vanguardia que preparará a los líderes para enfrentar los desafíos del futuro”.

Con módulos centrados en cómo la IA impacta en los modelos de negocios y concepciones relevantes como la privacidad y la protección de datos en el uso de herramientas de IA Generativa, además de workshops prácticos orientados a la implementación de iniciativas de IA Generativa, este programa de Smile.CX Academy se presenta como una oportunidad de networking e intercambio de experiencias para los líderes de los principales sectores.

Entre los ponentes del programa se encuentran grandes profesionales activos como Jorge Saravia, Ingeniero de sistemas de la Escuela Colombiana de Ingeniería con más de 15 años de experiencia como consultor en compañías como Banco Popular, Nueva EPS o Bavaria y Johan Osma especialista en bionanocompuestos que en los últimos 10 años ha producido más de 500 nanocompuestos y ha sido reconocido por sus labores en innovación en diferentes industrias.

Reconociendo el dominio de los participantes en la aplicación práctica de la IA Generativa en entornos empresariales dinámicos y competitivos. Los interesados pueden obtener más información y solicitar su participación escribiendo a [email protected]

Sin duda, Smile.CX Academy representa una oportunidad clave para innovar y adaptarse a las exigencias del mercado actual, donde la IA juega un papel fundamental en la mejora continua de la competitividad empresarial.

Tags: #Covisian #Smile.CXAcademy #Universidaddelosandes #CustomerExperience #ExperienciaDelCliente #Innovación #InteligenciaArtificialGenerativaEl programa culminará el 20 de noviembre con la entrega de un certificado de aprovechamiento por parte de la Universidad de los Andes y Smile.CX Academy,

Smile CX Academy, el programa de formación ejecutiva para impulsar la IA Generativa en Colombia Leer más »

Scroll al inicio