Nuestro socio IBM acaba de anunciar, en su TechXchange, el lanzamiento de su familia de modelos de IA más avanzada hasta la fecha, Granite 3.0. Se trata de la tercera generación de modelos de lenguaje Granite de IBM, y puede superar o igualar el rendimiento de modelos de tamaño similar de proveedores líderes en muchas pruebas de referencia académicas y del sector, demostrando un sólido rendimiento, transparencia y seguridad.
En línea con el compromiso de la compañía con la IA de código abierto, los modelos Granite se publican bajo la licencia permisiva Apache 2.0, lo que los hace únicos por la combinación de rendimiento, flexibilidad y autonomía para los clientes empresariales y la comunidad en general.
De asistentes a agentes: haciendo realidad el futuro de la IA empresarial
IBM está impulsando la IA empresarial a través de una amplia gama de tecnologías, desde modelos y asistentes hasta las herramientas necesarias para ajustar y desplegar la IA específicamente para los datos y casos de uso únicos de las empresas. IBM también está allanando el camino para que los futuros agentes de IA puedan autodirigirse, reflexionar y realizar tareas complejas en entornos empresariales dinámicos.
Asimismo, IBM ha presentado hoy la próxima versión de watsonx Code Assistant, basada en los modelos de código Granite, para ofrecer asistencia de programación de uso general en lenguajes como C, C++, Go, Java y Python, con capacidades avanzadas de modernización de aplicaciones para Enterprise Java Applications . Ahora también se puede acceder a las funciones de código de Granite a través de una extensión de Visual Studio Code, IBM Granite.Code.
La familia Granite 3.0 de IBM incluye:
- Propósito general/Lenguaje: Granite 3.0 8B-Instruct, Granite 3.0 2B-Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base
- Barreras de protección y seguridad: Granite Guardian 3.0 8B, Granite Guardian 3.0 2B
- Mixture of Experts (MoE): Granite 3.0 3B A800M Instruct, Granite 3.0 1B A400M Instruct, Granite 3.0 3B A800M Base, Granite 3.0 1B A400M Base
Los nuevos modelos de lenguaje Granite 3.0 8B y 2B están diseñados para la IA empresarial, ofreciendo un gran rendimiento y rentabilidad en tareas como la regeneración aumentada de recuperación (RAG), clasificación, resumen, extracción de entidades y uso de herramientas. Estos modelos compactos y versátiles están diseñados para ajustarse con precisión a los datos empresariales e integrarse a la perfección en cualquier entorno empresarial o flujo de trabajo.
Subiendo la barra: Pruebas de Granite 3.0
En las tareas empresariales básicas de RAG, el uso de herramientas y tareas en el ámbito de la ciberseguridad, el modelo Granite 3.0 8B Instruct muestra un rendimiento superior de media en comparación con los modelos de código abierto de tamaño similar de Mistral y Meta.
Los modelos Granite 3.0 se han estrenado con más de 12 billones de tokens de datos a partir de 12 lenguajes naturales y 116 lenguajes de programación diferentes, utilizando un novedoso método de entrenamiento en dos fases, que aprovecha los resultados de varios miles de experimentos diseñados para optimizar la calidad y la selección de datos y los parámetros de entrenamiento. Para finales de año, se espera que los modelos lingüísticos 8B y 2B también incluyan soporte para una ventana de contexto extendida de 128K y capacidades de comprensión multimodal de documentos.
Granite Guardian 3.0: la nueva era de la IA responsable
Como parte de este lanzamiento, IBM también ha presentado una nueva familia de modelos Granite Guardian que permiten a los desarrolladores de aplicaciones implementar barreras de seguridad mediante la comprobación de los avisos al usuario y las respuestas LLM para detectar una variedad de riesgos. Los modelos Granite 3.0 8B y 2B ofrecen el conjunto más completo de capacidades de detección de riesgos y daños disponibles actualmente en el mercado.
Además de las dimensiones de daño, como prejuicios sociales, odio, toxicidad, blasfemia, violencia, técnicas de jailbreak etc., estos modelos también proporcionan una serie de comprobaciones únicas específicas de RAG, como el fundamento, la relevancia del contexto y la relevancia de la respuesta.
Aunque los modelos Granite Guardian se derivan de los correspondientes modelos de lenguaje Granite, pueden utilizarse para implementar medidas de seguridad junto a cualquier modelo de IA, ya sea abierto o propietario.
Disponibilidad de los modelos Granite 3.0
Toda la suite de modelos Granite 3.0 y los modelos actualizados series temporales están disponibles para su descarga en Hugging Face bajo la licencia permisiva Apache 2.0. Las variantes instructivas de los nuevos modelos lingüísticos Granite 3.0 8B y 2B y los modelos Granite Guardian 3.0 estarán disponibles desde hoy para uso comercial en la plataforma watsonx de IBM. A su vez, estará disponible una selección de modelos Granite 3.0 como microservicios NVIDIA NIM y a través de las integraciones Vertex AI Model Garden de Google Cloud con Hugging Face.