OpenAI aporta un ajuste fino a GPT-4o – guía en línea


Suscríbase a nuestros boletines diarios y semanales para recibir las últimas actualizaciones y contenido exclusivo sobre la cobertura de inteligencia artificial líder en la industria. Más información


OpenAI anunció hoy que permite a los desarrolladores de software de terceros ajustar (o modificar) el comportamiento de versiones personalizadas de su nuevo modelo multimodal grande (LMM), GPT-4o, haciéndolo más adecuado para las necesidades de su aplicación u organización.

Ya sea ajustar el tono, seguir instrucciones específicas o mejorar la precisión en tareas técnicas, el ajuste fino permite mejoras significativas incluso con conjuntos de datos pequeños.

Los desarrolladores interesados ​​en la nueva capacidad pueden visitar el sitio web de OpenAI. Panel de control de ajuste finohaga clic en “crear” y seleccione gpt-4o-2024-08-06 desde el menú desplegable del modelo base.

La noticia llega menos de un mes después de que la compañía hiciera posible que los desarrolladores ajustaran la variante más pequeña, más rápida y más barata del modelo, el GPT-4o mini, que sin embargo es menos potente que el GPT-4o completo.

“Desde la codificación hasta la escritura creativa, el ajuste fino puede tener un gran impacto en el rendimiento del modelo en una variedad de dominios”, afirman los miembros del personal técnico de OpenAI, John Allard y Steven Heidel, en un Publicación de blog en el sitio web oficial de la empresa“Esto es solo el comienzo: seguiremos invirtiendo en la expansión de nuestra personalización del modelo “Opciones para desarrolladores”.

Fichas gratuitas disponibles desde ahora hasta el 23 de septiembre

La empresa señala que los desarrolladores pueden lograr resultados sólidos con tan solo unas pocas docenas de ejemplos en sus datos de entrenamiento.

Para lanzar la nueva función, OpenAI ofrece hasta 1 millón de tokens por día de forma gratuita para usar en el ajuste de GPT-4o para cualquier organización de terceros (cliente) desde ahora hasta el 23 de septiembre de 2024.

Fichas se refieren a las representaciones numéricas de combinaciones de letras, números y palabras que representan conceptos subyacentes aprendidos por un LLM o LMM.

Como tales, funcionan efectivamente como el “lenguaje nativo” de un modelo de IA y son la medida utilizada por OpenAI y otros proveedores de modelos para determinar cuánta información está ingiriendo (entrada) o proporcionando (salida) un modelo. Para ajustar un LLM o LMM como GPT-4o como desarrollador/cliente, debe convertir los datos relevantes para su organización, equipo o caso de uso individual en tokens que pueda comprender, es decir, tokenizarlos, que es lo que proporcionan las herramientas de ajuste fino de OpenAI.

Sin embargo, esto tiene un costo: normalmente costará $25 por cada millón de tokens ajustar GPT-4o, mientras que ejecutar el modelo de inferencia/producción de su versión ajustada cuesta $3,75 por cada millón de tokens de entrada y $15 por cada millón de tokens de salida.

Para aquellos que trabajan con el modelo más pequeño GPT-4o mini, hay 2 millones de tokens de capacitación gratuitos disponibles diariamente hasta el 23 de septiembre.

Esta oferta se extiende a todos los desarrolladores en niveles de uso pago, lo que garantiza un amplio acceso a capacidades de ajuste.

La decisión de ofrecer tokens gratuitos se produce en un momento en que OpenAI se enfrenta a una fuerte competencia en precio por parte de otros proveedores propietarios como Google y Antrópico, así como de modelos de código abierto como el recientemente presentado Hermes 3 de Nous Research, una variante del Llama 3.1 de Meta.

Sin embargo, con OpenAI y otros modelos cerrados/propietarios, los desarrolladores no tienen que preocuparse por alojar la inferencia del modelo o entrenarlo en sus servidores: pueden usar OpenAI para esos fines o vincular sus propios servidores preferidos a la API de OpenAI.

Las historias de éxito resaltan el potencial de ajuste

El lanzamiento del ajuste fino de GPT-4o es el resultado de extensas pruebas con socios seleccionados, lo que demuestra el potencial de los modelos personalizados en varios dominios.

Cosine, una empresa de ingeniería de software de IA, ha aprovechado el ajuste fino para lograr resultados de última generación (SOTA) del 43,8 % en el índice de referencia SWE-bench con su agente de ingeniería de IA autónomo Genie, el más alto de cualquier modelo o producto de IA declarado públicamente hasta la fecha.

Otro caso destacado es Distyl, un socio de soluciones de IA para empresas Fortune 500, cuyo GPT-4o perfeccionado ocupó el primer lugar en el índice de referencia BIRD-SQL, logrando una precisión de ejecución del 71,83%.

El modelo se destacó en tareas como reformulación de consultas, clasificación de intenciones, razonamiento en cadena de pensamiento y autocorrección, particularmente en la generación de SQL.

Se hace hincapié en la seguridad y la privacidad de los datos incluso cuando se utilizan para perfeccionar nuevos modelos

OpenAI ha reforzado la idea de que la seguridad y la privacidad de los datos siguen siendo prioridades principales, incluso a medida que amplían las opciones de personalización para los desarrolladores.

Los modelos ajustados permiten un control total sobre los datos comerciales, sin riesgo de que las entradas o salidas se utilicen para entrenar otros modelos.

Además, la empresa ha implementado mitigaciones de seguridad en capas, incluidas evaluaciones automatizadas y monitoreo de uso, para garantizar que las aplicaciones se adhieran a las políticas de uso de OpenAI.

Todavía La investigación ha demostrado que el ajuste fino de los modelos puede hacer que se desvíen de sus límites y salvaguardas, y reducir su rendimiento generalDepende de las organizaciones si creen que vale la pena correr el riesgo; sin embargo, OpenAI claramente cree que sí y las alienta a considerar el ajuste como una buena opción.

De hecho, cuando anunció nuevas herramientas de ajuste para desarrolladores en abril (como la creación de puntos de control basados ​​en épocas), OpenAI declaró en ese momento que “creemos que en el futuro, la gran mayoría de las organizaciones desarrollarán modelos personalizados para su industria, negocio o caso de uso”.

El lanzamiento hoy de nuevas capacidades de ajuste fino de GPT-4o subraya el compromiso continuo de OpenAI con esa visión: un mundo en el que cada organización tiene su propio modelo de IA personalizado.

Aureliano Teodoro es un reportero de tecnología que se centra en temas de vigilancia, privacidad y poder corporativo. Anteriormente fue redactor senior en Gawker y su trabajo también apareció en GQ, Vice y la revista New York Times, El País, entre otros medios.

Leave a Comment