OpenAI se ha convertido en una especie de «sinónimo» de inteligencia artificial. Esta empresa estadounidense, fundada en 2015, está tras el desarrollo de ChatGPT, uno de los bots conversacionales más conocidos del mundo. A pesar de llevar poco más de dos años en el mercado, las constantes actualizaciones lo han convertido en un asistente prometedor para realizar casi cualquier tipo de tarea.
Algunas de las novedades más recientes e importantes de ChatGPT lo convierten en un poderoso motor de búsqueda capaz de rivalizar con el mismísimo Google. Además, se ha abierto una línea telefónica en Estados Unidos para que cualquier persona pueda interactuar con el bot, sin necesidad de disponer de un smartphone o conexión a Internet.
A pesar de su potencial, ChatGPT tiene duros competidores. Existe Claude 3, uno de los modelos de IA más potentes, aparte de Apple Intelligence o Google Gemini. Incluso China está pisando fuerte con su nuevo modelo: R1.
DeepSeek R1 iguala algunos de los tests de rendimiento de OpenAI O1
El laboratorio chino de inteligencia artificial DeepSeek acaba de revelar su nueva familia de modelos R1 bajo una licencia abierta del MIT. Su versión más grande contiene 671 mil millones de parámetros, y la compañía afirma que funciona a niveles comparables al modelo o1 de OpenAI en varias pruebas matemáticas.
Aparte de DeepSeek-R1-Zero y DeepSeek-R1, que son los modelos principales, el laboratorio también ha publicado seis versiones más «pequeñas», que van desde 1,5 mil a 70 mil millones de parámetros. Estos modelos se basan en arquitecturas de código abierto existentes como Qwen y Llama, entrenados con datos generados a partir del modelo R1 completo.
La versión más pequeña es capaz de ejecutarse en un ordenador portátil, lo que lo hace ideal para tareas de testeo por casi cualquier usuario. No obstante, el modelo más completo requiere de bastantes más recursos informáticos para funcionar correctamente.
Los nuevos modelos liberados por DeepSeek apuntan a marcar un antes y un después en la industria, porque son capaces de rivalizar con modelos propietarios como el o1 de OpenAI. Estos modelos con licencia del MIT pueden ser modificados, estudiarlos o usarlos comercialmente por cualquiera.
Es muy divertido ejecutarlos, verlos pensar es divertidísimo. Cada respuesta comienza con una etiqueta pseudo-XML … que contiene la cadena de pensmaiento utilizada para ayudar a generar la respuesta – Simon Willison, investigador independiente
Al parecer, el modelo R1 funciona de manera diferente a los típicos modelos de lenguaje grande (LLM) al incorporar lo que la gente en la industria llama un «enfoque de razonamiento en tiempo de inferencia». Intentan simular una cadena de pensamiento similar a la humana mientras el modelo busca una solución a la consulta, como comenta la fuente.
Esta clase de modelos, denominados de «razonamiento simulado» o SR para abreviar, surgió cuando OpenAI presentó su familia de modelos o1. Esta familia permite a la inteligencia artificial realizar razonamientos más difíciles en una mayor variedad de temas. La compañía anunció un adelanto el pasado mes de diciembre llamada «o3» que promete interesantes cambios.
Por lo que se sabe, hay tres laboratorios chinos que han logrado que sus modelos tengan capacidades comparables a o1 de OpenAI: DeepSeek, Alibaba y Kimi, de Moonshot. No obstante, DeepSeek, por sus orígenes, será incapaz de responder a ciertas preguntas sobre temas concretos, como la plaza de Tiananmén o la autonomía de Taiwán.
El artículo China lanza su nuevo modelo de inteligencia artificial y los expertos lo tienen claro: podría competir contra OpenAI fue publicado originalmente en Urban Tecno.
Dejar una contestacion