Rankeando los asistentes generativos

Un muy buen artículo en The Wall Street Journal, «The Great AI Challenge: We test five top bots on useful, everyday skills« elabora un ranking muy completo de los asistentes generativos más populares del momento: Perplexity.ai, ChatGPT de OpenAI, Gemini de Google, Claude de Anthropic, y Copilot de Microsoft, y los ordena por puntuación general en ese mismo orden, con clasificaciones específicas para información sobre salud, finanzas, cocina, escritura de trabajo, escritura creativa, resúmenes, actualidad y código, así como una puntuación adicional referida a la velocidad de obtención de las respuestas.

En el momento actual, dada la enorme popularidad de los asistentes generativos en formato chatbot, un artículo de este tipo tiene un gran valor. Hablamos de un panorama competitivo brutal, rápidamente cambiante a medida que las compañías lanzan nuevas versiones y van perfeccionando sus productos, y en el que muchos usuarios se mueven simplemente por las referencias que tienen y lo que conocen.

Obviamente, ChatGPT cuenta con la ventaja de haber puesto en marcha la locura cuando, el 30 de noviembre de 2022, lanzó ChatGPT en abierto y con su versión 3 gratuita. A partir de ahí, vimos cómo Microsoft aprovechaba el hecho de haber sido quien hospedó a OpenAI en su Azure difiriendo los pagos durante mucho tiempo, vimos a Google tratar de reaccionar desesperadamente – primero con Bard, después con Gemini – y fuimos metiendo también en la escena a otros competidores más pequeños pero enormemente interesantes como Perplexity o Claude.

Ahora, la escena es clara: si nos fiamos de las tendencias que marca Google Trends, que se elaboran a partir de la frecuencia de búsqueda, ChatGPT domina muy claramente, seguido de los dos gigantes Google y Microsoft, y muy por detrás, Claude y Perplexity. Sin embargo, esa popularidad no está marcada por la calidad de las respuestas de los asistentes generativos, sino simplemente por otros factores más relacionados con la intensidad informativa que han sido capaces de generar, por el efecto pionero, etc.

De ahí que el valor de un ranking de este tipo, que ha comparado las versiones de pago de cada uno de los asistentes, tiene, a pesar de su posible inestabilidad en el tiempo, sea muy elevado, como lo es el hecho de que Perplexity, una compañía mucho más pequeña que el resto de sus competidores, que ha levantado unos 165 millones de dólares sobre una valoración de mil millones, y que tan solo cuenta con 55 empleados – OpenAI tiene más de 1,200, por no hablar de los que tienen Microsoft o Google – sea capaz de liderarlo.

A la hora de escoger qué asistente generativo utilizar, conviene por tanto plantearse la posibilidad de elegir en función de la temática que estemos explorando: si hablamos de temáticas del momento, la propuesta de Perplexity, con su información permanentemente actualizada y su enumeración de fuentes utilizadas para la respuesta, parece razonablemente imbatible. Por otro lado, y sin tener en cuenta la temática, es preciso entender que Perplexity busca intencionadamente la concisión, lo que puede hacer que aquellos que simplemente buscan una respuesta que copiar y pegar en un trabajo lo encuentren menos útil.

Perplexity sigue un modelo freemium en el que el producto gratuito utiliza su propio modelo basado en el modelo GPT 3.5 de OpenAI combinado con un modelo masivo de lenguaje propio de la compañía que incorpora capacidades de procesamiento del lenguaje natural. La versión de pago tiene acceso a GPT 4, Claude 3 , Mistral Large, Llama 3 y a un modelo experimental de desarrollo propio. Esa aproximación de consolidación cruzada conlleva una menor vulnerabilidad a las mal llamadas «alucinaciones», que a pesar de todo, suceden como en todos los modelos de este tipo, pero también tiene posibles implicaciones de cara a la futura viabilidad de la compañía, que podría encontrarse con cambios en los términos de servicio de las APIs que utiliza si su popularidad escalase hasta el punto de poner en peligro a aquellas compañías que utiliza como fuentes.

En cualquier caso, y dado que cada vez más personas utilizan este tipo de asistentes generativos para una gama cada vez más amplia de tareas, un ranking elaborado con cierta seriedad supone un aporte muy interesante. Ya veremos si, además, llega hasta el punto de mover la aguja de las estadísticas de popularidad.

Sé el primero en comentar

Dejar una contestacion

Tu dirección de correo electrónico no será publicada.


*