Cada semana aparecen nuevas funciones, nuevos modelos y nuevas promesas alrededor de la inteligencia artificial. Una ventana de contexto más grande. Una generación de imágenes más precisa. Un modo voz más natural. Un agente que supuestamente ya puede trabajar por ti mientras tú te tomas un café y contemplas el futuro.
Mientras tanto, la mayoría seguimos utilizando una pequeña parte de todo todo el potencial de las herramientas.
Puedes tener acceso a la IA más avanzada del mercado y acabar utilizándola para resumir e-mails, reorganizar textos o preparar una reunión. Pero nos flipamos con las noticias y novedades. Creo que hay muchas personas que confunden el benchmark técnico con utilidad real.
Que una herramienta gane una comparativa de capacidad de cálculo debería importarte bastante poco si no encaja con tu forma de trabajar.
Llevo bastante tiempo probando ChatGPT, Claude, Gemini y Copilot de forma intensiva y hoy me gustaría hacer una compartativa entre ellas y después os dejará una herramienta para que cada uno de vosotros averigue cual es mejora para cada uno de vosotros.
Para hacer la comparativa quise seguir una de las metodologías que aprendí en mi libro de Decisiones x Datos.
Definir categorías
Evaluar las herramientas
Ponderar las categorías según mi trabajo
Evaluar el resultado final
Espero que os sea útil a todos.
Paso 1 · Definir categorías
Intentar comparar herramientas función por función no tiene demasiado recorrido porque el análisis queda viejo en cuanto llega la siguiente actualización. Me interesaba algo más estable y conectado con el trabajo real, así que decidí crear estas 7 categorías:

Cognición y razonamiento: La capacidad de ayudarme a estructurar ideas, sintetizar información, detectar matices y sostener pensamiento complejo.
Memoria, continuidad y personalización. La posibilidad de trabajar con proyectos largos, contexto acumulado, instrucciones persistentes y conversaciones que no empiezan desde cero cada día.
Multimodalidad y formatos: Imagen, voz, visualización, documentos, transformación entre formatos y construcción de sistemas visuales.
Ecosistema e integración: La facilidad para conectar la IA con documentos, herramientas, automatizaciones y entornos reales de trabajo.
Trabajo con datos y análisis: Capacidad para interpretar información compleja, analizar documentos, cruzar fuentes y ayudarme a entender mejor los datos.
Experiencia de uso, filosofía y confianza: Una categoría bastante subjetiva, pero importante cuando trabajas muchas horas con estas herramientas.
Capacidad operativa y agéntica: Capacidad de automatización, workflows, ejecución de tareas y coordinación de acciones.
Nota mental: para agrupar estas categorías he usado las 4 herramientas generalistas (Chatgpt, Claude, Gemini & copilot). Es decir las herramientas han participado en la definición.
Paso 2 · Evaluar las herramientas
Una vez definidas las categorías evalué el estado actual de cada herramienta a 16 de mayo de 2026. No buscaba una verdad absoluta ni una puntuación objetiva. Solo quería visualizar diferencias reales de uso.

Cuando trabajas muchas horas con estas herramientas dejan de parecerse tanto entre sí. Algunas destacan muchísimo en continuidad y multimodalidad. Otras en razonamiento profundo o capacidad operativa. Otras empiezan a ganar valor gracias a integración y contexto.
Nota mental:
Esta es mi valoración, puedes discutir algún punto, puedes hacer la tuya y comparamos. No problem, pero con datos.
A partir de aquí empecé a evaluar mi trabajo.
Paso 3 · Ponderar las categorías según mi trabajo actual
Porque una cosa es lo que parece espectacular en una demo y otra muy distinta aquello que realmente utilizas todos los días.
Por ejemplo, la parte agéntica me parece una de las áreas con más potencial de crecimiento en los próximos años. Pero cuando reviso honestamente cómo trabajo hoy, sigo dedicando muchísimo más tiempo a pensar, estructurar ideas, trabajar documentos, crear contenidos, analizar información y transformar conocimiento entre formatos distintos.
Por eso decidí ponderar las categorías según el impacto real que tienen actualmente en mi trabajo.
La distribución quedó así:

Cognición y razonamiento — 24%
Memoria y continuidad — 22%
Multimodalidad y formatos — 21%
Trabajo con datos y análisis — 16%
Capacidad operativa y agéntica — 6%
Ecosistema e integración — 6%
Experiencia de uso, filosofía y confianza — 5%
Esta creo que es la radiografía de mi trabajo en la actualidad.
Paso 4 · Ranking y evaluación final
En el momento en el que cruzas la valoración de las herramientas con tu nivel de importancia actual te sale un ranking de las herramienta que mejor encaja en tu trabajo.

El resultado encaja bastante con cómo estoy utilizando actualmente estas herramientas.
ChatGPT concentra muchas de las capacidades que hoy tienen más peso para mí. Continuidad, multimodalidad, memoria, estructuración, trabajo visual y transformación de formatos. Gran parte de mi trabajo actual pasa por construir visualizaciones, organizando conocimiento, preparando materiales o conectando información dispersa.
Claude me parece la herramienta más potente para escritura compleja y determinadas tareas cognitivas largas. Lo que es increíble es su capacidad de ejecución con el cowork & skills. Son un mundo nuevo que me toca profundizar.
Gemini está creciendo muy rápido. Sobre todo en multimodalidad y ecosistema. Y Copilot … bueno diré que ha mejorado mucho. Si hubiera hecho este ejercicio hace un año hubiera sacado un 1 o un 2 en casi todas las categorías.
Lo interesante de este ejercicio es que el ranking depende muchísimo menos de la herramienta que de cómo ponderas tu trabajo.
Porque al final no estás evaluando únicamente modelos de IA. Estás evaluando qué sistema amplifica mejor tu forma concreta de trabajar. Para que tu puedas hacer tu propio ranking

Cómo creo que cambiará esta ponderación
Probablemente esta distribución ya está empezando a quedarse vieja en el momento de publicarse.
Hoy sigo dando mucho peso a razonamiento, continuidad, multimodalidad y trabajo intelectual profundo porque todavía utilizo la IA principalmente para pensar y construir conocimiento.
Pero sospecho que muchas de estas capacidades acabarán convirtiéndose en algo esperado por defecto. En breve todos los modelos funcionarán tan bien en esto que la diferencia de las herramientas empezará a desplazarse hacia otro sitio.
Agentes, ejecución, automatización, memoria persistente, integración y coordinación entre herramientas probablemente tendrán muchísimo más peso dentro de pocos años. Así que si cambio la ponderación, creo que actualmente Claude es la que está más adelantada para el trabajo del mañana.
Mi IA de uso diario hoy sigue siendo ChatGPT. Es donde trabajo, organizo ideas, construyo visualizaciones y mantengo continuidad. Y Claude se está convirtiendo cada vez más en mi IA de exploración. La herramienta a la que voy cuando quiero experimentar con mayor detalle.
Son dos miradas.
Para lo que hago ahora mi tool es ChatGPT, para lo que creo que haré en el futuro se acerca más a Claude. Todo esto siempre que OpenIA no acelere, que creo que lo hará. Otro día hablamos del momento de moverse de una herramienta a otra.
Espero que os haya gustado.





