Comparativa de Agentes de IA para Coding

10 herramientas. 30 propiedades. 1 ganador.

Los Contendientes

#AgenteCreadorTipoGitHub Stars
1GSD v2Tâches (comunidad)CLI autónomo (Pi SDK)~15K
2Hermes AgentNous ResearchAgente auto-mejorable~5K
3Claude CodeAnthropicCLI agéntico nativo~30K
4Codex CLIOpenAICLI ligero~67K
5OpenCodeanomalyco (OSS)CLI model-agnostic~5K
6GooseBlock (Square)Agente extensible~27K
7ClineCline Bot IncIDE agent (VS Code)~40K
8AiderPaul GauthierPair programming CLI~30K
9OpenClawOpenClawAgente personal con memoria~1K
10Letta CodeLetta AIMemory-first coding agent~5K

Scoring

  • 🏆 = +3 (mejor en clase)
  • ✅ = +2 (feature completa)
  • ⚠️ = +1 (parcial / limitada)
  • ❌ = -1 (no disponible)

Tabla Comparativa (30 Propiedades)

1. Autonomía

PropiedadGSD v2HermesClaude CodeCodexOpenCodeGooseClineAiderOpenClawLetta Code
Ejecución autónoma🏆⚠️⚠️
Walk-away (deploy solo)🏆⚠️⚠️⚠️⚠️⚠️⚠️
Auto-recovery de errores⚠️⚠️⚠️⚠️⚠️
Loop detection⚠️⚠️

2. Memoria y Persistencia

PropiedadGSD v2HermesClaude CodeCodexOpenCodeGooseClineAiderOpenClawLetta Code
Memoria entre sesiones⚠️🏆⚠️⚠️🏆
Session search (FTS)🏆⚠️
Memory files (MD)⚠️🏆⚠️⚠️
Graph/typed memory

3. Skills y Mejora

PropiedadGSD v2HermesClaude CodeCodexOpenCodeGooseClineAiderOpenClawLetta Code
Skills system🏆⚠️⚠️
Skill creation auto🏆⚠️
Self-improvement cycle⚠️
Skills marketplace⚠️

4. Modelo y Flexibilidad

PropiedadGSD v2HermesClaude CodeCodexOpenCodeGooseClineAiderOpenClawLetta Code
Model agnostic🏆🏆
Multi-provider routing⚠️⚠️⚠️
Local models (Ollama)⚠️⚠️⚠️⚠️⚠️⚠️
Custom API endpoints⚠️🏆🏆

5. Integración y Plataformas

PropiedadGSD v2HermesClaude CodeCodexOpenCodeGooseClineAiderOpenClawLetta Code
CLI/Terminal🏆
VS Code🏆
Messaging (Telegram/Discord)⚠️🏆
Multi-platform gateway🏆

6. DevOps y Deploy

PropiedadGSD v2HermesClaude CodeCodexOpenCodeGooseClineAiderOpenClawLetta Code
Git integration🏆⚠️🏆
Checkpoints/Rollback⚠️⚠️⚠️⚠️
Parallel execution🏆⚠️⚠️⚠️⚠️⚠️
Cost tracking⚠️

7. Capacidades Extra

PropiedadGSD v2HermesClaude CodeCodexOpenCodeGooseClineAiderOpenClawLetta Code
Browser automation
Voice/TTS
MCP support⚠️⚠️⚠️
Image generation
Cron/Scheduled tasks
Subagent delegation⚠️⚠️
Open source
Context optimization🏆⚠️⚠️⚠️⚠️⚠️⚠️⚠️⚠️
Spec-driven development🏆

Scoring Final

AgenteAutonomíaMemoriaSkillsModeloIntegraciónDevOpsExtraTOTAL
GSD v212128510240
Hermes Agent61292841152
Claude Code820-437218
Codex CLI6-3-3-43100
OpenCode5-3-31033015
Goose5-30553217
Cline00-3523310
Aider-2-3-31027-110
OpenClaw0858831042
Letta Code8125835344

🏆 Ganador: Hermes Agent

Score: 52 puntos

Podio

  1. 🥇 Hermes Agent (52 pts) — El más completo
  2. 🥈 Letta Code (44 pts) — Memory-first, stateful, aprende entre sesiones
  3. 🥉 OpenClaw (42 pts) — Mejor para asistente personal con memoria
  4. 🏅 GSD v2 (40 pts) — Mejor para coding autónomo

Por qué Hermes gana

  • Memoria que persiste de verdad (MEMORY.md + USER.md + Session Search)
  • Skills que se crean solos — el único que hace esto realmente
  • Multi-platform — Telegram, Discord, Slack, WhatsApp, Signal, Email, CLI
  • Self-improvement cerrado — aprende de errores y corrige
  • Open source — auditables

Por qué Letta Code es el nuevo contendiente fuerte

Letta Code es el único que compite de verdad con Hermes en memoria:

  • Stateful por diseño — mismo agente entre sesiones, no sesiones independientes
  • Memoria jerárquica — blocks editables, /remember command, auto-bootstrap
  • Model agnostic — Claude, GPT, Gemini, GLM, Kimi, MiniMax
  • Open source — puedes self-hostear con Docker
  • Filosofía: “Like having a coworker that learns and remembers” vs “meeting a new contractor”

Lo que le falta vs Hermes: multi-platform messaging, browser automation, voice, skill creation automática.

Claude Code (18 pts): Potente pero con amnesia

Claude Code es el mejor ejecutor individual. Cuando funciona, genera código de mayor calidad que cualquier otro. Pero tiene problemas fundamentales:

Lo bueno:

  • Ejecución autónoma de alta calidad
  • Mejor código generado (cuando funciona)
  • Checkpoints + rollback
  • Subagent delegation
  • Loop detection
  • Context optimization
  • MCP support
  • VS Code integration nativa

Lo malo:

  • Solo modelos Anthropic — vendado a Claude (-4 en categoría modelo)
  • Sin memoria entre sesiones — cada conversación empieza de cero
  • Closed source — no puedes auditar qué hace
  • Sin multi-platform — solo terminal y VS Code
  • Sin skills system real
  • Sin browser, voice, image gen, cron

El veredicto: Es como contratar un genio con amnesia. Produce código excelente HOY pero mañana no recuerda nada. Cada sesión es independiente — no aprende, no mejora.

Vs Letta Code: hace lo mismo PERO con memoria persistente, model agnostic, y open source. Vs Hermes: hace todo eso + multi-platform + skills auto-creados + self-improvement.

Cuándo usarlo: Si solo necesitas código de alta calidad hoy, sin importar el mañana → Claude Code gana.

OpenCode (15 pts): El esqueleto más limpio

OpenCode es el CLI más minimal y flexible — pero le falta todo lo que hace un agente interesante.

Lo bueno:

  • 🏆 El más model-agnostic — cualquier provider, cualquier endpoint
  • 🏆 Custom API endpoints — conecta lo que quieras
  • 100% open source — minimal, hackeable, legible
  • Local models (Ollama) — corre sin internet
  • Git integration básica

Lo malo:

  • Sin memoria — cada sesión empieza de cero (-3)
  • Sin skills — no tiene sistema de skills (-3)
  • Sin multi-platform — solo terminal
  • Sin browser, voice, image gen, cron
  • ⚠️ Autonomía básica — no es autónomo como GSD v2
  • ⚠️ Sin checkpoints, sin parallel execution

El veredicto: Es un esqueleto excelente. El CLI más limpio y flexible que existe. Pero le falta todo: memoria, skills, autonomía real. Si quieres algo minimal que conecte a cualquier modelo → OpenCode gana. Si quieres un agente que haga cosas → cualquier otro es mejor.

En el contexto de Orion: Interesante como referencia de arquitectura CLI limpia, pero no como agente. Su flexibilidad de modelos ya la tenemos en OpenClaw.


Para Orion

La lección: combinar lo mejor de cada uno

FeatureFuenteEstado en Orion
Memoria persistenteHermes + Letta✅ ClawVault
Skills auto-creationHermes❌ Pendiente
Multi-platformOpenClaw✅ Telegram, Discord
Context optimizationGSD v2❌ Pendiente
Stateful sessionsLetta Code⚠️ Parcial
Model agnosticOpenCode + Aider✅ Multi-provider
Spec-driven devGSD v2❌ Evaluar
Self-improvementHermes + Letta⚠️ Planificado

2026-04-09 · Orion Research