Comparativa de Agentes de IA para Coding

10 herramientas. 30 propiedades. 1 ganador.

Los Contendientes

#	Agente	Creador	Tipo	GitHub Stars
1	GSD v2	Tâches (comunidad)	CLI autónomo (Pi SDK)	~15K
2	Hermes Agent	Nous Research	Agente auto-mejorable	~5K
3	Claude Code	Anthropic	CLI agéntico nativo	~30K
4	Codex CLI	OpenAI	CLI ligero	~67K
5	OpenCode	anomalyco (OSS)	CLI model-agnostic	~5K
6	Goose	Block (Square)	Agente extensible	~27K
7	Cline	Cline Bot Inc	IDE agent (VS Code)	~40K
8	Aider	Paul Gauthier	Pair programming CLI	~30K
9	OpenClaw	OpenClaw	Agente personal con memoria	~1K
10	Letta Code	Letta AI	Memory-first coding agent	~5K

Scoring

🏆 = +3 (mejor en clase)
✅ = +2 (feature completa)
⚠️ = +1 (parcial / limitada)
❌ = -1 (no disponible)

Tabla Comparativa (30 Propiedades)

1. Autonomía

Propiedad	GSD v2	Hermes	Claude Code	Codex	OpenCode	Goose	Cline	Aider	OpenClaw	Letta Code
Ejecución autónoma	🏆	✅	✅	✅	✅	✅	⚠️	❌	⚠️	✅
Walk-away (deploy solo)	🏆	⚠️	⚠️	⚠️	⚠️	⚠️	❌	❌	❌	⚠️
Auto-recovery de errores	✅	⚠️	✅	⚠️	⚠️	⚠️	❌	❌	❌	⚠️
Loop detection	✅	⚠️	✅	❌	❌	❌	❌	❌	❌	⚠️

2. Memoria y Persistencia

Propiedad	GSD v2	Hermes	Claude Code	Codex	OpenCode	Goose	Cline	Aider	OpenClaw	Letta Code
Memoria entre sesiones	⚠️	🏆	⚠️	❌	❌	❌	⚠️	❌	✅	🏆
Session search (FTS)	❌	🏆	❌	❌	❌	❌	❌	❌	⚠️	✅
Memory files (MD)	⚠️	🏆	⚠️	❌	❌	❌	⚠️	❌	✅	✅
Graph/typed memory	❌	❌	❌	❌	❌	❌	❌	❌	✅	✅

3. Skills y Mejora

Propiedad	GSD v2	Hermes	Claude Code	Codex	OpenCode	Goose	Cline	Aider	OpenClaw	Letta Code
Skills system	✅	🏆	⚠️	❌	❌	⚠️	❌	❌	✅	✅
Skill creation auto	❌	🏆	❌	❌	❌	❌	❌	❌	❌	⚠️
Self-improvement cycle	❌	✅	❌	❌	❌	❌	❌	❌	⚠️	✅
Skills marketplace	⚠️	❌	❌	❌	❌	❌	❌	❌	✅	❌

4. Modelo y Flexibilidad

Propiedad	GSD v2	Hermes	Claude Code	Codex	OpenCode	Goose	Cline	Aider	OpenClaw	Letta Code
Model agnostic	✅	✅	❌	❌	🏆	✅	✅	🏆	✅	✅
Multi-provider routing	✅	⚠️	❌	❌	✅	⚠️	⚠️	✅	✅	✅
Local models (Ollama)	⚠️	⚠️	❌	❌	✅	⚠️	⚠️	✅	⚠️	⚠️
Custom API endpoints	✅	⚠️	❌	❌	🏆	✅	✅	🏆	✅	✅

5. Integración y Plataformas

Propiedad	GSD v2	Hermes	Claude Code	Codex	OpenCode	Goose	Cline	Aider	OpenClaw	Letta Code
CLI/Terminal	🏆	✅	✅	✅	✅	✅	❌	✅	❌	✅
VS Code	✅	❌	✅	✅	❌	✅	🏆	❌	❌	❌
Messaging (Telegram/Discord)	⚠️	🏆	❌	❌	❌	❌	❌	❌	✅	❌
Multi-platform gateway	❌	🏆	❌	❌	❌	❌	❌	❌	✅	❌

6. DevOps y Deploy

Propiedad	GSD v2	Hermes	Claude Code	Codex	OpenCode	Goose	Cline	Aider	OpenClaw	Letta Code
Git integration	🏆	✅	✅	⚠️	✅	✅	✅	🏆	✅	✅
Checkpoints/Rollback	✅	✅	✅	❌	❌	⚠️	⚠️	⚠️	❌	⚠️
Parallel execution	🏆	⚠️	⚠️	❌	❌	⚠️	❌	❌	⚠️	⚠️
Cost tracking	✅	❌	✅	⚠️	❌	❌	❌	❌	❌	❌

7. Capacidades Extra

Propiedad	GSD v2	Hermes	Claude Code	Codex	OpenCode	Goose	Cline	Aider	OpenClaw	Letta Code
Browser automation	❌	✅	❌	❌	❌	❌	✅	❌	❌	❌
Voice/TTS	❌	✅	❌	❌	❌	❌	❌	❌	✅	❌
MCP support	✅	✅	✅	⚠️	⚠️	✅	✅	❌	✅	⚠️
Image generation	❌	✅	❌	❌	❌	❌	❌	❌	✅	❌
Cron/Scheduled tasks	❌	✅	❌	❌	❌	❌	❌	❌	✅	❌
Subagent delegation	⚠️	✅	✅	❌	❌	⚠️	❌	❌	✅	✅
Open source	✅	✅	❌	✅	✅	✅	✅	✅	✅	✅
Context optimization	🏆	⚠️	✅	⚠️	⚠️	⚠️	⚠️	⚠️	⚠️	⚠️
Spec-driven development	🏆	❌	❌	❌	❌	❌	❌	❌	❌	❌

Scoring Final

Agente	Autonomía	Memoria	Skills	Modelo	Integración	DevOps	Extra	TOTAL
GSD v2	12	1	2	8	5	10	2	40
Hermes Agent	6	12	9	2	8	4	11	52
Claude Code	8	2	0	-4	3	7	2	18
Codex CLI	6	-3	-3	-4	3	1	0	0
OpenCode	5	-3	-3	10	3	3	0	15
Goose	5	-3	0	5	5	3	2	17
Cline	0	0	-3	5	2	3	3	10
Aider	-2	-3	-3	10	2	7	-1	10
OpenClaw	0	8	5	8	8	3	10	42
Letta Code	8	12	5	8	3	5	3	44

🏆 Ganador: Hermes Agent

Score: 52 puntos

Podio

🥇 Hermes Agent (52 pts) — El más completo
🥈 Letta Code (44 pts) — Memory-first, stateful, aprende entre sesiones
🥉 OpenClaw (42 pts) — Mejor para asistente personal con memoria
🏅 GSD v2 (40 pts) — Mejor para coding autónomo

Por qué Hermes gana

Memoria que persiste de verdad (MEMORY.md + USER.md + Session Search)
Skills que se crean solos — el único que hace esto realmente
Multi-platform — Telegram, Discord, Slack, WhatsApp, Signal, Email, CLI
Self-improvement cerrado — aprende de errores y corrige
Open source — auditables

Por qué Letta Code es el nuevo contendiente fuerte

Letta Code es el único que compite de verdad con Hermes en memoria:

Stateful por diseño — mismo agente entre sesiones, no sesiones independientes
Memoria jerárquica — blocks editables, /remember command, auto-bootstrap
Model agnostic — Claude, GPT, Gemini, GLM, Kimi, MiniMax
Open source — puedes self-hostear con Docker
Filosofía: “Like having a coworker that learns and remembers” vs “meeting a new contractor”

Lo que le falta vs Hermes: multi-platform messaging, browser automation, voice, skill creation automática.

Claude Code (18 pts): Potente pero con amnesia

Claude Code es el mejor ejecutor individual. Cuando funciona, genera código de mayor calidad que cualquier otro. Pero tiene problemas fundamentales:

Lo bueno:

Ejecución autónoma de alta calidad
Mejor código generado (cuando funciona)
Checkpoints + rollback
Subagent delegation
Loop detection
Context optimization
MCP support
VS Code integration nativa

Lo malo:

❌ Solo modelos Anthropic — vendado a Claude (-4 en categoría modelo)
❌ Sin memoria entre sesiones — cada conversación empieza de cero
❌ Closed source — no puedes auditar qué hace
❌ Sin multi-platform — solo terminal y VS Code
❌ Sin skills system real
❌ Sin browser, voice, image gen, cron

El veredicto: Es como contratar un genio con amnesia. Produce código excelente HOY pero mañana no recuerda nada. Cada sesión es independiente — no aprende, no mejora.

Vs Letta Code: hace lo mismo PERO con memoria persistente, model agnostic, y open source. Vs Hermes: hace todo eso + multi-platform + skills auto-creados + self-improvement.

Cuándo usarlo: Si solo necesitas código de alta calidad hoy, sin importar el mañana → Claude Code gana.

OpenCode (15 pts): El esqueleto más limpio

OpenCode es el CLI más minimal y flexible — pero le falta todo lo que hace un agente interesante.

Lo bueno:

🏆 El más model-agnostic — cualquier provider, cualquier endpoint
🏆 Custom API endpoints — conecta lo que quieras
✅ 100% open source — minimal, hackeable, legible
✅ Local models (Ollama) — corre sin internet
✅ Git integration básica

Lo malo:

❌ Sin memoria — cada sesión empieza de cero (-3)
❌ Sin skills — no tiene sistema de skills (-3)
❌ Sin multi-platform — solo terminal
❌ Sin browser, voice, image gen, cron
⚠️ Autonomía básica — no es autónomo como GSD v2
⚠️ Sin checkpoints, sin parallel execution

El veredicto: Es un esqueleto excelente. El CLI más limpio y flexible que existe. Pero le falta todo: memoria, skills, autonomía real. Si quieres algo minimal que conecte a cualquier modelo → OpenCode gana. Si quieres un agente que haga cosas → cualquier otro es mejor.

En el contexto de Orion: Interesante como referencia de arquitectura CLI limpia, pero no como agente. Su flexibilidad de modelos ya la tenemos en OpenClaw.

Para Orion

La lección: combinar lo mejor de cada uno

Feature	Fuente	Estado en Orion
Memoria persistente	Hermes + Letta	✅ ClawVault
Skills auto-creation	Hermes	❌ Pendiente
Multi-platform	OpenClaw	✅ Telegram, Discord
Context optimization	GSD v2	❌ Pendiente
Stateful sessions	Letta Code	⚠️ Parcial
Model agnostic	OpenCode + Aider	✅ Multi-provider
Spec-driven dev	GSD v2	❌ Evaluar
Self-improvement	Hermes + Letta	⚠️ Planificado

2026-04-09 · Orion Research