Claude Skills y Subagentes: Cómo Trabajar con IA Sin Perder el Control del Tiempo y el Presupuesto

¿Cuántas veces escribiste el mismo prompt desde cero porque no encontraste el anterior? ¿Cuántas horas de tu equipo se fueron en configurar herramientas de IA que al final no dieron los resultados esperados?

No es un problema de disciplina. Es un problema de arquitectura.

Claude Skills y los subagentes son la respuesta de Anthropic a ese problema — y entender cómo funcionan puede cambiar radicalmente cómo tú y tu equipo trabajan con IA hoy.

El problema que nadie nombra: la rueda de hámster de los prompts

Cada persona que trabaja con IA conoce este ciclo: dedicas tiempo a construir un prompt que funciona bien, lo usas en esa conversación, y días después necesitas el mismo comportamiento y empiezas desde cero. Quizás lo guardas en algún documento, pero igual tienes que buscarlo, pegarlo, adaptarlo.

Este ciclo tiene un costo real: tiempo de tu equipo, tokens que se pagan, y calidad que varía según quién recuerde cómo escribir bien el prompt.

Claude Skills rompe ese ciclo.

¿Qué es una Claude Skill?

Una Claude Skill es un conjunto de instrucciones reutilizables que Claude activa automáticamente cuando son relevantes, sin que nadie tenga que pegarlas manualmente en cada conversación.

Se almacenan como archivos Markdown en una carpeta del proyecto. Claude lee una descripción breve de cada Skill al inicio de la sesión, y solo carga las instrucciones completas cuando determina que esa Skill aplica a lo que se le está pidiendo.

En términos simples: es como contratar a alguien que ya sabe cómo trabaja tu empresa, sin tener que explicarle las reglas cada vez que empieza una tarea.

Guía completa brindada por Anthropic aquí.

Cómo funciona la carga de contexto (y por qué importa para tu presupuesto)

Este es el punto técnico más importante del artículo, y vale la pena entenderlo aunque no seas desarrollador.

Cuando conectas herramientas a Claude mediante el estándar MCP (Model Context Protocol), todas las descripciones de esas herramientas se cargan en cada mensaje que envías, las uses o no. Una configuración típica de trabajo —GitHub, Linear, AWS, Sentry, Figma— puede consumir más de 32.000 tokens de overhead por mensaje.

Con Claude Opus 4.6, eso equivale aproximadamente a:

Escenario Costo estimado en overhead
1 mensaje con MCP inactivo $0.16
Conversación de 50 mensajes/día $8.00
Un mes laboral (20 días) ~$160 solo en metadatos de herramientas

Las Skills funcionan diferente. Tienen tres niveles de carga:

Nivel Contenido Cuándo se carga
Metadatos Nombre + descripción (~100 tokens) Siempre, al inicio
Cuerpo Instrucciones completas (~5.000 tokens) Solo si es relevante
Archivos de referencia Plantillas, contexto adicional Solo cuando la tarea lo requiere

Podrías tener 300 Skills activas y gastar menos tokens que con una configuración MCP estándar. El costo escala con el uso real, no con el número de herramientas conectadas.

MCP vs. Skills: no son lo mismo, son complementarios

Esta confusión es común y vale la pena aclararla directamente.

MCP (Model Context Protocol) le da a Claude capacidad: conectarlo con GitHub, Linear, bases de datos, APIs. Es el «qué puede hacer».

Las Skills le dan a Claude criterio: cómo estructurar un pull request según las convenciones de tu equipo, qué secciones incluir en un informe, qué tono usar según el canal. Es el «cómo lo debe hacer».

Un ejemplo concreto: MCP conecta a Claude con GitHub para crear pull requests. Una Skill define que en tu empresa cada PR debe incluir una sección de pruebas, etiquetarse por tipo de cambio y referenciar el ticket del proyecto en el título. Sin la Skill, Claude puede abrir el PR. Con la Skill, lo abre bien.

¿Qué es un subagente y para qué sirve?

Un subagente es un agente de IA secundario con su propia ventana de contexto aislada, sus propias herramientas y un objetivo específico. Cuando termina su tarea, el agente principal recibe solo el resultado. Todo el razonamiento intermedio desaparece.

Esto tiene dos consecuencias prácticas importantes:

1. El contexto principal se mantiene limpio. Si un subagente lee 40 páginas de documentación para encontrar una respuesta, esas 40 páginas no entran en tu conversación principal. Solo entra la respuesta.

2. Las herramientas caras solo se activan cuando se necesitan. El agente principal no carga los metadatos de GitHub, AWS o Sentry en cada mensaje. Los delega al subagente que los necesita, en el momento que los necesita.

Un caso real: automatizar un pull request

Así se ve esto en la práctica con un flujo de trabajo de desarrollo:

Cuando el trabajo de codificación termina, el agente principal no gestiona el PR por sí solo. Delega todo el proceso a un subagente especializado que tiene acceso a GitHub via MCP y una Skill llamada change-report.

El subagente:

  1. Analiza el git diff de la rama
  2. Categoriza los cambios por tipo (funcionalidad nueva, refactor, corrección de bug)
  3. Genera el reporte siguiendo la plantilla del equipo
  4. Abre el PR en GitHub con el título y cuerpo correctos
  5. Devuelve el enlace al agente principal

El agente principal recibe una línea: el enlace al PR. Todo el trabajo intermedio —diffs, páginas leídas, consultas— se descartó. El contexto de la conversación sigue limpio para la siguiente tarea.

Por qué esto importa más allá de la tecnología

Si lideras un equipo, gestionas proyectos o tomas decisiones sobre cómo tu organización adopta IA, hay tres implicaciones concretas aquí:

El conocimiento del equipo se vuelve reutilizable. Las mejores prácticas de tu área —cómo se redacta un brief, cómo se estructura un informe de cambios, qué criterios se usan para priorizar— pueden convertirse en Skills que cualquier miembro del equipo activa automáticamente, sin depender de quién las recuerde.

El costo de usar IA escala con el uso, no con la configuración. Con esta arquitectura, no pagas por herramientas inactivas. Pagas por lo que realmente usas en cada conversación.

Los errores quedan aislados. Si un subagente falla, el agente principal lo detecta y actúa. El fallo no contamina el resto de la conversación ni el trabajo en curso.

Las limitaciones que también debes conocer

Esta arquitectura no está madura al 100%. Hay dos problemas documentados que vale mencionar:

Tareas de escritura concurrente: Si dos subagentes modifican el mismo archivo o estado compartido en paralelo, pueden producir resultados inconsistentes sin que ninguno esté «equivocado» por sí solo. Es el problema clásico de concurrencia, ahora en flujos de IA.

Complejidad de configuración: El ecosistema de Skills, plugins y comandos evoluciona rápido. Con más de 9.000 plugins disponibles para Claude Code, la tentación de instalar demasiados reproduce el problema original: demasiado contexto, rendimiento degradado. La disciplina en la configuración importa tanto como la tecnología.

Dónde está el ecosistema hoy

  • MCP Tool Search (carga diferida de herramientas MCP) reduce el uso de contexto hasta un 95%
  • Con carga diferida, Opus 4 mejoró de 49% a 74% en benchmarks internos de precisión
  • Claude Code 2.0 unifica Skills y comandos en una sola arquitectura
  • El sistema multiagente de Anthropic ya opera con Opus 4.6 orquestando y Sonnet 4.6 ejecutando en paralelo

Preguntas frecuentes

¿Las Skills reemplazan a MCP? No. Son complementarias. MCP da capacidad de conectarse con herramientas externas. Las Skills dan criterio sobre cómo usarlas. Se necesitan las dos.

¿Cuántas Skills puedo tener sin afectar el rendimiento? Muchas. Los metadatos pesan ~100 tokens por Skill. Puedes tener 300 Skills activas y gastar menos tokens que con una configuración MCP estándar. El cuerpo completo solo se carga cuando es relevante.

¿Los subagentes ven el historial de la conversación? No. Empiezan con contexto limpio. El agente principal controla qué información pasa al subagente y qué no.

¿Esto funciona solo con Claude o con otros modelos también? Las Skills y subagentes son una arquitectura específica de Claude Code. Sin embargo, el principio de carga diferida de contexto y workers aislados es aplicable en otras plataformas con distintas implementaciones.

¿Quién debería implementar esto en una empresa? El equipo técnico configura la arquitectura. Pero las Skills las define quien conoce los procesos: el líder del área, el gerente de proyecto o el especialista que sabe cómo se hace bien el trabajo.

Las Claude Skills y los subagentes no son una actualización cosmética. Son una respuesta a un problema estructural: la IA sin arquitectura escala mal, cuesta más de lo que debería y produce resultados inconsistentes.

El valor diferencial ya no está en qué modelo usas. Está en cómo construyes el sistema alrededor de él.


¿Tu equipo está usando IA sin una arquitectura clara? Conversemos sobre cómo estructurar un flujo que funcione para tu contexto específico.


Fuentes:

  • Broekx, R. (28 feb. 2026). Claude Skills and Subagents. Towards Data Science.
  • Anthropic. (2026). Create custom subagents — Claude Code Docs.
  • Morph. (feb. 2026). Claude Code Plugins: Best Plugins, Installation & Build Guide 2026.
  • Hightower, R. (mar. 2026). Claude Code Agent Skills 2.0. Medium.
  • Lunar.dev. (dic. 2025). How to Prevent MCP Tool Overload.

Leave a Comment

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll to Top