Claude

Computer use en Claude Code CLI: el agente testea solo lo que programa

Claude Code ahora controla tu computadora desde la terminal. Abre apps, clickea botones, testea lo que recién terminó de programar. Está en research preview para Pro y Max — y resuelve el dolor más grande de programar con un agente.

Mateo CañoMateo Caño4 min de lectura
Computer use en Claude Code CLI: el agente testea solo lo que programa

Esto resuelve el dolor más grande de programar con un agente.

Claude Code ahora controla tu compu desde la terminal. Abre apps, clickea botones, testea lo que recién terminó de programar. Está en research preview para Pro y Max.

Le pedís una feature. La codea. Y en vez de decirte "listo, probalo vos", la abre, la clickea, la rompe, la arregla. Solo. Adiós Playwright para tests E2E básicos. Si recién arrancás con Claude Code, leé primero 3 cosas antes de abrir Claude Code.


El problema que resuelve

Programando con Claude Code clásico, el loop era:

  1. Le pedís una feature
  2. Claude escribe el código
  3. Te dice "listo, probá si funciona"
  4. Vos abrís la app, clickeás, verificás
  5. Si rompió algo, le decís y vuelve a la 2

El paso 4 era el cuello de botella. Especialmente cuando la feature toca UI o flujos interactivos. Computer use desde la CLI mata ese paso.

Ahora el loop es:

  1. Le pedís una feature
  2. Claude escribe el código
  3. Claude abre la app, clickea, verifica que funciona
  4. Si algo no anda, lo arregla y testea de nuevo
  5. Te avisa cuando todo verde

Vos solo revisás el resultado final. Eso cambia el ritmo de programación bastante.


Casos de uso típicos

Donde más rinde:

  • Tests E2E manuales que no querés escribir — flujos de signup, checkout, login, formularios. Le pedís "testeá el flow de checkout completo" y va.
  • Verificar features de UI — que el botón nuevo aparece, que el dropdown abre, que el modal cierra.
  • Testing cross-browser básico — corre la misma verificación en Chrome, Safari, Firefox.
  • Reproducir bugs reportados — le pasás los pasos del reporte, lo reproduce, identifica la causa.
  • Smoke tests post-deploy — "andá a esta URL y verificá que cargue, podés loguearte y ver el dashboard".

Para más casos donde computer use rinde, también podés ver la guía de computer use en Windows — los casos de oficina aplican.


Setup en Claude Code CLI (3 pasos)

Si ya tenés Claude Code CLI andando con plan Pro o Max:

  1. Activar la feature — en research preview entrás vía flag: claude --enable-computer-use. Próximas releases lo van a hacer default.
  2. Permisos del sistema — la primera vez que pide acceso, Mac/Windows pregunta. Aceptar.
  3. Listo — desde la siguiente sesión, podés decirle cosas como "abre la app y verificá X".

Si no estás seguro de cómo está armado tu setup, revisá el diccionario de Claude Code primero.


Cuándo NO usar computer use en CLI

Algunos escenarios donde no es la mejor herramienta:

  • Suites de tests automáticos en CI — para eso Playwright/Cypress/Puppeteer siguen ganando por velocidad y consistencia.
  • Cosas que pueden borrar datos productivos — no le sueltes la rienda en una sesión conectada a tu DB de producción.
  • Tareas que toman más de 30 min de UI — el costo en tokens se dispara. Para esto, código tradicional o un test escrito.

Para mantener el costo bajo control mientras testeás, aplicá las 8 reglas de Claude.md para ahorrar 80% de tokens. Aplican igual en sesiones con computer use.


Comparación con alternativas

HerramientaMejor paraCosto
Computer use Claude CodeIteración rápida + tests manualesTokens
Playwright / CypressCI / suites grandesTiempo de setup, infra mínima
ManualFlujos críticos con riesgoTu tiempo
SeleniumStack legacy con muchas envsConfiguración compleja

La combinación más común va a ser: Claude Code computer use para desarrollo + iteración rápida, Playwright corriendo en CI para los flujos críticos.


Lo que viene

Computer use desde la CLI es la primera versión. Lo que probablemente viene en próximas releases:

  • Headless mode — correr sin abrir la UI visible (útil para CI y servers).
  • Recording — guardar la sesión como un script reutilizable.
  • Mejor parallelism — testear varias rutas al mismo tiempo (encaja con el redesign de Code Desktop con sesiones paralelas).

Para una visión más amplia del rumbo de Anthropic, mirá la guía de Claude Opus 4.7 — el modelo que potencia todo esto.


Tip de oro

Antes de pedirle a Claude que ejecute una feature compleja con computer use, escribile el caso de prueba en lenguaje natural. Algo como:

"Quiero que testees este flow: 1) abrí la app en localhost:3000, 2) clickeá Sign Up, 3) llená el form con un email random, 4) verificá que aparece el dashboard, 5) si algo falla, decime exactamente en qué paso."

Cuanto más explícito el caso, menos margen de error tiene Claude. Para más patrones de prompting que rinden, leé los tips de Boris Cherny para Opus 4.7.


Comentá CLI en el último reel de @ai._kid y te paso el setup exacto + 3 prompts probados que automatizan tests E2E sin escribir una línea de código de testing.

Preguntas frecuentes sobre Computer use Claude Code CLI

Antes, Claude Code escribía el código y te decía "listo, probalo vos". Ahora puede abrir tu app, navegarla, clickear botones y verificar que lo que escribió funciona. Cierra el loop entre "código" y "se prueba". Para arrancar bien con el setup base, leé 3 cosas antes de abrir Claude Code.

Para tests E2E básicos sí — sobre todo flujos rápidos donde armar Playwright sería overkill. Para suites complejas con miles de tests, Playwright sigue ganando por velocidad y reliability. La regla: Computer use para iteración rápida, Playwright para CI. Si querés sacarle más jugo a Claude Code, mirá los 6 tips del creador para Opus 4.7.

Research preview disponible para planes Pro y Max. No está en Free todavía, ni en API standalone. Para entender bien cuál modo usar, mirá las 3 formas de usar Claude.

Antes de cada acción potencialmente destructiva (cerrar app sin guardar, ejecutar comandos del sistema, modificar archivos fuera del repo), Claude pide confirmación. También respeta el .gitignore y las exclusiones que configures. Para optimizar permisos y no recibir prompts repetidos, leé el diccionario de Claude Code.

Sí. Tanto Mac como Windows tienen acceso. Para Windows, Anthropic sumó la versión hace pocos días, junto con Cowork. Para arrancar con el setup correcto en Code Desktop, mirá la guía del Code Desktop redesign.

Fuentes e inspiración

Mirá los posts originales donde desarrollamos estas ideas en redes.

Decorative floral background for booking section
Hemos ayudado a más de 100 negocios

Convierte el caos de contenido en un sistema, hoy.

Agenda una evaluación gratuita de 30 minutos y te mostraremos exactamente dónde un sistema de contenido puede ahorrarte tiempo y escalar tu producción.

thrivevenice.Californiathrivevenice.California
thrivevenice.Californiathrivevenice.California

¿Listo para sistematizar tu contenido?

Agenda una llamada gratuita de 30 minutos para descubrir cómo un sistema de contenido puede reemplazar horas de trabajo manual cada semana.