Computer use en Claude Code CLI: el agente testea solo lo que programa

Q: ¿Qué planes tienen acceso?

Research preview disponible para planes **Pro y Max**. No está en Free todavía, ni en API standalone. Para entender bien cuál modo usar, mirá las 3 formas de usar Claude.

Esto resuelve el dolor más grande de programar con un agente.

Claude Code ahora controla tu compu desde la terminal. Abre apps, clickea botones, testea lo que recién terminó de programar. Está en research preview para Pro y Max.

Le pedís una feature. La codea. Y en vez de decirte "listo, probalo vos", la abre, la clickea, la rompe, la arregla. Solo. Adiós Playwright para tests E2E básicos. Si recién arrancás con Claude Code, leé primero 3 cosas antes de abrir Claude Code.

El problema que resuelve

Programando con Claude Code clásico, el loop era:

Le pedís una feature
Claude escribe el código
Te dice "listo, probá si funciona"
Vos abrís la app, clickeás, verificás
Si rompió algo, le decís y vuelve a la 2

El paso 4 era el cuello de botella. Especialmente cuando la feature toca UI o flujos interactivos. Computer use desde la CLI mata ese paso.

Ahora el loop es:

Le pedís una feature
Claude escribe el código
Claude abre la app, clickea, verifica que funciona
Si algo no anda, lo arregla y testea de nuevo
Te avisa cuando todo verde

Vos solo revisás el resultado final. Eso cambia el ritmo de programación bastante.

Casos de uso típicos

Donde más rinde:

Tests E2E manuales que no querés escribir — flujos de signup, checkout, login, formularios. Le pedís "testeá el flow de checkout completo" y va.
Verificar features de UI — que el botón nuevo aparece, que el dropdown abre, que el modal cierra.
Testing cross-browser básico — corre la misma verificación en Chrome, Safari, Firefox.
Reproducir bugs reportados — le pasás los pasos del reporte, lo reproduce, identifica la causa.
Smoke tests post-deploy — "andá a esta URL y verificá que cargue, podés loguearte y ver el dashboard".

Para más casos donde computer use rinde, también podés ver la guía de computer use en Windows — los casos de oficina aplican.

Setup en Claude Code CLI (3 pasos)

Si ya tenés Claude Code CLI andando con plan Pro o Max:

Activar la feature — en research preview entrás vía flag: claude --enable-computer-use. Próximas releases lo van a hacer default.
Permisos del sistema — la primera vez que pide acceso, Mac/Windows pregunta. Aceptar.
Listo — desde la siguiente sesión, podés decirle cosas como "abre la app y verificá X".

Si no estás seguro de cómo está armado tu setup, revisá el diccionario de Claude Code primero.

Cuándo NO usar computer use en CLI

Algunos escenarios donde no es la mejor herramienta:

Suites de tests automáticos en CI — para eso Playwright/Cypress/Puppeteer siguen ganando por velocidad y consistencia.
Cosas que pueden borrar datos productivos — no le sueltes la rienda en una sesión conectada a tu DB de producción.
Tareas que toman más de 30 min de UI — el costo en tokens se dispara. Para esto, código tradicional o un test escrito.

Para mantener el costo bajo control mientras testeás, aplicá las 8 reglas de Claude.md para ahorrar 80% de tokens. Aplican igual en sesiones con computer use.

Comparación con alternativas

Herramienta	Mejor para	Costo
Computer use Claude Code	Iteración rápida + tests manuales	Tokens
Playwright / Cypress	CI / suites grandes	Tiempo de setup, infra mínima
Manual	Flujos críticos con riesgo	Tu tiempo
Selenium	Stack legacy con muchas envs	Configuración compleja

La combinación más común va a ser: Claude Code computer use para desarrollo + iteración rápida, Playwright corriendo en CI para los flujos críticos.

Lo que viene

Computer use desde la CLI es la primera versión. Lo que probablemente viene en próximas releases:

Headless mode — correr sin abrir la UI visible (útil para CI y servers).
Recording — guardar la sesión como un script reutilizable.
Mejor parallelism — testear varias rutas al mismo tiempo (encaja con el redesign de Code Desktop con sesiones paralelas).

Para una visión más amplia del rumbo de Anthropic, mirá la guía de Claude Opus 4.7 — el modelo que potencia todo esto.

Tip de oro

Antes de pedirle a Claude que ejecute una feature compleja con computer use, escribile el caso de prueba en lenguaje natural. Algo como:

"Quiero que testees este flow: 1) abrí la app en localhost:3000, 2) clickeá Sign Up, 3) llená el form con un email random, 4) verificá que aparece el dashboard, 5) si algo falla, decime exactamente en qué paso."

Cuanto más explícito el caso, menos margen de error tiene Claude. Para más patrones de prompting que rinden, leé los tips de Boris Cherny para Opus 4.7.

Comentá CLI en el último reel de @ai._kid y te paso el setup exacto + 3 prompts probados que automatizan tests E2E sin escribir una línea de código de testing.

Preguntas frecuentes sobre Computer use Claude Code CLI

Antes, Claude Code escribía el código y te decía "listo, probalo vos". Ahora puede abrir tu app, navegarla, clickear botones y verificar que lo que escribió funciona. Cierra el loop entre "código" y "se prueba". Para arrancar bien con el setup base, leé 3 cosas antes de abrir Claude Code.

Para tests E2E básicos sí — sobre todo flujos rápidos donde armar Playwright sería overkill. Para suites complejas con miles de tests, Playwright sigue ganando por velocidad y reliability. La regla: Computer use para iteración rápida, Playwright para CI. Si querés sacarle más jugo a Claude Code, mirá los 6 tips del creador para Opus 4.7.

Research preview disponible para planes Pro y Max. No está en Free todavía, ni en API standalone. Para entender bien cuál modo usar, mirá las 3 formas de usar Claude.

Antes de cada acción potencialmente destructiva (cerrar app sin guardar, ejecutar comandos del sistema, modificar archivos fuera del repo), Claude pide confirmación. También respeta el .gitignore y las exclusiones que configures. Para optimizar permisos y no recibir prompts repetidos, leé el diccionario de Claude Code.

Sí. Tanto Mac como Windows tienen acceso. Para Windows, Anthropic sumó la versión hace pocos días, junto con Cowork. Para arrancar con el setup correcto en Code Desktop, mirá la guía del Code Desktop redesign.

Fuentes e inspiración

Mirá los posts originales donde desarrollamos estas ideas en redes.

Computer use en Claude Code CLI: el agente testea solo lo que programa

El problema que resuelve

Casos de uso típicos

Setup en Claude Code CLI (3 pasos)

Cuándo NO usar computer use en CLI

Comparación con alternativas

Lo que viene

Tip de oro

Preguntas frecuentes sobre Computer use Claude Code CLI

¿Qué cambia respecto a Claude Code clásico?

¿Reemplaza a Playwright para tests E2E?

¿Qué planes tienen acceso?

¿Cómo evita romper cosas en mi compu?

¿Funciona en Windows también?

Fuentes e inspiración

Computer use de Claude llega a Windows: Cowork y Code Desktop

Claude Managed Agents: agentes en producción sin armar la infra

Claude for Word: la beta que Microsoft Copilot nunca fue

Convierte el caos de contenido en un sistema, hoy.

¿Listo para sistematizar tu contenido?

El problema que resuelve

Casos de uso típicos

Setup en Claude Code CLI (3 pasos)

Cuándo NO usar computer use en CLI

Comparación con alternativas

Lo que viene

Tip de oro

Preguntas frecuentes sobre Computer use Claude Code CLI

¿Qué cambia respecto a Claude Code clásico?

¿Reemplaza a Playwright para tests E2E?

¿Qué planes tienen acceso?

¿Cómo evita romper cosas en mi compu?

¿Funciona en Windows también?

Fuentes e inspiración

Más sobre Claude

Computer use de Claude llega a Windows: Cowork y Code Desktop

Claude Managed Agents: agentes en producción sin armar la infra

Claude for Word: la beta que Microsoft Copilot nunca fue

Convierte el caos de contenido en un sistema, hoy.

¿Listo para sistematizar tu contenido?