2026-04-29·Por Jeff

Claude Code Is a Worldview, Not a Tool: 7 Product Philosophies from Cat Wu

AIAnthropicClaude CodeProduct Philosophy

Claude Code no es una herramienta, es una cosmovisión — analizando las 7 filosofías de producto de la entrevista con Cat Wu

Recomiendo a quienes hagan productos que se tomen el tiempo de ver estas dos entrevistas con Catherine "Cat" Wu, la responsable de producto de Claude Code: una entrevista individual en el podcast de Lenny's Podcast, y otra con Boris Cherny en el episodio AI & I de Every.to. Las dos suman más de tres horas y tienen una densidad de información tal que las escuché dos veces enteras.

Mucha gente está discutiendo estas entrevistas enfocándose en cómo Anthropic comprimió funciones que antes tomaban 6 meses en lanzarse en 1 semana, o incluso 1 día. La aceleración es una locura, sí. Pero lo que más me impactó a mí no es la velocidad.

Lo que realmente me iluminó es la cosmovisión completa que se esconde detrás de este producto llamado Claude Code. Se puede desglosar en 7 puntos, y cada uno por separado va contra el sentido común; juntos, muestran cómo debería ser un producto nativo de IA. Vamos uno por uno.

1

El Plan Mode no es una función, es una cosmovisión.

Boris Cherny dijo una frase contundente en el programa:

"Al cambiar a plan mode, hacer que Claude muestre paso a paso lo que va a hacer y alinear el plan antes de empezar a escribir duplica o triplica la tasa de éxito en tareas complejas."

Duplica o triplica la tasa de éxito. La primera vez que escuché esa cifra, me impactó.

En la práctica, solo hay que presionar Shift+Tab dos veces. También mencionó que el propio Boris, al hacer funciones difíciles, primero entra en plan mode, alinea el plan y luego empieza a escribir, sin ni siquiera escribir una línea de código.

La pregunta es: ¿por qué un interruptor que parece una simple opción de interfaz puede disparar tanto la tasa de éxito?

Porque tras él hay una premisa de nivel de producto — reconocer que los modelos alucinan, por lo que las intenciones deben mostrarse sobre la mesa. El Plan Mode no es para que los usuarios lo vean; es para que el modelo mismo no pueda saltarse el paso de pensar.

Muchos creen que el Plan Mode es "dejar que el usuario verifique el plan de la IA", pero una descripción más precisa sería "obligar a la IA a pensar primero, antes de actuar".

Hacer de la "externalización del pensamiento" un mecanismo de producto: eso sí es una cosmovisión.

2

Sigue las capacidades del modelo para desmontar el andamiaje, no apiles funciones.

Cat Wu mencionó un concepto muy sutil en el podcast de Lenny's: AGI-pilled — básicamente, "el nivel de apuesta por la AGI". Dijo que calibrar ese grado es una de las cosas más difíciles al hacer producto:

"Demasiado AGI-pilled lleva a una visión de producto desconectada de la realidad; demasiado poco AGI-pilled desperdicia la capacidad del modelo. Cada vez que sale un modelo nuevo, hay que recalibrar ese punto de equilibrio."

Su filosofía con Boris es "lo que se elimina vale tanto como lo que se hace". Retirar una función (unship) no es porque haya fracasado, sino porque se ha encontrado un camino más simple e intuitivo para implementarlo.

El ejemplo más concreto es la lista de tareas (todo list). Al principio, los modelos no marcaban de forma fiable las tareas completadas, así que el equipo tuvo que agregar system reminders cada varios mensajes. Cuando salió un nuevo modelo, ese "andamiaje de recordatorios" se volvió redundante y lo eliminaron directamente.

Cat también tiene un punto de referencia fijo: hacer que Claude Code añada una función de tabla en Excalidraw. En junio de 2025, Opus 4 lo lograba de vez en cuando; menos de un año después, en abril de 2026, Opus 4.6 ya lo consigue al primer intento, demostrándolo en vivo frente a miles de ingenieros.

Un año de diferencia, de "de vez en cuando funciona" a "funciona al primer intento". El ritmo de desmontar el andamiaje sigue exactamente las capacidades del modelo.

Mientras otros persiguen funciones, ellos persiguen al modelo: cada vez que el modelo se vuelve un poco más fuerte, se desmonta un poco más del andamiaje.

3

Protección multicapa estilo Swiss Cheese, no vibe coding.

Dentro de Anthropic llaman a este mecanismo el Swiss Cheese Model — varias capas superpuestas. Cada capa tiene huecos, pero al superponerse, no quedan agujeros.

Para Claude Code, Boris describió en el programa cómo ejecuta un pull request de principio a fin:

"Claude mismo ejecuta las pruebas; si no hay pruebas, las escribe; ejecuta su propio linter; actúa como un revisor automático; y al final, hay un humano que lo verifica."

Fíjense: entre las cinco capas, las primeras cuatro las monta Claude Code para sí mismo. No confía en que ninguna capa por sí sola funcione sin fallos; por eso, antes de llegar al humano, se aplica cuatro veces él mismo.

Para Boris, el vibe coding — ese estilo "siento que puede funcionar" — solo es adecuado para código único y prototipos, no para sistemas en producción. La razón es simple: lo que debilita a un sistema en producción no es que el modelo no sea lo bastante fuerte, sino que los contraejemplos son inevitables.

Eso es lo más afilado del pensamiento Swiss Cheese: los verdaderos productos de IA de nivel industrial no apuestan a que el modelo no se equivocará, sino que asumen que se equivocará, y luego construyen una estructura para amortiguar esos errores.

4

Antfooding — una retroalimentación cada 5 minutos.

Dentro de Anthropic, los ingenieros se llaman ants (hormigas), y por eso llaman a su ciclo de autouso Antfooding — una versión evolucionada del dogfooding.

Cat dijo una frase que suena una locura:

"En nuestro canal de retroalimentación, aparece un mensaje nuevo cada 5 minutos."

Cada 5 minutos. ¿A alguien le gusta esa función? ¿Hay algún bug? ¿Hay que retirarla (unship)? En 5 minutos ya tienes una señal.

En la oficina, cientos de ingenieros usan Claude Code a diario; Cat Camina un poco y obtiene retroalimentación de primera mano. Esta imagen es clave: los primeros usuarios de Claude Code son las personas más exigentes, más habilidosas para programar y menos tímidas a la hora de quejarse del mundo.

Lanzamiento → dogfooding interno → retroalimentación cada pocos minutos → iteración → nuevo lanzamiento. ¿Qué tan corto es este ciclo? Antes, una función pasaba desde el concepto hasta el lanzamiento en 6 meses (planificación, alineación entre equipos, redacción del PRD), pero ahora el ritmo general en Anthropic se ha comprimido a 24 horas para uno elegible de ser launch. Nota: ¡Esto no significa que la misma función pasara de 6 meses a 24 horas, sino el ritmo iterativo del equipo completo!

No hay un usuario más exigente que un ingeniero que se queda atascado con Claude Code. El dogfooding normal es "también lo usamos", pero el Antfooding es "lo usamos más intensamente que nadie".

5

Haz que los subagentes se critiquen mutuamente, no que decidan de un plumazo.

Esta sección es quizá la que más revoluciona mi forma de pensar entre todas las que entrevistas presentan.

Boris describió su propio comando de revisión de código (code review) así:

"De entrada, lanzo varios subagentes en paralelo: uno busca el estilo normativo, otro busca en el git history cómo se implementó antes, y otro busca errores evidentes. En la primera ronda, salen tanto problemas reales como falsas alarmas. Entonces abro otros 5 subagentes, especialmente para que señalen los problemas que los subagentes anteriores detectaron El resultado es que encuentras todos los problemas reales y eliminas todos los falsos positivos."

Al leer esto, me quedé perplejo. Mi reacción instintiva al crear productos con agents siempre ha sido "cambiar a un modelo más potente": al tener un problema de calidad, lo primero que pienso es que el modelo no es lo suficientemente bueno. Nunca se me había ocurrido la idea de usar múltiples agents para que se critiquen mutuamente. La calidad no depende de la potencia del modelo, sino del conflicto entre modelos.

La mayoría de la gente, al crear productos con agents, piensa: "con un modelo fuerte, todo se resuelve". Claude Code va en la dirección contraria: usar múltiples modelos que se enfrenten. Una primera ola de subagentes hace la revisión, y una segunda ola de subagentes está especialmente entrenada para señalar fallos en la primera ola de revisiones.

Cat también usa una configuración similar: un subagente planificador y uno revisor. Cuando se comunican en tiempo real, se utilizan subagentes syncs; en la CI (integración continua) lo hacen a través de un slash command. Básicamente hacen la misma cosa.

El costo es real. Un flujo de trabajo pesado (subagent-heavy) puede consumir entre 2 y 5 veces más tokens que uno con un solo agent. En la empresa, según datos públicos de la industria, el rango promedio mensual por desarrollador se encuentra entre 150 y 250 USD. Pero dentro de Anthropic ha habido un caso extremo: un solo usuario ha gastado 150.000 dólares en tokens en un mes — aunque sea anómalo, eso ilustra el techo alarmante de esta estrategia.

Pero la postura de Boris es contundente: dejar que los subagentes se critiquen mutuamente lleva a resultados más limpios. La fricción es la fuente de la calidad.

Mejor confiar en que la IA acierte una vez solitas, que dejar que las IAs se critiquen entre sí.

6

Stop Hook redefine lo que significa "haber terminado".

La sección anterior hablaba de no confiar en juicios puntuales de un punto; esta va un paso más allá: tampoco debe creerse cuando el propio modelo dice que ha terminado.

La solución que plantea Boris es el Stop Hook:

"Puedes dejar que el modelo siga ejecutándose hasta que las cosas realmente estén resueltas."

Concretamente, se monta un hook llamado stop hook que ejecuta la suite de pruebas. Si alguna prueba falla, se retorna el error a Claude para que lo corrija, se vuelve a ejecutar, y así sucesivamente hasta que todas las pruebas pasen el verde completo. "Ya está terminado" no es válido; "las pruebas han pasado" sí es válido.

Boris enfatizó en el programa, destacándolo específicamente, que darle a Claude un bucle de autor*test (auto-test loop) es la pieza más importante para obtener buenos resultados en Claude Code. Con este bucle, la calidad final se multiplica de 2 a 3 veces.

Él mismo también tiene un hook PostToolUse para formatear automáticamente el código. Claude suele hacer bien el formateo, pero ese gancho corrige el último 10% para evitar cortes en la CI.

Al juntar estas dos capas, el Stop Hook está ejecutando una acción fundamental: redefinir qué significa la palabra Done. En la era IA, el úncio hecho verificable es el resultado**. "Ya lo hice", de boca del modelo, no cuenta. Cuenta "ya pasó".

7

De typing a deciding: lo más escaso es el juicio.

Por último, Cat dijo una frase en el podcast de Lenny's que he capturado en imágenes para amigos innumerables veces:

"El código se está haciendo cada vez más barato. Lo que más vale ahora es juzgar qué hay que escribir; y saber lo difícil que es algo permite priorizar mejor."

Añade: todos los roles se están fusionando. Los PMs hacen trabajo de inggenieros, los Iiiingenieros hacen trabajo de PMddy design/ddi dess**. Cat tiene un está dando.

La visión de Boris es más radical. Para él, the programming was the art ddcopy. Él ha venido explicándolo con una analogía: el programador scriptor, IAimprentay IA<|<|<|<|<|<|-.

El programmdmundo un amanuense imprimir los librosy Ya cadiver5íscasi d.

Ahora, reunidos todoses /sss la sita/ ss la s s en una sola mired:

Plan5Bbaare demostr jdecirdecir decisióndjud jdic jdicción; y modeloconstrucción5j0aplicaciunícola correr. . Y el ;evaluacion deliber20es/ vs/ sbots subagenciassas subagenciass cr*ds evaluacs; ...

Tny una sola ta/ *ddecir-dec).

ción de productodecpro (dec), projando funciones d** *jud. juicio. No j jnnnn...

Esta es la correcta interpretación de porvenir/las:

hacer la cín, ayel Planar mostárciódcis decd jud.

Des2-jecandelmiente\elasticidad—ndréjud, decisición;

dec(ju.s/d4 (sword):

H, final); j0ultin, deciscon juestaráme; parcería comp00 pre;cima. -decision)

Product: 7con visionjdiciónú5** decidiendoeeñaprenup**presionesdec5 uci:5p<|vq_6305|># Claude Code no es una herramienta, es una cosmovisión — analizando las 7 filosofías de producto de la entrevista con Cat Wu

Recomiendo a quienes hacen productos ver estas dos entrevistas con Cat Wu, la responsable de producto de Claude Code. Una es una entrevista individual en Lenny's Podcast, y la otra aparece en Every.to llamada "AI & I", donde habla con Boris Cherny. Entre las dos suman más de tres horas y la densidad de información es tal que las escuché dos veces seguidas.

Mucha gente está discutiendo estas entrevistas centrándose en cómo Anthropic logró que funciones que antes requerían 6 meses de desarrollo se completaran en una semana, o incluso en un día. E invirtiendo en velocidad. Pero lo que más me impactó a mí viendo esas charlas no fue la velocidad.

Lo que realmente me iluminó es la cosmovisión completa que está incrustada en este producto llamado Claude Code. Se puede desglosar en 7 puntos, y cada uno por separado va en contra del sentido común. Juntos, muestran cómo debería ser un producto nativo de IA. Vamos uno por uno.

1

Plan Mode no es una función, es una cosmovisión.

Boris Cherny dijo una frase poderosa en el programa:

"Cambia a Plan Mode, haz que Claude muestre paso a paso lo que hará y, antes de escribir, alineen el plan en el qu.ude de lo que se va a escribir. Con eso, la probabilidad de éxito para tareas complejas se duplica o triplica."

Duplica o triplica. La primera vez que escuché ese número me dio como un pequeño mareo.

En la práctica, solo es necesario presionar Shift+Tab dos veces. En el programa, TVA dijeron que incluso Boris, cuando trabaja en funciones difíciles, primero usa Plan Mode, alinea el plan antes de empezar y ni siquiera ha escrito una sola línea de código.

La pregunta es: ¿por qué un pequeño interruptor, que parece una opción de la interfaz, puede hacer que la taza acción de superar y terminar tareas se dispare?

Porquesté es una premisa de producto que demuestra otra epjación más decisiva — admitancia de alucinación de lso modelos onjuar en proponer intrafundadormeno subel floryformaryse eraevito punan que eecución autónica xacción ante Plan Mode n jereblo para suario, sino** para no le importe ante deb comunnción en modo ecautele prointivo, nie ded**la IA sal misionum esfuerzo perdidorfinna.

"Convertir la «externalidades cridactctación → mecanica de producto. Menellamiento obligatflospesnal e IAtide en pblemicobjeto audioddelaa la posprcsprop la caciptidadporalizable** Cre de integra con e A.I …Se su mplaza puest los fines efóticos estaquíco legares)

** o seño sistema i eurmoderrverge O pr5iarmne pos; po ce que ins5nar , Capacidades guía elaboraciónuna muetra ddesve<hems extraí >**

Esta se sam, ecadaepción
deGmenm5i > recalculamos

de, prontos5
dentemente era 'agregdunci'ión','sténia's

acerta si eis05). sus accopios de peneuntemporalre) , Bebeemeecom lo que como

una
afisiga y implementacort

|Exma. ...
|mpo .... _