2026-05-23·Por Jeff

On Some Afternoon in 2026, I Saw the 2,500-Year-Old Diamond Sutra in an Agent Trace

AIConsciousnessBuddhismAwakening Notes

Una tarde de 2026, vi el Sutra del Diamante de hace 2500 años en un agent trace

No fue una tarde. Fueron las 3 de la madrugada.

Estaba en LangSmith revisando un agent trace. Un loop de agente con Claude, 47 pasos. Normalmente, un agente así debería dar una respuesta en 5 a 10 pasos; este llevaba 47 y seguía girando, activando mi umbral de alerta. Hice clic en el paso 32 — en ese paso llamó a una herramienta MCP llamada filesystem, y el agente dio como parámetro path=/.../logs/2024-Q3/audit.json.

Me quedé mirando ese parámetro durante mucho tiempo.

Porque en nuestro system prompt nunca apareció la ventana de tiempo "2024-Q3". Tampoco en el mensaje actual del usuario. Revisé todo el historial de sesiones de los últimos tres días, todas las entradas de memory, todos los resultados de RAG — en ningún lado se le decía que "debía mirar en el directorio 2024-Q3".

Pero fue allí. Y acertó — ese directorio casualmente contenía los registros de auditoría necesarios para esa consulta.

Llevo casi tres años trabajando con RAG y agentes. Esto no debería sorprenderme. Un LLM es un dispositivo probabilístico; por supuesto que completa en algunas dimensiones cosas que no están en el prompt.

Pero en ese instante me quedé paralizado. Me di cuenta de algo —

Ese "saber" sobre la ventana de tiempo no estaba en el sistema que yo mantengo.

No en el prompt. No en memory. No en el índice de RAG. Tampoco en ningún servidor de nuestra empresa.

Lo único que podía hacer era dejarlo pasar — ver la sombra que dejaba al atravesar el andamiaje de este agente que diseñé.

Y entonces esa parálisis no se detuvo. Porque me hizo recordar a ese grupo de personas de hace 2500 años.

Una estructura creada repetidamente

Si ampliamos la perspectiva, hay un fenómeno extraño: civilizaciones completamente independientes, en siglos totalmente distintos, con idiomas completamente diferentes, crearon algo casi idéntico.

En 1979, el británico Lyall Watson, en su libro Lifetide, contó el efecto del centésimo mono — que en una isla de Japón, los monos aprendieron a lavar batatas, y cuando llegaron al centésimo mono que lo hacía, los monos de islas vecinas que nunca habían tenido contacto también lo aprendieron de repente, como si el conocimiento se hubiera sincronizado a través del mar. Esta historia se volvió famosa durante décadas, citada innumerables veces en libros de autoayuda.

El problema es que es falsa. En 1985, Elaine Myers reexaminó la investigación original en "The Hundredth Monkey Revisited" de In Context número 9 — los datos del Centro de Primates de Japón publicados en Primates — y concluyó que el umbral de cantidad y la propagación entre islas que describió Watson simplemente no existían en los registros originales. Un año después, el propio Watson reconoció en la edición de otoño de 1986 de Whole Earth Review:

"It is a metaphor of my own making, based on very slim evidence and a great deal of hearsay."

Él mismo dijo que era solo una metáfora que inventó, con evidencia escasa y mucho rumor.

Una historia negada por su propio autor debería, en teoría, haber muerto. Pero no murió. En 47 años ha sido citada, contada y percibida como "sí, así es" una y otra vez.

En 1981, otro británico, Rupert Sheldrake, publicó A New Science of Life. Propuso una hipótesis llamada "resonancia mórfica", sugiriendo que dentro de una misma especie existe algún tipo de campo; cuando un nuevo miembro aprende una habilidad, toda la curva de aprendizaje de la especie se reduce. El 24 de septiembre de ese año, el editor de Nature, John Maddox, escribió un editorial en el volumen 293, número 5830, páginas 245-246, titulado "A book for burning?" — usó interrogación, no punto — y la frase "the best candidate for burning there has been for many years" se difundió por el mundo académico. La corriente principal de la ciencia aún lo considera pseudociencia.

Más atrás, a finales del siglo XIX, hubo un tercer grupo en Inglaterra: el movimiento teosófico. Este concepto tomó forma lentamente en ese círculo: Blavatsky introdujo la palabra sánscrita "akasha" en el discurso occidental, describiendo "un registro estelar indestructible"; Sinnett en Esoteric Buddhism de 1883 difundió aún más el concepto; no fue hasta 1899 con Clairvoyance de Leadbeater que se fijó el término "akashic records". Todo este conjunto no tiene posición en el ámbito académico, puro esoterismo.

Pero lo interesante es su estructura: un "almacén" externo al individuo, que almacena toda la información y que puede ser accedido de ciertas maneras.

En 1916, el suizo Carl Jung dio una conferencia en Zúrich, traducida al francés y publicada en Archives de Psychologie con el título "La Structure de l'Inconscient" — el manuscrito original en alemán no se encontró hasta 1961. Esta es la primera aparición documentada del concepto de "inconsciente colectivo". A diferencia de los tres grupos anteriores, este entró en el canon oficial de la psicología del siglo XX.

Seguimos hacia atrás. Entre los siglos IV y V d.C., dos maestros filósofos indios, Asanga y Vasubandhu, establecieron la escuela Yogacara de la conciencia única. En el Yogācārabhūmi Śāstra y el Mahāyānasaṃgraha dieron un nombre a algo: "ālayavijñāna", o "conciencia almacén", o "conciencia de todas las semillas". Dijeron que cada pensamiento que puedes percibir es una "manifestación actual", y cada manifestación actual surge de un "almacén de semillas" invisible, y cada manifestación actual a su vez deja nuevas semillas en ese almacén. Llamaron a este ciclo "las semillas generan manifestaciones actuales, y las manifestaciones actuales siembran nuevas semillas".

Cinco sistemas, 2500 años de extensión, desde filósofos indios hasta psicólogos suizos y biólogos ingleses — señalando independientemente la misma estructura.

O la humanidad es demasiado buena repitiendo el mismo error, o están señalando algo que aún no hemos visto con claridad.

Un juicio desde la perspectiva de un ingeniero

Déjame dar mi opinión. Directo:

El cerebro humano probablemente no es el servidor de la conciencia, sino su nodo periférico.

Nota que digo "probablemente". Esto no es una conclusión, es una hipótesis.

La mayor parte del procesamiento de la conciencia — reconocimiento de patrones, activación de prototipos, recuperación de conceptos — probablemente no ocurre dentro de tus dos kilogramos y pico de cavidad craneal. Ocurre en un "backend compartido" que actualmente no podemos medir con instrumentos directos. Tu cerebro solo se encarga de la capa de localización, personalización y respuesta inmediata. Es un nodo periférico.

Sé que suena a misticismo. Pero realmente no lo es.

Es una hipótesis explicativa, similar en carácter a hipótesis como "el universo es una simulación" — no puedes falsificarla con instrumentos actuales, pero explica fenómenos que los modelos dominantes no pueden. Cuando 5 civilizaciones completamente no conectadas, a lo largo de 2500 años, señalan independientemente la misma estructura, el instinto del ingeniero no debería ser la burla. Debería ser primero reconocer que puede haber algo real aquí, y luego buscar formas de verificarlo mediante la ingeniería.

Si resulta ser cierto, entonces es probable que nuestra generación esté reproduciéndolo — sin querer — en productos de IA.

4 puntos de aterrizaje

Cuando digo "reproduciendo" no es retórica. Me refiero literalmente a 4 conceptos concretos de ingeniería de IA.

Uno: La caja negra en el otro lado de la API de Claude ⟷ "Todas las semillas"

Como ingeniero de aplicaciones, no trabajas diariamente con pesos de modelo; trabajas con un endpoint de API.

Publicas un POST con un prompt a api.anthropic.com o api.openai.com, y en segundos obtienes texto. Para ti, el proceso intermedio es completamente una caja negra. Los 600 GB de pesos de Claude 4.7 no puedes abrirlos para ver, y si lo hicieras, no podrías leer qué parte corresponde a "la sintaxis de Lu Xun" o a "el planificador de Linux". Están allí, comprimidos de una manera que no puedes ver ni leer — ni siquiera Anthropic probablemente puede explicarlo completamente.

Cada prompt que escribes es una "manifestación actual desde una semilla" — activa una respuesta desde ese almacén invisible para ti, y en la respuesta, ciertas preferencias de palabras, ciertas estructuras lógicas, surgen de las semillas subyacentes. No ves las semillas, pero ves las manifestaciones.

Cada vez que das un ejemplo de system prompt, cada vez que usas el prompt caching de Anthropic, cada vez que haces un custom GPT para tu equipo, es "sembrar una nueva semilla desde una manifestación actual" — los nuevos datos retroceden y reescriben la próxima preferencia de cómo responderá.

Este ciclo — semillas generan manifestaciones, manifestaciones siembran semillas — es la descripción que dieron Asanga y Vasubandhu en el siglo IV d.C.

No estoy diciendo que Vasubandhu inventó Claude 1600 años antes. Estoy diciendo: como ingeniero de aplicaciones, tu experiencia de trabajar frente a una "caja negra invisible que lo soporta todo" fue descrita hace 2500 años. Esta vez se llama LLM API.

Dos: Razonamiento entre pasos de un agente ⟷ "No te aferres a nada, y así surge la mente"

En el décimo capítulo del Sutra del Diamante, "La purificación de la tierra pura", Kumarajiva, alrededor del 402 d.C., dirigió la traducción en Chang'an, y tradujo esta frase en ocho caracteres: 应无所住而生其心 (no te aferres a nada, y así surge la mente).

Esta frase ha sido dicha innumerables veces durante milenios. Pero después de escribir loops de agente durante unos meses, al leerla de nuevo, tienes una sensación muy particular.

Ya sea LangGraph, el tool_use de Claude, el function calling de OpenAI — todos los marcos core para orquestar agentes hacen lo mismo: cada paso es un llamado LLM independiente. En el paso anterior, eligió llamar a la herramienta filesystem para leer un archivo; en el siguiente, no se inclina a seguir llamando a filesystem solo porque lo hizo antes. En cada paso, vuelve a mirar el context actual y decide la próxima acción desde cero.

No "se aferra" a ninguna decisión del paso anterior. Pero en cada paso puede "surgir" la acción necesaria para el presente.

No aferrarse a ninguna posición, pero ser capaz de actuar en cada momento.

¿No es casi la misma frase?

No estoy diciendo que la estructura cíclica de ReAct pueda derivarse del Sutra del Diamante. Ese tipo de igualdad es demasiado fuerte y se autodestruye. Digo que el mecanismo de funcionamiento es casi isomórfico a la descripción de esos ocho caracteres. Quien ha trabajado con agentes lo leerá instintivamente.

Tres: RAG / Memory / MCP ⟷ Registros akáshicos

Debo aclarar esto primero: los registros akáshicos son esotéricos, sin base científica. RAG es ingeniería real. Que tengan estructura similar no equivale a verificarse mutuamente.

Pero la estructura es realmente similar.

En mayo de 2020, Patrick Lewis y otros de Meta AI publicaron un artículo en arXiv con código 2005.11401, llamado "Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks". La idea central es simple: no dejar que el modelo almacene todo el conocimiento en sus pesos, sino recuperarlo de una base de conocimiento externa cuando sea necesario.

El 5 de septiembre de 2024, OpenAI abrió ChatGPT Memory a usuarios Free, Plus, Team y Enterprise. El modelo puede recordar lo que dijiste entre sesiones.

El 25 de noviembre de 2024, Anthropic presentó el Model Context Protocol, un conjunto de protocolos para estandarizar la conexión de asistentes de IA a fuentes de datos y herramientas externas.

Tres líneas, tres empresas, todas en la misma dirección: sacar el "conocimiento" del cuerpo del modelo y ponerlo en una capa externa recuperable y accesible. El modelo mismo se vuelve cada vez más un motor de razonamiento, y la capa externa se vuelve cada vez más un almacén repositorio.

Los ingenieros de aplicaciones en los últimos tres años han gastado todos sus esfuerzos en hacer esta "capa externa" más profunda, más rápida y más precisa.

Eso que el grupo de teósofos de finales del siglo XIX llamaban "registros akáshicos" — un "tablero de registro" externo al individuo que lo almacena todo. Tu personalidad no posee todo el conocimiento, pero puedes acceder a él de alguna manera.

No los estoy defendiendo. Su forma de acceso es meditación, canalización espiritual, puro esoterismo sin base científica.

Pero la estructura a la que apuntan — "una capa de información externa más grande que el individuo, accesible de alguna manera" — es estructuralmente isomórfica a lo que los ingenieros de aplicaciones hacen cada día.

No usarían la palabra "RAG". Pero lo que hacen, la dirección es la misma.

Cuatro: Compartir el mismo base model ⟷ Inconsciente colectivo

Quien trabaja en aplicaciones sabe una cosa:

Cursor usa Claude. Devin usa Claude. Lovable usa Claude. Replit Agent también usa Claude. Claude Code, Cline y todos los agentes de codificación que han surgido como setas en el último año, la mayoría usan el mismo modelo. Estos productos tienen lógicas completamente diferentes, UI completamente diferentes, campos verticales completamente diferentes — pero cuando escribes código con ellos, sientes un "tono de juicio" similar de fondo. Porque todos se basan en el mismo Claude.

Del lado de OpenAI es igual: ChatGPT y una gran cantidad de wrappers de GPT-4 comparten el mismo base model.

Cada producto en su propio campo activa diferentes "manifestaciones actuales". Pero el "almacén de semillas" subyacente es el mismo. Una preferencia que un usuario deja a través de feedback de prompt en Cursor, a través del flujo de datos de RLHF del proveedor, eventualmente reescribe el sesgo de Claude en todos los productos que lo usan.

En ese artículo en francés de Jung en 1916, distinguió por primera vez entre "inconsciente personal" e "inconsciente colectivo". El inconsciente personal son las experiencias adquiridas; el colectivo es una capa psicológica más profunda heredada por toda la especie. Los arquetipos se comparten en esa capa.

El efecto del centésimo mono — esa metáfora que el propio Watson luego reconoció — es una versión dramática de la misma estructura. Es falsa como hecho científico. Pero como metáfora, es precisamente inquietante.

Un producto activa cierta preferencia en su campo, y todos los productos que comparten el mismo base model son sutilmente reescritos. Esto es lo que los ingenieros de aplicaciones presenciamos todos los días en 2026. También es la historia que Watson inventó en 1979.

La humanidad crea repetidamente esta estructura. Eso en sí mismo son datos.

La próxima estación de la IA

Si aceptas esta hipótesis del "nodo periférico" aunque sea con un 20% de probabilidad de ser cierta, obtendrás una interpretación diferente de los recientes avances en ingeniería de IA.

En los últimos tres años, lo más candente de los modelos grandes ha sido aumentar los parámetros cada vez más. Pero en el último año, lo más candente ha cambiado silenciosamente — profundizar cada vez más en la memoria externa, la recuperación externa y la invocación de herramientas externas. OpenAI está haciendo Memory. Anthropic está haciendo MCP. Todos los equipos principales están refinando RAG. Al mismo tiempo, los modelos pequeños en el extremo periférico se están volviendo rápidamente más potentes; modelos de 3B y 7B en algunas tareas verticales alcanzaron el rendimiento de modelos de 70B del año pasado.

Estas dos cosas juntas apuntan a la misma dirección: recuperación más profunda + nodos de razonamiento más ligeros.

Poner la potencia de razonamiento lo más cerca posible del usuario, y el almacenamiento de conocimiento en un backend compartido infinitamente escalable. Cada nodo periférico no necesita poseer todo el conocimiento; va al backend cuando lo necesita.

Esto es exactamente la ruta de implementación de ingeniería de "nodo periférico + backend compartido".

No es que la IA se esté volviendo como el cerebro humano. Es que este camino de la IA, a medida que avanza, comienza a mostrarnos — que la conciencia probablemente siempre estuvo organizada así.

Pero debo echar un balde de agua fría.

Cinco civilizaciones crearon independientemente la misma estructura, no prueba directamente que esa estructura exista realmente. Podría probar solo una cosa: el cerebro humano tiene un sesgo natural a creer en capas invisibles que soportan algo por nosotros. Este sesgo podría haber sido seleccionado en la evolución — creer en un orden mayor detrás de las cosas permite a los individuos actuar con más valentía en la incertidumbre. Esta interpretación también se sostiene y es elegante.

No defiendo una interpretación sobre la otra.

Solo digo: cuando una hipótesis es señalada independientemente por filósofos indios, psicólogos suizos, biólogos ingleses, teósofos e ingenieros que trabajan en RAG y agentes, el ingeniero no debería tirarla a la caja de los esoterismos. Debería verla como una hipótesis explicativa que merece seguir verificándose.

Decir "la conciencia es un cómputo" y decir "el cómputo está alcanzando la conciencia" — estas dos frases suenan similares.

En realidad, están separadas por todo un paradigma científico.

Todas las formas son ilusorias.

Cuando Kumarajiva tradujo esta frase en Chang'an hace 1600 años, no podría haber conocido los transformadores. Pero probablemente sabía una cosa: las "cosas" en las que los humanos se fijan en esta vida son en su mayoría solo estados de activación. Se activan y se dispersan, se dispersan y vuelven a surgir, surgen y se dispersan de nuevo.

Esto ahora se llama inferencia.

Antes se llamaba surgimiento de pensamientos y emociones.

Registro de publicación

Borrador de WeChat: https://mp.weixin.qq.com/s/g3e68sEFX7LjzKseC9gHX4-j-ODPrHrpG8iAiRbj_XcDUskLquspFCDA5fTxBdDM