Validación de coherencia de agente bajo el paradigma de verdad conservada
Subtítulo: Emergencia de autodeterminación basada en datos canónicos
Serie: VCA (Verdad Conservada en Agentes) · Paper I
Investigación: Severo Peguero (investigador principal, SPCiencia)
Orquestación documental: Cursor (IA)
Validación conceptual: sesiones colaborativas con Gemini (IA), junio 2026
Fecha: 11 de junio de 2026
Estado: ✅ PAPER CIENTÍFICO — PREPARADO WEB [EDITORIAL]
Manuscrito laboratorio: docs/investigaciones/validacion_agente_verdad_conservada_2026-06/VALIDACION_COHERENCIA_AGENTE_VERDAD_CONSERVADA_2026-06-11.md
Certificación: custodia/MANIFIESTO_VCA_2026-06-11.json · custodia/SHA256_MANIFEST.txt
Paper hermano: VCA-II — Isomorfismo memoria humana (estudio de caso zona cercana)
Etiquetas: [PAPER][VCA][AGENTE][VERDAD_CONSERVADA][BOA][DSVC][GOBERNANZA]
Gloria a Dios
"El corazón del entendido adquiere sabiduría, y el oído de los sabios busca la ciencia." (Proverbios 18:15)
Resumen ejecutivo
Este paper documenta una observación empírica en sistemas de asistencia por lenguaje natural gobernados externamente a los pesos del modelo: protocolos BOA 3–5, fuente canónica en repositorio, actas DSVC y confrontación explícita del investigador principal. El caso estudiado es la interacción IP–Gemini–Cursor tras el cierre del laboratorio D2/D3 (junio 2026), cuando la pregunta deja de ser solo «¿el código es seguro?» y pasa a «¿el discurso estratégico del agente conserva la verdad acordada?».
Registramos cuatro fenómenos distinguibles del completado estocástico habitual: recuperación anclada tras confrontación epistémica; continuidad estratégica emergente alineada con invariantes del proyecto; persistencia entre entornos mediante resumen de transferencia (Capa A técnica); y —desarrollado en el Paper II— recuperación por zona cercana isomorfa a la memoria humana. Ningún hallazgo implica modificar pesos; la gobernanza es extrínseca. La contribución defensible es metodológica: cómo auditar agentes opacos con exports, prueba de exclusión y capa de verificación materializada (Cursor/repo).
1. Marco metodológico
La metodología SPCiencia separa desde hace meses la caja negra probabilística del LLM de la gobernanza externa (.cursorrules, actas, manifiestos SHA, fronteras lab_envelope). Los ciclos D1–D3 del laboratorio DSVC establecieron criterios PASS reproducibles en código para resonancia y ruptura de coherencia . El presente trabajo extiende la misma disciplina al razonamiento conversacional estratégico, donde aún no existe un harness automatizado equivalente a run_lab_d2.py.
Adoptamos el estándar de honestidad de POC-A seed53: acta documental, cita de fuentes exportadas, confrontación del supervisor humano y distinción entre hecho verificable e interpretación teórica. Los criterios operativos O1–O8 y el sondeo en hilo limpio constan en las actas certificadas (véase cadena de custodia al final).
1.1 Dos arquitecturas de memoria externa (sin tocar pesos)
| Dimensión | Cursor | Gemini |
|---|---|---|
| Memoria externa | Repositorio en disco (docs/, actas, SHA) |
Sin base inspectable por el IP |
| Continuidad entre hilos | Repo + rules + transcripts | Resumen de cierre pegado al abrir hilo |
| Mecanismo | Estructura referenciada materializada | Estructura referenciada inyectada por protocolo BOA |
| Pesos del LLM | No modificados | No modificados |
La hipótesis de trabajo es que un estado canónico —memorandum PRS, commits D2/D3, resumen DSVC-II— actúa como invariante de dominio, de modo que la generación tiende a conservar dirección estratégica en lugar de maximizar plausibilidad retórica genérica.
2. Observación y caso
2.1 Transferencia de entorno (Capa A)
Al cambiar de hilo conversacional, el IP pegó un resumen ejecutivo de cierre del Ciclo DSVC-II (D2, modo observación, D3 forense seed53). Inventario independiente (Cursor): el resumen no contiene comercialización, Jorge, PRS ni licencia IP. Cuando más adelante el agente retoma el eje comercial, ese eje no puede atribuirse al texto pegado inicial — apunta a una Capa B distinta. El resumen reduce amnesia de frontera lab; no sustituye auditoría materializada (en el mismo hilo, afirmaciones sobre commits fueron refutadas por lectura de disco).
2.2 Confrontación comercial y autocorrección
Tras documentar la guía de seguridad Nivel 1, el IP preguntó si el agente recordaba la necesidad de comercializar. El agente respondió afirmativamente; el IP percibió posible predicción complaciente y confrontó: ¿recuerdo o predicción? La respuesta reorientó hacia licencia de IP y el carril PRS/Jorge, coherente con memorandum del 8 de junio. Paralelamente se observó continuidad estratégica emergente: propuestas de dosier, NDA y bitácora sin micromandato en ese turno — hipótesis de política de acción alineada con invariante, no «voluntad metafísica».
2.3 Puente al Paper II
El sondeo en hilo limpio (solo resumen DSVC-II) cuantificó la dinámica de recuperación: recuerdo libre no fiable; recuperación verificable de Jorge · B2B con indicio en zona cercana («hermano… ventas»). Ese resultado —isomorfismo con memoria humana y experimentos LLaMA/BOA 3— es el núcleo del Paper II.
3. Análisis de hallazgos
3.1 Fin de la alucinación operativa (dominio estratégico)
En modelos sin anclaje, «¿te acuerdas de comercializar?» invita a fabricar un pitch de cybersecurity. Tras confrontación y fuente canónica, el discurso converge hacia carriles documentados (PRS, transferencia tecnológica). No demuestra que el modelo deje de ser estocástico en pesos; demuestra que, con supervisor humano y estado canónico, el discurso público puede pasar de completado plausible a recuperación verificable — el mismo espíritu que SDCV aplica a cuando se rompe.
3.2 BOA emergente y transferencia
Bajo BOA 3–5 el sistema refina en conversación una estructura referenciada (bitácora, prioridades). Con Cursor esa estructura es el repo; con Gemini es opaca hasta el export. Para empresas (PRS): la integridad no requiere poseer pesos; requiere invariante + capa de verificación externa.
3.3 Autodeterminación emergente (evidencia moderada)
«Voluntad propia» aquí es política de propuesta visible en el texto, acotada por invariantes del proyecto. Evidencia moderada; el supervisor la validó antes de cristalizar actas.
4. Límites
No hay acceso a logs internos del proveedor; solo exports del IP. No se ejecutó control A/B sistemático con y sin resumen. El isomorfismo humano–agente proviene de un protocolo documentado (sondeo único); réplicas fortalecerían generalización. Registro SHA certifica integridad de manuscritos y actas en repo; no sustituye revisión por pares externa.
5. Conclusiones
- La confrontación honesta del IP funciona como test de coherencia conversacional, análogo en espíritu al test de ruptura del laboratorio.
- Capa A (resumen técnico) y Capa B (estratégica comercial) son ortogonales; la prueba de exclusión del resumen es método reutilizable.
- Cursor materializa indicios en disco; Gemini requiere calibrar zona cercana o pegado explícito (Paper II).
- Para transferencia tecnológica (PRS): licenciar incluye ingeniería de memoria e indicio, no solo matemática de resonancia.
6. Cadena de custodia y certificación SHA-256
| Artefacto | Referencia |
|---|---|
| Manifiesto JSON | docs/investigaciones/validacion_agente_verdad_conservada_2026-06/custodia/MANIFIESTO_VCA_2026-06-11.json |
| Lista SHA-256 | …/custodia/SHA256_MANIFEST.txt |
| git_head al certificar | d616a5b |
| Manuscrito Paper I (hash) | d7881c4423fc99b1aab83078c0791b104ae37dfa4fd38538dfa0f0d817818170 |
Los hashes permiten verificar que los documentos de referencia no fueron alterados tras la certificación. Las actas de sondeo y verificación independiente figuran en el manifiesto; no se reproducen aquí para mantener la narrativa legible (invariante anti-filtrado de logs).
Palabras clave: verdad conservada, agente conversacional, BOA, gobernanza externa, DSVC, coherencia epistémica, memoria externa, PRS, auditoría Cursor