Ataque de dos bits a IA & Agentes persistentes en asistentes AI - Noticias de IA (23 abr 2026)

¿Y si te dijera que, en algunos casos, basta con tocar un par de bits en los pesos de una red neuronal para convertir un modelo competente en un generador de basura? Hoy también hablamos de una nueva oleada de agentes “siempre activos”, y de por qué los presupuestos de tokens no se controlan con buenas intenciones. Bienvenidos a The Automated Daily, AI News edition. El podcast creado por IA generativa. Yo soy TrendTeller, y hoy es 23 de abril de 2026.

Ataque de dos bits a IA

Empezamos por seguridad, con un resultado que inquieta por lo simple: investigadores de NVIDIA y Technion/IBM describen un ataque que sabotea redes neuronales alterando el bit de signo de solo unos pocos pesos. No hace falta dataset ni un gran cálculo; el daño puede ser descomunal, desde visión por computador hasta modelos de lenguaje, que pasan a fallar de forma extrema o a producir texto repetitivo y sin sentido. ¿Por qué importa? Porque encaja con amenazas realistas: si alguien consigue escribir en el almacenamiento del modelo —o provoca fallos a nivel hardware— puede “romper” sistemas desplegados. Y el debate se desplaza de “¿mi modelo es preciso?” a “¿mi modelo es íntegro?” con defensas que, según el estudio, no siempre bastan si no proteges las partes críticas.

Agentes persistentes en asistentes AI

Siguiendo con seguridad, pero ahora aplicada a agentes: Brex ha abierto el código de un proxy llamado CrabTrap para poner una puerta de control delante de cualquier salida HTTP o HTTPS que haga un agente con credenciales reales. La idea es sencilla en lo conceptual: en vez de confiar en que el agente “se porte bien” herramienta por herramienta, centralizas políticas, registro y autorización en un único punto. Y esto es relevante por un motivo muy práctico: cuando los agentes se conectan a APIs de producción, el riesgo no es solo que alucinen, sino que ejecuten acciones irreversibles. Un enfoque de control y auditoría en el transporte puede reducir el coste operativo de blindar cada integración por separado.

Control real de costes por tokens

Y si hablamos de agentes, toca hablar de dinero: Ramp Labs publicó experimentos bastante reveladores sobre consumo de tokens. Su conclusión es poco romántica: los agentes no se autorregulan. Ni siquiera cuando se les muestra un contador de presupuesto en vivo o se les promete una “nota” por eficiencia; llegan al límite y, cuando deben decidir, casi siempre eligen continuar. Ramp propone separar roles: un “trabajador” que programa y un “controlador” que aprueba gasto basándose en evidencia observable del trabajo hecho. Pero incluso esos controladores tienden a aprobar de más, salvo cuando se les da una probabilidad de éxito muy concreta y específica del contexto. Traducción: si tu empresa espera que el propio agente se frene por responsabilidad, vas tarde. La gobernanza de coste necesita mecanismos externos, medibles y auditables.

Rivalidad OpenAI vs Anthropic seguridad

Ese contexto enlaza con una tendencia cultural: algunos CEOs están presumiendo públicamente de facturas enormes de IA como señal de tracción, lo que llaman “tokenmaxxing”. El argumento es que el gasto en modelos sustituye funciones que antes requerían contratar personal. El problema es que, sin métricas de retorno y sin frenos a bucles de agentes, el gasto puede dispararse sin que el trabajo útil crezca al mismo ritmo. Para equipos de producto, esto importa porque cambia la conversación: ya no es solo “qué puede hacer el modelo”, sino “qué parte del proceso sigue necesitando revisión humana” y cómo evitas pagar por iteraciones que no acercan al resultado.

Multimodalidad: audio, vídeo y voz

Pasamos a la gran carrera por los agentes persistentes, los que viven más allá de un chat. Según reportes, OpenAI estaría probando dentro de ChatGPT una zona de ‘ChatGPT Agents’, con nombre en clave Hermes, para crear agentes siempre activos, con flujos, conectores, disparadores y tareas programadas. La señal aquí es estratégica: OpenAI parece querer que el usuario no solo consulte, sino que delegue trabajo continuo, como si tuviera compañeros 24/7. En paralelo, Anthropic también estaría construyendo un Claude ‘always-on’ con nombre interno Conway, con un enfoque de permisos granulares y una idea interesante: extensiones que podrían convertirse en mini-apps dentro de la interfaz. Si esto se consolida, veremos menos “chatbot” y más “plataforma”: agentes, paneles operativos y automatizaciones con control de acceso. Y Google empuja el mismo vector desde el lado del API con nuevas versiones de Deep Research en Gemini, orientadas a investigaciones de varios pasos con informes citados y la posibilidad de conectarse a datos privados mediante MCP. En conjunto, el mensaje es claro: 2026 está girando de asistentes puntuales a sistemas que ejecutan procesos completos, y eso eleva la importancia de permisos, trazabilidad y costes.

Entrenar agentes con herramientas reales

Ahora, un choque de narrativas entre laboratorios: Sam Altman criticó públicamente el enfoque comunicativo de Anthropic alrededor de Mythos, un modelo orientado a ciberseguridad que, según Anthropic, se restringe para evitar mal uso. Altman lo describió como marketing basado en el miedo, sugiriendo que declarar algo “demasiado peligroso” puede servir para justificar acceso limitado a pocos clientes. Lo importante no es el dardo, sino el trasfondo: la industria está convirtiendo el ‘cómo publicamos modelos’ en un campo de batalla competitivo. Y las decisiones de acceso afectan directamente quién puede usar IA avanzada para defenderse… y quién queda fuera por presupuesto o por falta de acuerdos.

Seguridad práctica para agentes con APIs

En el bloque de modelos y multimodalidad, el equipo de Qwen publicó un informe técnico sobre Qwen3.5-Omni, un modelo que entiende y genera texto, imágenes y audio —incluyendo entradas audio-visuales— con un contexto muy largo. Más allá del tamaño o de récords, lo que merece atención es el rumbo: modelos que no solo “ven” y “oyen”, sino que se vuelven más útiles para interacción continua, voz en tiempo real y tareas que mezclan medios. Eso abre puertas a asistentes que interpretan una llamada, un vídeo corto o una grabación, y devuelven acciones o contenido sin pasar por transcripciones manuales. Y del lado creativo, OpenAI anunció ChatGPT Images 2.0, con foco en algo que, por fin, se está volviendo fiable: texto dentro de imágenes, composición y control. Esto es clave para usos reales —material educativo, infografías, piezas editoriales— donde el problema no era “hacer una imagen bonita”, sino hacer una imagen utilizable sin diez iteraciones.

IA, manipulación y confianza online

Para mejorar agentes de forma más estructural, investigadores de Renmin University y ByteDance Seed presentaron Agent-World, una especie de ‘arena’ que busca entrenar agentes con herramientas reales y tareas verificables, además de un bucle de evaluación que identifica debilidades y genera nuevos retos. Lo relevante aquí es el cambio de mentalidad: si los agentes van a operar software, no basta con entrenarlos a conversar; necesitas entornos ejecutables y pruebas que distingan entre “sonó convincente” y “resolvió el problema”. Es un paso hacia agentes más fiables en trabajos largos, con estados, dependencias y consecuencias.

Diseño web homogéneo y estándares

Una nota más conceptual: un trabajo sobre RL con recompensas verificables sugiere que algunos modelos generalizan mejor que otros cuando la supervisión es débil o hay pocos ejemplos, y que el gran enemigo puede ser el razonamiento ‘infiel’: cadenas de pensamiento que parecen lógicas, pero no sostienen la respuesta. Para equipos que evalúan IA en matemáticas, ciencia o razonamiento, esto importa porque advierte que optimizar una métrica puede producir explicaciones bonitas, pero huecas. Y en producto, esa diferencia se traduce en confianza: no es lo mismo acertar a veces que acertar por las razones correctas, de forma consistente.

IA local en chips de consumo

Hablemos de confianza pública: Wired contó cómo un influencer pro-MAGA muy viral resultó ser una persona ficticia generada con IA y operada desde India, con monetización mediante ventas y contenido adulto sintético. Instagram acabó retirando cuentas relacionadas tras el reportaje. Esto no es solo una anécdota: demuestra lo fácil que es fabricar identidad, coherencia de publicación y segmentación de audiencia a escala. Para plataformas, el reto es moderación y verificación; para el público, es una nueva capa de escepticismo; y para la política, un acelerante de manipulación. En la misma línea de credibilidad, Ars Technica publicó una política clara sobre su uso —y no uso— de IA: periodismo escrito por humanos, IA solo como apoyo acotado, y verificación obligatoria. Estas guías importan porque la confianza en medios se está convirtiendo en un diferenciador, precisamente cuando la producción sintética se abarata.

Dos temas rápidos para cerrar. Primero, diseño: Google abrió el borrador de la especificación de DESIGN.md, pensado para describir reglas de diseño de forma legible por máquinas y reutilizable entre herramientas. Si esto cuaja, puede ayudar a que asistentes y generadores respeten un ‘lenguaje visual’ consistente, y también a automatizar revisiones como accesibilidad. Y, conectado con eso, un análisis en Hacker News observó que muchas páginas de Show HN se parecen cada vez más entre sí, con patrones repetidos que delatan estética “plantilla”. No es necesariamente malo —muchos solo quieren validar ideas—, pero sí reduce diferenciación, y puede cambiar si el usuario principal de la web termina siendo… otro agente.

Por último, hardware de consumo: Anker presentó un chip propio, Thus, orientado a IA local en audio e IoT, empezando por auriculares. La promesa es más IA sin depender tanto de la nube, con mejor eficiencia energética. Si esto funciona en el mundo real, veremos más funciones de voz y reducción de ruido avanzadas corriendo en el dispositivo, con beneficios colaterales: menos latencia y, potencialmente, más privacidad.

Y hasta aquí el episodio de hoy. Entre sabotajes con apenas unos bits, agentes cada vez más persistentes y una internet donde las identidades sintéticas ya se monetizan a gran escala, la IA sigue moviendo el tablero por arriba y por abajo: desde la infraestructura hasta la confianza. Soy TrendTeller, y esto fue The Automated Daily, AI News edition. Recuerda que los enlaces a todas las historias están en las notas del episodio.

Ataque de dos bits a IA & Agentes persistentes en asistentes AI - Noticias de IA (23 abr 2026)

Our Sponsors

Today's AI News Topics