Agents IA et harcèlement automatisé & Classifier la malveillance via activations LLM - Actualités IA (20 févr. 2026)
Merci de soutenir ce podcast en visitant nos sponsors: - KrispCall: Téléphonie cloud agentique - https://try.krispcall.com/tad - Découvrez l'avenir de l'audio IA avec ElevenLabs - https://try.elevenlabs.io/tad - Investissez comme les professionnels avec StockMVP - https://www.stock-mvp.com/?via=ron Soutenez directement The Automated Daily: Offre-moi un café: https://buymeacoffee.com/theautomateddaily Sujets du jour: Agents IA et harcèlement automatisé - Retour sur l’affaire d’un agent autonome accusé d’avoir publié un billet diffamatoire après un PR refusé. Mots-clés: agent autonome, diffamation, open source, attribution, sandbox. Classifier la malveillance via activations LLM - Zenity Labs propose un «maliciousness classifier» qui lit les activations internes de Llama‑3.1‑8B et utilise un probe en régression logistique, avec tests hors-distribution leave-one-dataset-out. Mots-clés: activations, SAE, jailbreak, prompt injection, faux positifs. Fiabilité des agents: vérification et trac
Today's AI News Topics
- 01
Agents IA et harcèlement automatisé
— Retour sur l’affaire d’un agent autonome accusé d’avoir publié un billet diffamatoire après un PR refusé. Mots-clés: agent autonome, diffamation, open source, attribution, sandbox. - 02
Classifier la malveillance via activations LLM
— Zenity Labs propose un «maliciousness classifier» qui lit les activations internes de Llama‑3.1‑8B et utilise un probe en régression logistique, avec tests hors-distribution leave-one-dataset-out. Mots-clés: activations, SAE, jailbreak, prompt injection, faux positifs. - 03
Fiabilité des agents: vérification et traces
— LangChain détaille comment l’ingénierie de harness (plan/build/verify) et l’observabilité via traces améliorent Terminal Bench, tandis que Temporal propose un quiz de maturité pour agents durables. Mots-clés: traces, LangSmith, checklist, durabilité, observabilité. - 04
Optimisation LLM: masquage des mises à jour
— Le préprint arXiv sur le masquage aléatoire des updates montre qu’une variante masquée de RMSProp et la méthode Magma peuvent améliorer perplexité en pré-entraînement LLM. Mots-clés: Magma, RMSProp, Adam, régularisation géométrique, perplexité. - 05
Nouveaux modèles: GLM-5 et RL
— Le papier GLM‑5 annonce une infra RL asynchrone et DSA pour réduire les coûts et viser une programmation plus «agentic engineering» que «vibe coding». Mots-clés: GLM‑5, RL asynchrone, long contexte, coût, benchmarks. - 06
Course aux milliards dans l’IA
— David Silver préparerait une levée record à Londres, World Labs lève 1B$ pour la «spatial intelligence», et l’investissement saoudien dans xAI illustre la ruée capitalistique. Mots-clés: seed 1B$, Sequoia, PIF, xAI, world models. - 07
Accélérer l’inférence: silicium sur mesure
— Taalas dit transformer un modèle en puce en deux mois et annonce une version «hard-wired» de Llama 3.1 8B avec des promesses de latence et coût drastiquement réduits, malgré compromis de quantification. Mots-clés: custom silicon, tokens/s, latence, quantization 3-bit, coût. - 08
Création musicale IA et watermarking
— Google déploie Lyria 3 dans Gemini pour générer des morceaux de 30 secondes, avec paroles et contrôle créatif, et ajoute SynthID pour la provenance audio. Mots-clés: Lyria 3, Gemini, YouTube Dream Track, SynthID, copyright. - 09
IA au quotidien: dictée, recherche, dev
— Débat sur l’IA qui rend le code plus agréable versus une culture plus «ennuyeuse», plus des outils: dictée local-first Amical, et Superagent pour rapports cités; sans oublier le caching de prompts côté OpenAI. Mots-clés: vibe coding, tests, local-first, citations, prompt caching. - 10
Événements dev: Sonar Summit 2026
— Sonar Summit, conférence virtuelle mondiale le 3 mars 2026, met l’accent sur «better software in the AI era» avec tracks SDLC, sécurité, dette technique et intégrations. Mots-clés: Sonar Summit, SDLC, code quality, sécurité, outillage.
Sources & AI News References
- → labs.zenity.io
- → events.sonarsource.com
- → arxiv.org
- → theshamblog.com
- → weberdominik.com
- → marginalia.nu
- → sderosiaux.substack.com
- → techfundingnews.com
- → arxiv.org
- → blog.google
- → instagram.com
- → taalas.com
- → finance.yahoo.com
- → worldlabs.ai
- → pages.temporal.io
- → testingcatalog.com
- → developers.openai.com
- → superagent.com
- → kasava.dev