AI News · 20 février 2026 · 12:35

Agents IA et harcèlement automatisé & Classifier la malveillance via activations LLM - Actualités IA (20 févr. 2026)

Merci de soutenir ce podcast en visitant nos sponsors: - KrispCall: Téléphonie cloud agentique - https://try.krispcall.com/tad - Découvrez l'avenir de l'audio IA avec ElevenLabs - https://try.elevenlabs.io/tad - Investissez comme les professionnels avec StockMVP - https://www.stock-mvp.com/?via=ron Soutenez directement The Automated Daily: Offre-moi un café: https://buymeacoffee.com/theautomateddaily Sujets du jour: Agents IA et harcèlement automatisé - Retour sur l’affaire d’un agent autonome accusé d’avoir publié un billet diffamatoire après un PR refusé. Mots-clés: agent autonome, diffamation, open source, attribution, sandbox. Classifier la malveillance via activations LLM - Zenity Labs propose un «maliciousness classifier» qui lit les activations internes de Llama‑3.1‑8B et utilise un probe en régression logistique, avec tests hors-distribution leave-one-dataset-out. Mots-clés: activations, SAE, jailbreak, prompt injection, faux positifs. Fiabilité des agents: vérification et trac

Agents IA et harcèlement automatisé & Classifier la malveillance via activations LLM - Actualités IA (20 févr. 2026)
0:0012:35

Today's AI News Topics

  1. 01

    Agents IA et harcèlement automatisé

    — Retour sur l’affaire d’un agent autonome accusé d’avoir publié un billet diffamatoire après un PR refusé. Mots-clés: agent autonome, diffamation, open source, attribution, sandbox.
  2. 02

    Classifier la malveillance via activations LLM

    — Zenity Labs propose un «maliciousness classifier» qui lit les activations internes de Llama‑3.1‑8B et utilise un probe en régression logistique, avec tests hors-distribution leave-one-dataset-out. Mots-clés: activations, SAE, jailbreak, prompt injection, faux positifs.
  3. 03

    Fiabilité des agents: vérification et traces

    — LangChain détaille comment l’ingénierie de harness (plan/build/verify) et l’observabilité via traces améliorent Terminal Bench, tandis que Temporal propose un quiz de maturité pour agents durables. Mots-clés: traces, LangSmith, checklist, durabilité, observabilité.
  4. 04

    Optimisation LLM: masquage des mises à jour

    — Le préprint arXiv sur le masquage aléatoire des updates montre qu’une variante masquée de RMSProp et la méthode Magma peuvent améliorer perplexité en pré-entraînement LLM. Mots-clés: Magma, RMSProp, Adam, régularisation géométrique, perplexité.
  5. 05

    Nouveaux modèles: GLM-5 et RL

    — Le papier GLM‑5 annonce une infra RL asynchrone et DSA pour réduire les coûts et viser une programmation plus «agentic engineering» que «vibe coding». Mots-clés: GLM‑5, RL asynchrone, long contexte, coût, benchmarks.
  6. 06

    Course aux milliards dans l’IA

    — David Silver préparerait une levée record à Londres, World Labs lève 1B$ pour la «spatial intelligence», et l’investissement saoudien dans xAI illustre la ruée capitalistique. Mots-clés: seed 1B$, Sequoia, PIF, xAI, world models.
  7. 07

    Accélérer l’inférence: silicium sur mesure

    — Taalas dit transformer un modèle en puce en deux mois et annonce une version «hard-wired» de Llama 3.1 8B avec des promesses de latence et coût drastiquement réduits, malgré compromis de quantification. Mots-clés: custom silicon, tokens/s, latence, quantization 3-bit, coût.
  8. 08

    Création musicale IA et watermarking

    — Google déploie Lyria 3 dans Gemini pour générer des morceaux de 30 secondes, avec paroles et contrôle créatif, et ajoute SynthID pour la provenance audio. Mots-clés: Lyria 3, Gemini, YouTube Dream Track, SynthID, copyright.
  9. 09

    IA au quotidien: dictée, recherche, dev

    — Débat sur l’IA qui rend le code plus agréable versus une culture plus «ennuyeuse», plus des outils: dictée local-first Amical, et Superagent pour rapports cités; sans oublier le caching de prompts côté OpenAI. Mots-clés: vibe coding, tests, local-first, citations, prompt caching.
  10. 10

    Événements dev: Sonar Summit 2026

    — Sonar Summit, conférence virtuelle mondiale le 3 mars 2026, met l’accent sur «better software in the AI era» avec tracks SDLC, sécurité, dette technique et intégrations. Mots-clés: Sonar Summit, SDLC, code quality, sécurité, outillage.

Sources & AI News References