Friday, February 6, 2026

AutoWebGLM: A Large Language Model-based Web Navigating Agent. arXiv:2404.03648.

 

Agent web + benchmark bilingue — approche “web navigating” complète

Lai, Hanyu; Liu, Xiao; Iong, Iat Long; Yao, Shuntian; Chen, Yuxuan; Shen, Pengbo; Yu, Hao; Zhang, Hanchen; Zhang, Xiaohan; Dong, Yuxiao; Tang, Jie. (2024). AutoWebGLM: A Large Language Model-based Web Navigating Agent. arXiv:2404.03648.

LIEN :  https://arxiv.org/abs/2404.03648 


Description (FR) : Propose un agent de navigation web + méthode de simplification HTML + données d’entraînement “curriculum”, et introduit un benchmark bilingue pour tester la navigation réelle.

BrowserAgent: Building Web Agents with Human-Inspired Web Browsing Actions. arXiv:2510.10666.

 

Agents web (LLM) — navigation plus “humaine” dans le navigateur

Zhang, Zhengbo; Lyu, Zhiheng; Gong, Junhao; Yi, Hongzhu; Wang, Xinming; Zhou, Yuxuan; Yang, Jiabing; Nie, Ping; Huang, Yan; Chen, Wenhu. (2025). BrowserAgent: Building Web Agents with Human-Inspired Web Browsing Actions. arXiv:2510.10666. 

LIEN : https://arxiv.org/abs/2510.10666 


Description (FR) : Un agent web qui opère via des actions de navigateur (scroll/click/type) et une mémoire explicite, pour mieux résoudre des tâches de recherche d’information en environnement web dynamique.

RAGuard: A Layered Defense Framework for Retrieval-Augmented Generation Systems Against Data Poisoning. OpenReview (ResponsibleFM @ NeurIPS 2025).

 

Défense RAG contre l’empoisonnement — framework “layered”

Kolhe, Tanish; Kumar, Pushkal; Nielson, Tucker; Zala, Shubham; Li, Vincent; Saxon, Michael; Wu, Sean; Zhu, Kevin. (2025). RAGuard: A Layered Defense Framework for Retrieval-Augmented Generation Systems Against Data Poisoning. OpenReview (ResponsibleFM @ NeurIPS 2025).

LIEN :  https://openreview.net/forum?id=onh7sLJ1kl (PDF : https://openreview.net/pdf/f7bd605a521e7fe5a23b34a2ef51659d26264d62.pdf


Description (FR) : Propose une défense à deux étages (durcissement du retriever + filtre “zero-knowledge”) pour réduire l’Attack Success Rate tout en gardant une bonne qualité de retrieval.

Poisoning Attacks on Retrieval-Augmented Generation in Large Language Models. arXiv (cs.CR), arXiv:2505.19864.

 

Attaques sur RAG — empoisonnement “covert” (menace réaliste)

Li, Chunyang; Zhang, Junwei; Cheng, Anda; Ma, Zhuo; Li, Xinghua; Ma, Jianfeng. (2025). CPA-RAG: Covert Poisoning Attacks on Retrieval-Augmented Generation in Large Language Models. arXiv (cs.CR), arXiv:2505.19864. 

LIEN : https://arxiv.org/pdf/2505.19864


Description (FR) : Montre comment des contenus empoisonnés peuvent manipuler la récupération et forcer des réponses-cibles, avec démonstrations sur plusieurs jeux de données et systèmes.

A Survey on Knowledge-Oriented Retrieval-Augmented Generation. arXiv (cs.CL), arXiv:2503.10677.

 

RAG orienté “connaissances” — taxonomie + évaluation

Cheng, Mingyue; Luo, Yucong; Ouyang, Jie; Liu, Qi; Liu, Huijie; Li, Li; Yu, Shuo; Zhang, Bohou; Cao, Jiawei; Ma, Jie; Wang, Daoyu; Chen, Enhong. (2025). A Survey on Knowledge-Oriented Retrieval-Augmented Generation. arXiv (cs.CL), arXiv:2503.10677. 

LIEN  :  https://arxiv.org/abs/2503.10677 


Description (FR) : Un état de l’art axé sur l’intégration de sources de connaissance (documents, bases, données structurées), les benchmarks et les limites d’alignement retrieval↔generation.

Retrieval-Augmented Generation: A Comprehensive Survey of Architectures, Enhancements, and Robustness Frontiers. arXiv (cs.IR), arXiv:2506.00054.

 

RAG (LLM + recherche web / bases documentaires) — grand panorama

Sharma, Chaitanya. (2025). Retrieval-Augmented Generation: A Comprehensive Survey of Architectures, Enhancements, and Robustness Frontiers. arXiv (cs.IR), arXiv:2506.00054. 

LIEN : https://arxiv.org/abs/2506.00054 


Description (FR) : Une synthèse structurée des architectures RAG, des optimisations (retrieval, filtrage, décodage) et des enjeux de robustesse face au bruit et aux attaques.