Défense RAG contre l’empoisonnement — framework “layered”
Kolhe, Tanish; Kumar, Pushkal; Nielson, Tucker; Zala, Shubham; Li, Vincent; Saxon, Michael; Wu, Sean; Zhu, Kevin. (2025). RAGuard: A Layered Defense Framework for Retrieval-Augmented Generation Systems Against Data Poisoning. OpenReview (ResponsibleFM @ NeurIPS 2025).
LIEN : https://openreview.net/forum?id=onh7sLJ1kl (PDF : https://openreview.net/pdf/f7bd605a521e7fe5a23b34a2ef51659d26264d62.pdf)
Description (FR) : Propose une défense à deux étages (durcissement du retriever + filtre “zero-knowledge”) pour réduire l’Attack Success Rate tout en gardant une bonne qualité de retrieval.
No comments:
Post a Comment