Sunday, March 1, 2026
Friday, February 6, 2026
A Secured Data Processing Technique for Effective Utilization of Cloud Computing.
Marwan, Mbarek; Kartit, Ali; Ouahmane, Hassan. (2018). A Secured Data Processing Technique for Effective Utilization of Cloud Computing. JDMDH (Épisciences), 2 janvier 2018. DOI : https://doi.org/10.46298/jdmdh.4085
LIEN : — PDF : https://jdmdh.episciences.org/4085/pdf
Contenu : Propose une approche sécurité (segmentation + watermarking) pour traitement de données en cloud — pertinent pour services Internet et chaînes de données sensibles.
Exploring Historical Labor Markets: Computational Approaches to Job Title Extraction.
Adam, R.; et al. (2025). Exploring Historical Labor Markets: Computational Approaches to Job Title Extraction. JDMDH (Épisciences), 2 avril 2025. DOI : https://doi.org/10.46298/jdmdh.15038
Lien : — PDF : https://jdmdh.episciences.org/15373/pdf
Contenu : Compare dictionnaires, règles, NER et génération de texte pour extraire des intitulés (OCR bruité) — directement transférable à l’extraction structurée depuis des contenus web/archives.
Combining Visual and Textual Features for Semantic Segmentation of Historical Newspapers.
Barman, Raphaël; Ehrmann, Maud; Clematide, Simon; Ares Oliveira, Sofia; Kaplan, Frédéric. (2021). Combining Visual and Textual Features for Semantic Segmentation of Historical Newspapers. JDMDH (Épisciences), 19 janvier 2021.
LIEN :https://doi.org/10.46298/jdmdh.6107
LIEN : https://jdmdh.episciences.org/7097/pdf?utm_
Contenu : Propose un modèle multimodal (vision + texte OCR) pour segmenter des pages et améliorer l’accès/recherche dans des collections numérisées (logique proche “Internet à grande échelle”).
Processing the Structure of Documents: Logical Layout Analysis of Historical Newspapers in French.
Gutehrlé, Nicolas; Atanassova, Iana. (2022). Processing the Structure of Documents: Logical Layout Analysis of Historical Newspapers in French. JDMDH (Épisciences), 30 mai 2022. DOI : https://doi.org/10.46298/jdmdh.9093
LIEN : — PDF : https://jdmdh.episciences.org/9614/pdf
Contenu : Montre comment automatiser la structure logique (titres/sections/paragraphes) de documents en français (XML ALTO), étape clé pour recherche d’info et navigation dans de grandes archives en ligne.
Adapting vs. Pre-training Language Models for Historical Languages.
Manjavacas, Enrique; Fonteyn, Lauren. (2022). Adapting vs. Pre-training Language Models for Historical Languages. JDMDH (Épisciences), 13 juin 2022. DOI : https://doi.org/10.46298/jdmdh.9152
LIEN : — PDF : https://jdmdh.episciences.org/9690/pdf
Contenu : Compare “adapter” un modèle de langue existant vs. pré-entraîner from-scratch, utile pour l’indexation/recherche (IR) et l’exploitation de corpus (archives numériques, dépôts).
Le projet OPTIMICE : une optimisation de la qualité des traductions de métadonnées par la collaboration entre acteurs du monde scientifique et traduction automatique.
Hernández Morin, Katell; Barbin, Franck. (2023). Le projet OPTIMICE : une optimisation de la qualité des traductions de métadonnées par la collaboration entre acteurs du monde scientifique et traduction automatique. JDMDH (Épisciences), 10 janvier 2023. DOI : https://doi.org/10.46298/jdmdh.9117
LIEN : — PDF : https://jdmdh.episciences.org/10795/pdf
Contenu: Décrit une méthodologie opérationnelle combinant TA neuronale + post-édition humaine pour améliorer la qualité des métadonnées (résumés, mots-clés) dans des chaînes éditoriales ouvertes.
Vers une robotique du traduire. JDMDH (Épisciences)
Baillot, Anne; Carter, Ellen; Grass, Thierry; Ruiz Fabo, Pablo. (2022). Vers une robotique du traduire. JDMDH (Épisciences), 2022. DOI : https://doi.org/10.46298/jdmdh.10445
LIEN : — PDF : https://jdmdh.episciences.org/10445/pdf
Contenu: Introduction (très “Internet/IA”) sur la traduction automatique neuronale (DeepL, Google Translate), la post-édition, les normes et les impacts sur les chaînes de production/formation.
La valorisation de HAL : finalités, outils et process.
Schöpfel, Joachim. (2024). La valorisation de HAL : finalités, outils et process. Journal of Data Mining & Digital Humanities (JDMDH) (Épisciences), 2024.
LIEN : PDF : https://jdmdh.episciences.org/14002/pdf
Contenu : Analyse comment HAL est utilisé comme infrastructure (outils, processus, finalités) et ce que cela implique pour la circulation des métadonnées et la valorisation des publications.
Épirevue: revues électroniques basées sur des dépôts ouverts (HAL, arXiv, etc.).
Épirevue thématique ouverte (publication sur réseaux académiques)
Collectif d’auteurs de revues overlay. (continu). Épirevue: revues électroniques basées sur des dépôts ouverts (HAL, arXiv, etc.).
LIEN : 📄 Accès gratuit : https://www.episciences.org/ (portail de revues)
Contenu : Présente le modèle de revues électroniques fondées sur des dépôts ouverts, et discute comment les systèmes d’édition overlay favorisent l’accès libre aux publications scientifiques (modèle intrinsèquement lié à HAL/Épisciences).
L’utilisation de HAL par les laboratoires de recherche. Une étude qualitative.
Article HAL extrait via Épisciences (science ouverte technique)
Schöpfel, Joachim; Prost, Hélène; Jacquemin, Bernard; Kergosien, Éric; Thiault, Florence. (2023). L’utilisation de HAL par les laboratoires de recherche. Une étude qualitative. Journal of Data Mining and Digital Humanities (épirevue via Épisciences).
LIEN : 📄 Accès gratuit : https://doi.org/10.35562/balisages.1166
Contenu (FR) : Étude approfondie des pratiques des laboratoires scientifiques en matière de dépôt et usage de HAL, notamment l’intégration des métadonnées, la communication scientifique directe et l’impact des technologies numériques sur la diffusion des savoirs.
Harvesting Textual and Structured Data from the HAL Publication Repository. arXiv
Référentiel de données HAL pour l’IA et les réseaux
Kulumba, Francis, Antoun, Wissam, Vimont, Guillaume & Romary, Laurent. (2024). Harvesting Textual and Structured Data from the HAL Publication Repository. arXiv (prépublication, sciences de l’information).
LIEN : 📄 Accès gratuit : https://arxiv.org/abs/2407.20595
Contenu : Présente HALvest, un jeu de données qui relie le texte intégral et les citations des publications déposées dans HAL, montrant comment exploiter les données de HAL pour des tâches de modélisation, prédiction et apprentissage, y compris l’apprentissage de graphes cités.
Jeunesse de l’Université de Bouaké et socialisation à l’ère de l’intelligence artificielle.
Jeunesse et socialisation à l’ère de l’IA via Internet
Dagnogo, Gnéré Laeticia Blama & Samasse, Arrouna. (2022). Jeunesse de l’Université de Bouaké et socialisation à l’ère de l’intelligence artificielle. Communication, technologies et développement [En ligne], 11.
LIEN : https://journals.openedition.org/ctd/7529
Contenu : Étude empirique qui montre comment l’usage du smartphone et des applications intelligentes via Internet influe sur la socialisation des jeunes universitaires, entre opportunités pédagogiques et risques d’addiction.
La sauvegarde des libertés individuelles face à l’utilisation de l’intelligence artificielle.
Intelligence artificielle et liberté individuelle
Lapin, J. (2020). La sauvegarde des libertés individuelles face à l’utilisation de l’intelligence artificielle. Critique & technologie digitale [En ligne]
Contenu : Ce texte juridique examine les risques que les systèmes d’IA posent à la protection de la vie privée et aux libertés individuelles dans un contexte numérique en pleine expansion.
LIEN : 📄 Texte libre : https://journals.openedition.org/ctd/3192
Intelligence artificielle et e-démocratie : nouveaux droits, nouvelles exclusions. Communication, technologies et démocratie
Intelligence artificielle et e-démocratie : nouveaux droits
Konin, Alla Marcellin & Sam Beugré, N’Dré. (2024). Intelligence artificielle et e-démocratie : nouveaux droits, nouvelles exclusions. Communication, technologies et démocratie [En ligne]
Contenu (FR) : Cet article analyse comment l’essor de l’IA dans les espaces publics numériques transforme l’exercice des droits démocratiques tout en suscitant de nouvelles formes d’exclusion et de contrôle social.
LIEN : 📄 Texte libre : https://journals.openedition.org/ctd/11862
Enjeux éthiques et critiques de l’intelligence artificielle en enseignement supérieur.
Enjeux éthiques et critiques de l’IA en enseignement supérieur
Collin, Simon & Marceau, Emmanuelle. (2022). Enjeux éthiques et critiques de l’intelligence artificielle en enseignement supérieur.
LIEN : Éthique publique [En ligne], DOI: https://doi.org/10.4000/ethiquepublique.7619
Contenu (FR) : Cet article explore les enjeux éthiques (conception, données, usage) que soulève l’intégration de l’IA dans l’enseignement supérieur et montre l’importance d’une réflexion critique parallèle aux déploiements technologiques.
LIEN : 📄 Texte libre : https://journals.openedition.org/ethiquepublique/7619
Provably Robust Multi-bit Watermarking for AI-generated Text. 34th USENIX Security Symposium (USENIX Security ’25), Aug 13–15, 2025.
Traçabilité des contenus IA — watermarking robuste (open access)
Qu, Wenjie; Zheng, Wengrui; Tao, Tianyang; Yin, Dong; Jiang, Yanze; Tian, Zhihua; Zou, Wei; Jia, Jinyuan; Zhang, Jiaheng. (2025). Provably Robust Multi-bit Watermarking for AI-generated Text. 34th USENIX Security Symposium (USENIX Security ’25), Aug 13–15, 2025.
PDF gratuit : https://www.usenix.org/system/files/usenixsecurity25-qu-watermarking.pdf
Contenu : Propose un tatouage multi-bits pour textes générés par IA avec garanties de robustesse face à des modifications adversariales — pertinent pour provenance, modération et conformité.
A Comprehensive Survey on Post-Quantum TLS. IACR Communications in Cryptology, 1(2). DOI: 10.62056/ahee0iuc.
Sécurité Internet — migration TLS vers la cryptographie post-quantique (survey)
Alnahawi, Nouri; Müller, Johannes; Oupický, Jan; Wiesmaier, Alexander. (2024). A Comprehensive Survey on Post-Quantum TLS. IACR Communications in Cryptology, 1(2). DOI: 10.62056/ahee0iuc.
PDF gratuit : https://orbilu.uni.lu/bitstream/10993/61704/1/1-2-6.pdf
Description (FR) : Une référence majeure sur les options PQC pour TLS (auth, key exchange, AKE), avec taxonomie et analyses de performance — crucial pour l’avenir du Web sécurisé.
Federated Learning for IoT: A Survey of Techniques, Challenges, and Applications.
IoT + IA distribuée — survey open access sur le Federated Learning
Dritsas, Elias; Trigka, Maria. (2025). Federated Learning for IoT: A Survey of Techniques, Challenges, and Applications. Journal of Sensor and Actuator Networks, 14(1), Article 9. DOI: 10.3390/jsan14010009.
LIEN : https://www.mdpi.com/2224-2708/14/1/9
Description (FR) : Cartographie claire des techniques FL adaptées à l’IoT (hétérogénéité, bande passante, confidentialité), des défis et des cas d’usage concrets.
Performance Comparison of HTTP/3 and HTTP/2 with Proxy Integration. arXiv (version en HTML).
Protocoles web modernes — HTTP/3 (QUIC) vs HTTP/2 en contexte proxy
Liu, Fan; Farkiani, Behrooz; Dehart, John; Parwatikar, Jyoti; Crowley, Patrick. (2024). Performance Comparison of HTTP/3 and HTTP/2 with Proxy Integration. arXiv (version en HTML).
LIEN : https://arxiv.org/html/2409.16267v3
Description (FR) : Compare performances et comportements (pertes/latence/migration de connexion) de HTTP/3 vs HTTP/2 lorsqu’on introduit des proxies — utile pour comprendre l’Internet “réel” (CDN, mobiles, entreprises).
AutoWebGLM: A Large Language Model-based Web Navigating Agent. arXiv:2404.03648.
Agent web + benchmark bilingue — approche “web navigating” complète
Lai, Hanyu; Liu, Xiao; Iong, Iat Long; Yao, Shuntian; Chen, Yuxuan; Shen, Pengbo; Yu, Hao; Zhang, Hanchen; Zhang, Xiaohan; Dong, Yuxiao; Tang, Jie. (2024). AutoWebGLM: A Large Language Model-based Web Navigating Agent. arXiv:2404.03648.
LIEN : https://arxiv.org/abs/2404.03648
Description (FR) : Propose un agent de navigation web + méthode de simplification HTML + données d’entraînement “curriculum”, et introduit un benchmark bilingue pour tester la navigation réelle.
BrowserAgent: Building Web Agents with Human-Inspired Web Browsing Actions. arXiv:2510.10666.
Agents web (LLM) — navigation plus “humaine” dans le navigateur
Zhang, Zhengbo; Lyu, Zhiheng; Gong, Junhao; Yi, Hongzhu; Wang, Xinming; Zhou, Yuxuan; Yang, Jiabing; Nie, Ping; Huang, Yan; Chen, Wenhu. (2025). BrowserAgent: Building Web Agents with Human-Inspired Web Browsing Actions. arXiv:2510.10666.
LIEN : https://arxiv.org/abs/2510.10666
Description (FR) : Un agent web qui opère via des actions de navigateur (scroll/click/type) et une mémoire explicite, pour mieux résoudre des tâches de recherche d’information en environnement web dynamique.
RAGuard: A Layered Defense Framework for Retrieval-Augmented Generation Systems Against Data Poisoning. OpenReview (ResponsibleFM @ NeurIPS 2025).
Défense RAG contre l’empoisonnement — framework “layered”
Kolhe, Tanish; Kumar, Pushkal; Nielson, Tucker; Zala, Shubham; Li, Vincent; Saxon, Michael; Wu, Sean; Zhu, Kevin. (2025). RAGuard: A Layered Defense Framework for Retrieval-Augmented Generation Systems Against Data Poisoning. OpenReview (ResponsibleFM @ NeurIPS 2025).
LIEN : https://openreview.net/forum?id=onh7sLJ1kl (PDF : https://openreview.net/pdf/f7bd605a521e7fe5a23b34a2ef51659d26264d62.pdf)
Description (FR) : Propose une défense à deux étages (durcissement du retriever + filtre “zero-knowledge”) pour réduire l’Attack Success Rate tout en gardant une bonne qualité de retrieval.
Poisoning Attacks on Retrieval-Augmented Generation in Large Language Models. arXiv (cs.CR), arXiv:2505.19864.
Attaques sur RAG — empoisonnement “covert” (menace réaliste)
Li, Chunyang; Zhang, Junwei; Cheng, Anda; Ma, Zhuo; Li, Xinghua; Ma, Jianfeng. (2025). CPA-RAG: Covert Poisoning Attacks on Retrieval-Augmented Generation in Large Language Models. arXiv (cs.CR), arXiv:2505.19864.
LIEN : https://arxiv.org/pdf/2505.19864
Description (FR) : Montre comment des contenus empoisonnés peuvent manipuler la récupération et forcer des réponses-cibles, avec démonstrations sur plusieurs jeux de données et systèmes.
A Survey on Knowledge-Oriented Retrieval-Augmented Generation. arXiv (cs.CL), arXiv:2503.10677.
RAG orienté “connaissances” — taxonomie + évaluation
Cheng, Mingyue; Luo, Yucong; Ouyang, Jie; Liu, Qi; Liu, Huijie; Li, Li; Yu, Shuo; Zhang, Bohou; Cao, Jiawei; Ma, Jie; Wang, Daoyu; Chen, Enhong. (2025). A Survey on Knowledge-Oriented Retrieval-Augmented Generation. arXiv (cs.CL), arXiv:2503.10677.
LIEN : https://arxiv.org/abs/2503.10677
Description (FR) : Un état de l’art axé sur l’intégration de sources de connaissance (documents, bases, données structurées), les benchmarks et les limites d’alignement retrieval↔generation.
Retrieval-Augmented Generation: A Comprehensive Survey of Architectures, Enhancements, and Robustness Frontiers. arXiv (cs.IR), arXiv:2506.00054.
RAG (LLM + recherche web / bases documentaires) — grand panorama
Sharma, Chaitanya. (2025). Retrieval-Augmented Generation: A Comprehensive Survey of Architectures, Enhancements, and Robustness Frontiers. arXiv (cs.IR), arXiv:2506.00054.
LIEN : https://arxiv.org/abs/2506.00054
Description (FR) : Une synthèse structurée des architectures RAG, des optimisations (retrieval, filtrage, décodage) et des enjeux de robustesse face au bruit et aux attaques.