Livenson NICOLAS
Un system paper fondé sur une architecture RAG multi-agents pour l’agriculture intelligente
Résumé
En Haïti, environ 70 % des agriculteurs subissent chaque année des pertes importantes liées aux maladies des cultures et aux infestations des fruits, en partie faute d’outils d’aide à la décision adaptés. Dans ce contexte, nous présentons un tuteur numérique, développé dans le cadre du projet Deep Farm, combinant intelligence artificielle et expertise agronomique. Le système repose sur une architecture Retrieval-AugmentedGeneration (RAG) modulaire et une orchestration multi-agents coordonnant plusieurs expertises complémentaires : diagnostic visuel par réseaux de neurones, données météorologiques contextualisées et connaissances agronomiques documentées. Les expérimentations réalisées durant le stage montrent un niveau de maturité fonctionnelle très élevé des composantes RAG et orchestration, ainsi qu’une capacité à produire des recommandations traçables et contextualisées. La qualité de génération finale demeure limitée par l’utilisation de modèles de langage compacts, mais l’architecture proposée constitue un socle robuste, évolutif et réplicable, pertinent pour renforcer la résilience des systèmes agricoles face aux contraintes climatiques et sanitaires.
1. Introduction – Quand l’intelligence artificielle devient le partenaire des agriculteurs haïtiens
L’agriculture haïtienne traverse une phase critique, marquée par une convergence de contraintes environnementales, économiques et sanitaires. Le réchauffement climatique, la variabilité des régimes pluviométriques, la raréfaction des ressources en eau et la vulnérabilité des systèmes de production tropicaux fragilisent durablement les moyens de subsistance des producteurs. Dans ce contexte, la filière mangue – pilier économique pour de nombreuses familles rurales – se trouve particulièrement exposée. Les maladies phytosanitaires, notamment l’anthracnose, peuvent anéantir des récoltes entières lorsque les décisions de surveillance et de traitement sont tardives, tandis que l’accès à une expertise agronomique et phytosanitaire qualifiée demeure limité pour une large majorité d’agriculteurs.
Cette situation locale s’inscrit dans une dynamique globale documentée par les organisations internationales. Les projections de la FAO soulignent la nécessité d’augmenter significativement la production agricole à l’horizon 2050 afin de répondre à la demande alimentaire, dans un contexte où la pression sur les ressources, en particulier l’eau, devrait s’intensifier malgré les gains d’efficacité anticipés. À cela s’ajoute l’enjeu climatique : le secteur agricole contribue de manière substantielle aux émissions mondiales de gaz à effet de serre, imposant une transformation des modes de production afin de concilier productivité, durabilité et résilience.
Face à ces défis, l’agriculture intelligente (Smart Agriculture) s’impose comme une voie stratégique. En mobilisant l’intelligence artificielle, l’analyse de données et des systèmes d’aide à la décision, elle vise à optimiser les rendements, réduire les pertes, améliorer la gestion des intrants et préserver les ressources naturelles. Dans les pays en développement, ces approches revêtent une importance particulière car elles peuvent compenser partiellement le déficit d’expertise et de services de conseil, à condition de rester accessibles et contextualisées.
C’est dans cette perspective que s’inscrit le projet Deep Farm, consortium international réunissant douze institutions, dont l’ESTIA (France) et l’ESIH (Haïti), soutenu par le programme Erasmus+ de l’Union européenne. L’objectif central de ce travail est de proposer un tuteur numérique capable d’assister les producteurs dans la détection précoce des maladies et la prise de décision agronomique, en combinant vision par ordinateur, bases de connaissances agronomiques et orchestration multi-agents.
La question directrice est alors la suivante : comment transformer ces technologies en un outil réellement opérationnel pour des producteurs de terrain, parfois peu familiarisés avec les outils numériques, tout en garantissant des recommandations rigoureuses, contextualisées et exploitables dans des conditions de production contraintes ? Ce system paper, issu d’un travail de stage de Master 2, propose une réponse à travers une architecture centrée sur la culture de la mangue Madame Francisque, réplicable à n’importe quelle culture.
2. Méthodologie – Une architecture modulaire au service de l’intelligence collective
Le système combine deux familles d’approches complémentaires : (i) un pipeline RAG conçu comme moteur de preuves agronomiques et (ii) une orchestration multi-agents permettant de mobiliser des expertises hétérogènes de façon dynamique. Cette approche vise à dépasser les limites des solutions monolithiques ou mono-agent fréquemment rencontrées dans la littérature agricole [2], [3].
2.1. Le RAG modulaire : un moteur de recherche de connaissances agronomiques
Au cœur du dispositif, le RAG est conçu comme un retriever orienté preuves [2] : il n’invente pas des faits, mais extrait et structure des passages issus d’un corpus validé. Cette séparation entre extraction de preuves et génération est motivée par l’objectif de réduire les hallucinations et d’améliorer la traçabilité des recommandations [9].
Le pipeline s’organise autour des étapes suivantes :
- Acquisition et traçabilité
Chaque document (articles scientifiques, guides techniques institutionnels) est enregistré avec ses métadonnées. Une empreinte numérique est utilisée afin de limiter les doublons et de faciliter l’audit du corpus. - Extraction et nettoyage
Le texte est extrait depuis des formats hétérogènes (PDF, HTML) à l’aide d’outils adaptés (PyMuPDF, BeautifulSoup). Un mécanisme OCR de secours permet de traiter les documents numérisés. Le nettoyage vise à supprimer les artefacts (en-têtes, sommaires, références parasites). - Découpage en passages (chunking)
Les documents sont segmentés en passages de taille contrôlée (environ 384 tokens, avec un chevauchement de 128), en respectant autant que possible les limites de phrase afin de préserver la cohérence sémantique. - Indexation hybride (lexicale et sémantique)
La recherche lexicale repose sur PostgreSQL avec BM25, tandis que la recherche sémantique est assurée par Milvus à partir de vecteurs d’embeddings produits par le modèle intfloat/multilingual-e5-large-instruct (1024 dimensions), retenu pour sa robustesse en français et sa capacité multilingue [7]. - Recherche et synthèse de preuves
Pour une requête donnée, les deux modes de recherche sont combinés, puis des filtres métiers (culture, variété, zone géographique, stade phénologique) sont appliqués. La sortie prend la forme d’une synthèse structurée de points clés accompagnés de leurs références.
Le paramètre top-k = 4 a été retenu comme compromis entre précision du retrieval et latence, avec une réduction de latence observée d’environ 35 % par rapport à une configuration initiale à top-k = 8.
2.2. Orchestration multi-agents
Si le RAG constitue le socle documentaire, l’orchestrateur représente la couche décisionnelle. Développé avec LangGraphet adossé à Redis pour la persistance des états, il coordonne plusieurs agents spécialisés :
- Agent Vision : analyse d’images (feuilles et fruits) via des modèles CNN afin de proposer des hypothèses de maladies assorties de scores de confiance.
- Agent Météo : interrogation de l’API OpenWeather à partir des coordonnées GPS afin de fournir des informations météorologiques contextualisées.
- Agent RAG-Proof : extraction des preuves documentaires sans génération de texte final.
- Agent Phénologie : ajustement des recommandations en fonction du stade de développement de la culture.
- Agent Maladie : expertise phytosanitaire dédiée à l’interprétation des symptômes et à la formulation de recommandations de gestion.
L’orchestrateur détecte l’intention de la requête utilisateur, planifie dynamiquement l’activation des agents (de manière conditionnelle), gère les erreurs et fusionne les sorties afin de produire une recommandation structurée et explicite.
2.3. Interopérabilité et robustesse
Le système intègre le Model Context Protocol (MCP) afin de standardiser les échanges entre agents et de faciliter l’ajout ou le remplacement de composants sans refonte architecturale. Une stratégie de dégradation contrôlée est mise en œuvre : en cas d’indisponibilité partielle (par exemple du diagnostic visuel), le système fournit une réponse fondée sur les ressources disponibles et signale explicitement les limites de la recommandation.
2.4. Experimental setup
Les expérimentations ont été réalisées sur un poste de travail de type desktop (CPU 32 cœurs, GPU 16 Go VRAM, système d’exploitation Windows). Le corpus documentaire comprend entre 80 et 120 documents (articles scientifiques et guides techniques), en français et en anglais, sélectionnés et validés par deux ingénieurs agronomes impliqués dans le projet.
L’évaluation repose sur un ensemble de scénarios couvrant trois types de requêtes : texte seul, image associée à des coordonnées GPS, et requêtes complexes impliquant plusieurs agents. Environ 20 requêtes ont été testées par scénario, avec une évaluation qualitative réalisée conjointement par l’auteur et les agronomes partenaires.
3. Résultats – Performances et enseignements
Les expérimentations montrent une architecture fonctionnelle et robuste, tout en mettant en évidence des limites liées aux contraintes matérielles et à l’utilisation de modèles de langage compacts.
Le pipeline RAG présente un niveau de maturité fonctionnelle très élevé, permettant l’extraction cohérente de preuves agronomiques pertinentes. L’orchestration multi-agents s’est révélée efficace pour coordonner les expertises selon les scénarios testés. Les temps de réponse varient selon la complexité des requêtes, de quelques dizaines de secondes pour les cas simples à plusieurs minutes pour des requêtes multi-agents complexes.
La génération finale repose sur le modèle phi-4-mini-instruct, qui offre une bonne stabilité mais limite la richesse explicative des réponses lorsque de nombreux contextes doivent être intégrés simultanément.
4. Discussion – Positionnement scientifique et limites
Les travaux récents en agriculture intelligente montrent l’intérêt croissant du RAG et des assistants numériques spécialisés (par ex. AgroLLM, AgriGPT). Toutefois, peu de systèmes décrits dans la littérature combinent explicitement un RAG orienté preuves avec une orchestration multi-agents dynamique et une stratégie de dégradation contrôlée.
Les principales contributions de ce travail résident dans :
(i) une architecture multi-agents opérationnelle adaptée à un contexte agricole contraint,
(ii) une séparation claire entre retrieval et génération, améliorant la traçabilité,
(iii) l’intégration d’un protocole d’interopérabilité (MCP), et
(iv) une validation agronomique intégrée dès la conception.
Les limites concernent principalement l’absence de fine-tuning spécifique, la latence variable pour les requêtes complexes et l’évaluation quantitative encore limitée, qui constituent des axes prioritaires pour des travaux futurs.
5. Conclusion
Ce system paper montre qu’il est possible de concevoir un tuteur numérique fondé sur une architecture RAG multi-agents, capable de fournir des recommandations agronomiques contextualisées et traçables pour la culture de la mangue en Haïti. Bien que limité par l’usage de modèles de langage compacts et l’absence de déploiement terrain à ce stade, le système proposé constitue une base solide et évolutive pour des développements ultérieurs et un futur déploiement auprès des producteurs.
Références bibliographiques
[1] Nicolas, L. (2025). Système RAG Multi-Agents pour l’Agriculture Intelligente : application à la culture de mangue Madame Francisque en Haïti. Rapport de stage (Master eBIHAR), ESTIA-TECH & ESIH.
[2] Lewis, P., et al. (2020). Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks. NeurIPS, 33.
[3] Wooldridge, M. (2009). An Introduction to MultiAgentSystems. Wiley.
[4] Park, J. S., et al. (2023). Generative Agents: Interactive Simulacra of Human Behavior. ACM UIST.
[5] Russell, S., & Norvig, P. (2021). Artificial Intelligence: A Modern Approach (4th ed.). Pearson.
[6] Hofstätter, S., et al. (2021). Improving Efficient Neural Ranking Models with Cross-Architecture Knowledge Distillation. Information Retrieval Journal.
[7] Luan, Y., et al. (2021). Sparse, Dense, and Attentional Representations for Text Retrieval. TACL.
[8] Borgeaud, S., et al. (2022). Improving Language Models by Retrieving from Trillions of Tokens. ICML.
[9] Ram, O., et al. (2023). In-Context Retrieval-Augmented Language Models. arXiv.
[10] Gao, L., & Callan, J. (2022). Unsupervised Corpus Aware Language Model Pre-Training for Dense Passage Retrieval. ACL.
Livenson NICOLAS
Projet Deep Farm (Erasmus+)
École Supérieure d’Infotronique d’Haïti
ESIH
livenson.nicolas@esih.edu



























