← Retour aux offres

Poste d'ingénieur.e en science des données au sein de l'équipe Pl@ntNet (Cirad / Inria)

Postée le 16 jan.

Lieu : Montpellier · Contrat : CDD · Rémunération : 27-37K selon expérience €

Société : Pl@ntNet (Cirad)

Le Cirad (Centre de Coopération Internationale en Recherche Agronomique pour le Développement) produit et transmet de nouvelles connaissances pour accompagner l'innovation et le développement agricole dans les pays du Sud avec ses partenaires.
Au sein de l'UMR AMAP (plus particulièrement de l'équipe en charge de la plateforme Pl@ntNet), en étroite collaboration avec l'EPI Inria Zenith basée au LIRMM, et les membres du consortium du projet européen MAMBO, la personne recrutée sera en charge de l'expérimentation et du développement de nouvelles approches pour la caractérisation automatisée de communautés végétales à partir d'analyses visuelles. Ces travaux s'inscrivent dans le cadre des recherches menées à la frontière entre sciences informatiques et sciences du végétal, menées depuis plus d'une vingtaine d'années sein du laboratoire.

Description du poste

La personne recrutée sera en charge du développement, de l'évaluation et de la mise à disposition de modèles profonds pour l'analyse d'images de communautés végétales. Ce travail vise à caractériser de manière automatique la biodiversité végétale à très large échelle spatiale et taxonomique (au niveau européen) à travers l'élaboration de nouvelles métriques. Il sera développé en partenariat avec l'Inria d'une part, avec lequel l'unité collabore depuis plus d'une douzaine d'années, ainsi qu'avec les partenaires du projet MAMBO (plus d'une dizaine en tout, dont l'univ. d'Aarhus (DK), l'Univ. d'Amsterdam (NL), Naturalis (NL), le CEH (UK)) spécialisés dans le développement de nouvelles méthodes pour la caractérisation de la biodiversité à partir de données multimédias.

Les principales activités de la personne recrutée porteront sur :
. l'analyse des besoins des partenaires et des usagers finaux,
. la définition de protocoles expérimentaux visant la comparaison de différents modèles de deep learning pour répondre aux besoins,
. la structuration de vastes corpus de données visuelles, fournies par les partenaires ou disponibles au travers de bases de données internationales. Cela inclut toutes les étapes de la chaine de traitement suivante : vérification de la cohérence, nettoyage, pré-traitement des données en fonction de leur typologie, normalisation, annotation automatique, importation,
. L'entrainement et l'évaluation de modèles de classification automatisée sur des clusters régionaux (MesoLR) et nationaux (Jean Zay),
. la diffusion des résultats obtenus sous forme d'articles, de présentations, de posters, etc.).
. la rédaction de la documentation pour le transfert et le réentrainement des modèles développés.

Profil recherché

Compétences techniques et niveaux requis :

. Expertise en machine learning (plus particulièrement Deep learning), et bonnes connaissances du framework Pytorch,
. Expertise en gestion / exploitation large volumes de données multimédias,
. Expérience de la programmation scripts sous serveurs Linux (Bash, Python)
. Expérience dans l'utilisation de systèmes de gestion de versions de code (GitLab, GitHub)

. Connaissance en développement Web (HTML / CSS / JavaScript),

. Langues : Français / Anglais

. Compétences relationnelles : Autonomie, curiosité intellectuelle, capacité à travailler de manière collaborative et interdisciplinaire, avec des partenaires de cultures étrangères.

Pour postuler :

https://recrutement.cirad.fr/offre-de-emploi/emploi-ingenieur-e-en-science-des-donnees_6994.aspx