La gestion structurée de données volumineuses est un défi majeur dans le quotidien des laboratoires de recherche travaillant avec des données génomiques en agronomie, en santé, ou en écologie. Si certains chercheurs ont acquis la double compétence biologie/informatique, une bonne partie d’entre eux restent en difficulté face à des jeux de données grandissants, et manquent souvent de solutions pour les gérer sur le long terme. Depuis une dizaine d’années au sein du CIRAD, des applications web sont développées dans le but de répondre à cette problématique, en offrant des interfaces conviviales permettant d’importer de grands volumes d’informations dans des bases de données NoSQL, de les garder à disposition sous une forme centralisée, interrogeable, interopérable et partageable, et ainsi de les ré-exploiter de manière efficace.
C’est dans ce contexte qu’ont été conçus deux systèmes, en production depuis plusieurs années et utilisés par des chercheurs du monde entier :
– WIDDE (BMC Genomics 2015[1]), portail en ligne dédié à l’exploration de la diversité génétique des bovins, ovins, et caprins via la mise à disposition des génotypes caractérisant les races/populations à l’échelle mondiale;
– Gigwa (Gigascience 2016[2] et 2019[3], Methods in molecular biology 2022[4]), outil versatile de gestion, partage, exploration et analyse de données de génotypage à haut débit, avec focus sur l’interopérabilité.
Vous évoluerez au sein du CIRAD, rattaché.e à l’Unité Mixte de Recherche INTERTRYP en collaboration avec l’UMR AGAP Institut et en interaction avec des collaborateurs d’autres instituts (INRAe, IRD, Bioversity International) et filiales du Cirad (PalmElit), notamment à travers la plateforme de bioinformatique montpelliéraine South Green[5]. Dans un contexte pluridisciplinaire à la croisée de l’ingénierie logicielle, la science des données et la génomique, vous serez amené.e à contribuer à la pérennisation de ces systèmes en ayant pour rôles principaux :
– d’implémenter de nouvelles fonctionnalités (interfaces web, requêtes MongoDB avancées, calculs statistiques, visualisation de données, interopérabilité…) et maintenir les fonctionnalités existantes;
– de contribuer à l’identification d’outils existants qui pourraient avantageusement se greffer à nos systèmes (en amont ou en aval) et mettre en œuvre des procédures facilitant leur intégration;
– d’optimiser les solutions de conteneurisation existantes (Docker);
– de proposer des perspectives pour faciliter la diffusion et le déploiement des outils (haute disponibilité par réplication), notamment en mode Cloud ;
– d’accompagner la diffusion des outils auprès de collectifs d’utilisateurs de votre entourage Cirad, notamment dans le cadre de formations internes ou académiques.
Vous êtes en cursus d’alternance pour obtenir un diplôme d’ingénieur en informatique ou équivalent, avec une spécialité dans le développement d’applications web et/ou Java.
– Vous avez une capacité d’écoute et d’analyse du besoin permettant de proposer des solutions techniques adaptées ;
– Vous faites preuve d’aptitude au travail en équipe, disposez d’une aisance relationnelle et vous avez le sens du service ;
– Vous faites preuve de rigueur, de méthode, et avez une capacité à l’autonomie ;
– Vous avez le goût pour les applications informatiques à la biologie et l’analyse des génomes.
Compétences requises :
• Développement d’interfaces Web (Javascript, HTML, CSS);
• Développement objet (Java);
• Systèmes de gestion de bases de données;
• Architecture REST-API.
Compétences souhaitées :
• Notions de NoSQL;
• Développement d’applications client/serveur;
• Aptitude à communiquer en anglais, au moins à l’écrit.
Date limite : 20/06/2023
Postuler pour ce poste