La conférence ACM SIGMOD/PODS, la plus prestigieuse conférence en bases de données, vient de fermer ses portes à Providence aux États-Unis. Pour la première fois, dans le cadre de la conférence, un concours de programmation était organisé par Samuel Madden et Michael Stonebraker du MIT.
Le prix du concours de programmation a été attribué à Clément Genzmer, étudiant polytechnicien qui a choisi Télécom ParisTech/INFRES en double diplôme. Le prix est doté de 5000 USD.
L’objet du concours était le déploiement d’un système de gestion de données élémentaire (accès aux données, insertions, suppressions, gestion de transactions) fonctionnant entièrement en mémoire vive, ce système devant être le plus rapide possible. Toute latitude était laissée sur les choix techniques pour réaliser ce système.
Clément Genzmer a commencé à travailler sur le concours dans le cadre du mini-projet à réaliser pour le cours de Bases de données avancées, ce sujet étant proposé par les enseignants parmi d’autres. Il a ensuite poursuivi ce travail toute l’année, dans le cadre du cursus projet qu’il a effectué avec Pierre Senellart, enseignant chercheur au département Informatique et Réseaux.
15 participants (étudiants ou équipes d’étudiants) ont soumis leur déploiement fin mars 2009. Les organisateurs ont étudié les soumissions, et choisi les cinq déploiements les plus rapides parmi celles qui respectaient toutes les conditions. Ces finalistes ont été invités à participer à la conférence SIGMOD. Outre Clément, étaient finalistes des étudiants de l’ETHZ (Zurich, Suisse), de TU Dresden (Dresde, Allemagne), de l’UCI (Irvine, CA, USA) et de Wrocław (Pologne).
Les finalistes ont ensuite disposés de deux mois pour améliorer leur déploiement. Les organisateurs ont alors évalué ces soumissions, et choisi celle qui présentait les meilleures performances.
Clément a eu une approche très pragmatique et expérimentale, tout en programmant de manière très rigoureuse. Il a ainsi essayé plusieurs structures de données (arbres binaires de recherche, tables de hachage, etc.) afin de sélectionner la plus performante, et de l’adapter à la tâche. Il a fait preuve également de beaucoup d’indépendance et de créativité en proposant des variantes d’algorithmes bien établis. Chaque ajout ou modification de code était systématiquement évalué, et n’était conservé que ce qui apportait un gain significatif (en terme de rapidité, d’occupation mémoire, ou de stabilité).
La soutenance de cursus projet de Clément a lieu le jeudi 9 juillet 2009 à Télécom ParisTech ; il y abordera cette réalisation, et aussi les deux autres sujets sur lesquels il a travaillé durant son cursus projet (extraction de liens sociaux à partir de co-occurrences sur le Web, et réécriture de requêtes soumises à des moteurs de recherche pour gérer les ambiguïtés singulier/pluriel). Puis, Clément va partir en stage de fin d’étude chez Yahoo! à Londres.
Et qui sait, peut-être le retrouverons-nous à SIGMOD l’an prochain