News

Perception sémantique par analyse spatio-spectrale de la scène – sujet de thèse Centre de Robotique – Safran

Objectif

Dans le cadre de l’exploitation du MOBILEX CAOR Mines – Safran il est envisagé d’implémenter un système de perception sur une plate-forme mobile, permettant d’identifier les zones “franchissables” à résistance réduite et de fournir une cartographie de navigation englobant ces informations.

Il est privilégié d’identifier une technologie, une méthode et des algorithmes, afin de réaliser un dispositif indépendant des équipements du robot mobile et qui installé à bord, permettrait de caractériser seuls la franchissabilité de l’environnement.

La technologie envisagée est l’analyse multi/hyperspectrale d’image de la scène et la fusion avec l’analyse de l’image spatiale 2D ou 2D + profondeur.

Ce que nous cherchons n’est pas forcément une carte précise en tout point du parcours, mais plutôt d’identifier certaines zones, où la franchissabilité serait en-dessous d’un certain seuil et qui permettrait au robot mobile de passer.

La thèse s’articulera autour des travaux suivants :

  • État de l’art sur la perception des différents matériaux et leur degré de franchissabilité;
  • Identification de solutions de capture d’images spectrales et spatiales des catégories d’obstacles;
  • Évaluation des différentes méthodes d’analyse multi / hyperspectrale et fusion avec l’information spatiale pour la classification des obstacles selon leur “franchissabilité”;
  • Segmentation de scène et détection d’objets dans le domaine spatial avec leur positionnement et structure 3D.

 

Etat de l’art et obtention d’images exploitables

L’état des lieux sur l’imagerie multi/hyper spectrale permettra d’identifier les caractéristiques physiques déterminant la franchissabilité des matériaux qui composent les principales catégories d’obstacles (végétaux, minéraux, métalliques, pré-fabriqués, etc), susceptibles de bloquer la route du robot. De ces caractéristiques et des retours d’expérience de Safran et du CAOR/Mines sur la perception de l’environnement, des méthodes d’identification de matériaux par analyses d’image et machine learning seront à définir et à évaluer. Cet état des lieux sera complété d’un état des lieux de solutions embarquées à bord des robots mobiles de type off-road et AGV, basé sur le traitement d’image. Il permettra d’identifier et de définir les points critiques d’environnement à maîtriser.

Evaluation des différentes méthodes d’analyse hyperspectrale

Ce sujet de thèse se veut initialement ouvert et exploratoire. Il s’agira donc d’identifier un panel d’approches possibles, d’en caractériser la faisabilité et la fiabilité, ainsi que la capacité à être adaptées à l’environnement off-road et non-structuré (obstacles végétaux, rochers, artefacts, etc). A partir de cet état des lieux, la ou les solutions les plus prometteuses seront explorées plus profondément.

L’analyse hyperspectrale d’images étend les possibilités de l’analyse d’images classique, étant largement appliquée dans différents domaines d’application tels que l’imagerie spatiale, l’agriculture, l’industrie pharmaceutique et la médecine et finalement l’analyse chimique. La plupart des applications utilisant l’imagerie hyperspectrale relèvent de deux classes de traitements :

  • La détection et la classification des matériaux constituant chaque pixel de l’image de l’objet ;
  • La réduction de volume de bandes spectrales tout en minimisant les pertes d’information pour une vitesse de traitement accrue.

Les capteurs hyperspectraux fournissent des centaines de bandes spectrales par pixel, ce qui rend le traitement des images très coûteux en termes de calculs. Des méthodes de réductions de tailles des données sans pertes d’information pourront être abordées. Dans la plupart des cas le matériel observé est composé de plusieurs types de matériaux distincts, considérés « purs ». Chaque matériau distinct comporte une signature considérée comme étant « pure ». Une signature d’un matériau composite quelconque sera donc un assemblage de signatures « pures » (« endmembers ») de matériaux constituants. Différentes techniques de classification des pixels « hyperspectraux » ont déjà été utilisées, le plus souvent des mesures de distances ou probabilistes. L’ensemble des techniques qui se proposent de déterminer la décomposition en « endmembers » et leur proportion dans la signature analysée, se retrouve dans la littérature sous le nom de techniques de séparation de sources (« unmixing techniques »).

Des techniques de séparation linéaire de sources ont été utilisées avec succès pour améliorer la précision des différents algorithmes de classification des images hyperspectrales. Parmi les approches qui ont été proposées [7] pour une comparaison exhaustive, une attention particulière sera accordée aux algorithmes qui combinent la séparation linéaire des sources et les techniques éparses [8], ou les champs aléatoires de Markov [9] et les algorithmes de coupes de graphes [10], qui à eux seuls (sans séparation des sources) ont donné des résultats intéressants dans d’autres domaines de classification d’images.

Définition de la méthode retenue

Dans cette thèse, l’approche qui sera implémentée mettra l’accent sur la recherche des caractéristiques multi-dimensionnelles, dans le parallélépipède « 2D + lambda » (bande spectrale), qui nous permettrait de constituer une base de signatures « pures » correspondant aux différents types de matériaux composant les obstacles. Une base de caractéristiques multi-dimensionnelles sera donc créée à partir d’une collection d’images multi-spectrales, annotées et sélectionnées [11].

Par la suite, différentes techniques de classification par du deep learning et machine learning seront testées (AdaBoost, SVM ou Random Forests, etc.) afin de choisir les signatures « pures » qui caractérisent le mieux possible les obstacles et les matériaux qui les composent. L’apprentissage sera effectué donc sur une base d’images exemples pour chaque élément constituant d’obstacle, tandis que l’évaluation s’effectuera sur une vérité terrain constituée par des différents mélanges connus, d’éléments « purs ». Cette évaluation nous permettra de sélectionner l’algorithme d’apprentissage optimal pour notre application.

Evaluation de la solution

Cette dernière phase permettra d’évaluer la solution retenue. Sur la base des développements réalisés et des hypothèses prises en compte pour l’évaluation des obstacles, une évaluation multicritère de la “franchissabilité” sera réalisée. Elle permettra de caractériser les points suivants :

  • Fiabilité de détection des zones à faible adhérence
  • Capacité à être intégré dans un robot mobile off-road
  • Réponses aux objectifs de sûreté de fonctionnellement

Bibliographie:

[1]  Parente, M. and Plaza, A., Survey of geometric and statistical unmixing algorithms for hyperspectral 
images, in IEEE GRSS Workshop on Hyperspectral Image and Signal Processing: Evolution in Remote 
Sensing-WHISPERS’10, Reykjavik, Iceland, 2010.

[2] Imec introduces hyperpectral CMOS camera for snapshot and video”, EETimes February 2013, Julien Happich. ONLINE: http://www.electronics-eetimes.com/en/imec-introduces-hyperpectral-cmos-camera-for-snapshot-and -video.html?cmp_id=7&news_id=222915621#

[3] A. Plaza and C.-I. Chang, High performance computing in remote sensing. CRC Press Florida, 2007.

[4] A. Plaza, J. Plaza, A. Paz and S. Sanchez, “Parallel hyperspectral image and signal processing,” IEEE Signal Processing Magazine, vol. 28, no. 3, pp. 119-126, May 2011.

[5] S. Bernabe, S. Lopez, A. Plaza and R. Sarmiento, ‘GPU Implementation of an Automatic Target Detection and Classification Algorithm for Hyperspectral Image Analysis’, IEEE Geoscience and Remote Sensing Letters, accepted for publication, 2012

[6] US 2010/0056928 A1. Date: Mar.4, 2010. “Digital Light Processing Hyperspectral Imaging Apparatus”. K. Zuzak; J. Cadeddu; R. Ufret-Vincenty; R. Francis; E. Livingston.

[7] Dopido, I. ; Villa, A. ; Plaza, A. ; Gamba, P. “A Quantitative and Comparative Assessment of Unmixing-Based Feature Extraction Techniques for Hyperspectral Image Classification” IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, Volume: 5 , Issue: 2, 2012 , Page(s): 421 – 435.

[8] Le Sun ; Zebin Wu ; Zhihui Wei ; Jianjun Liu ; Xingxiu Li, “Supervised hyperspectral image classification combining sparse unmixing and spatial constraint”, 2012 International Conference on Computer Vision in Remote Sensing (CVRS), 2012 , Page(s): 110 – 115

[9] Eches, O. ; Benediktsson, J.A. ; Dobigeon, N. ; Tourneret, J.-Y., “Adaptive Markov Random Fields for Joint Unmixing and Segmentation of Hyperspectral Images” IEEE Transactions on Image Processing, Volume: 22 , Issue: 1, 2013 , Page(s): 5 – 16

[10] Jun Bai ; Shiming Xiang ; Chunhong Pan, “A Graph-Based Classification Method for Hyperspectral Images”, IEEE Transactions on Geoscience and Remote Sensing, Volume: 51 , Issue: 2, 2013 , Page(s): 803 – 817

[11] Daniel D. Lee & H. Sebastian Seung (1999). “Learning the parts of objects by non-negative matrix factorization”. Nature. 401 (6755): 788–791. Bibcode:1999 Natur.401..788L. doi:10.1038/44565. PMID 10548103. S2CID 4428232.

 

Contacts:

Bogdan Stanciulescu: MINES Paris PSL, bogdan.stanciulescu@minesparis.psl.eu

Paula Lakomicki, SAFRAN Electronics & Defense, paula.lakomicki@safrangroup.com

Christophe Guettier, SAFRAN Electronics & Defense, christophe.guettier@safrangroup.com

 

Cutting-Edge Neural Rendering for Automotive Applications – Postdoctorate position

Work Description: Join us in pioneering the future of 3D scene representation and rendering with Neural Radiance Fields (NeRF). Initially, NeRF models were resource-intensive to train, but recent advancements have significantly improved their efficiency. In the automotive industry, rapid and efficient inference is crucial. This project aims to push the boundaries of embedded Neural Networks by exploring their potential in new applicative domains.

Your mission will be to optimize Neural Rendering models to render the vehicle’s surrounding environment in real-time. We will place a special emphasis on the latest developments in NeRF technology, striving for a real-time architecture. Typically, speeding up NeRFs involves a trade-off with rendering precision. However, innovative approaches, such as dividing scenes into thousands of voxel grids with independent small NeRFs, are being explored to maintain visual quality while enhancing speed.

Key Responsibilities:

  • Develop and optimize Neural Rendering models for real-time applications.
  • Explore and implement efficient training methods on embedded hardware.
  • Collaborate with a dynamic team of researchers and industry experts.
  • Contribute to the advancement of state-of-the-art 3D scene representation technologies.
  • Specific application domain to be discussed face-to-face.

What We Offer:

  • A stimulating research environment at Mines Paris PSL University.
  • Collaboration with Forvia, a leader in the automotive industry.
  • Opportunities to publish and present your work at leading conferences.
  • A chance to make a significant impact on the future of automotive technology.

Qualifications:

  • PhD in Computer Science, Electrical Engineering, or a related field.
  • Strong background in Neural Networks and 3D rendering.
  • Experience with embedded systems is a plus.
  • Passion for innovation and problem-solving.

Join us in this exciting journey to revolutionize automotive technology with cutting-edge Neural Rendering solutions. Apply now and be a part of the future!

References:

  • Representing Scenes as Neural Radiance Fields for View Synthesis, Tancik et al., 2020
  • Instant Neural Graphics Primitives with a Multiresolution Hash Encoding, Müller et al., 2022
  • Neural Radiance Fields for Unconstrained Photo Collections (NeRF in the wild), Brualla et al., 2021
  • FastNeRF: High-Fidelity Neural Rendering at 200FPS, Garbin, Stephan J et al, arXiv preprint 2021
  • PlenOctrees for Real-time Rendering of Neural Radiance Fields, Alex Yu et al, 2021, ICCV 2021
  • Baking Neural Radiance Fields for Real-Time View Synthesis, Peter Hedman et al, ICCV 2021, https://nerf.live
  • KiloNeRF: Speeding up Neural Radiance Fields with Thousands of Tiny MLPs, Christian Reiser, ICCV 2021

Contacts:

Bogdan Stanciulescu: MINES Paris PSL: bogdan.stanciulescu@minesparis.psl.eu

Samer Ammoun: samer.ammoun@forvia.com

PhD defense of Louis SOUM-FONTEZ on “LiDAR-based domain generalization and unknown 3D object detection”

This thesis was realized under the direction of François Goulette and Jean-Emmanuel Deschaud of the Center of Robotics of Mines Paris – PSL.

The defense took place on Monday 10 March 2025 at Mines Paris – PSL.

Jury members:

  • NUCHTER Andreas, Professor at Wurtzbourg University – Rapporteur
  • CHECCHIN Paul, Professor at Clermont Auvergne University – Rapporteur
  • CHAMBON Sylvie, Professor at Institut de Recherche en Informatique de Toulouse (IRIT) – Examinatrice
  • GOULETTE François, Professor at ENSTA Paris – IP Paris – Thesis Director
  • DESCHAUD Jean-Emmanuel, Associate Professor at Mines Paris – PSL University – Thesis Co-Director

https://www.caor.minesparis.psl.eu/wp-content/uploads/2025/03/parisluco3d-700x400.jpg

Summary of the PhD thesis:

The development of robust perception systems is fundamental for the safe and efficient operation of autonomous vehicles. These systems perform essential tasks such as 3D object detection, enabling vehicles to identify and localize obstacles, including other vehicles, pedestrians, and various objects within their environment. Accurate detection is critical for effective decision-making and navigation through complex driving scenarios. However, 3D object detection presents significant challenges due to the diverse nature of real-world conditions, which encompass a broad range of sensor setups, geographic environments, and scene complexities.

Firstly, this thesis work identifies and addresses the domain shifts that occur between different LiDAR datasets due to variations in sensor specifications, geographic environments, and dataset-specific attributes. These shifts often lead to significant performance gaps when models are transferred between datasets. To mitigate these issues, a multi-dataset training framework called MDT3D is introduced. MDT3D integrates data from various sources and employs novel augmentation and label harmonization techniques to create models that can generalize effectively across different conditions.

Secondly, the thesis presents ParisLuco3D, a dataset captured in urban areas around the Luxembourg Garden in Paris, designed to test model robustness in complex real-world scenarios. This provides a dedicated dataset to test model generalization, which we benchmark to highlight the poor performance of baseline generalization methods.

Lastly, the last axis of generalization explored is generalizing detection to novel unknown objects. We reframe the detection of unknown objects as an out-of-distribution (OOD) problem, allowing models to differentiate between known and previously unseen objects without compromising accuracy on familiar categories.

Congratulations to Louis !!!

https://www.caor.minesparis.psl.eu/wp-content/uploads/2025/03/PXL_20250310_084048287-scaled-600x400.jpg
https://www.caor.minesparis.psl.eu/wp-content/uploads/2025/03/PXL_20250310_110136419-scaled-600x400.jpg

Best Paper Award conference WACV2025

Hugo Blanc (PhD Student at Mines Paris – PSL University), Jean-Emmanuel Deschaud (Associate Professor Mines Paris – PSL University), and Alexis Paljic (Professor Mines Paris – PSL University) received the Best Paper Award of the WACV2025 conference in Computer Vision.

This award recognizes the novelty of the method RayGauss on novel view synthesis. The project web page on RayGauss is: https://raygauss.github.io/

Read the Mines Paris communication article (in french)

PRIX INTERNATIONAL POUR LE CENTRE DE ROBOTIQUE

Silvère Bonnabel, professeur au Centre de Robotique (CAOR) de Mines Paris – PSL, a reçu, avec ses co-auteurs Martin Brossard et Axel Barrau, le « 2024 George N. Saridis Best Transactions Paper Award for Outstanding Research ». Ce prix de la revue IEEE Transactions on Intelligent Vehicles (T-IV) récompense leur article « AI-IMU Dead-Reckoning », en sélectionnant un article sur la période triennale 2020-2023.

La cérémonie de remise s’est tenue le 25 septembre 2024, lors de la conférence internationale IEEE International Conference on Intelligent Transportation Systems (ITSC)  à Edmonton, au Canada.

Lire l’article de la communication de l’Ecole.

RECRUTEMENT D’UN ENSEIGNANT-CHERCHEUR (H/F) CONFIRMÉ EN ROBOTIQUE MOBILE

(deadline de candidature le 25 avril 2024)

Dans le cadre de l’ouverture prochaine d’une extension à Versailles-Satory, le Centre de Robotique de Mines-Paris PSL recrute un enseignant-chercheur (H/F) *confirmé* (≥10 ans après la thèse) permanent en Robotique mobile. Il/elle sera chargé-e de développer la recherche et les partenariats industriels spécifiquement pour les véhicules automatisés «off-road», notamment au sein de l’écosystème du plateau de Satory, centré sur des thématiques en lien avec la défense, avec des industriels tels que Nexter et Arquus, mais aussi potentiellement pour le BTP, pour l’agriculture, et pour l’intervention en milieu sinistré. Véhicule « off-road » est à comprendre d’abord au sens de voiture ou robot, ou engin de chantier terrestre tout terrain se déplaçant hors-route (chemin de terre, champs, forêt, zones détruites/abandonnées, chantier de BTP, …), mais pourrait aussi potentiellement concerner/impliquer des drones, ou robots marcheurs.
Les recherches devront comporter une composante de partenariat industriel, logiquement avec les acteurs du plateau de Satory, mais aussi avec d’autres comme Safran qui est déjà un partenaire important du centre. La thématique académique peut relever des algorithmes de Perception, et/ou ceux de Planification, et/ou ceux de Contrôle (voire la boucle robotique complète).

Le poste est un CDI de droit public de chargé ou directeur de recherche (selon expérience et détention ou non de l’HdR) de l’EPSCP MinesParis (ou peut, pour un-e candidat-e fonctionnaire de l’enseignement supérieur et recherche, être à terme un détachement dans un corps des enseignants de l’Institut Mines Telecom).

Profil
– Doctorat dans un domaine proche des algorithmes pour le véhicule intelligent ou la robotique mobile ;
– Expérience de Recherche d’au moins une dizaine d’années dans ces domaines ;
– Idéalement titulaire d’une Habilitation à Diriger des Recherche (HdR), ou prêt à la passer à très court terme

Cliquer ici pour la fiche de poste complète.