
In uno studio recente, ricercatori cinesi hanno sviluppato un sistema LiDAR su chip-scala che imita la foveazione dell'occhio umano concentrando dinamicamente il rilevamento ad alta-risoluzione sulle regioni di interesse (ROI) mantenendo un'ampia consapevolezza nell'intero campo visivo.
Lo studio è pubblicato sulla rivistaComunicazioni sulla natura.
I sistemi LiDAR alimentano la visione artificiale di auto-a guida autonoma, droni e robot emettendo raggi laser per mappare scene 3D con precisione millimetrica. L'occhio concentra i suoi sensori più densi nella fovea (punto visivo centrale nitido) e sposta lo sguardo su ciò che è importante. Al contrario, la maggior parte dei LiDAR utilizza raggi paralleli rigidi o scansioni che diffondono ovunque una risoluzione uniforme (spesso grossolana). Aumentare i dettagli significa aggiungere più canali in modo uniforme, il che fa esplodere costi, potenza e complessità.
Il progetto del team raggiunge una risoluzione angolare "oltre-retinale" di 0,012 gradi nelle ROI-due volte più nitide del limite di circa 0,017 gradi dell'occhio. Ciò significa che il sistema è in grado di distinguere punti separati dagli angoli più piccoli, come quando si individuano i dettagli più fini su un segnale stradale distante. Rialloca i canali di rilevamento paralleli su richiesta, evitando costosi ridimensionamenti a forza bruta.
Phys.org ha parlato con i co-autori dello studio, Ruixuan Chen e Xingjun Wang, della Scuola di elettronica dell'Università di Pechino.
"La motivazione deriva da una discrepanza pratica tra la percezione biologica e quella della macchina", hanno spiegato i ricercatori. "L'occhio umano raggiunge un'elevata acutezza ed efficienza energetica ridistribuendo l'attenzione-mantenendo un'ampia consapevolezza e concentrando le risorse su ciò che conta. Al contrario, la risoluzione LiDAR è spesso perseguita da "più canali ovunque", il che diventa rapidamente costoso e assetato di energia-."
Il problema del ridimensionamento
I sistemi di visione artificiale si sono espansi oltre le telecamere tradizionali per includere sensori LiDAR, che consentono una misurazione precisa della distanza e una percezione ambientale 3D. A differenza delle telecamere passive, tuttavia, LiDAR richiede hardware di emissione e ricezione per ogni pixel, limitando la risoluzione ottenibile.
Gli attuali approcci per migliorare la risoluzione LiDAR si trovano ad affrontare un collo di bottiglia critico. La duplicazione dei canali offre guadagni di risoluzione lineare ma innesca esplosioni superlineari in complessità, potenza e costi.
"In primo luogo, la risoluzione è strettamente legata al conteggio dei canali hardware e ai meccanismi di scansione. In secondo luogo, LiDAR è un sensore attivo: ogni pixel costa effettivamente sia risorse di trasmissione che di ricezione", hanno spiegato i ricercatori. "Ciò rende la messa a fuoco adattiva fondamentalmente più difficile rispetto all'imaging passivo, perché è necessario gestire la potenza ottica, la sensibilità del ricevitore e la larghezza di banda della digitalizzazione rispettando i vincoli di-sicurezza degli occhi."
Per i LiDAR a onda continua modulata in frequenza- coerente, questa sfida è particolarmente impegnativa. Ciascun canale coerente richiede un controllo stabile della frequenza, un hardware di ricezione sofisticato e una calibrazione rigorosa. Ciò rende la massiccia duplicazione dei canali molto più difficile da giustificare economicamente.
Una soluzione biomimetica
La soluzione dei ricercatori combina due tecnologie chiave. Questi includono un agile laser a cavità esterna (ECL) con una gamma di sintonizzazione di oltre 100 nm e pettini di frequenza elettro-ottici riconfigurabili costruiti su piattaforme di niobato di litio a film sottile (TFLN).
L'ECL fornisce segnali chirp FMCW di alta-qualità per una portata coerente e agisce come un meccanismo di guida del raggio-controllato dalla lunghezza d'onda-. Sintonizzando la lunghezza d'onda centrale, il sistema può reindirizzare rapidamente la direzione di visione all'interno di un ampio campo visivo.
Il pettine elettro-ottico genera quindi più portanti FMCW parallele dalla stessa sorgente laser con segnale acustico. Fondamentalmente, la regolazione delle condizioni di trasmissione in radiofrequenza modifica la spaziatura del pettine.
"Questo è ciò che consente lo 'zoom'-possiamo aumentare la densità di punti in una regione selezionata (campionamento più fine) o rilassarla (campionamento più grossolano) senza cambiare l'ottica o aggiungere canali," hanno aggiunto i ricercatori.
Il sistema utilizza quello che i ricercatori chiamano "micro-parallelismo". Ciò significa utilizzare un numero moderato di canali fisici per ottenere l'equivalente di molte più linee di scansione attraverso il riposizionamento dinamico.
Validazione sperimentale
Il team ha dimostrato le capacità del sistema in tre scenari sperimentali, ottenendo una risoluzione angolare di 0,012 gradi nelle regioni focalizzate-superando il limite nominale della retina umana.
Nell'imaging di scene statiche, il sistema ha catturato un ambiente stradale simulato con risoluzioni di 54 x 71 pixel per scansioni a campo completo-of-view e 17 x 71 pixel per scansioni focalizzate localmente. Queste scansioni mirate hanno quadruplicato la densità dei dettagli verticali, rivelando ostacoli precedentemente invisibili, con il 90% dei punti precisi fino a meno di 1,3 cm.
I ricercatori hanno anche dimostrato la fusione delle fotocamere LiDAR-, creando nuvole di punti colorate che combinano una geometria 3D precisa con dati sull'aspetto RGB. Confrontando le scansioni standard con quelle focalizzate, l'allineamento dell'istogramma del colore è migliorato di circa il 10%, indicando una migliore corrispondenza tra punti 3D e pixel dell'immagine.
"Fondendo LiDAR con una fotocamera, generiamo nuvole di punti colorate e arricchiamo la rappresentazione della scena, il che migliora l'interpretabilità e supporta compiti di percezione a valle che dipendono dalla trama e dai segnali semantici", hanno spiegato i ricercatori.
L'aspetto forse più impressionante è che il team ha catturato-in tempo reale immagini 4D-più immagini-di un lancio di pallacanestro in cui ogni punto mostrava contemporaneamente posizione, velocità di rotazione, riflettività della superficie e colore. A 8 Hz su un ampio campo visivo, questo ha rivelato schemi di movimento invisibili al LiDAR 3D standard.
Il lavoro sperimentale ha rivelato importanti compromessi a livello di sistema-che informano i futuri percorsi di sviluppo.
"Quello più chiaro è la tensione tra la risoluzione angolare e il margine di misurazione per-canale", hanno osservato i ricercatori. "Nella nostra lettura coerente parallela, ciascun canale deve occupare la propria banda elettrica non-sovrapposta. Quando riduciamo la frequenza di ripetizione, possiamo effettivamente spingere il campionamento angolare più fine, ma l'esperimento mostra che questo comprime anche la larghezza di banda di lettura per-canale."
Il team ha identificato diverse direzioni prioritarie per far avanzare la tecnologia verso l'implementazione pratica. Questi includono un'integrazione monolitica più profonda sulle piattaforme TFLN, lo sviluppo di sorgenti a banda ultra-larga per una migliore risoluzione della portata e l'implementazione di policy di attenzione-a circuito chiuso per la percezione guidata dagli eventi-.
Gli attuali esperimenti che utilizzano collegamenti in fibra introducono un'instabilità di polarizzazione che limita le capacità di classificazione dei materiali.
"Tuttavia, prevediamo che l'integrazione monolitica risolverà radicalmente questo collo di bottiglia", hanno affermato i ricercatori. "Passando da percorsi in fibra instabili a guide d'onda confinate su-chip, possiamo ottenere un recupero stabile della polarizzazione."
Il sistema LiDAR bionico offre potenziali applicazioni che abbracciano veicoli autonomi, droni aerei e marini, robotica e sistemi di visione neuromorfica. Secondo i ricercatori, oltre al LiDAR, i pettini riconfigurabili consentono una rapida analisi spettrale per le comunicazioni ottiche, la tomografia a coerenza, il rilevamento della compressione e la metrologia di precisione.









