Una escena tridimensional contiene información de objetos de interés de los que es necesario estimar posición y orientación. Nótese que la señal proveniente de una cámara no es solo un objeto bidimensional (una imagen), sino que incluye tres canales de color RGB, dos coordenadas de posición para los pixeles, seis parámetros que definen la pose de la cámara (tres de posición, y tres de orientación), y el tiempo. Además, un sistema de navegación visual puede incluir sensores tales como giróscopos y acelerómetros que incrementan el número de dimensiones del modelo del sistema de navegación. Así, es necesario procesar señales multidimensionales y/o multicomponente.
En este trabajo de tesis, se propone abordar el problema de navegación por retroalimentación visual usando métodos de procesamiento multi-dimensional. Se considerará un sistema sistema de formación de imágenes para cámaras con lentes de campo visual amplio (fisheye). Además, analizar técnicas de localización de características y reconstrucción de escenas tridimensionales dinámicas. Finalmente, se pretende desarrollar un algoritmo para la navegación de un robot móvil terrestre usando el modelo propuesto, donde la eficiencia computacional, la robustez frente a pérdida de características, y la fusión de datos aún son problemas abiertos.