Características de la Imagen
Transcripción
Características de la Imagen
Características de la Imagen de la Imagen Curso Visión Artificial ¿Que es una Imagen? ¿Que es una Imagen? • una una imagen continua en Visión Artificial es imagen continua en Visión Artificial es una proyección de la realidad en un plano de la realidad La propiedad más común es la la realidad. La propiedad más común es la intensidad de la luz reflejada • Esa imagen continua debe ser muestreada Esa imagen continua debe ser muestreada para poder usar procesamiento discreto. ¿Cómo muestreo espacialmente? ¿Cómo muestreo espacialmente? • Teorema Teorema de muestreo de Shannon: de muestreo de Shannon: Sea una Sea una señal bidimensional de que representa una imagen continua con anchos de banda U and V en las direcciones del eje x y del eje y respectivamente. Es posible reconstruir fc(x,y) con exactitud perfecta de sus muestras i d f d fc(jΔx,kΔy) es Δx <1/2U y Δy < 1/2V • Problemas de muestreo resultan en Aliasing. P bl d l Ali i Ejemplo, el tablero de ajedrez La cuantificación de la Intensidad La cuantificación de la Intensidad • Los Los valores de traducción de la energía valores de traducción de la energía luminosa se deben cuantificar para digitalizar la imagen la imagen • Cuantificación es el mapeo de la intensidad en una imagen continua a un conjunto de 2b una imagen continua a un conjunto de 2 valores donde b es el número de bits de representación de la intensidad representación de la intensidad Cuantificación(Cont.) • Por Por ejemplo, los valores típico según el tipo de ejemplo los valores típico según el tipo de imágenes b=1 (imagen binaria), b=8 (256 colores o niveles de gris) y b=24 colores o niveles de gris) y b=24 (224=16,777,216 colores) • Cuantificadores no tienen que ser lineales Cuantificadores no tienen que ser lineales Modelos de Colores Modelos de Colores • Un Un modelo de color consiste de una modelo de color consiste de una especificación de tres componentes para representar un color específico Siendo que representar un color específico. Siendo que existen varios sets of que pueden ser bases para creación de colores como una función 3D para creación de colores como una función 3D • Algunos modeles usan los 3 colores primarios otros usan propiedades como intensidad y la otros usan propiedades como intensidad y la saturación Modelos de Colores(Cont.) Modelos de Colores(Cont.) • RGB Aditivo: – Todo color visible puede ser representado como una suma ponderada de las 3 componentes primarias rojo (Red), verde (Green) y azul (Blue) (Red), verde (Green) y azul (Blue) – Ejemplo: (255,0,0) es rojo saturado; (150,150,50) es amarillo pastel,(25,25,25) es gris oscuro • CMY(K) Substractivo: CMY(K) S b t ti – El sistema CMY (Cian(Cyan), Magenta, Amarillo(Yellow)) trabaja sobre esta base Amarillo(Yellow)) trabaja sobre esta base – Adicionalmente K es el nivel de Negro(absorción). Modelos de Color(Cont.) Modelos de Color(Cont.) • Modelo substractivo Modelo substractivo • HSI: S – Hue son las longitudes de onda dominante en el color. Saturación l ó es la fuerza relativa del color l f l d l l respecto de la base blanca. Intensidad es el brillo. Topología de la Imagen Topología de la Imagen • Conexionismo – Un blob es un conjunto de pixeles. Una propiedad fundamental es el número y forma de sus blobs. – Un conjunto de pixeles está conectado si ellos están Un conjunto de pixeles está conectado si ellos están adyacentes. – Blobs son frecuentemente, pero no siempre conjuntos conectados de pi eles conectados de pixeles. – Las 2 maneras más comunes de definir adyacencia son: 4‐vecindad: pixeles que tocan en dirección vertical u horizontal; • 8‐vecindad: pixeles que tocan en dirección vertical u horizontal o diagonal horizontal o diagonal. • Topología de la Imagen(Cont.) Topología de la Imagen(Cont.) • Paradoja de las conexiones Paradoja de las conexiones • Las distancias: di i – City block : el menor número de pasos h horizontales/verticales. l / l – Chessboard : el menor número de pasos h i t l / ti l /di horizontales/verticales/diagonales. l – Euclideana : distancia recta entre los centros Chamfering y distancias y distancias • Menor Menor distancia de cada pixel a un blob distancia de cada pixel a un blob específico Medidas de resumen Medidas de resumen • Histograma es un registro del número de pixeles de cada uno de los niveles cuantizados de brillo(grayscale). En el caso de las imágenes de color se producen 3 • En el caso de las imágenes de color se producen 3 histogramas, uno por cada componente de color. • 4x4 3‐bit imagen monocromático – – – – • 6 2 4 6 7 6 6 6 3 1 1 6 0 0 0 0 0 Histograma h(i), i=0,...,7: [ 4 2 1 1 1 0 6 1 ] Estructuras de datos Estructuras de datos • Matrices: at ces: – La estructura más común para almacenar imagenes son los arreglos bidimensionales, es decir las matrices, cuyos valores comúnmente representan el ti l ú t t l brillo de los pixeles. Para una imagen de n filas por m columnas, – M: {1,..,n}x{1,...,m} ‐> V. V=B={0,1}: imagen binaria – V={0,...,2 V {0 2b‐1}: b bit imagen de intensidad (escala 1} b bit i d i t id d ( l de grises) Estructuras de Datos(Cont.) Estructuras de Datos(Cont.) • Imagen Indexada – Una imagen también puede ser descrita por una combinación de una tabla de búsqueda (LUT Look‐up table) y una matriz de valores que apunta a la LUT. Esto se llama imagen indexada. • La LUT es también conocida como mapa de color (CM p), y y Color map), y la combinación de la LUT y la matriz de valores indexados es la imagen indexada. – V={0,...,2b‐1}: imagen indexada de b bits – CM: V CM: V ‐>> C, un conjunto de colores distinguibles. C un conjunto de colores distinguibles – Ejemplo: En una imagen de color de 8 bits, el valor de pixel V=23 puede ser indexado al color rojo brillante (255,0,0). Estructuras de Datos(Cont.) Estructuras de Datos(Cont.) • Códigos Cadenas – Estos son útiles en definir conjuntos linealmente conectados, donde cada uno no tiene más de dos vecinos del mismo tipo (bordes). – Ejemplo: • Comenzando Comenzando desde de la fila superior izquierda, una cadena desde de la fila superior izquierda una cadena basada en 4‐vecindad produciría un código cadena del borde de este blob EESESEOOOSONONEN. En el caso de 8‐vecindad el código seria E/E/SE/SE/O/O/SO/O/NO/N/NE Estructuras de Datos(Cont.) Estructuras de Datos(Cont.) • • Códigos Run length (Run lenght Cod RLC) es un tipo de representación de imagen muy util para compresión de imágenes binarias. El comienzo y el imagen muy util para compresión de imágenes binarias El comienzo y el final de la cadena son codificados. Ejemplo: • – Codigo = ((fila1codigo)( fila2codigo)...) – filacodigo = (NumeroFila, BC1, BT1, BC2, BT2,..) – where BCn significa que el negro comienza en n significa que el negro comienza en n – BCn significa que el negro termina en n – RLC para esta imagen es – ((1)(2,5,6)(3,4,4,7,7)(4,4,4,7,7)(5,5,6)(6)) Grafos • • • Grafos: relaciones como “el segmento 5 es adyacente al segmento 12” o “la imagen del hombre está cerca de la imagen del árbol” son a menudo representadas por grafos. Hay muchos tipos de grafos (ej. Dirigidos, no dirigidos, con atributos, arboles de varios tipos) para representar diferentes relaciones. Ejemplo: grafos de adyacencias (sin atributos, no dirigidos) Pirámides • Pirámides a menudo es necesario analizar escenas a múltiples niveles de resolución niveles de resolución simultáneamente. Las pirámides son estructuras de datos t t d d t bien adaptadas para p procesamiento de imágenes multiresolución. Pirámides(Cont.) • Pirámide vista como árbol Pirámide vista como árbol