Características de la Imagen

Transcripción

Características de la Imagen
Características de la Imagen
de la Imagen
Curso Visión Artificial
¿Que es una Imagen?
¿Que es una Imagen?
• una
una imagen continua en Visión Artificial es imagen continua en Visión Artificial es
una proyección de la realidad en un plano de la realidad La propiedad más común es la
la realidad. La propiedad más común es la intensidad de la luz reflejada
• Esa imagen continua debe ser muestreada Esa imagen continua debe ser muestreada
para poder usar procesamiento discreto. ¿Cómo muestreo espacialmente?
¿Cómo muestreo espacialmente?
• Teorema
Teorema de muestreo de Shannon: de muestreo de Shannon: Sea una Sea una
señal bidimensional de que representa una imagen continua con anchos de banda U and V en las direcciones del eje x y del eje y respectivamente. Es posible reconstruir fc(x,y) con exactitud perfecta de sus muestras i d
f
d
fc(jΔx,kΔy) es Δx <1/2U y Δy < 1/2V
• Problemas de muestreo resultan en Aliasing. P bl
d
l
Ali i
Ejemplo, el tablero de ajedrez
La cuantificación de la Intensidad
La cuantificación de la Intensidad
• Los
Los valores de traducción de la energía valores de traducción de la energía
luminosa se deben cuantificar para digitalizar la imagen
la imagen
• Cuantificación es el mapeo de la intensidad en una imagen continua a un conjunto de 2b
una imagen continua a un conjunto de 2
valores donde b es el número de bits de representación de la intensidad
representación de la intensidad
Cuantificación(Cont.)
• Por
Por ejemplo, los valores típico según el tipo de ejemplo los valores típico según el tipo de
imágenes b=1 (imagen binaria), b=8 (256 colores o niveles de gris) y b=24
colores o niveles de gris) y b=24 (224=16,777,216 colores)
• Cuantificadores no tienen que ser lineales
Cuantificadores no tienen que ser lineales
Modelos de Colores
Modelos de Colores
• Un
Un modelo de color consiste de una modelo de color consiste de una
especificación de tres componentes para representar un color específico Siendo que
representar un color específico. Siendo que existen varios sets of que pueden ser bases para creación de colores como una función 3D
para creación de colores como una función 3D
• Algunos modeles usan los 3 colores primarios otros usan propiedades como intensidad y la
otros usan propiedades como intensidad y la saturación
Modelos de Colores(Cont.)
Modelos de Colores(Cont.)
• RGB Aditivo: – Todo color visible puede ser representado como una suma ponderada de las 3 componentes primarias rojo (Red), verde (Green) y azul (Blue)
(Red), verde (Green) y azul (Blue)
– Ejemplo: (255,0,0) es rojo saturado; (150,150,50) es amarillo pastel,(25,25,25) es gris oscuro
• CMY(K) Substractivo:
CMY(K) S b t ti
– El sistema CMY (Cian(Cyan), Magenta, Amarillo(Yellow)) trabaja sobre esta base
Amarillo(Yellow)) trabaja sobre esta base
– Adicionalmente K es el nivel de Negro(absorción).
Modelos de Color(Cont.)
Modelos de Color(Cont.)
• Modelo substractivo
Modelo substractivo
• HSI:
S
– Hue son las longitudes de onda dominante en el color. Saturación
l
ó es la fuerza relativa del color l f
l
d l l
respecto de la base blanca. Intensidad es el brillo.
Topología de la Imagen
Topología de la Imagen
• Conexionismo
– Un blob es un conjunto de pixeles. Una propiedad fundamental es el número y forma de sus blobs. – Un conjunto de pixeles está conectado si ellos están Un conjunto de pixeles está conectado si ellos están
adyacentes. – Blobs son frecuentemente, pero no siempre conjuntos conectados de pi eles
conectados de pixeles. – Las 2 maneras más comunes de definir adyacencia son:
4‐vecindad: pixeles que tocan en dirección vertical u horizontal; • 8‐vecindad: pixeles que tocan en dirección vertical u horizontal o diagonal
horizontal o diagonal. •
Topología de la Imagen(Cont.)
Topología de la Imagen(Cont.)
• Paradoja de las conexiones
Paradoja de las conexiones
• Las distancias:
di
i
– City block : el menor número de pasos h
horizontales/verticales. l /
l
– Chessboard : el menor número de pasos h i t l / ti l /di
horizontales/verticales/diagonales. l
– Euclideana : distancia recta entre los centros
Chamfering y distancias
y distancias
• Menor
Menor distancia de cada pixel a un blob distancia de cada pixel a un blob
específico
Medidas de resumen
Medidas de resumen
• Histograma es un registro del número de pixeles de cada uno de los niveles cuantizados de brillo(grayscale). En el caso de las imágenes de color se producen 3
• En el caso de las imágenes de color se producen 3 histogramas, uno por cada componente de color.
• 4x4 3‐bit imagen monocromático –
–
–
–
•
6
2
4
6
7
6
6
6
3
1
1
6
0 0
0 0 0
Histograma h(i), i=0,...,7: [ 4 2 1 1 1 0 6 1 ] Estructuras de datos
Estructuras de datos
• Matrices:
at ces:
– La estructura más común para almacenar imagenes
son los arreglos bidimensionales, es decir las matrices, cuyos valores comúnmente representan el ti
l
ú
t
t
l
brillo de los pixeles. Para una imagen de n filas por m columnas, – M: {1,..,n}x{1,...,m} ‐> V.
V=B={0,1}: imagen binaria
– V={0,...,2
V {0 2b‐1}: b bit imagen de intensidad (escala 1} b bit i
d i t id d (
l
de grises)
Estructuras de Datos(Cont.)
Estructuras de Datos(Cont.)
• Imagen Indexada
– Una imagen también puede ser descrita por una combinación de una tabla de búsqueda (LUT Look‐up table) y una matriz de valores que apunta a la LUT. Esto se llama imagen indexada. • La LUT es también conocida como mapa de color (CM p), y
y
Color map), y la combinación de la LUT y la matriz de valores indexados es la imagen indexada. – V={0,...,2b‐1}: imagen indexada de b bits – CM: V CM: V ‐>> C, un conjunto de colores distinguibles.
C un conjunto de colores distinguibles
– Ejemplo: En una imagen de color de 8 bits, el valor de pixel V=23 puede ser indexado al color rojo brillante (255,0,0).
Estructuras de Datos(Cont.)
Estructuras de Datos(Cont.)
• Códigos Cadenas
– Estos son útiles en definir conjuntos linealmente conectados, donde cada uno no tiene más de dos vecinos del mismo tipo (bordes). – Ejemplo:
• Comenzando
Comenzando desde de la fila superior izquierda, una cadena desde de la fila superior izquierda una cadena
basada en 4‐vecindad produciría un código cadena del borde de este blob EESESEOOOSONONEN. En el caso de 8‐vecindad el código seria E/E/SE/SE/O/O/SO/O/NO/N/NE
Estructuras de Datos(Cont.)
Estructuras de Datos(Cont.)
•
•
Códigos Run length (Run lenght Cod RLC) es un tipo de representación de imagen muy util para compresión de imágenes binarias. El comienzo y el imagen muy util
para compresión de imágenes binarias El comienzo y el
final de la cadena son codificados. Ejemplo:
•
– Codigo = ((fila1codigo)( fila2codigo)...)
– filacodigo = (NumeroFila, BC1, BT1, BC2, BT2,..)
–
where BCn significa que el negro comienza en n
significa que el negro comienza en n
–
BCn significa que el negro termina en n
– RLC para esta imagen es
–
((1)(2,5,6)(3,4,4,7,7)(4,4,4,7,7)(5,5,6)(6))
Grafos
•
•
•
Grafos: relaciones como “el segmento 5 es adyacente al segmento 12” o “la imagen del hombre está cerca de la imagen del árbol” son a menudo representadas por grafos.
Hay muchos tipos de grafos (ej. Dirigidos, no dirigidos, con atributos, arboles de varios tipos) para representar diferentes relaciones.
Ejemplo: grafos de adyacencias (sin atributos, no dirigidos) Pirámides
• Pirámides a menudo es necesario analizar escenas a múltiples niveles de resolución
niveles de resolución simultáneamente. Las pirámides son estructuras de datos t t
d d t
bien adaptadas para p
procesamiento de imágenes multiresolución.
Pirámides(Cont.)
• Pirámide vista como árbol
Pirámide vista como árbol

Documentos relacionados