102784 [20380] Visió per Computador Prueba 2 (2016) [A]

Transcripción

102784 [20380] Visió per Computador Prueba 2 (2016) [A]
102784 [20380] Visió per Computador
Prueba 2 (2016) [A]
Teoria (10p) (una pregunta test fallada descuenta 1/4 de pregunta acertada)
1. Queremos reducir la distorsión de barril introducida por el sistema óptico de una cámara. Qué usaremos.
a) Homografía
b) Ajuste con puntos de control y polinomio para x e y
c) Modelo radial basado en un polinomio en r
d) Afinidad
2. Hemos implementado una función de mapping con puntos de control basada en polinomios. La usaremos
para modelar un escalado+traslación+rotación cuál de estas opciones es la más sensata.
a) No podemos utilizarla
b) Debemos utilizarla con un polinomio de grado 1
c) Se utilizará con un polinomio de grado 2 y el modelo será exacto
d) Se utilizará con un polinomio de grado 2 y el modelo será aproximado
3. Utilizamos un resampling con la fórmula f (x, y) = ax + by + cxy + d dónde los valores de a, b, c, d se
establecen a partir de los valores de 4 píxeles vecinos. Qué tipo de resampling estamos utilizando.
a) nearest neighbour
b) bilinear
c) bicubic
d) basada en sinc()
4. Rotaremos una imagen varias veces con el mismo ángulo hasta completar un vuelta y compararemos el
resultado con la imagen inicial. Cuál de estos experimentos dará menos error.
a) 3 giros de 120◦ con resampling bicúbico
b) 4 giros de 90◦ con transposiciones y flips
c) 5 giros de 72◦ con nearest neighbour
d) 6 giros de 60◦ con kernel basado en sinc()
5. Cuál de estas propiedades se ajusta a una homografía en el caso de una proyección perspectiva centrada.
a) proyecta los puntos de un plano en cualquier otro plano
b) proyecta los puntos de un plano horizontal en un plano vertical
c) proyecta los puntos de un plano vertical en un plano horizontal
d) proyecta los puntos de cualquier plano en un plano cenital
6. Queremos obtener una imagen de las fachadas de una determinada calle sin distorsión perspectiva. Cuál
de los siguiente montajes sería un buen punto de partida.
a) secuencia desde un punto, girando la cámara. Solución con proyecciones planas.
b) secuencia desde un punto, girando la cámara. Solución con una proyección cilíndrica.
c) Vídeo perpendicular a escena y recorremos la calle. Solución selecciona unas pocas columnas de
cada imagen.
d) Vídeo perpendicular a escena y recorremos la calle. Solución empalma frames completos.
7. Cuál de estas afirmaciones es verdadera sobre el RANSAC
a) asegura resultado estable y tiempo constante si repetimos el proceso con los mismos datos.
b) asegura resultado estable, pero el tiempo puede variar si repetimos el proceso con los mismos datos.
c) no asegura resultado estable, pero sí tiempo constante si repetimos el proceso con los mismos datos.
d) no asegura resultado estable y el tiempo puede variar si repetimos el proceso con los mismos datos.
8. Cuál de estas afirmaciones respecto de una cámara pin-hole es verdadera.
a) Tenemos una focal fija determinada por el diámetro de agujero.
b) Hay desenfoque debido a la profundidad como en el caso de los objetivos con lentes.
c) A mayor diámetro del agujero mayor cantidad de luz pero mayor desenfoque.
d) A diferencia de las objetivos con lentes la imagen proyectada no está invertida.
9. En un vuelo con un drone captamos vistas cenitales a diferentes alturas. Interesa combinar imágenes
para formar mapa. Cuál de estos detectores de características usaríamos sin pasarnos en prestaciones.
a) Harris
b) Harris Laplace
c) Harris Affine
d) Harris UAV
10. Cuál de los siguientes acrónimos está asociado a un descriptor de características local.
a) PCA: Principal Component Analysis
b) LDA: Linear Discriminant Analysis
c) HOG: Histogram of Oriented Gradients
d) GHT: Generalized Hough Transform
11. Queremos detectar líneas verticales en una imágen genérica con la transformada de Hough, cuál de estas
opciones nos dará mejores resultados
a) aplicamos la transformada de Hough a todos los píxeles de la imagen
b) buscamos los contornos y aplicamos la transformada de Hough sólo a estos puntos
c) calculamos contornos únicamente con la derivada x, aplicamos Hough a estos puntos
d) calculamos contornos únicamente con la derivada y, aplicamos Hough a estos puntos
12. para calcular la respuesta de las esquinas una vez tenemos los valores propios, λ1 , λ2 , del tensor estructural. Como calculamos esta respuesta
a) R = λ1 λ2
b) R = λ1 + λ2
c) R = λ1 λ2 − k(λ1 + λ2 )2
d) R = λ1 λ2 − (λ1 + λ2 )
13. Cuál de estos nombres no está relacionado con algún algoritmo de segmentación
a) Split and Merge
b) K-means
c) Threshold
d) Tenengrad
14. Cuántos recorridos utilizan los algoritmos de etiquetado (i) conectividad a 4, (ii) conectividad a 8.
a) (i) 1, (ii) 1
b) (i) 2, (ii) 2
c) (i) 2, (ii) 4
d) (i) 4, (ii) 8
15. Qué tamaño tienen las matrices que generan las derivadas de estos detectores de contornos: Roberts,
Sobel, Prewitt.
a) 2×2, 2×2, 2×2.
b) 2×2, 3×3, 3×3.
c) 3×3, 3×3, 3×3.
d) 3×3, 3×3, 5×5.
16. En un algoritmo de segmentación basado en k-means cuál de las siguientes afirmaciones es falsa
a) Debemos indicar al inicio el número de clústers que esperamos encontrar
b) Podemos utilizar k muestras al azar de nuestros datos como centros iniciales
c) Podemos usar otras distancias diferentes de la euclidiana
d) El número de centros final puede ser mayor que el inicialmente definido
17. Sobre el algoritmo de Mean shift.
a) Es el algoritmo k-means pero el número de clústers se detecta de manera automática
b) A diferencia del k-means el Mean shift no es iterativo
c) Cada punto lo desplazamos hacia el valle más cercano
d) El Mean shift considera el espacio de características como una función de probabilidad empírica
18. Ordena las distancias para el caso: ~a = (0, 0, 1, 1, 0), ~b = (0, 0, 0, 0, 0)
a) ||~a − ~b||1 = ||~a − ~b||2 = ||~a − ~b||4 = ||~a − ~b||∞
b) ||~a − ~b||1 < ||~a − ~b||2 < ||~a − ~b||4 < ||~a − ~b||∞
c) ||~a − ~b||1 > ||~a − ~b||2 > ||~a − ~b||4 > ||~a − ~b||∞
d) ||~a − ~b||∞ < ||~a − ~b||2 < ||~a − ~b||4 < ||~a − ~b||1
19. Cuál de estas afirmaciones sobre la cross-validation es falsa
a) Entrenar un modelo sin validarlo puede dar lugar a overfitting
b) El leave-one-out es un tipo de cross-validation en el que el test se hace en cada ronda sólo sobre
una muestra
c) El leave-one-out es un tipo de K-fold en el que el training se hace en cada ronda con una muestra
d) En un K-fold el proceso de validación cruzada se repite K veces
20. Cuál de las siguientes afirmaciones es cierta respecto del LDA.
a) Maximiza la variabilidad intraclase y maximiza la variabilidad interclase.
b) Maximiza la variabilidad intraclase y minimiza la variabilidad interclase.
c) Minimiza la variabilidad intraclase y maximiza la variabilidad interclase.
d) Minimiza la variabilidad intraclase y minimiza la variabilidad interclase.
21. Tenemos dos esquemas de clasificación diferente. En el primero la salida de un algoritmo de clustering
nos establece las diferentes clases que componen nuestras muestras. En el segundo se utiliza un conjunto
de datos ciertos con los que entrenar y testear. Qué tipo de aprendizaje se asocia a cada caso.
a) (1) no supervisado, (2) supervisado
b) (1) no supervisado, (2) no supervisado
c) (1) supervisado, (2) no supervisado
d) (1) supervisado, (2) supervisado
22. La clasificación y la regresión están relacionadas por
a) nada, no tienen nada que ver.
b) predecir valores, clasificación obtiene valores continuos y la regresión discretos.
c) predecir valores, clasificación obtiene valores discretos y la regresión continuos.
d) ambas predicen valores discretos.
23. La anterior Kinect (1) estaba basada en la proyección de un patrón de puntos codificado y la actual (2)
utiliza una cámara ToF (time of flight). De qué tipo de métodos estamos hablando en cada caso.
a) (1) activo, (2) activo
b) (1) activo, (2) pasivo
c) (1) pasivo, (2) activo
d) (1) pasivo, (2) pasivo
24. Cuál de estas etapas no se corresponde con la obtención de 3D basado en varias vistas (multiview).
a) Point matching
b) Triangulation
c) Bundle adjustment
d) Normal estimation
25. Cuál de las siguientes técnicas de reconstrucción 3D recupera la forma a partir de la silueta del elemento
a reconstruir
a) Carving
b) Shape from focus
c) Photmetric stereo
d) Multiview stereo
Apellidos:
, Nombre:
NIU:
, DNI:
1
2
3
4
5
6
7
8
9
10 11 12
13 14 15
16 17 18
19 20 21
22 23 24
25
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
a
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
b
B:
c
c
c
c
c
c
c
c
c
c
c
c
c
c
c
c
c
c
c
c
c
c
c
c
c
M:
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
d
∅:
102784 [20380] Visió per Computador
Apellidos:
NIU:
Prueba 2 (2016) [A]
, Nombre:
, DNI:
Problemas (10p)
1. (2p) Queremos saber la distancia al coche que tenemos delante. Qué pasos deberíamos realizar sobre la
imagen captada por la cámara delantera de nuestro coche.
2. (3p) Implementa un detector de contornos con un parámetro que sea la escala (sigma).
3. (3p) Implementa un k-nearest neighbour modificado para obtener la probabilidad de que un pixel pertenezaca a la clase piel, para un clasificador binario: color_piel/color_no_piel.
4. (2p) Establece la secuencia de acciones necesarias para montar un Bag of Words que permita distinguir
entre modelos de coches diferentes, para un conjunto de entrada de imágenes de choches.

Documentos relacionados