Cours 2: Géométrie projective

Trois réglages clefs dans appareil photo:

  1. ouverture
  2. temps d’exposition
  3. ISO: sensibilité du film
    • limité par le bruit (de Poisson, etc…) ⟶ capteur plus grand ⟹ moins de bruit de Poisson (car plus de photons)

Oeil humain:

  • saccades: quand on regarde une image ⟶ on fixe à différents endroits

  • si on s’autorise à bouger l’oeil ⟶ accroît la perception

  • capteurs dans l’oeil ⟶ processus chimiques dans lequels il y a un cycle (rhodopsine (interagissent avec les photons) ⟹ détruite dans environnements éclairés)

Image formée sur la rétine

⟶ enregistrée par cônes (couleurs) et bâtonnets (niveaux de gris)

  • distribution par équilibrée: on perçoit les couleurs bien mieux vers le centre du champ de vision

  • plus de rhodopsine en périphérie (avec bâtonnets) ⟶ dans environnements sombres, on voit mieux sur les côtés

  • signal très bruité à cause d’une couche de cellules sous les cônes/bâtonnets

  • fovea ⟶ point aveugle

⟹ Impression qu’on a du monde extérieur ⟶ très différente de la réalité physique

  • ex: contraste perçu dépend des fréquences
  • détails perçus de manière “globale”
  • intuition qu’on a de la physique ⟶ mauvaise

    • divergence des rayons pas perçue
    • champ de vision précis à angle réduit

On voit mieux la lumière rouge la nuit: car bâtonnets pas saturés par la lumière rouge.


A partir d’estimations de la normale à différents endroits ⟶ on peut reconstruire image 3D

Tigre (yeux de face) voit mieux la profondeur (pour détecter proies) que la chèvre (dont les yeux divergent pour étendre champ visuel et voir prédateurs)


Angle de vergence entre les deux yeux ⟶ pas connu

Comment faire la fusion des deux images des 2 yeux ?

Les deux traitements d’image des 2 yeux se font ensemble (⟶ pas traitement des 2 images séparément, puis fusion)

Caméra générique

La seule chose importante dans une caméra sténopée, c’est les rayons qu’on sélectionne sur la rétine/écran.

Sur photo, sont modifiés

  • les distances
  • les angles
  • le parallélisme (convergent vers ligne d’horizon)

sont préservées:

  • les lignes droites

Introduction à la géométrie projective

On se donne un vecteur dans un espace vectoriel $v ∈ V (= ℝ^n \text{ ou en pratique } ℝ^3)$

g(v) ≝ [v] ≝ \lbrace λv \mid λ ∈ ℝ \rbrace = ℝv
ℙ(V) = g(V) = \lbrace ℝv \mid v ∈ V \rbrace

(ensemble des rayons qui passent par l’origine)

Plutôt que travailler avec cet ensemble compliqué de rayons, on travaille dans un plan affine (par ex $ℝ^2$ : le plan sur lequel on regarde), dans lequel chaque droite sera identifiée par le point d’intersection entre cette droite et le plan (sauf les droite parallèles au plan : il y a des points aux deux infinis (dans les deux directions), qu’on identifie (forme de tore)).

Si $W ⊆ V$,

Sous-espace projectif:
ℙ(W) ⊆ ℙ(V)

Intersection d’un plan de $ℝ^3$ et d’un plan affine ⟶ une droite

Dans ces plans affines: deux droites distinctes s’intersectent (pas de droites parallèles).

ℙ(V_1) ∩ ℙ(V_2) ≝ ℙ(V_1 ∩ V_2)
Espace engendré (combinaison linéaires):
L(V_1, V_2)
ℙ(V_1) ∩ ℙ(V_1) ≝ ℙ(V_1 ∩ V_2)
L'(ℙ(V_1), ℙ(V_2)) ≝ ℙ(L(V_1, V_2))

Par déf:

\dim ℙ(V) ≝ \underbrace{\dim(V)}_{=n+1}-1

\dim L(V_1, V_2) = \dim(V_1) + \dim(V_2) - \dim(V_1 ∩ V_2)
\dim L'(ℙ(V_1), ℙ(V_2)) = \dim(ℙ(V_1)) + \dim(ℙ(V_1)) - \dim(ℙ(V_1) ∩ ℙ(V_2))

φ : \begin{cases} V ⟶ W \\ x \mapsto φ(x) \end{cases}
\overline{φ} : \begin{cases} ℙ(V \backslash ker(φ)) ⟶ ℙ(W) \\ [x] \mapsto [φ(x)] \end{cases}

On veut associer un système de coordonnées à l’espace projectif $ℙ(V)$.

Points linéairement indépendants dans l’espace projectif:

$[v_1], \ldots, [v_k]$ indépendants ssi $(v_1, \ldots, v_k)$ indépendants dans $V$

Points en position générale dans l’espace projectif:

$[v_1], \ldots, [v_k]$ en position générale ssi tout sous-ensemble de taille $≤ \dim V$ est indépendant

Comment définir un système de coordonnées ?

Soient $[v_1], \ldots, [v_{\dim V}]$

On pose

[v^\ast] = \sum\limits_{ i=1 }^{\dim V} [v_i]
Base de coordonnées de l’espace projectif:

ssi $[v_1], \ldots, [v_{\dim V}], [v^\ast]$ sont en position générale

On veut définir des coordonnées dans l’espace projectif, de sorte que:

[x] ≝ \sum\limits_{ i } λ_i [v_i]

En se donnant $v^\ast$, on se donne un ordre de grandeur en projetant ce vecteur sur les droites $[v_i]$.


Plan à l’infini:
H_∞ ≝ \lbrace x ≝ (x_1, \ldots, x_{\dim V}) ∈ ℙ(V) \mid x_{n+1} = 0 \rbrace
φ: \begin{cases} ℙ(ℝ^{\dim V}) \backslash H_∞ ⟶ ℝ^{\dim V - 1} \\ (x_1, \ldots, x_{n+1}) ⟼ \Big(\frac{x_1}{x_{n+1}}, \ldots, \frac{x_n}{x_{n+1}}\Big) \end{cases}

Intérêt des coordonnées projectives: elles nous permettent d’exprimer par des matrices des transformations pas forcément linéaires dans l’espace vectoriel ambiant.

Dans l’espace projectif:

Ex: une translation (toutes les coordonnées sont dans l’espace projectif)

\begin{pmatrix} 1 & 0 & t_x \\ 0 & 1 & t_y \\ 0 & 0 & 1 \\ \end{pmatrix} \begin{pmatrix} x \\ y \\ 1 \\ \end{pmatrix} = \begin{pmatrix} x+ t_x \\ y+ t_y \\ 1 \\ \end{pmatrix}

transformation affine:

\begin{pmatrix} A & t \\ 0 & 1 \\ \end{pmatrix} \begin{pmatrix} x \\ y \\ 1 \\ \end{pmatrix} = \begin{pmatrix} A {}^t(x, y) + t \\ 1 \\ \end{pmatrix}

Transformation projective: ne préserve que la colinéarité

\begin{pmatrix} r_1^T \\ r_2^T \\ r_3^T \\ \end{pmatrix} v = \begin{pmatrix} r_1^T v \\ r_2^T v \\ r_3^T v \\ \end{pmatrix} = \begin{pmatrix} \frac{r_1^T v}{r_3^T v} \\ \frac{r_2^T v}{r_3^T v} \\ 1 \\ \end{pmatrix}

Les transformations effectuées par les caméras peuvent être écrites simplement avec des coordonnées projectives.

Leave a comment