TIPE 2016 : THÉORIE DES MODÈLES, DE L’EXEMPLE AU MODÈLE (Version Exhaustive)

Observations initiales

Le théorème d’Ax stipule que : toute fonction polynomiale injective de {\mathbb{C}}^{ n} dans { \mathbb{C}}^{n} est surjective.

  • Pour n = 1 : L’hypothèse “injective” devient inutile : c’est le théorème de D’Alembert.

  • En substituant un corps fini $$\mathbb{K}$$ à $$\mathbb{C}$$ : L’hypothèse “polynomiale” devient inutile : cela relève du principe des tiroirs.

Ax-Grothendieck : démonstration algébrique

Nullstellensatz fort

Soient n \geq 1, m \geq 0 et \mathbb{K} un corps.

Lemme de Zariski

Soient x_1, \ldots, x_n \not\in \mathbb{K} et A {\overset{ { \text{déf}}}{=}}\mathbb{K}[x_1, \ldots, x_n] une \mathbb{K}-algèbre de type fini (i.e finiment engendrée, en tant que \mathbb{K}-algèbre). Si A est un corps, alors A est algébrique sur \mathbb{K}.

Supposons que A = \mathbb{K}[x_1, \ldots, x_n] est un corps. Preuve par récurrence sur n \in \mathbb{N}^* :

  • Pour n=1 : le résultat est évident, puisque x_1^{-1} \in A = \mathbb{K}[x_1]

  • Si le résultat est acquis pour n \in \mathbb{N}^* : Par l’absurde
    on peut supposer, sans perte de généralité, que x_1 est transcendant sur \mathbb{K} (sinon, c’est trivial). Comme A est un corps, \mathbb{K}(x_1) \subset \mathbb{K}[x_1]1, et A = \underbrace{\mathbb{K}(x_1)}_{\overset{ { \text{déf}}}{=} k}[x_2, \ldots, x_n]

    Pour tout i \in ⟦ 2,n ⟧ : par hypothèse de récurrence, x_i est racine d’un polynôme unitaire P_i \in k[X]. En notant D_i(x_1) (D_i \in \mathbb{K}[X]) le produit des dénominateurs des coefficients de P_i, et en posant D {\overset{ { \text{déf}}}{=}}\prod_{j=2}^n D_j en multipliant “P_i(x_i) = 0” par D(x_1)^m, pour un entier m suffisamment grand, il vient que : D(x_1) x_i est entier sur \mathbb{K}[x_1]. De plus, comme \mathbb{K}[a_1] \cong \mathbb{K}[X], il existe un polynôme irréductible Q premier avec D.

    Donc (Q(x_1))^{-1} \in A=k[x_2, \ldots , x_n] (c’est un corps), et D(x_1)^r (Q(x_1))^{-1} \in k[D(x_1) x_2, \ldots , D(x_1) x_n] pour un entier r assez grand, d’où D(x_1)^r (Q(x_1))^{-1} est entier sur \mathbb{K}[x_1] (lemme 9).

    Or : \mathbb{K}[x_1] est factoriel (en tant qu’anneau principal), donc intégralement clos, et : D(x_1)^r (Q(x_1))^{-1} \in \mathbb{K}[x_1] d’où Q \lvert D, ce qui est absurde.

Nullstellensatz faible

Si \mathbb{K} est algébriquement clos, pour tout idéal J de \mathbb{K}[X_1, \ldots, X_n], \hbox{V}(J)=\emptyset \Longrightarrow J = \mathbb{K}[X_1, \ldots, X_n]

\hbox{V}(J) {\overset{ { \text{déf}}}{=}}\bigcap\limits_{P \in J} P^{-1}\left(\lbrace 0 \rbrace\right)

La fonction \Phi {\overset{ { \text{déf}}}{=}}\left\{ \begin{array}{lcll} & \mathbb{K}^n & \to & \big\lbrace \text{Idéaux maximaux de } \mathbb{K}[X_1,\ldots, X_n] \big \rbrace \\ & (a_1, \ldots, a_n) & \mapsto & \hspace{3em} \big\langle X_1-a_1 , \ldots,\, X_n-a_n \big\rangle \end{array}\right. est une bijection.

  • Surjectivité :

Soit I un idéal maximal de \mathbb{K}[X_1,\ldots, X_n]. On note A le corps \mathbb{K}[X_1,\ldots, X_n]/I. Le morphisme \phi {\overset{ { \text{déf}}}{=}}\left\{ \begin{array}{lcll} & \mathbb{K} & \to & A \\ & \lambda & \mapsto & \overline{\lambda} \end{array}\right. est injectif (si \lambda \in \operatorname{Ker}\phi, alors \lambda \in I, et \lambda = 0 car sinon I = \mathbb{K}[X_1,\ldots, X_n]), d’où k {\overset{ { \text{déf}}}{=}}\phi\left(\mathbb{K}\right) est un sous-corps algébriquement clos de A, et A = k\big[\overline{X_1},\ldots, \overline{X_n}\big]. Par le lemme de Zariski, A est algébrique sur k : c’est donc k (car k est algébriquement clos), et A \overset{ \phi^{-1}}{\cong} \mathbb{K}. En posant, pour tout i \in ⟦ 1,n ⟧, a_i {\overset{ { \text{déf}}}{=}}\phi^{-1}\big(\overline{X_i}\big) \in \mathbb{K} : X_i - a_i \in I, d’où I \supset \big\langle X_1-a_1 , \ldots,\, X_n-a_n \big\rangle, et par maximalité de \big\langle X_1-a_1 , \ldots,\, X_n-a_n \big\rangle, I = \big\langle X_1-a_1 , \ldots,\, X_n-a_n \big\rangle.

  • Injectivité :

    Si \big\langle X_1-a_1 , \ldots,\, X_n-a_n \big\rangle = \big\langle X_1-b_1 , \ldots,\, X_n-b_n \big\rangle, alors pour tout i \in ⟦ 1,n ⟧ : a_i - b_i = X_i - b_i - (X_i - a_i) \in I d’où a_i = b_i, car sinon I = \mathbb{K}[X_1,\ldots, X_n].

Par contraposée : si J est un idéal strict de \mathbb{K}[X_1,\ldots, X_n], J est inclus dans un idéal maximal I \supset J. De fait, par bijectivité de \Phi, il existe un élément de \mathbb{K}^n en lequel s’annulent les polynômes de I, et donc de J.

Astuce de Rabinowitsch

Si \mathbb{K} est algébriquement clos, pour tous polynômes P_1, \ldots, P_m \in \mathbb{K}[X_1, \ldots, X_n], l’idéal J {\overset{ { \text{déf}}}{=}}\big\langle P_1 , \ldots,\, P_m \big\rangle vérifie : \hbox{I}\left(\hbox{V}(J)\right)=\sqrt{J}

  • \hbox{I}\left(\hbox{V}(J)\right) est l’idéal des polynômes s’annulant en chacun des éléments de \hbox{V}(J)

  • \sqrt{J} est le radical de J (i.e l’ensemble des polynômes dont une puissance strictement positive appartient à J)

Soit J {\overset{ { \text{déf}}}{=}}\big\langle P_1 , \ldots,\, P_m \big\rangle \subset \mathbb{K}[X_1, \ldots, X_n].

  • \sqrt{J} \subset \hbox{I}\left(\hbox{V}(J)\right) : évident, par intégrité de \mathbb{K}.

  • \hbox{I}\left(\hbox{V}(J)\right) \subset \sqrt{J} : Soit P \in \mathbb{K}[X_1, \ldots, X_n] un polynôme non nul s’annulant en chacun des éléments de \hbox{V}(J). On se place dans \mathbb{K}[X_0,\, X_1, \ldots, X_n], et on pose \mathfrak{I} {\overset{ { \text{déf}}}{=}}\big\langle 1 - X_0 P, \, P_1 , \ldots,\, P_m \big\rangle Ainsi, \hbox{V}(\mathfrak{I}) = \emptyset, et par le Nullstellensatz faible : \mathfrak{I} = \mathbb{K}[X_0,\, X_1, \ldots, X_n] \ni 1 c’est-à-dire : 1 = (1 - X_0 P) \, Q_0(X_0, \ldots, X_n) + \sum \limits_{i=1}^m P_i \, Q_i(X_0, \ldots, X_n) {\hspace{1em} \circledast} pour des polynômes Q_0, \ldots, Q_m \in \mathbb{K}[X_0,\, X_1, \ldots, X_n]. En prenant l’image des membres de \circledast par le morphisme d’anneaux \left\{ \begin{array}{lcll} & \mathbb{K}[X_0,\, X_1, \ldots, X_n] & \to & \mathbb{K}(X_1, \ldots, X_n) \\ & Q(X_0,\, X_1, \ldots, X_n) & \mapsto & Q(1/P, \, X_1, \ldots, X_n) \\ \end{array}\right. il vient : 1 = \sum \limits_{i=1}^m P_i(X_1, \ldots, X_n) \, Q_i(1/P, \, X_1, \ldots, X_n) soit, en multipliant par P^r pour un entier r assez grand : P^r = \sum \limits_{i=1}^m P_i(X_1, \ldots, X_n) \, {\widetilde Q_i}(X_1, \ldots, X_n) \in J pour des polynômes {\widetilde Q_0}, \ldots, {\widetilde Q_m} \in \mathbb{K}[X_1, \ldots, X_n].

Ax - Grothendieck

Toute fonction polynomiale de \mathbb{C}^n dans \mathbb{C}^n qui est injective est bijective.

  • Pour les clôtures algébriques des corps finisSi \mathbb{K} est un corps fini dont \overline{\mathbb{K}} est une clôture algébrique : toute fonction polynomiale P de \overline{\mathbb{K}}^n dans \overline{\mathbb{K}}^n qui est injective est bijective.

    Par l’absurde, si P = (P_1, \ldots, P_n) : \overline{\mathbb{K}}^n \to \overline{\mathbb{K}}^n est injective mais non surjective : \forall x,y \in \overline{\mathbb{K}}^n, P(x) - P(y) = 0 \Longrightarrow x - y = 0 d’où, par le Nullstellensatz fort, en considérant la i-ème coordonnée (i \in ⟦ 1,n ⟧) : X_i-Y_i \in \sqrt{\big\langle P_i(X_1, \ldots, X_n)-P_i(Y_1, \ldots, Y_n) \big\rangle} \subset \overline{\mathbb{K}}[X_1, \ldots, X_n, \, Y_1, \ldots, Y_n] et il existe une fonction polynomiale Q : \overline{\mathbb{K}}^n \times \overline{\mathbb{K}}^n \to \overline{\mathbb{K}}^n, r \in \mathbb{N}^* tels que : \forall x,y \in \overline{\mathbb{K}}^n, \, \, \big(P(x)-P(y)\big)Q(x,y) = (x-y)^r

    Par non-surjectivité, il existe x_0 \in \overline{\mathbb{K}}^n tel que : \forall x \in \overline{\mathbb{K}}^n, P(x) - x_0 \neq 0 Donc \forall x \in \overline{\mathbb{K}}^n, \, P(x) - x_0 = 0 \, \, \Longrightarrow \underbrace{1}_{\text{ fonction constante égale à 1}}\hspace{-2.3em}(x) \hspace{1em} = 0 et de même, il existe une fonction polynomiale R : \overline{\mathbb{K}}^n \to \overline{\mathbb{K}}^n telle que : \forall x \in \overline{\mathbb{K}}^n, \, \big(P(x)-x_0 \big) \, R(x) = 1

    On note k le sous-corps de \overline{\mathbb{K}} engendré par \mathbb{K}, x_0, et les coefficients de P, Q, R : il est fini (car finiment engendré et chaque élément de k est algébrique sur \mathbb{K}, donc (lemme 6) \dim_\mathbb{K} k < \infty). Or, P peut être restreinte et corestreinte en une fonction polynomiale \widetilde{P} : k^n \to k^n, qui reste injective et non-surjective. Comme k est fini, c’est absurde.

    Polynôme et fonction polynomiale associéeComme \overline{\mathbb{K}} est infini (sinon \prod_{a \in \overline{\mathbb{K}}} \big(X-a\big) + 1 n’aurait pas de racines), on peut faire l’abus de langage de pas distinguer un polynôme et sa fonction polynomiale associée, car le morphisme d’anneaux qui à un polynôme associe sa fonction polynomiale associée est injectif (tout Q dans son noyau a une infinité de racines, et est donc nul).

     

  • Dans \mathbb{C} : Par l’absurde, si P = (P_1, \ldots, P_n) : \mathbb{C}^n \to \mathbb{C}^n est surjective mais non injective, on produit de même des fonctions polynomiales Q : \mathbb{C}^n \times \mathbb{C}^n \to \mathbb{C}^n, R : \mathbb{C}^n \to \mathbb{C}^n, un complexe x_0 et un entier r \in \mathbb{N}^* tels que : \forall x,y \in \mathbb{C}^n, \, \, \left\{ \begin{array}{l l} \big(P(x)-P(y)\big)Q(x,y) &= (x-y)^r \\ \big(P(x)-x_0 \big) \, R(x) &= 1 \end{array}\right. {\hspace{1em} \circledast} On note \mathcal{E} l’ensemble formé par x_0 et les coefficients de P, Q, R; et on pose A {\overset{ { \text{déf}}}{=}}\mathbb{Z}[\mathcal{E}], dont on note I un idéal maximal.

    • Montrons que le corps A/I = \mathbb{Z}[\mathcal{E}]/I est fini :

      Supposons, par l’absurde, que le noyau du morphisme d’anneaux \phi {\overset{ { \text{déf}}}{=}}\left\{ \begin{array}{lcll} & \mathbb{Z} & \to & \mathbb{Z}[\mathcal{E}]/I \\ & a & \mapsto & \overline{a} \end{array}\right. est trivial : alors on corestreint \phi à \phi(\mathbb{Z}), et \mathbb{Z} \cong \phi(\mathbb{Z}) \subset A/I. Comme A/I est une \phi(\mathbb{Z})-algèbre finiment engendrée, c’est aussi une \mathfrak{Q}-algèbre finiment engendrée, où \mathfrak{Q} \cong \mathbb{Q}. Par le lemme de Zariski, A/I est algébrique sur \mathfrak{Q}. Si on écrit A/I = \phi(\mathbb{Z})[\alpha_1, \ldots, \alpha_m], on peut choisir s \in \mathbb{Z}\backslash \lbrace 0 \rbrace tel que toutes les images par \phi^{-1} des dénominateurs des coefficients des polynômes minimaux des \left( \alpha_i \right)_{i \in ⟦ 1,m ⟧} divisent s. Il vient alors que les \left( \alpha_i \right)_{i \in ⟦ 1,m ⟧}, et donc le corps A/I, sont entiers sur \phi(\mathbb{Z})[\overline{1}/\phi(s)], d’où \phi(\mathbb{Z})[\overline{1}/\phi(s)] est un corps (lemme 10), et (\overline{1}/(\phi(s)+\overline{1}) \in \phi(\mathbb{Z})[\overline{1}/\phi(s)]. Donc \overline{1} = (\phi(s)+\overline{1}) P(\overline{1}/\phi(s))P \in \phi(\mathbb{Z})[X], et pour q \in \mathbb{N} assez grand : \phi(s)^q = (\phi(s)+\overline{1}) aa \in \phi(\mathbb{Z}), ce qui est impossible, parce que tout diviseur irréductible de \phi(s)+\overline{1} divise le membre de droite mais pas de gauche.    Donc \operatorname{Ker}\phi est un idéal non trivial de \mathbb{Z}, et \operatorname{Ker}\phi = p \mathbb{Z}, pour un nombre premier p. Donc A/I est de caractéristique p, et il est isomorphe à une algèbre de type fini sur \mathbb{F}_p, laquelle est, par le lemme de Zariski, algébrique sur \mathbb{F}_p. Par le lemme 6, elle est donc un \mathbb{F}_p-espace vectoriel de dimension fini, et, de fait, de cardinal fini.

    • Les formules \circledast sont encore vraies dans une clôture algébrique de A/I : c’est impossible, car le théorème d’Ax-Grothendieck est vérifié dans les clôtures algébriques des corps finis, par le lemme introductif.

Ax-Grothendieck à l’épreuve de la théorie des modèles

Notions de base

Syntaxe

Un système formel (par exemple : le calcul des prédicats (logique du premier ordre), dans lequel on se placera dans la suite) est constitué des éléments ci-après.

Langage :

C’est un ensemble de symboles de fonctions et de prédicats (ou relations) d’arités (i.e : de “nombre d’argument”) finies, ainsi que de constantes (fonctions d’arité nulle): dans la suite, on se placera sur le langage des anneaux : \mathcal{L}_{\textit{ anneaux}} = \lbrace 0,1,+,\times \rbrace

On se donne un ensemble dénombrable de variables \lbrace x_i \rbrace_{i \in \mathbb{N}}.

Terme
  • une variable x_i (i \in \mathbb{N})

  • OU une constante

  • OU une fonction d’arité n \in \mathbb{N} appliquée à n termes

Formule atomique

Un prédicat d’arité n \in \mathbb{N} appliqué à n termes

Formule

Une expression construite par induction à partir des formules atomiques, et des symboles ((, ), ",") / connecteurs (\to, \leftrightarrow, \lnot, \land, \lor) / quantificateurs (\forall, \exists) de la logique, en l’occurrence, du premier ordre.

Variables liées/libres

Dans une formule, une variable quantifiée est dite liée (libre sinon).

Énoncé/formule close

Une formule ne contenant que des variables liées.

Théorie

un ensemble d’énoncés. Les théories des anneaux commutatifs, des corps, des corps algébriquement clos de caractéristique p \in \underbrace{\lbrace \text{nombres premiers } \rbrace}_{\text{ noté \, } \mathbb{P}}, et 0 sont respectivement :

\begin{array}{l l l} \mathcal{T}_{\textit{ anneaux comm}} = &\big\{ & \\ & \hspace{1em} \forall x_1, \, \forall x_2, \, \forall x_3, \, & (x_1 + x_2) + x_3 = x_1 + (x_2 + x_3) \, ; \\ & \hspace{1em} \forall x_1, \, & x_1 = x_1 + 0 \, ; \\ & \hspace{1em} \forall x_1, \, \exists x_2, \, & x_1 + x_2 = 0 \, ; \\ & \hspace{1em} \forall x_1, \, \forall x_2, \, & x_1 + x_2 = x_2 + x_1 \, ; \\ & \hspace{1em} \forall x_1, \, \forall x_2, \, \forall x_3, \, & (x_1 \times x_2) \times x_3 = x_1 \times (x_2 \times x_3) \, ; \\ & \hspace{1em} \forall x_1, \, & x_1 \times 1 = 1 \times x_1 \, ; \\ & \hspace{1em} \forall x_1, \, \forall x_2, \, \forall x_3, \, & x_1 \times (x_2 + x_3) = x_1 \times x_2 + x_1 \times x_3 \, ; \\ & \hspace{1em} \forall x_1, \, \forall x_2, \, & x_1 \times x_2 = x_2 \times x_1 \, ; \\ & \big\} & \\ & & \\ \mathcal{T}_{\textit{ corps}} = &\big\lbrace \hspace{0.5em}\forall x_1, \, \exists x_2, \, & \lnot (x_1 = 0) \longrightarrow (x_1 \times x_2 = 1) \hspace{0.5em} \big \rbrace \\ \hspace{2.2em}\cup & \mathcal{T}_{\textit{ anneaux comm}} & \\ & & \\ \mathtt{CAC} = &\mathcal{T}_{\textit{ corps}} & \\ \hspace{1.9em}\bigcup\limits_{n \in \mathbb{N}^*} &\big\lbrace \hspace{0.5em} \forall x_1, \ldots, \forall x_n, \, \exists x_0 , \, & x_0^n + x_n x_0^{n-1} + \ldots + x_2 x_0 + x_1 = 0 \hspace{0.5em} \big \rbrace \\ & & \\ \mathtt{CAC}_{p} = &\mathcal{T}_{\textit{ corps}} & \\ \hspace{2.4em}\cup &\mathtt{CAC} & \\ \hspace{2.4em}\cup &\big\lbrace \hspace{0.5em} p = 0 \hspace{0.5em}\big \rbrace & \\ & & \\ \mathtt{CAC}_{0} = &\mathcal{T}_{\textit{ corps}} & \\ \hspace{2.4em}\cup &\mathtt{CAC} & \\ \hspace{2.1em}\bigcup\limits_{q \in \mathbb{P}} &\big\lbrace \hspace{0.5em} \lnot (q = 0) \hspace{0.5em}\big \rbrace & \\ & & \\ \end{array}

Sémantique

Soit \mathcal{L} un langage.

\mathcal{L}-structure

Un ensemble \mathcal{M} (appelé domaine du discours) non vide, où on interprète les éléments de \mathcal{L} : i.e on choisit

  • c^{\mathcal{M}} pour chaque symbole de constante c \in \mathcal{L}

  • ET f^{\mathcal{M}} : \mathcal{M}^{n_f} \to \mathcal{M} pour chaque symbole de fonction f \in \mathcal{L} d’arité n_f

  • ET P^{\mathcal{M}} \subset \mathcal{M}^{n_P} pour chaque symbole de prédicat P \in \mathcal{L} d’arité n_P

On interprète, ainsi, les \mathcal{L}-formules atomiques closes, puis les \mathcal{L}-énoncés de manière “usuelle” à partir des formules atomiques, par induction. On dit que la \mathcal{L}-structure \mathcal{M} satisfait un énoncé \theta, qu’on note \mathcal{M} \vDash \theta, si et seulement si \theta une assertion vraie dans \mathcal{M} (après l’avoir interprété). Pour une théorie \mathcal{T} dont les énoncés sont tous vrais dans \mathcal{M}, on note, de même, \mathcal{M} \vDash \theta.

Modèle

\mathcal{M} est un modèle de l’énoncé \theta (resp. de la théorie \mathcal{T}) si, et seulement si, \mathcal{M} \vDash \theta (resp. \mathcal{M} \vDash \mathcal{T}). Les modèles de \mathcal{T}_{\textit{ anneaux comm}} sont les anneaux commutatifs, ceux de \mathtt{CAC}_{0} sont les corps algébriquement clos de caractéristique nulle.

Satisfaisabilité

une théorie \mathcal{T} est dite : satisfaisable si elle admet au moins un modèle, finiment satisfaisable si toute partie finie de \mathcal{T} est satisfaisable.

Conséquence sémantique

on dit qu’un énoncé \theta est une conséquence (sémantique) d’une théorie \mathcal{T} si : pour tout modèle \mathcal{M} de \mathcal{T}, \mathcal{M} \vDash \theta. On le note \mathcal{T} \vDash \theta.

Théorème de Compacité

Filtres, Ultrafiltres et Ultraproduits

Filtre

un filtre \mathcal{F} sur un ensemble I est une partie de \mathcal{P}(I) vérifiant :

  • \emptyset \not\in \mathcal{F}
  • \forall X \in \mathcal{F}, \forall Y \in \mathcal{P}(I), \, Y \supset X \Longrightarrow Y \in \mathcal{F}
  • \forall X, Y \in \mathcal{F}, \, X \cap Y \in \mathcal{F}
Ultrafiltre

un filtre maximal (pour l’inclusion).

Ultrafiltre principal/trivial

un ultrafiltre de la forme \mathcal{U}_{X_0} {\overset{ { \text{déf}}}{=}}\lbrace Y \in \mathcal{P}(I) \mid Y \supset X_0 \rbrace, pour une partie X_0 \subset I.

Filtre de Frechet

Si I est infini, c’est l’ensemble des parties cofinies de I : \mathtt{Fr} {\overset{ { \text{déf}}}{=}}\lbrace Y \in \mathcal{P}(I) \mid I\backslash Y \text{ est finie} \rbrace. Il n’est pas principal (si Y \in \mathtt{Fr}, Y\backslash\lbrace y \rbrace \in \mathtt{Fr}, pour tout y \in Y).

Propriété de l’intersection finie

Une famille \mathcal{X} de parties de I a la “propriété de l’intersection finie” si : \forall X_1, \ldots, X_n \in \mathcal{X}, \, \bigcap_{i=1}^n X_i \neq \emptyset. Tout filtre a la propriété de l’intersection finie.

Lemmes sur les ultrafiltres

  1. Tout filtre \mathcal{F} sur I est un ultrafiltre si, et seulement si : \forall X \in \mathcal{P}(I), \, X \not\in \mathcal{F} \Longrightarrow I\backslash X \in \mathcal{F}.

  2. Tout filtre sur I est inclus dans un ultrafiltre.

  3. Toute famille \mathcal{X} de parties de I ayant la propriété de l’intersection finie est incluse dans un ultrafiltre.

  4. Si I est infini : si \mathcal{U} est un ultrafiltre non principal, il contient le filtre de Fréchet.

  5. Mesure associée à un ultrafiltre : tout ultrafiltre sur I correspond à la donnée d’une mesure finiment additive.

  1. Pour tout filtre \mathcal{F} et toute partie X telle X \not\in \mathcal{F} : \mathcal{F} \cup \lbrace X \rbrace n’a pas la propriété de l’intersection finie si, et seulement si, I\backslash X \in \mathcal{F}.

    • En effet : \Longleftarrow : Si I\backslash X \in \mathcal{F}, (I\backslash X)\cap X = \emptyset \Longrightarrow : Si \mathcal{F} \cup \lbrace X \rbrace n’a pas cette propriété, il existe X_1, \ldots, X_n \in \mathcal{F} tels que X_1 \cap \cdots \cap X_n \cap X = \emptyset, d’où (I\backslash X) \supset X_1 \cap \cdots \cap X_n, et I\backslash X \in \mathcal{F}
    Donc l’implication directe est acquise, et réciproquement, si
    \forall X \in \mathcal{P}(I), \, X \not\in \mathcal{F} \Longrightarrow I\backslash X \in \mathcal{F}
    \mathcal{F} \cup \lbrace X \rbrace ne peut être un filtre (et donc avoir la propriété de l’intersection finie) que si I\backslash X \not\in \mathcal{F}, et donc (par hypothèse) que si X \in \mathcal{F} (i.e \mathcal{F} \cup \lbrace X \rbrace = \mathcal{F}).
  2. L’ensemble E_{\mathcal{F}} des filtres sur I contenant \mathcal{F} est tel que tout sous-ensemble E' de E_{\mathcal{F}} totalement ordonné (pour l’inclusion) a un majorant (le filtre qu’est l’union des éléments de E', par exemple), donc, par le lemme de Zorn, E_{\mathcal{F}} a un élément maximal (un ultrafiltre).

  3. \mathcal{X} est incluse dans le filtre \mathcal{F}_{\mathcal{X}} {\overset{ { \text{déf}}}{=}}\lbrace Y \in \mathcal{P}(I) \mid \exists X_1, \ldots, X_n \in \mathcal{X}; Y \supset X_1 \cap \cdots \cap X_n \rbrace, lui-même inclus dans un ultrafiltre.

  4. Si \mathcal{U} contenait une partie finie X_0, il serait le filtre principal \mathcal{F}_{X_0} qu’elle engendre (il le contiendrait trivialement, et ne pourrait contenir de partie Y \not\supset X_0, car \mathcal{U} \ni (I\backslash Y) \supset X_0). Donc, par (A), \mathcal{U} contient toutes les parties cofinies.

  5. À tout ultrafiltre \mathcal{U} sur I, on associe la mesure finiment additive \mu_{\mathcal{U}} : \mathcal{P}(I) \to \lbrace 0, 1 \rbrace définie par : \forall X \in \mathcal{P}(I), \, \, \mu_{\mathcal{U}}(X) = 1 \iff X \in \mathcal{U} Réciproquement : si \mu : \mathcal{P}(I) \to \lbrace 0, 1 \rbrace est une mesure finiment additive, \mathcal{U}_\mu {\overset{ { \text{déf}}}{=}}\mu^{-1}(\lbrace 1 \rbrace) est un ultrafiltre.

    • En effet : La seule propriété non triviale à vérifier pour montrer que c’est un filtre est la stabilité par intersection : si \mu(X)=\mu(Y)=1, et, par l’absurde, \mu(X\cap Y) = 0 : 1 = \mu(I) \geq \mu(X \cup Y) = \mu(X\backslash (X\cap Y)) + \mu(Y\backslash (X\cap Y)) = 2. De plus, pour tout partie X \not\in \mathcal{U}, 1 = \mu((I\backslash X)\cup X) = \mu((I\backslash X) + \mu(X) = \mu((I\backslash X), d’où \mathcal{U} \ni (I\backslash X), et \mathcal{U} est un ultrafiltre, par (A).

    Dans la suite, on confondra un ultrafiltre et la mesure finiment additive qui lui est naturellement associée.

Ultrafiltres : remarque qualitative

Intuitivement, un ultrafiltre correspond à la donnée des “grandes” parties de I, de telle sorte que toute partie est soit “grande” (\mathcal{U}-presque sûre) soit “petite” (\mathcal{U}-négligeable). Si I est infini et \mathcal{U} non trivial, on convient que X \subset I est “grande” si, et seulement si, son complémentaire est “petit”, que toute intersection finie de parties “grandes” reste “grande” et que I tout entier est “grand”.

   Soient \left(\mathcal{M}_i\right)_{i \in I} une famille de \mathcal{L}-structures et \mathcal{U} un ultrafiltre sur I.

Égalité \mathcal{U}-presque partout

On définit, sur \prod_{i \in I} \mathcal{M}_i, une relation d’équivalence d’“égalité \mathcal{U}-presque partout” par : \forall M, N \in \prod_{i \in I} \mathcal{M}_i, \, \, \, M \overset{\mathcal{U}{\text{-pp}}}{=} N \iff \big\lbrace i \in I \mid \, M_i = N_i \big\} \in \mathcal{U} \iff \mu_{\mathcal{U}}\big(\left\{i \in I \mid \, M_i = N_i \right \rbrace\big) = 1

Ultraproduit

L’ultraproduit \mathcal{M}^{*} des \mathcal{M}_i (i \in I) par l’ultrafiltre \mathcal{U} est le quotient de \prod_{i \in I} \mathcal{M}_i par la relation d’équivalence \overset{\mathcal{U}{\text{-pp}}}{=}. On le note \prod_{i \in I} \mathcal{M}_i \Big/ \mathcal{U}.

L’ultraproduit est une $$\mathcal{L}$$-structure : \mathcal{M}^* {\overset{ { \text{déf}}}{=}}\prod_{i \in I} \mathcal{M}_i \Big/ \mathcal{U} est une \mathcal{L}-structure.

C’est le cas en interprétant

  • c^{\mathcal{M}^*} {\overset{ { \text{déf}}}{=}}\overline{\left(c^{\mathcal{M}_i}\right)_{i \in I}} pour chaque symbole de constante c \in \mathcal{L}

  • f^{\mathcal{M}^*} : {\left(\mathcal{M}^*\right)}^{n_f} \to \mathcal{M}^*, \, \, \bigg(\overline{M^{(1)}}, \ldots, \, \overline{M^{(n_f)}}\bigg) \mapsto \overline{\bigg(f^{\mathcal{M}_i}\big(M^{(1)}_i, \ldots, \, M^{(n_f)}_i\big)\bigg)_{i \in I}} pour chaque symbole de fonction f \in \mathcal{L} d’arité n_f

  • chaque symbole de prédicat P \in \mathcal{L} d’arité n_P par : \bigg(\overline{M^{(1)}}, \ldots, \, \overline{M^{(n_P)}}\bigg) \in P^{\mathcal{M}^*} \subset {\left(\mathcal{M}^*\right)}^{n_P} \iff \left\lbrace i \in I \mid \, \big(M^{(1)}_i, \ldots, \, M^{(n_P)}_i \big) \in P^{\mathcal{M}_i} \, \right \rbrace \in \mathcal{U}

Ultraproduits : remarques qualitatives

  • Ce qui est embêtant, c’est que toutes les formules du premier ordre ne sont pas préservées par passage au produit, en général : le fait que chaque M_i (i \in I) satisfasse une formule \phi n’implique pas qu’il en est de même pour le produit cartésien. Par (contre-)exemple, la disjonction “\lor” de l’énoncé "\forall x_1, \, \underbrace{(x_1 = 0)}_{\text{noté } \, A(x_1)} \lor \underbrace{(\exists x_2, \, x_1 \times x_2 = 1)}_{\text{noté } \, B(x_1)}" condamne l’ensemble des modèles de \mathcal{T}_{\textit{ corps}} à ne par être stable par produit cartésien (le connecteur “\lor” est “trop laxiste” : A(0) est vrai et B(0) est faux / A(1) est faux et B(1) est vrai : ce qui condamne A\big((0,1)\big) ET B\big((0,1)\big) à être faux !). En revanche, \mathcal{T}_{\textit{ anneaux comm}} a des modèles stables par produit cartésien, car ses énoncés sont des identités algébriques (i.e des clôtures par le quantificateur universel “\forall” de formules atomiques).

  • Intuitivement, un ultraproduit des structures \mathcal{M}_i (i \in I) est une forme de “moyenne”, ou d’“intégrale”, des structures calculée par rapport à la mesure “de probabilité” (seulement finiment additive, et pas \sigma-additive) associée à \mathcal{U}, de telle sorte qu’on pourrait le noter : \int_I \mathcal{M}(i) \, \mathrm d\mu_\mathcal{U}(i) Un ultrafiltre principal associé \lbrace i_0 \rbrace est dit “trivial” car il “correspond” à une mesure de Dirac concentrée en \lbrace i_0 \rbrace : l’“intégrale” vaut simplement \mathcal{M}_{i_0}. Si I est infini, un ultrafiltre non principal (contenant donc le filtre de Fréchet) correspond à une mesure diffuse : les résultats sont plus riches.

  • L’interprétation d’un ultraproduit en tant que que \mathcal{L}-structure est une interprétation “presque partout” relativement au produit cartésien : “un élément du produit cartésien est le représentant de l’interprétation d’une constante/de l’image par l’interprétation d’une fonction d’un n_f-uplet” OU “des éléments sont en relation dans l’ultraproduit” si c’est le cas en presque toutes coordonnées.

Théorème de Łoś

Une formule est vraie dans un ultraproduit si, et seulement si, elle est vraie en presque toutes coordonnées :    Si \mathcal{M}^* {\overset{ { \text{déf}}}{=}}\prod_{i \in I} \mathcal{M}_i \Big/ \mathcal{U} est un ultraproduit de \mathcal{L}-structures, \phi(x_1, \ldots, \, x_n) une \mathcal{L}-formule, et M^* = \bigg(\overline{M^{(1)}}, \ldots, \, \overline{M^{(n)}}\bigg) \in {\left(\mathcal{M}^*\right)}^n, alors : \mathcal{M}^* \vDash \phi(M^*) \iff \left\lbrace i \in I \mid \, \mathcal{M}_i \vDash \phi\big(M^{(1)}_i, \ldots, \, M^{(n)}_i \big) \, \right \rbrace \in \mathcal{U}

Pour toute \mathcal{L}-formule \psi, on note I(\psi) l’ensemble \left\lbrace i \in I \mid \, \mathcal{M}_i \vDash \psi\big(M^{(1)}_i, \ldots, \, M^{(n)}_i \big) \, \right \rbrace. Par induction structurelle :

  • Si \phi est atomique, cela résulte de l’interprétation des \mathcal{L}-prédicats et \mathcal{L}-termes dans la \mathcal{L}-structure \mathcal{M}^*.

  • Si \phi = \lnot \psi, \begin{aligned} I(\phi) \in \mathcal{U} \iff& I\big\backslash I(\phi) = \left\lbrace i \in I \mid \, \mathcal{M}_i \vDash \psi\big(M^{(1)}_i, \ldots, \, M^{(n)}_i \big) \, \right \rbrace \not\in \mathcal{U}\end{aligned} car \mathcal{U} est un ultrafiltre. On conclut par hypothèse d’induction.

  • Si \phi = \psi \land \chi : pour que I(\phi) \in \mathcal{U}, il faut (car I(\phi) \subset I(\psi), I(\chi)) et il suffit (par stabilité par intersection) que I(\psi) \in \mathcal{U} et I(\chi) \in \mathcal{U}, puisque \mathcal{U} est un filtre. On conclut par hypothèse d’induction.

  • Si \phi(x_1, \ldots, x_n) = \exists x_0, \, \psi(x_0, x_1, \ldots, x_n) :

    • \Longrightarrow : Si \mathcal{M}^* \vDash \phi(M^*), il existe \overline{M^{(0)}} \in \mathcal{M}^* tel que \mathcal{M}^* \vDash \psi\big(\overline{M^{(0)}}, M^*\big), et, par hypothèse d’induction : \mathcal{U} \ni \left\lbrace i \in I \mid \, \mathcal{M}_i \vDash \psi\big(M^{(0)}_i, M^{(1)}_i, \ldots, \, M^{(n)}_i \big) \, \right\} \subset \left\{i \in I \mid \, \mathcal{M}_i \vDash \exists x_0, \psi\big(x_0, M^{(1)}_i, \ldots, \, M^{(n)}_i \big) \, \right \rbrace = I(\phi) Donc I(\phi) \in \mathcal{U}, car \mathcal{U} est un filtre.

    • \Longleftarrow : Si I(\phi) \in \mathcal{U}, pour tout i \in I(\phi) : par l’axiome du choix, il existe M^{(0)}_i \in \mathcal{M}_i tel que \mathcal{M}_i \vDash \psi\big(M^{(0)}_i, M^{(1)}_i, \ldots, \, M^{(n)}_i \big). En notant, pour tout j \in I\backslash I(\phi), M^{(0)}_j un élément quelconque de \mathcal{M}_j \neq \emptyset (avec l’axiome du choix), il vient que : M^{(0)} \in \prod_{i \in I} \mathcal{M}_i est tel que \mathcal{M}^* \vDash \psi\big(\overline{M^{(0)}}, M^*\big) par hypothèse d’induction (comme I(\phi) \in \mathcal{U}), et \mathcal{M}^* \vDash \phi(M^*) est acquis.

Pour conclure, on utilise le fait que : \forall x_0, \phi \equiv \lnot (\exists x_0, \lnot \phi); \phi \lor \psi \equiv \lnot (\lnot \phi \land \lnot \psi); \phi \longrightarrow \psi \equiv \lnot (\phi \land \lnot \psi); et \phi \longleftrightarrow \psi \equiv (\phi \longrightarrow \psi) \land (\psi \longrightarrow \phi).

Théorème de Compacité

Une théorie est satisfaisable si et seulement si elle est finiment satisfaisable.

Soit \mathcal{T} une théorie finiment satisfaisable, dont on note I l’ensemble des parties finies. Par hypothèse : pour tout i \in I, il existe un modèle \mathcal{M}_i tel que \mathcal{M}_i \vDash i. Pour tout \theta \in \mathcal{T}, on pose I(\theta) {\overset{ { \text{déf}}}{=}}\left\lbrace i \in I \mid \, \mathcal{M}_i \vDash \theta \, \right \rbrace. La famille \left(I(\theta)\right)_{\theta \in \mathcal{T}} est incluse dans un ultrafiltre \mathcal{U}, car elle admet la propriété de l’intersection finie (\forall \theta_1, \ldots, \theta_n \in \mathcal{T}, \, \emptyset \neq \bigcap_{k = 1}^n I(\theta_k) \ni \lbrace \theta_1, \ldots, \theta_n \rbrace). L’ultraproduit \mathcal{M}^* {\overset{ { \text{déf}}}{=}}\prod_{i \in I} \mathcal{M}_i \Big/ \mathcal{U} est alors un modèle de \mathcal{T}, puisque : si \theta \in \mathcal{T}, I(\theta) \in \mathcal{U}, d’où, par Łoś, \mathcal{M}^* \vDash \theta.

Est-il trop “fort” de recourir à l’axiome du choix ?Le recours à l’axiome du choix (équivalent au lemme de Zorn) - pour démontrer l’existence, pour tout filtre, d’un ultrafiltre le contenant ET dans le théorème de Łoś - peut paraître trop “fort”. Mais il n’en est rien : la démonstration “classique” du théorème de compacité repose sur le théorème de complétude de Gödel (“une théorie est satisfaisable si, et seulement si, elle est cohérente/consistante/non contradictoire”), qui y a aussi recours.

Corollaire 1 du théorème de compacité Si \mathcal{T} est une théorie, \theta un énoncé tels que \mathcal{T} \vDash \theta, alors il existe une partie finie F \subset \mathcal{T} telle que F \vDash \theta

On montre la contraposée. Si, pour toute partie finie F \subset \mathcal{T} : F \not\vDash \theta, c’est-à-dire qu’il existe un modèle \mathcal{M}_F de F qui satisfait \lnot \theta, alors \mathcal{T}\cup\lbrace \lnot \theta \rbrace est finiment satisfaisable, et, par compacité, est satisfaisable : cela contredit “\mathcal{T} \vDash \theta”.

Corollaire 2 du théorème de compacité Dans le langage des anneaux : si \theta est un énoncé qui est vrai dans des corps de caractéristiques p \in \mathbb{P}, pour p arbitrairement grand, alors il existe un corps de caractéristique nulle qui satisfait \theta.

On montre la contraposée, appliquée à \lnot \theta : si \theta est un énoncé vrai dans tous les corps de caractéristique nulle, alors il existe q \in \mathbb{P} tel que \theta est vrai dans tous les corps de caractéristique supérieure à q. On pose T {\overset{ { \text{déf}}}{=}}\mathcal{T}_{\textit{ corps}} \cup \lbrace p \neq 0 \rbrace_{p \in \mathbb{P}}, dont les modèles sont les corps de caractéristique nulle. Par hypothèse, T \vDash \theta, donc il existe une partie finie F \varsubsetneq T telle que F \vDash \theta (par le corollaire 1). Or, F \subset \mathcal{T}_{\textit{ corps}} \cup \lbrace p \neq 0 \rbrace_{p \in \mathbb{P}\cap ⟦ 0, q-1 ⟧}, pour un q \in \mathbb{P}. Par suite, tout corps de caractéristique supérieure à q est un modèle de F, et donc aussi de \theta.

Ce n’est pas finiAvec ce deuxième corollaire, on pourrait croire qu’on est à deux doigts du théorème d’Ax - modulo la démonstration du fait qu’il se formule comme un ensemble d’énoncés dans le langage des anneaux, et qu’il est vrai dans des corps de caractéristique arbitrairement grande (ces deux derniers points sont vrais). Mais il n’en est rien : il n’est pas dit que le corps de caractéristique nulle satisfaisant le théorème d’Ax - dont l’existence est avérée - est isomorphe à \mathbb{C} (penser à \mathbb{Q}).

Ax-Grothendieck

Cardinalité d’un ultraproduit & 2^{\aleph_0}-catégoricité de \mathtt{CAC_p}

Tous corps algébriquement clos \mathbb{K}, \mathbb{L} de même cardinal \kappa non dénombrable et de même caractéristique p \in \lbrace 0 \rbrace\cup\mathbb{P} sont isomorphes. On dit que \mathtt{CAC_p} est \kappa-catégorique.

  • Un corps algébriquement clos est déterminé, à isomorphisme près, par sa caractéristique et son degré de transcendance sur son sous-corps premierDeux corps algébriquement clos K_1, K_2 sont isomorphes si, et seulement si, ils ont la même caractéristique et le même degré de transcendance sur leur sous-corps premier.

    L’implication directe est évidente. Réciproquement, si K_1 est de degré de transcendance k sur son sous-corps premier \pi, alors pour toute base de transcendance S de cardinalité k, K_1 \cong \overline{\pi(S)}. Comme il en est de même de K_2, le résultat est acquis.

  • Comme \kappa est non dénombrable, \mathbb{K} et \mathbb{L} ont le même degré de transcendance sur leur sous-corps premier au plus dénombrable : \kappa. En effet, l’ensemble des éléments algébriques sur ce sous-corps premier au plus dénombrable reste dénombrable (l’ensemble des polynômes minimaux est dénombrable). Le lemme introductif conclut.

Lemme : Cardinalité de l’ultraproduit d’une famille dénombrable d’ensembles dénombrables.Soit \mathcal{U} un ultrafiltre non principal sur \mathbb{N}. Si \mathcal{M}^* {\overset{ { \text{déf}}}{=}}\prod_{i \in \mathbb{N}} \mathcal{M}_i \Big/ \mathcal{U} est un ultraproduit de \mathcal{L}-structures dénombrables, alors \mathcal{M}^* est de cardinalité égale à \left\vert \mathcal{P}(\mathbb{N}) \right\vert = 2^{\aleph_0}

Pour tout i \in \mathbb{N}, \mathcal{M}_i est de la forme \lbrace m^{(i)}_n \rbrace_{n \in \mathbb{N}}. On construit un ensemble F \subset \mathbb{N}^{\mathbb{N}} de fonctions telles que : si f, g \in F sont différentes, elles sont \mathcal{U}-presque partout différentes (i.e \big\lbrace i \in \mathbb{N} \mid \, f(i) \neq g(i) \big\} \in \mathcal{U} \iff \big\{i \in \mathbb{N} \mid \, f(i) = g(i) \big\} \not\in \mathcal{U} \iff \big\{i \in \mathbb{N} \mid \, f(i) = g(i) \big \rbrace est fini). F {\overset{ { \text{déf}}}{=}}\big\lbrace f_\delta {\overset{ { \text{déf}}}{=}}n \mapsto \sum\limits_{m<n} \delta(m) 2^m \big\}_{\delta \in \{0,1 \rbrace^\mathbb{N}} convient, et vérifie \vert F\vert = 2^{\aleph_0} = \left\vert \mathcal{P}(\mathbb{N}) \right\vert. L’application : \phi {\overset{ { \text{déf}}}{=}}\left\{ \begin{array}{lcll} & F & \to & \prod_{i \in \mathbb{N}} \mathcal{M}_i \Big/ \mathcal{U} \\ & f & \mapsto & \overline{\left(m^{(i)}_{f(i)}\right)_{i \in \mathbb{N}}} \end{array}\right. est injective :

  • En effet : Pour toutes f, g \in F, si f \neq g : \mathcal{U} \not\ni \big\lbrace i \in \mathbb{N} \mid \, f(i) = g(i) \big\} = \big\{i \in \mathbb{N} \mid \, m^{(i)}_{f(i)} = m^{(i)}_{g(i)} \big \rbrace, d’où : \overline{\left(m^{(i)}_{f(i)}\right)_{i \in \mathbb{N}}} \neq \overline{\left(m^{(i)}_{g(i)}\right)_{i \in \mathbb{N}}}.

RaffinementOn aurait pu seulement supposer les (\mathcal{M}_i)_{i \in \mathbb{N}} de cardinalités non bornées : en effet, en notant n_i le plus petit entier tel que \vert\mathcal{M}_i\vert \geq 2^{n_i} > f(n_i), \phi {\overset{ { \text{déf}}}{=}}\left\{ \begin{array}{lcll} & F & \to & \prod_{i \in \mathbb{N}} \mathcal{M}_i \Big/ \mathcal{U} \\ & f & \mapsto & \overline{\left(m^{(i)}_{f(n_i)}\right)_{i \in \mathbb{N}}} \end{array}\right. convenait.

Théorème de transfert

Pour tout P \subset \mathbb{P} infini, et tout ultrafiltre non principal \mathcal{U} sur P : L’ultraproduit de la famille des clôtures algébriques des \left(\mathbb{F}_p\right)_{p \in P} est isomorphe à \mathbb{C}.

On note \mathbb{K}^* {\overset{ { \text{déf}}}{=}}\prod_{p \in P} \overline{\mathbb{F}_p} \Big/ \mathcal{U} cet ultraproduit, et on pose \mathbb{K}_p {\overset{ { \text{déf}}}{=}}\overline{\mathbb{F}_p}.

  1. \mathbb{K}^\ast est un corps algébriquement clos :

    En effet : Pour tout p \in \mathbb{P}, \mathbb{K}_p satisfait \mathtt{CAC}, donc par Łoś, \mathbb{K}^* aussi.

  2. \mathbb{K}^\ast est de caractéristique nulle : En effet : Pour tout q \in \mathbb{P}, \big\lbrace p \in P \mid \, \mathbb{K}_p \vDash q \neq 0 \big \rbrace est cofini, et appartient donc à \mathcal{U}. Il s’ensuit, par Łoś, que \mathbb{K}^* \vDash q \neq 0.

  3. \mathbb{K}^\ast est isomorphe à \mathbb{C} : En effet : Par le lemme sur la cardinalité de l’ultraproduit d’une famille dénombrable d’ensembles dénombrables, \mathbb{K}^* a la cardinalité - non dénombrable - de \mathbb{C}. Comme ces deux corps sont en plus algébriquement clos et de même caractéristique (nulle), ils sont isomorphes, par le théorème de catégoricité de la section précédente.

Remarque : On peut voir \mathbb{C} comme la “limite” des \mathbb{F}_p, quand p tend vers l’infini, dans le sens très précis évoqué plus haut.

Toute théorie \mathcal{T} du langage des anneaux est vraie dans \mathbb{C} dès qu’elle est vraie dans les clôtures algébriques des \mathbb{F}_p, pour une infinité de nombres premiers p.

On note P l’ensemble des nombres premiers p tels que \overline{\mathbb{F}_p} satisfait \mathcal{T}, \mathcal{U} un ultrafiltre non principal sur P. Par le théorème précédent, \mathbb{C} est isomorphe à \mathbb{K}^* {\overset{ { \text{déf}}}{=}}\prod_{p \in P} \overline{\mathbb{F}_p} \Big/ \mathcal{U}, qui est lui-même un modèle de \mathcal{T}, par Łoś. Donc \mathbb{C} satisfait \mathcal{T}.

Ax-Grothendieck

Lemme : Clôture algébrique de $$\mathbb{F}_p$$Soit p \in \mathbb{P}. “La” (à isomorphisme près) clôture algébrique de \mathbb{F}_p est localement finie.

  Pour tous n < k \in \mathbb{N}^*, on note f_n^k un plongement de \mathbb{F}_{p^{n!}} dans \mathbb{F}_{p^{k!}} (dont l’existence a été précédemment assurée, puisque n! \lvert \, k!). On note \overline{\mathbb{F}_p} l’ensemble quotient de E {\overset{ { \text{déf}}}{=}}\bigsqcup\limits_{n \in \mathbb{N}^*} \mathbb{F}_{p^{n!}} par la relation d’équivalence : \forall x, y \in E, \forall n, m \in \mathbb{N}^*, \, \, \, (p^{n!},x) \sim (p^{m!},y) \Leftrightarrow \exists k \in \mathbb{N}^*, \, n \leq k, \, m \leq k \text{ et } \, f_n^k(x)=f_m^k(y)

Pour tout n \in \mathbb{N}^*, \mathbb{F}_{p^{n!}} s’injecte dans \overline{\mathbb{F}_p} par l’application : \phi_{p^{n!}} {\overset{ { \text{déf}}}{=}}\left\{ \begin{array}{cll} \mathbb{F}_{p^{n!}} & \to & \overline{\mathbb{F}_p} \\ x & \mapsto & \overline{(p^{n!},x)} \end{array}\right.

$$\overline{\mathbb{F}_p}$$ intuitivementIntuitivement, \overline{\mathbb{F}_p} se comprend comme étant la “réunion” de la chaîne croissante2 : \mathbb{F}_p \subset \mathbb{F}_{p^2} \subset \mathbb{F}_{p^6} \subset \ldots \subset \mathbb{F}_{p^{n!}} \subset \ldots

Montrons que :

  1. \overline{\mathbb{F}_p} est une extension algébrique de \mathbb{F}_p :

    • \overline{\mathbb{F}_p} est un corps : Soient a \in \mathbb{F}_{p^{n!}}, b \in \mathbb{F}_{p^{m!}}. Or, \mathbb{F}_{p^{n!}} et \mathbb{F}_{p^{m!}} sont isomorphes à deux sous-corps de \mathbb{F}_{p^{\max(m,n)!}}, dont a et b peuvent être comme des éléments (par isomorphisme). L’addition et la multiplication se font alors dans \mathbb{F}_{p^{\max(m,n)!}}, et, de plus, tout élément non nul (dans \overline{\mathbb{F}_p}) admet un inverse.

    • \overline{\mathbb{F}_p} est algébrique sur \mathbb{F}_p, car tous les \mathbb{F}_{p^{n!}} (n \in \mathbb{N}^*) sont des \mathbb{F}_p-espaces vectoriels3 de dimension finie.  

  2. \overline{\mathbb{F}_p} est algébriquement clos : Soit P \in \overline{\mathbb{F}_p}[X] un polynôme de degré supérieur à 1.

    • Cas 1 : P a une racine4 dans \mathbb{F}_p. Alors P a une racine dans \overline{\mathbb{F}_p}, puisque \mathbb{F}_p s’injecte dans \overline{\mathbb{F}_p}.

    • Cas 2 : P est irréductible sur \mathbb{F}_p. Alors, en posant n {\overset{ { \text{déf}}}{=}}\deg P, P a une racine dans \mathbb{F}_{p^n} :

      • En effet : L’anneau K {\overset{ { \text{déf}}}{=}}\mathbb{F}_p[X]/(P) est un corps (car P est irréductible), qui un \mathbb{F}_p-espace vectoriel de dimension \deg P = n (car \mathbb{F}_p[X] est euclidien). Par unicité des corps finis, il vient donc que \mathbb{F}_p[X]/(P) \, \cong \, \mathbb{F}_{p^n}. L’image de X par cet isomorphisme est donc racine du polynôme X^{p^n}-X, d’où P divise X^{p^n} - X, qui est scindé sur \mathbb{F}_{p^n}.

      Or, \mathbb{F}_{p^n} s’injecte dans \mathbb{F}_{p^{n!}}, qui lui-même s’injecte dans \overline{\mathbb{F}_p} : P a une racine dans \overline{\mathbb{F}_p}.

  Donc \overline{\mathbb{F}_p} est une clôture algébrique de \mathbb{F}_p, et, de par son expression, tout sous-corps finiment engendré de \overline{\mathbb{F}_p} est fini (puisqu’isomorphe à un sous-corps d’un \mathbb{F}_{p^{n!}}, pour n assez grand) : \overline{\mathbb{F}_p} est localement finie.

Toute fonction polynomiale de \mathbb{C}^n dans \mathbb{C}^n qui est injective est bijective.

  • Pour les clôtures algébriques $$\overline{\mathbb{F}_p}$$ des $$\mathbb{F}_p$$Soit p \in \mathbb{P}. Toute fonction polynomiale P de \overline{\mathbb{F}_p}^n dans \overline{\mathbb{F}_p}^n qui est injective est bijective.

    Soit P = (P_1, \ldots, P_n) : \overline{\mathbb{F}_p}^n \to \overline{\mathbb{F}_p}^n une fonction polynomiale injective, et y = (y_1, \ldots, y_n) \in \overline{\mathbb{F}_p}^n.

    On note k le sous-corps de \overline{\mathbb{F}_p} engendré par y_1, \ldots, y_n et les coefficients de P_1, \ldots, P_n : il est fini, car \overline{\mathbb{F}_p}^n est localement finie (par le lemme précédent). L’image de P_{\vert \, k^n} est incluse dans k^n (puisque chaque composante est incluse dans \lbrace k[a] \rbrace_{a \in k} \subset k). Donc P_{\vert \, k^n} est une application injective entre ensembles finis de même cardinal : elle est surjective, et il existe x \in k^n tel que k^n \ni y = P(x). P est donc surjective.

  • Le théorème d’Ax-Grothendieck s’énonce par une infinité d’énoncés du premier ordre (dans le langage des anneaux) : On pose, pour tout corps \mathbb{K}, fonction polynomiale P (P_1, \ldots, P_n) : \mathbb{K}^n \to \mathbb{K}^n de degré d \in \mathbb{N}^* : \begin{aligned} \text{Inj}_d\hspace{.4em}&(p_{0, 0, \ldots, 0}, p_{1, 0, \ldots, 0}, \ldots, p_{d, 0, \ldots, 0}, p_{0, 1, \ldots, 0} \ldots, p_{d, d, \ldots, d}) {\overset{ { \text{déf}}}{=}}"\forall x_1, \ldots, x_n, \forall y_1, \ldots, y_n, \\ &\bigwedge\limits_{k=1}^n \sum\limits_{i_1 + \ldots + i_n \leq d} p_{i_1, \ldots, i_n} x_1^{i_1} \cdots x_n^{i_n} = \sum\limits_{i_1 + \ldots + i_n \leq d} p_{i_1, \ldots, i_n} y_1^{i_1} \cdots y_n^{i_n} \longrightarrow \bigwedge\limits_{k=1}^n x_k = y_k" \\ ~~\\ \text{Surj}_d&(p_{0, 0, \ldots, 0}, p_{1, 0, \ldots, 0}, \ldots, p_{d, 0, \ldots, 0}, p_{0, 1, \ldots, 0} \ldots, p_{d, d, \ldots, d}) {\overset{ { \text{déf}}}{=}}"\forall y_1, \ldots, y_n, \exists x_1, \ldots, x_n, \\ &\bigwedge\limits_{k=1}^n \sum\limits_{i_1 + \ldots + i_n \leq d} p_{i_1, \ldots, i_n} x_1^{i_1} \cdots x_n^{i_n} = y_k" \\ ~~\\ \text{Ax}(d) &{\overset{ { \text{déf}}}{=}}"\forall p_{0, 0, \ldots, 0}, p_{1, 0, \ldots, 0}, \ldots, p_{d, 0, \ldots, 0}, p_{0, 1, \ldots, 0} \ldots, p_{d, d, \ldots, d}, \\ &\text{Inj}_d(p_{0, 0, \ldots, 0}, \ldots, p_{d, d, \ldots, d}) \longrightarrow \text{Surj}_d(p_{0, 0, \ldots, 0}, \ldots, p_{d, d, \ldots, d})" ~~\\~~\\ \mathcal{T}_{\text{Ax}} \hspace{0.9em}&{\overset{ { \text{déf}}}{=}}\lbrace \text{Ax}(d) \rbrace_{d \in \mathbb{N}^*} \\\end{aligned}

    \mathbb{K} vérifie alors le théorème d’Ax-Grothendieck si, et seulement si, \mathbb{K} \vDash \mathcal{T}_{\text{Ax}}

  • Dans \mathbb{C} : Pour tout p \in \mathbb{P}, \overline{\mathbb{F}_p} \vDash \mathcal{T}_{\text{Ax}} : donc d’après le théorème de transfert, \mathbb{C} \vDash \mathcal{T}_{\text{Ax}}, et le théorème d’Ax-Grothendieck est démontré.

ANNEXE

Lemmes pour le Lemme de Zariski
Anneau factoriel

Un anneau commutatif A est dit factoriel si tout élément de A se décompose de manière unique, à ordre et association près, en un produit d’éléments irréductibles et d’un élément inversible.

Anneau intégralement clos

Un anneau intègre A est dit intégralement clos si : pour tous a,b \in A\backslash\lbrace 0 \rbrace, si a/b (élément du corps des fractions de A) est racine d’un polynôme unitaire à coefficients dans A alors a/b \in A.

Idéal maximal

Un idéal est dit maximal si tout idéal qui le contient strictement est l’anneau lui-même.

  • Lemme 1 : Caractérisation des idéaux maximauxDans un anneau commutatif A : l’idéal I est maximal si, et seulement si, A/I est un corps.

    \Longrightarrow : Si I est maximal et a \in (A/I)\backslash\lbrace 0 \rbrace : en notant a_0 \in A\backslash I un représentant de a, I + a_0A = A (puisque cet idéal contient strictement I). Donc 1 = a_0 b + i, où b \in A, i \in I, et x est inversible.

    \Longleftarrow : Si A/I est un corps et I \subsetneq J \subset A : il existe a_0 \in J\backslash I, dont la classe a vérifie donc a \in (A/I)\backslash\lbrace 0 \rbrace. Donc 1 = a_0 b + i \in J, où b \in A, i \in I, et J=A.

  • Lemme 2 : Anneau Principal $$\Longrightarrow$$ Factoriel : Tout anneau principal est factoriel.

    Soit a_0 un élément d’un anneau principal A.   Existence, par l’absurde : si a_0 n’a pas de décomposition, alors a_0=a_1 ba_1 \not\in A^* et b \not\in A^*, b n’ayant pas non plus de décomposition (a est irréductible). On construit alors proche en proche une famille (a_n)_{n\in \mathbb{N}} telle que a_{n+1}\big\vert a_n, avec a_{n+1} et a_n non associés. L’idéal \left\langle a_n \right\rangle_{n\in \mathbb{N}} est alors de la forme cA, d’où : il existe N \in \mathbb{N} tel que c \in (a_n)_{n\in ⟦ 0,N ⟧}, donc a_N\big\vert c\big\vert a_{N+1} : absurde, car a_N et a_{N+1} ne sont pas associés.

    Pour chaque élément irréductible p, \left\langle p \right\rangle est maximal, car si \left\langle p \right\rangle \subset \left\langle a \right\rangle \subset A, alors p=ab pour un b \in A, et a est une unité - d’où \left\langle a \right\rangle = A - ou b est une unité - d’où \left\langle a \right\rangle = \left\langle p \right\rangle. Donc par le lemme 1, A/\langle p \rangle est un corps. Si u p_1 \cdots p_n = v q_1 \cdots q_m {\hspace{1em} \circledast} avec n,m>0 et des notations évidentes, alors en supposant, sans perte de généralité, que \langle p_1 \rangle ne contient aucun des (\langle p_i \rangle)_{i\in ⟦ 0,n ⟧} ni (\langle q_i \rangle)_{i\in ⟦ 0,m ⟧} : p_1 est nécessairement associé à l’un des q_i, car sinon, par \circledast dans A/\langle p \rangle, la classe de zéro est non nulle. On simplifie par l’élément régulier p_1, et on conclut par élimination de proche en proche.

  • Lemme 3 : Anneau Factoriel $$\Longrightarrow$$ Intégralement closTout anneau factoriel est intégralement clos.

    Soit A un anneau factoriel, dont on note K le corps des fractions. Soit u {\overset{ { \text{déf}}}{=}}a/b \in K (où a et b sont premiers entre eux) tel que : u^n+u_{n-1}c^{n-1}+\ldots+c_0=0 En multipliant par b^n : a^n+c_{n-1}ba^{n-1}+\ldots+c_0b^n=0 Soit d un diviseur de b premier ou inversible. Si d est premier, d\lvert a^n, d’où (par théorème de Gauss) d\lvert a : ce qui n’est pas le cas (par hypothèse sur a et b). Donc d est une unité, et u\in A.

Inclusions des théoriesAnneaux commutatifs \supset Anneaux intègres \supset Anneaux intégralement clos \supset Anneaux à PGCD \supset Anneaux factoriels \supset Anneaux principaux \supset Anneaux euclidiens \supset Corps \supset Corps finis

Lemmes pour le Nullstellensatz faible
  • Lemme 4 : Extension algébrique d’un corps algébriquement closUn corps algébriquement clos \mathbb{K} n’a pas d’extension algébrique propre

    Si a est un élément d’une extension de corps de \mathbb{K} algébrique sur \mathbb{K} : P(a) = 0, pour un polynôme P à coefficients dans \mathbb{K}. On conclut que a \in \mathbb{K} en utilisant le caractère scindé de P et l’intégrité de \mathbb{K}.

  • Lemme 5 : Maximalité de $$\Big\langle X_1-a_1 , \ldots,\, X_n-a_n \Big\rangle$$Pour tous a_1, \ldots, a_n \in \mathbb{K}, \Big\langle X_1-a_1 , \ldots,\, X_n-a_n \Big\rangle est un idéal maximal de \mathbb{K}[X_1,\ldots, X_n]

    Le noyau du morphisme d’anneaux surjectif \phi {\overset{ { \text{déf}}}{=}}\left\{ \begin{array}{lcll} & \mathbb{K}[X_1,\ldots, X_n] & \to & \mathbb{K} \\ & P(X_1, \ldots, X_n) & \mapsto & P(a_1, \ldots, a_n) \end{array}\right. est l’idéal \Big\langle X_1-a_1 , \ldots,\, X_n-a_n \Big\rangle :

    • En effet : il le contient évidemment, et si P \in \mathbb{K}[X_1, X_2] a pour racine (a_1, a_2) : P \, = \underbrace{P(X_1,X_2) - P(X_1, a_2)}_{= \, \, (X_2-a_2)Q(X_1,X_2) \, \, \text{, où } \, Q \in \mathbb{K}[X_1, X_2]} \hspace{1em} + \hspace{1em} \underbrace{P(X_1, a_2) - P(a_1,a_2)}_{= \, \, (X_1-a_1)R(X_1) \, \, \text{, où } \, R \in \mathbb{K}[X_1, X_2]} \in \Big\langle X_1-a_1 , X_2-a_2 \Big\rangle On conclut par une récurrence immédiate sur k \in \mathbb{N}^*, pour \mathbb{K}[X_1,\ldots, X_k]

    En factorisant \phi, il vient que \mathbb{K}[X_1,\ldots, X_n]/\left\langle X_1-a_1 , \ldots,\, X_n-a_n \right\rangle \cong \mathbb{K}, d’où \Big\langle X_1-a_1 , \ldots,\, X_n-a_n \Big\rangle est maximal.

Lemmes pour Ax-Grothendieck
  • Lemme 6 : Une $$A$$-algèbre $$B$$ de type fini et engendrée par des éléments entiers sur $$A$$ est un $$A$$-module finiSoit A un anneau commutatif. Une A-algèbre B de type fini (i.e : finiment engendrée en tant qu’algèbre) engendrée par des éléments entiers sur A est un A-module fini (i.e : finiment engendré en tant que module).

    Si B est une A-algèbre de type fini de la forme A[x_1, \ldots, x_n], où les x_i sont entiers sur A :

    • Si n = 1 : il existe un polynôme unitaire P {\overset{ { \text{déf}}}{=}}X^m + \sum\limits_{i=0}^{m-1} p_i X^i \in A[X] de degré m tel que P(x_1) = 0. Donc x_1^m = - \sum\limits_{i=0}^{m-1} p_i x_1^i, et B est finiment engendré par \big(1, x_1, \ldots, x_1^{m-1} \big) en tant que A-module.

    • Si n=2 : il existe des polynômes unitaires P_1, P_2 \in A[X] de degrés m_1, m_2 tels que : P_1(x_1) = 0 , \, \, P_2(x_2) = 0 Montrons que B est finiment engendré, en tant que A-module, par \left(x_1^i x_2^j \right)_{(i,j) \in ⟦ 0, m_1-1 ⟧ \times ⟦ 0, m_2-1 ⟧}. Pour tout P \in B = A[x_1,x_2] = (A[x_1])[x_2], P appartient, de même, au A[x_1]-module engendré par \big(1, x_2, \ldots, x_2^{m_2-1} \big). Or, A[x_1] est engendré, en tant que A-module, par \big(1, x_1, \ldots, x_1^{m_1-1} \big), donc le résultat s’ensuit.

    On conclut par une récurrence immédiate sur n \in \mathbb{N}^*, en montrant que le A-module B est finiment engendré par \left(x_1^{i_1} \cdots x_n^{i_n} \right)_{(i_1,\ldots,i_n) \in ⟦ 0, m_1-1 ⟧ \times \cdots \times ⟦ 0, m_n-1 ⟧} (avec des notations analogues).

  • Lemme 7 : Équivalence entre la donnée d’une structure de $$A[X]$$-module et la donnée d’un $$A$$-module muni d’un endomorphisme.Tout A[X]-module peut-être associé de manière biunivoque à un couple formé d’un A-module et d’un endomorphisme de ce dernier.

    Pour être plus explicite, on notera toute structure de A-module B : \big(B, \hspace{-2em}\underbrace{A}_{\text{anneau des sclaires}}\hspace{-2em}\big).

    1. On définit une application \Phi de la manière suivante : À tout couple \big((B,A),u\big), où B est un A-module et u : B \to B un endomorphisme de B, on associe le A[X]-module \Phi\Big(\big((B,A),u\big)\Big) {\overset{ { \text{déf}}}{=}}(B, A[X]), où la multiplication externe est définie par : \left\{ \begin{array}{cll} A[X] \times B & \to & B \\ (P,b) & \mapsto & P(u)(b) \end{array}\right. (i.e : P \cdot b = P(u)(b)) Comme A est un sous-anneau de A[X], cette structure de A[X]-module prolonge celle de A-module.

    2. On définit une application \Psi de la façon suivante : À tout A[X]-module (B,A[X]), on associe le couple \Psi\big((B,A[X])\big) {\overset{ { \text{déf}}}{=}}\big((B,A),u\big) (comme A est un sous-anneau de A[X], B est aussi un A-module), où u : B \to B est un endomorphisme de (B, A) défini par :

      u {\overset{ { \text{déf}}}{=}}\left\{ \begin{array}{cll} B & \to & B \\ b & \mapsto & X \cdot b \end{array}\right.
    3. Vérifions que \Phi et \Psi sont inverses l’une de l’autre :

      • \Psi \circ \Phi = {\rm id} : Soit \big((B,A),u\big) un couple formé d’un A-module B et d’un endomorphisme u : B \to B de B. On vérifie que : \Psi\bigg(\Phi\Big(\big((B,A),u\big)\Big)\bigg) = \Psi\big((B, A[X])\big) = \big((B,A),u\big) En effet, si on pose \big((B,A),v\big) {\overset{ { \text{déf}}}{=}}\Psi\big((B, A[X])\big) :

        pour tout b \in B, \, v(b) = X \cdot b = u(b), d’où v = u.

      • \Phi \circ \Psi = {\rm id} : Soit (B,A[X]) un A[X]-module. On vérifie que : \Phi\bigg(\Psi\big((B, A[X])\big)\bigg) = \Phi\Big(\big((B,A),u\big)\Big) = (B, A[X]) En effet, avec u {\overset{ { \text{déf}}}{=}}\left\{ \begin{array}{cll} B & \to & B \\ b & \mapsto & X \cdot b \end{array}\right. : pour tous P \in A[X], b \in B, P \hspace{-5em}\underbrace{\cdot}_{\text{ nouvelle multiplication externe}}\hspace{-5em} b \hspace{4em} \, = \, \, P(u)(b) \, \, = \, \hspace{4em} P(X) \hspace{-5em}\underbrace{\cdot}_{\text{ ancienne multiplication externe}}\hspace{-5em} b

  • Lemme 8 : Cayley-Hamilton dans les $$A$$-modules finisSi B est un A-modules de type fini, u : B \to B une application A-linéaire, alors u est annulée par un polynôme (unitaire) de A[X].

    B est finiment engendré en tant que A-module, B est donc de la forme : B = x_1 A + \ldots + x_n A. Pour tout i \in ⟦ 1, n ⟧, il existe (\lambda_{i,j})_{j \in ⟦ 1, n ⟧} {\overset{ { \text{déf}}}{=}}\Lambda_j \in A^n tel que : u(x_i) = \sum\limits_{j = 1}^n \lambda_{i,j} x_j On pose \Lambda {\overset{ { \text{déf}}}{=}}\left( \begin{array}{c} \vphantom{\Big\vert}\Lambda_1 \\ \hline \vdots \\ \hline \Lambda_n \\ \end{array}\right) \in \mathcal{M}_n(A) Dans le A-module \mathcal{M}_{n,1}(A), muni de l’endomorphisme u : \left( \begin{array}{c} \vphantom{\Big\vert} u(x_1) \\ \vdots \\ u(x_n) \\ \end{array}\right) \, \, = \, \, \Lambda \left( \begin{array}{c} \vphantom{\Big\vert} x_1 \\ \vdots \\ x_n \\ \end{array}\right)

    Soit, dans le A[X]-module \mathcal{M}_{n,1}(A) qui lui est biunivoquement associé par le lemme 7 : X \cdot \, I_n \left( \begin{array}{c} \vphantom{\Big\vert} x_1 \\ \vdots \\ x_n \\ \end{array}\right) = \left( \begin{array}{c} \vphantom{\Big\vert} X \cdot x_1 \\ \vdots \\ X \cdot x_n \\ \end{array}\right) \, \, = \, \, \Lambda \left( \begin{array}{c} \vphantom{\Big\vert} x_1 \\ \vdots \\ x_n \\ \end{array}\right) c’est-à-dire : \Big( X \, I_n - \Lambda \Big) \left( \begin{array}{c} \vphantom{\Big\vert} x_1 \\ \vdots \\ x_n \\ \end{array}\right) \, \, = \, \, 0 {\hspace{1em} \circledast} Soit, en multipliant \circledast à gauche par la transposée de la comatrice de X \, I_n - \Lambda, et en notant P le polynôme \det(X I_n - \Lambda) \in A[X] : \left( \begin{array}{c} \vphantom{\Big\vert} P(u)(x_1) \\ \vdots \\ P(u)(x_n) \\ \end{array}\right) \, \, = \, \, \det \Big( X \, I_n - \Lambda \Big) \left( \begin{array}{c} \vphantom{\Big\vert} x_1 \\ \vdots \\ x_n \\ \end{array}\right) \\ = \, \, {\vphantom{\Big( X \, I_n - \Lambda \Big)}}^{ t}\hspace{-0.3em}\widetilde{\Big( X \, I_n - \Lambda \Big)} \, \, \underbrace{\Big( X \, I_n - \Lambda \Big) \left( \begin{array}{c} \vphantom{\Big\vert} x_1 \\ \vdots \\ x_n \\ \end{array}\right)}_{\vphantom{\big\vert}= \, \, 0} \\ = 0

    Donc P(u) est l’endomorphisme nul (il est nul sur une famille génératrice de B), et P \in A[X] annule u.

  • Lemme 9 : Toute $$A$$-algèbre de type fini engendrée par des éléments entiers sur $$A$$ est entière sur $$A$$Si B est une A-algèbre de la forme A[x_1, \ldots, x_n], où x_1, \ldots, x_n sont entiers sur A, alors B est entière sur A.

    1. B est un A-module fini, par le lemme 6.

    2. Soit b \in B. Montrons que b est entier sur A : Comme B est un A-module fini, il en est de même du A-module A[b] \subset B. L’endomorphisme A-linéaire u : A[b] \to A[b] défini par : u {\overset{ { \text{déf}}}{=}}\left\{ \begin{array}{cll} A[b] & \to & A[b] \\ a & \mapsto & ab \end{array}\right. est alors annulé, d’après Cayley-Hamilton (lemme 8), par un polynôme P \in A[X]. En évaluant 0 = P(u) en a = 1_{A}, il vient que b est entier sur A.

  • Lemme 10 : Corps entier sur un sous-anneau commutatifSi B est un corps entier sur un anneau commutatif A \subset B, alors A est un corps.

    Soit a \in A\backslash\lbrace 0 \rbrace. a^{-1} \in B, donc il existe c_0, \ldots, c_{n-1} \in A tels que (a^{-1})^n + \sum\limits_{i=0}^{n-1} c_i (a^{-1})^i = 0, et A \ni a^{-1} = - \sum\limits_{i=0}^{n-1} c_i a^{n-i-1}.

Lemmes d’algèbre pour Ax-Grothendieck via la théorie des modèles

  

Clôture algébrique

une clôture algébrique \overline{\mathbb{K}} d’un corps \mathbb{K} est une extension algébrique de \mathbb{K} (i.e : tout élément de \overline{\mathbb{K}} est racine d’un polynôme à coefficients dans \mathbb{K}), qui est algébriquement close (i.e : tout polynôme à coefficients dans \overline{\mathbb{K}} a une racine dans \overline{\mathbb{K}}).

Corps localement fini

un corps dont tous les sous-corps finiment engendrés sont finis.

  • Existence et Unicité (à isomorphisme près) de “la” clôture algébrique

    1. Tout corps \mathbb{K} possède une clôture algébrique (i.e une extension algébrique algébriquement close).

    2. Deux clôtures algébriques de \mathbb{K} sont reliées par un isomorphisme fixant les éléments de \mathbb{K}.

     

  1. Existence d’une clôture algébrique : On note U \subset \mathbb{K}[X] l’ensemble des polynômes irréductibles unitaires de \mathbb{K}[X]. Pour chaque P \in U, on introduit de nouvelles variables \omega^{P}_1, \ldots, \omega^{P}_{\deg P}. On pose : C {\overset{ { \text{déf}}}{=}}\left\lbrace \omega^P_i \mid i \in ⟦ 1, \deg P ⟧ \right \rbrace_{P \in U}, et R {\overset{ { \text{déf}}}{=}}\mathbb{K}[C]. Ainsi, pour tout P \in U, P - \prod_{i=1}^{\deg P} (X-\omega^{P}_i) \, = \sum_{j=0}^{\deg P - 1} r^P_j \cdot X^j \in R[X] {\hspace{1em} \circledast} pour des coefficients (r^P_j)_{0 \leq j < \deg P} \in R^{\deg P}. On note I \subset R l’idéal engendré par \left\lbrace r^P_j \mid j \in ⟦ 0, \deg P -1 ⟧\right \rbrace_{P \in U} : il est inclus dans un idéal maximal M \subset R (par le lemme de Zorn). Le corps R/M est alors une clôture algébrique de \mathbb{K} : en effet, il est algébrique sur \mathbb{K} (\overline{P(\omega^P_i)} = \overline{0}, pour tous P \in U, i \in ⟦ 1, \deg P ⟧), et pour tout P \in U, P est scindé, en considérant \circledast modulo M.

  2. Unicité, à \mathbb{K}-isomorphisme près (isomorphisme de corps laissant invariant chaque élément de \mathbb{K}) : Soient \mathbb{L}_1, \mathbb{L}_2 deux clôtures algébriques de \mathbb{K}. L’ensemble des couples (K, f), où K est une extension de \mathbb{K} sur laquelle \mathbb{L}_1 est algébrique et f \in \mathbb{L}_2^K un \mathbb{K}-homomorphisme de corps, est non vide et inductif (partiellement ordonné et toute partie totalement ordonnée admet un majorant). Par le lemme de Zorn, il existe un élément maximal (K_{\text{ max}}, f_{\text{ max}}). Montrons que K_{\text{ max}} = \mathbb{L}_1 : pour tout x \in \mathbb{L}_1, x admet un polynôme minimal (K_{\text{ max}}[X] est principal) \mu_x(X) \in K_{\text{ max}}[X] irréductible sur \mathbb{L}_1 (puisque \mathbb{L}_1 est intègre). Donc K_{\text{ max}}[x] est un corps (sur lequel \mathbb{L}_1 reste algébrique). De plus, comme le polynôme5 f_{\text{ max}}(\mu_x) admet une racine y \in \mathbb{L}_2, \Phi {\overset{ { \text{déf}}}{=}}\left\{ \begin{array}{cll} K_{\text{ max}}[x] & \to & \mathbb{L}_2 \\ P(x) & \mapsto & f_{\text{ max}}(P)(y) \end{array}\right. est un \mathbb{K}-homomorphisme de corps. Ainsi, par maximalité de (K_{\text{ max}}, f_{\text{ max}}), K_{\text{ max}}[x] = K_{\text{ max}}, et x \in K_{\text{ max}}, d’où K_{\text{ max}} = \mathbb{L}_1. Comme f_{\text{ max}}(\mathbb{L}_1) \subset \mathbb{L}_2 est algébriquement clos, et \mathbb{L}_2 en est une extension algébrique, il vient que f_{\text{ max}}(\mathbb{L}_1) = \mathbb{L}_2 : donc le morphisme surjectif f_{\text{ max}} : \mathbb{L}_1 \to \mathbb{L}_2 est non identiquement nul, et, partant, injectif (son noyau est un idéal strict du corps \mathbb{L}_1 : c’est \lbrace 0 \rbrace). Ainsi, f_{\text{ max}} : \mathbb{L}_1 \to \mathbb{L}_2 est un \mathbb{K}-isomorphisme de corps.

    Clôture algébrique : remarques qualitatives

    • Parmi les extensions de corps \mathbb{L} \supset \mathbb{K} :

      • dans une extension algébrique : tous les éléments de \mathbb{L} sont racines d’un polynôme à coefficients dans \mathbb{K}.

      • dans une extension algébriquement close : tous les polynômes à coefficients dans \mathbb{L} ont une racine dans \mathbb{L}.

    • “La” (à \mathbb{K}-isomorphisme près) clôture algébrique est :

      • une “extension algébrique” maximale.

      • une “extension algébriquement close” minimale.

      • une extension algébrique algébriquement close.

    • Intuitivement : parmi les extensions de corps, les extensions algébriques sont des petites extensions, les extensions algébriquement closes des grandes extensions. La clôture algébrique est la plus grande de ces petites extensions, et la plus petite de ces grandes extensions.

    • Les extensions algébriquement closes n’ont pas d’extension algébrique propre : en effet, si \mathbb{K} algébriquement clos a pour extension algébrique \mathbb{L} : tout élément de \mathbb{L} est élément de \mathbb{K}, car racine d’un polynôme à coefficients dans \mathbb{K}, lequel est scindé sur \mathbb{K} (\mathbb{K} AC).

  • Existence et unicité (à isomorphisme près) d’un corps fini à $$p^n$$ élémentsSoit p \in \mathbb{P}, n \in \mathbb{N}^*. Il existe un corps fini à p^n éléments, unique à isomorphisme près.

      1. Existence : On considère le polynôme P {\overset{ { \text{déf}}}{=}}X^{p^n}-X \in \mathbb{F}_p[X]. Il existe un sur-corps \mathbb{L} \supset \mathbb{F}_p tel que P est scindé dans \mathbb{L}. De plus, il est à racines simples, puisque P' = p^n X^{p^n-1}-1 = -1 n’a pas de racines. On vérifie alors aisément que l’ensemble R_n \subset \mathbb{F}_{p^n} des racines de P est un sous-corps de \mathbb{L}, car : \forall x, y \in \mathbb{F}_{p^n}, (x+y)^{p^n} = x^{p^n} + y^{p^n} (\mathbb{L} est de caractéristique p), et tout élément non nul a \in R_n a pour inverse a^{p^n-2}. Donc R_n est un corps à p^n éléments.

  1. Unicité à isomorphisme près : Soient \mathbb{K}, \mathbb{L} deux corps de cardinal p^n. Montrons que \mathbb{K} \cong \mathbb{L}. Soit a un élément primitif (i.e un générateur du groupe cyclique \mathbb{K}^*), et \mu_a(X) \in \mathbb{F}_p[X] son polynôme minimal (il existe car l’idéal des polynômes de \mathbb{F}_p[X] annulateurs de a est non trivial (il contient X^{p^n-1}-1) et principal). Comme a \in \mathbb{K}, X^{p^n}-X est un polynôme annulateur de a, et \mu_a \, \lvert \, X^{p^n}-X. Or, X^{p^n}-X = \prod\limits_{b \in \mathbb{L}}(X-b) \in \mathbb{L}[X], donc6 \mu_a est scindé dans \mathbb{L}, et il existe b \in \mathbb{L} qui est une racine de \mu_a : son polynôme minimal \mu_b \in \mathbb{F}_p[X] divise donc \mu_a(X), et comme \mu_a(X) est irréductible (\mathbb{F}_p est intègre) et unitaire : \mu_a = \mu_b

    De plus : \mathbb{K} \cong \mathbb{F}_p[X]/(\mu_a)

    • En effet : comme \mu_a(X) est irréductible, (\mu_a) \subset \mathbb{F}_p[X] est un idéal maximal de l’ensemble des idéaux principaux propres, i.e (puisque \mathbb{F}_p[X] est principal) de l’ensemble des idéaux propres, et (\mu_a) est maximal, d’où \mathbb{F}_p[X]/(\mu_a) est un corps. Le morphisme d’anneaux \phi {\overset{ { \text{déf}}}{=}}\left\{ \begin{array}{cll} \mathbb{F}_p[X] & \to & \mathbb{K} \\ P(X) & \mapsto & P(a) \end{array}\right. se factorise en un morphisme de corps \Phi {\overset{ { \text{déf}}}{=}}\left\{ \begin{array}{cll} \mathbb{F}_p[X]/(\mu_a) & \to & \mathbb{K} \\ \overline{P(X)} & \mapsto & P(a) \end{array}\right. injectif (en tant que morphisme de corps) et surjectif (car son image contient le groupe multiplicatif engendré par a, qui vaut \mathbb{K}^* par hypothèse sur a).

      On procède de même avec \mathbb{L} : l’homomorphisme de corps \Psi {\overset{ { \text{déf}}}{=}}\left\{ \begin{array}{cll} \mathbb{F}_p[X]/(\mu_b) & \to & \mathbb{L} \\ \overline{P(X)} & \mapsto & P(b) \end{array}\right. injectif (en tant que morphisme de corps), et surjectif, car \vert\mathbb{F}_p[X]/(\mu_b)\vert = \vert\mathbb{F}_p[X]/(\mu_a)\vert = \vert\mathbb{K}\vert = \vert\mathbb{L}\vert. Donc \mathbb{K} \, \cong \, \mathbb{F}_p[X]/(\mu_a) = \mathbb{F}_p[X]/(\mu_b) \, \cong \, \mathbb{L}

  • Sous-corps d’un corps finiSoit p \in \mathbb{P}, n \in \mathbb{N}^*.

    1. Tout sous-corps \mathbb{K} de \mathbb{F}_{p^n} est isomorphe à \mathbb{F}_{p^d}, pour un entier d divisant n.

    2. Pour tout diviseur d de n, il existe un unique sous-corps de \mathbb{F}_{p^n} isomorphe à \mathbb{F}_{p^d}.

     

  1. \mathbb{F}_{p^n} est de caractéristique p (son sous-corps premier \pi est de cardinal p), donc \mathbb{K} aussi, et en posant d {\overset{ { \text{déf}}}{=}}\dim_{\pi} \mathbb{K} : \vert\mathbb{K}\vert = p^d, d’où \mathbb{K} \cong \mathbb{F}_{p^d}, par unicité (à isomorphisme près) des corps finis. Or, \mathbb{F}_{p^n} est un \mathbb{K}-espace vectoriel, d’où : p^n = \vert\mathbb{F}_{p^n}\vert = \vert\mathbb{K}\vert^{\dim_\mathbb{K} \mathbb{F}_{p^n}} = p^{d \cdot \, \dim_\mathbb{K} \mathbb{F}_{p^n}} et donc d \lvert n.

  2. On vérifie aisément que l’ensemble R_d \subset \mathbb{F}_{p^n} des racines de X^{p^d}-X est un sous-corps de \mathbb{F}_{p^n}, car : \forall x, y \in \mathbb{F}_{p^n}, (x+y)^{p^d} = x^{p^d} + y^{p^d} (\mathbb{F}_{p^n} est de caractéristique p). De plus, \vert R_d\vert \leq p^d.

    En outre, comme d \lvert n, p^d - 1 \lvert p^n - 1, et X^{p^d}-X = X(X^{p^d-1}-1) \, \lvert \, X(X^{p^n-1}-1) = X^{p^n}-X

    • En effet, en posant a {\overset{ { \text{déf}}}{=}}p^d - 1 et b {\overset{ { \text{déf}}}{=}}p^n - 1 = ac (où c est entier) : a \lvert b = ac \Longrightarrow X^a-1 \, \lvert \, X^b-1 : \begin{aligned} X^b-1 \, &= \, (X^a-1) \, \dfrac{X^b - X^{b-ac}}{X^a -1}\\ &= \, (X^a-1) \, X^{b-a} \dfrac{X^a - X^{a-ac}}{X^a -1} \\ &= \, (X^a-1) \, X^{b-a} \dfrac{1 - (X^{-a})^c}{1 - X^{-a}} \\ &= \, (X^a-1) \, X^{b-a} \sum\limits_{k=0}^{c-1} X^{-ak} \\ &= \, (X^a-1) \, \sum\limits_{k=1}^{c} X^{b-ak} \\\end{aligned}

      Par suite, comme X^{p^n}-X est scindé à racines simples dans \mathbb{F}_{p^n}, R_d a exactement p^d éléments, et par unicité des corps finis : R_d \cong \mathbb{F}_{p^d}.

Schéma de Vérité de Tarski

Tout commence avec le constat, faussement trivial : “Il neige” est vrai si, et seulement si il neige.

À l’aube de la création de la “théorie des modèles” : le problème, millénaire, de la notion de vérité d’un énoncé se pose. Tarski donne un critère caractérisant tout “prédicat de vérité” :

Pour i \in \mathbb{N}, on se donne des “ensembles de symboles” (dit langages) \mathcal{L}_i et \mathcal{L}_{i+1} \supsetneq \mathcal{L}_i. On se place sur un \mathcal{L}_i-système formel (ex : logique du premier ordre) :

  • \mathcal{L}_i est appelé Langage-Objet

  • \mathcal{L}_i contient (éventuellement) un prédicat de vérité “\text{vrai}_i

On se donne un :

  • \mathcal{L}_{i+1}-système formel, où : \mathcal{L}_{i+1} contient \mathcal{L}_i et est appelé métalangage pour le langage-objet \mathcal{L}_i

  • \mathcal{L}_{i+1} contient un prédicat de vérité “\text{vrai}_{i+1}” (n’appartenant pas à \mathcal{L}_i)

Pour tout \mathcal{L}_i-énoncé p : p est \text{vrai}_{i+1} ssi I_{i+1}(p) où : I_{i+1}(p) est l’interprétation de p dans le \mathcal{L}_{i+1}-système formel

(V_i) caractérise les “prédicats de vérité”, pour tout prédicat appartenant à \mathcal{L}_{i+1}\backslash\mathcal{L}_i

De quoi rend compte ce schéma de vérité

  • Le schéma (V_i) rend compte, selon Tarski, de notre intuition la plus élémentaire de la notion de vérité : quelle que soit sa position philosophique, personne ne nie l’équivalence du fait que ‘Socrate est homme’ est vrai, et du fait que Socrate soit un homme.

  • Tarski plonge \mathcal{L}_i dans un métalangage \mathcal{L}_{i+1} contenant \text{vrai}_{i+1} pour éviter le paradoxe du menteur (dû à l’autoréférence) (ex: l’adjectif “hétérologique” est-il hétérologique ou autologique ? / “Cette phrase est fausse.” : faux ou vrai ?)

  1. car si F(x_1) \in \mathbb{K}(x_1)\backslash \lbrace 0 \rbrace, il existe P(x_1) \in \mathbb{K}[x_1]\backslash \lbrace 0 \rbrace tel que P(x_1) F(x_1) \in \mathbb{K}[x_1], d’où F(x_1) \in \mathbb{K}[x_1] puisque P(x_1) est inversible dans \mathbb{K}[x_1]

  2. “est inclus” étant à comprendre au sens de “s’injecte dans” 

  3. en identifiant leur sous-corps premier avec \mathbb{F}_p 

  4. en voyant P comme polynôme de \mathbb{F}_p[X], ce qui est loisible car \mathbb{F}_p s’injecte dans \overline{\mathbb{F}_p} 

  5. par abus de notation, on note encore f_{\text{ max}} le morphisme qui à P = \sum_{k = 0}^{\deg P} p_k X^k associe f_{\text{ max}}(P) {\overset{ { \text{déf}}}{=}}\sum_{k = 0}^{\deg P} f_{\text{ max}}(p_k) X^k 

  6. en identifiant, par abus de notation, \mathbb{F}_p[X] au sous-corps premier de \mathbb{L} (qui lui est isomorphe), et en exprimant le fait que \mu_a \, \lvert \, X^{p^n}-X dans \mathbb{L}[X] 

Leave a comment