Théorie axiomatique des ensembles

Un article de Wikipédia, l'encyclopédie libre.

La théorie des ensembles est la science mathématique de l'infini.[1] Elle donne les règles permettant de construire de nouveaux ensembles à partir d'ensembles connus au moyen d'axiomes, elle étudie les propriétés des ensembles, sur lesquelles sont fondées les théories actuelles. La langue de la théorie des ensembles, dans sa simplicité, est suffisamment universelle pour formaliser toutes les structures utiles et ainsi la théorie des ensembles, conjointement avec le calcul des prédicats, unifie le langage mathématique.

Une théorie axiomatique des ensembles se présente généralement comme une suite d'assemblages d'éléments syntaxiques issus d'un langage du premier ordre ; alors qu'une théorie dite "naïve" même si elle énonce explicitement ses axiomes, est écrite dans le langage usuel.

Sommaire

[modifier] Les origines d'une théorie rigoureuse des ensembles

Cantor est le principal créateur de la théorie des ensembles, sous une forme que l'on qualifie aujourd'hui de théorie naïve des ensembles. Mais, à côté de considérations élémentaires, sa théorie comportait des niveaux d'abstraction élevés. La vraie nouveauté de la théorie de Cantor, c'est qu'elle permet de parler de l'infini. Par exemple, une idée importante de Cantor a été de définir l'équipotence. Deux ensembles A et B sont équipotents, ou ont même cardinalité (même nombre d'éléments quand ils sont finis), s'il existe un moyen d'associer à chaque élément de A un et un seul élément de B et inversement. On peut ainsi démontrer que l'ensemble \mathbb{N} des entiers naturels a la même cardinalité que l'ensemble \mathbb{Q} des nombres rationnels, bien que \mathbb{N} soit un sous-ensemble propre de \mathbb{Q}. Ces deux ensembles sont dits infinis dénombrables. D'un autre côté, l'ensemble \mathbb{R} des nombres réels n'a pas la même cardinalité que \mathbb{N} ou \mathbb{Q}, mais une cardinalité supérieure : il est dit indénombrable ou non dénombrable. Cantor a donné deux preuves que \mathbb{R} n'est pas dénombrable, et la deuxième, qui utilise un argument connu sous le nom d'argument de la diagonale de Cantor, a été extraordinairement influente et a eu de nombreuses et diverses applications en logique et en mathématiques.

Cantor a approfondi la théorie et a construit des hiérarchies infinies d'ensembles infinis, les nombres ordinaux et les nombres cardinaux. Ces constructions étaient controversées à son époque, l'opposition étant conduite par le finitiste Léopold Kronecker ; mais aujourd'hui elles sont acceptées par la majorité des mathématiciens.

Le développement de la théorie des ensembles par Cantor était encore « naïf » dans le sens qu'il n'employait pas encore une axiomatique précise, et parce que pour lui il n'y avait qu'une seule théorie des ensembles, un seul univers ensembliste attendu, alors que les théoriciens des ensembles d'aujourd'hui jonglent avec des univers différents.

Après coup, on a pu simplifier, assez injustement pour Cantor, en résumant sa théorie à un usage tacite de l'axiome d'extensionnalité, et d'une version trop forte du schéma d'axiomes de compréhension, qui en substance permettrait d'associer à toute propriété l'ensemble des objets vérifiant cette propriété. Une telle théorie, que l'on n'attribuera pas à Cantor, est contradictoire. Elle mène à deux famille de paradoxes. Les uns, comme le paradoxe de Berry ou le paradoxe de Richard, se rattachent au fait que le langage n'est pas bien défini, les autres, comme le paradoxe de Russell à un usage trop large de la compréhension : quand on essaie de construire l'ensemble S = {A | A n'appartient pas à A} de tous les ensembles qui n'appartiennent pas à eux-mêmes on tombe sur une contradiction. L'actuel schéma d'axiomes de compréhension, proposé par Zermelo, est restreint afin d'éviter ce paradoxe.

Cantor connaissait, avant la découverte du paradoxe de Russell, des paradoxes plus complexes, mais de même nature, comme le paradoxe de Burali-Forti ou le paradoxe du plus grand cardinal. Beaucoup de théoriciens des ensembles s'entendent pour dire que l'axiomatisation la plus adéquate à la théorie développée par Cantor est la théorie ZFC avec axiome de fondation (voir ci-dessous), ou la théorie des classes de von Neumann, Gödel et Bernays, qui lui est, en un certain sens (qui peut être rendu précis), équivalente.

Au tournant du siècle, Cantor est de plus en plus handicapé par sa maladie nerveuse, mais ses solutions aux paradoxes circulent par sa correspondance et sont connues, à la fin du XIXe siècle, de Richard Dedekind et, à Göttingen, de David Hilbert et de Ernst Zermelo. Cependant, pour beaucoup de mathématiciens de l'époque, les paradoxes jettent un doute sur la validité de la théorie des ensembles, les solutions proposées par Cantor sont trop informelles pour convaincre ceux qui les connaissent. Certains s'orientent vers la méthode axiomatique, illustrée à la même époque par Hilbert pour les fondements de la géométrie (1899).

Ainsi, en 1908, Ernst Zermelo construit un système d'axiomes pour la théorie des ensembles. En dehors de l'axiome d'extensionnalité, on peut voir ces axiomes comme une restriction de la version contradictoire du schéma d'axiomes de compréhension aux cas particuliers utiles, qui ne permettent pas de dériver les paradoxes. Dans ce système, il inclut également l'axiome du choix (qui n'a rien à voir avec la compréhension), un axiome à l'époque très controversé, avec lequel il a montré (en 1904) le théorème du bon ordre, et qui a également été utilisé implicitement par Cantor. Ce système a été redéfini de façon plus formelle et complété dans les années 1920 par Abraham Adolf Fraenkel et Thoralf Skolem, qui ajouteront le schéma d'axiomes de remplacement (autre cas particulier de la compréhension non restreinte), donnant la théorie ZFC connue aujourd'hui.

[modifier] Le problème de l'axiome du choix

L'axiome du choix est apparu explicitement dans une publication de Ernst Zermelo de 1904, c'est-à-dire avant la parution de son axiomatisation de la théorie des ensembles. L'axiome du choix est en effet d'une nature différente des autres axiomes de la théories des ensembles énoncés ultérieurement, et qui résultent pour la plupart d'une analyse soignée de la compréhension non restreinte. En effet l'axiome du choix ne donne pas de définition explicite de l'ensemble construit (ensemble de choix ou fonction de choix suivant les versions). D'autre part, dans son article de 1904, Zermelo démontre avec l'axiome du choix son fameux théorème qui énonce que tout ensemble peut être bien ordonné, proposition qui n'a rien d'intuitivement évident, ne serait-ce que pour l'ensemble des réels. L'axiome du choix était utilisé tacitement au moins par Georg Cantor, mais la publication de Zermelo déclenche des débats passionnés chez les mathématiciens de l'époque[2].

L'axiome du choix est par ailleurs très lié à l'infini mathématique, en effet l'axiome du choix est intuitivement vrai pour un nombre fini de choix, et d'ailleurs tout à fait démontrable dans ce cas à partir des autres axiomes de la théorie des ensembles. Or nous sommes autour de 1904 en plein dans la controverse déclenchée par la découverte des paradoxes[3]. Diverses conceptions de l'infini mathématique s'affrontent alors. Cela ira jusqu'à la remise en cause radicale des fondements des mathématiques par Luitzen Egbertus Jan Brouwer, fondateur de l'intuitionnisme, qui écarte le principe du tiers exclu, qui se situe bien en amont de l'axiome du choix. Cependant à l'époque, certains mathématiciens qui ne vont pas aussi loin et acceptent certaines formes de raisonnement non constructif, se méfient de l'axiome du choix. Emile Borel écrit encore en 1950[4] : C'est déjà un résultat important obtenu par les adversaires de l'axiome de Zermelo que tous ceux qui admettent cet axiome prennent le soin, lorsqu'ils obtiennent un théorème nouveau, de spécifier si la démonstration de ce théorème exige ou non l'utilisation de l'axiome de Zermelo. Cet axiome a ainsi créé une branche séparée des mathématiques ; l'importance et l'intérêt de cette branche décideront de son sort.. On peut quand même dire qu'aujourd'hui, vu justement son utilisation dans des branches importantes des mathématiques, l'axiome du choix est largement accepté.

Ceci d'autant plus que l'on sait d'après les travaux de Gödel[5] que d'admettre l'axiome du choix n'est pas plus « risqué », au sens où il montre que si la théorie ZFC était incohérente la théorie ZF le serait aussi (voir ci-dessous la section sur les résultats d'indépendance en théorie des ensembles).

On a identifié par ailleurs des restrictions de l'axiome du choix, comme l'axiome du choix dénombrable (qui permet par exemple de montrer qu'une réunion dénombrable d'ensembles dénombrables est dénombrable), lui-même conséquence de l'axiome du choix dépendant (qui permet par exemple de montrer l'existence d'une suite infinie décroissante pour une relation non bien fondée). Ainsi Robert Solovay a publié en 1970 la cohérence de la théorie ZF + axiome du choix dépendant + tout sous-ensemble des réels est Lebesgue-mesurable, théorie contredisant donc l'axiome du choix dans toute sa généralité, relativement à la la théorie ZF + il existe un cardinal inaccessible (un renforcement de la théorie ZF qui permet de montrer la cohérence de ZF)[6]. Cependant, l'axiome du choix dénombrable est insuffisant en géométrie algébrique, car le traitement des corps algébriquement clos requiert le lemme de Zorn équivalent à l'axiome du choix ; donc le théorème selon lequel tout corps peut être plongé dans un corps algébriquement clos est fondé sur l'axiome du choix général.[7]

Un des meilleurs exemples des étrangetés auquel conduit l'axiome du choix est certainement le paradoxe de Banach-Tarski, publié en 1924[8] qui, en utilisant l'axiome du choix, affirme qu'on peut découper une sphère en un nombre fini de morceaux, les déplacer par une suite de mouvement rigides (translation et rotation), en permettant à certaines pièces d'en traverser d'autres et de les rassembler en formant deux copies de la sphère d'origine. Ceci semble contredire l'intuition physique que nous avons de la notion de volume, mais le paradoxe de Banach-Tarski fait intervenir des parties non mesurables.

[modifier] Les axiomes de la théorie ZFC

La théorie qui se base sur les axiomes originaux de Zermelo est appelée théorie de Zemerlo ou théorie Z. Si on la complète par l'axiome de remplacement de Fraenkel, on obtient la théorie de Zermelo-Fraenkel, ou plus simplement la théorie ZF, bien que la forme finale des axiomes soit due à Skolem. Lorsqu'on lui adjoint l'axiome du choix, un axiome qui était plus controversé au moment de l'élaboration de ces théories qu'il ne l'est aujourd'hui, on obtient alors la théorie dite ZFC (« C » pour « choix »).

Un aspect important de la théorie ZFC est que tous les objets dont elle traite sont des ensembles et ne peuvent être que des ensembles. En particulier, chaque élément d'un ensemble est lui-même un ensemble. D'autres objets mathématiques familiers, tels que les nombres, doivent donc par conséquent être définis en termes d'ensembles.

Strictement parlant, les axiomes de ZFC sont simplement des énoncés du calcul des prédicats du premier ordre égalitaire dans un langage ayant un seul symbole primitif pour l'appartenance (relation binaire). Ce qui suit doit donc seulement être perçu comme une tentative d'exprimer en français la signification attendue de ces axiomes. De plus, l'axiome de séparation (ou compréhension) et l'axiome de remplacement sont en fait des schémas infinis d'axiomes.

  1. Axiome d'extensionnalité : Si deux ensembles ont les mêmes éléments, alors ils sont identiques.
  2. Axiome de l'ensemble vide : Il existe un ensemble sans élément. On le note \varnothing (ou plus rarement {}). Cet axiome ne fait pas à proprement parler partie de l'axiomatisation de ZFC, du moins dans sa version actuelle, formalisée en calcul des prédicats du premier ordre. On peut le déduire d'une propriété générique du calcul des prédicats, qui est qu'un modèle d'une théorie est non vide. Dans le cas de la théorie des ensembles, cela revient à dire qu'il existe au moins un ensemble, et cette propriété ne nécessite pas d'axiome spécifique : elle se démontre en logique pure. On en déduit par le schéma d'axiomes de compréhension l'existence de l'ensemble vide. On trouve cependant cet axiome dans des variantes de la théorie des ensembles, ou dans des présentations plus anciennes ou semi-formelles de la théorie ZFC comme celle de Paul Halmos[9].
  3. Axiome de la paire : Si x et y sont deux ensembles, alors, il existe un ensemble contenant x et y et eux seuls comme éléments. Cet ensemble se note {x,y}. À noter que x et y ne sont pas nécessairement distincts. Cet axiome est conséquence du schéma de remplacement mais pas du schéma de compréhension, aussi on peut l'omettre dans la théorie ZF mais il est indispensable dans la théorie Z.
  4. Axiome de la réunion : Pour tout ensemble X, il existe un ensemble R dont les éléments sont précisément ceux des éléments de X et eux seuls.
  5. Axiome de l'ensemble des parties : Pour tout ensemble E, il existe un ensemble dont les éléments sont précisément les sous-ensembles de E. Cet ensemble se note habituellement P(E).
  6. Axiome de l'infini : Il existe un ensemble W dont \varnothing est élément et tel que pour tout x appartenant à W, x \cup \{x\} appartient aussi à W. On peut ensuite définir par compréhension l'intersection de tous les ensembles contenant \varnothing et clos par cette opération : il s'agit de l'ensemble des nombres entiers tels que définis par von Neumann.
  7. Schéma d'axiomes de compréhension ou de séparation : pour tout ensemble A et toute propriété P exprimée dans le langage, il existe un ensemble dont les éléments sont les éléments de A vérifiant P. Le schéma de compréhension est conséquence du schéma de remplacement qui suit.
  8. Schéma d'axiomes de remplacement : Pour tout ensemble A et toute relation fonctionnelle P, formellement définie comme une proposition P(x,y) et telle que P(x,y) et P(x,z) impliquent que y = z, il existe un ensemble contenant précisément les images par P des éléments de l'ensemble d'origine A.
  9. Axiome de fondation : Tout ensemble X non vide contient un élément y tel que X et y sont des ensembles disjoints (qui n'ont aucun élément en commun), ce qui se note X \cap y = \varnothing. Cet axiome n'est pas toujours ajouté à Z ou ZF. On peut construire assez facilement comme sous-classe d'un modèle quelconque de ZF, un modèle de ZF vérifiant l'axiome de fondation. Les ensembles utiles au développement des mathématiques usuelles appartiennent à cette sous-classe, et donc cela a peu d'importance d'ajouter celui-ci ou non à la théorie pour ces développements. L'axiome de fondation n'est par exemple pas mentionné dans le livre de Halmos[9], dont le but est de présenter les aspects de la théorie des ensembles utiles pour le mathématicien non spécialiste de ce domaine. L'axiome de fondation est par contre très utile dans le domaine spécialisé de la théorie des ensembles, il permet de hiérarchiser l'univers ensembliste, de définir un rang ordinal (voir l'article axiome de fondation) ... Des théories des ensembles, extensions de ZFC sans fondation, ont par ailleurs été développées, qui introduisent un axiome d'anti-fondation (il en existe plusieurs variantes) qui contredit directement l'axiome de fondation. L'anti-fondation est une idée assez ancienne (Dimitri Mirimanoff 1917, Paul Finsler 1926), mais ces théories ont connu un regain d'intérêt pour leur lien avec l'informatique théorique[10].
  10. Axiome du choix : (version de Zermelo) Étant donné un ensemble X d'ensembles non vides mutuellement disjoints, il existe un ensemble y (l'ensemble de choix pour X) contenant exactement un élément pour chaque membre de X.
    L'axiome du choix reste controversé pour une minorité de mathématiciens. Des formes faibles existent, comme l'axiome du choix dépendant, très utile pour le développement de l'analyse réelle.

[modifier] Les résultats d'indépendance en théorie des ensembles

[modifier] Modèles intérieurs

Les premiers résultats d'indépendance notables en théorie des ensembles sont ceux de Kurt Gödel qui démontre que l'axiome du choix est compatible avec la théorie ZF, autrement dit si la théorie ZFC est contradictoire, alors la théorie ZF est contradictoire. Il montre également le même résultat pour l'hypothèse du continu vis à vis de ZF ou ZFC. Gödel utilise la méthode appelée depuis la méthode des modèles intérieurs, elle revient à construire, par exemple dans un modèle de ZF ne satisfaisant pas nécessairement l'axiome du choix, une sous-classe de celui-ci qui possède une nouvelle relation d'appartenance satisfaisant l'axiome du choix. Une contradiction de la théorie ZFC entraîne donc une contradiction de la théorie ZF.

[modifier] Forcing

Paul Cohen, en 1963, démontre que la négation de l'hypothèse du continu (HC) est compatible avec la théorie ZFC : si la théorie ZFC + (non HC) est contradictoire, alors la théorie ZFC est contradictoire. La méthode qu'il introduit, le forcing, devait avoir un énorme succès en théorie des ensembles. Reformulée, étendue, itérée ... elle a permis de montrer de nombreux résultats d'indépendance.

[modifier] Second théorème d'incomplétude

Les résultats d'indépendance précédents reposent sur des résultats d’équicohérence (ou équiconsistance, par exemple la cohérence de la théories ZF entraîne la cohérence de ZF+AC (la réciproque est évidente). Mais pour d'autres axiomes, comme les axiomes de grands cardinaux, ce n'est pas le cas : dans la théorie ZFC + « il existe un cardinal inaccessible » on peut montrer l'existence d'un modèle de ZFC, c'est-à-dire la cohérence de cette théorie. Le second théorème d'incomplétude de Gödel permet d'en déduire que l'existence d'un cardinal inaccessible n'est pas démontrable dans ZFC (en supposant bien-sûr que cette dernière théorie est cohérente). Le second théorème d'incomplétude permet donc également de démontrer des résultats d'indépendance. Il est utilisé plus largement pour comparer des théories, une théorie étant « plus forte » qu'une autre si elle permet de démontrer sa cohérence.

[modifier] Notes

  1. (en)Thomas Jech, Set Theory, The Stanford Encyclopedia of Philosophy (Fall 2002 Edition), Edward N. Zalta (ed.) [1].
  2. On trouve dans les leçons sur la théorie des fonctions d'Emile Borel Gauthiers-Villars 4ème édition 1950, un échange de lettres à ce sujet entre René Baire, Jacques Hadamard, Henri Lebesgue et Borel lui-même ; les lettres apparaissent dans la note IV introduite à partir de la seconde édition).
  3. le paradoxe de Russell et d'autres, est paru dans les principles of mathematics du dit Russell en 1903, le paradoxe de Richard est publié en 1905 ...
  4. Préface de la 4ème édition des leçons sur la théorie des fonctions
  5. Kurt Gödel. The Consistency of the Axiom of Choice and of the Generalized Continuum Hypothesis with the Axioms of Set Theory, Princeton University Press.ISBN 0691079277.
  6. Robert M. Solovay A model of set theory in which every set of reals is Lebesgue mesurable, Annals of Math. 92, 1970, pp 1-56.
  7. Ouvrage collectif Penser les mathématiques (séminaire de l'ENS) Editions du Seuil, Paris 1982 ISBN 2 02 006061 2 note 7 p.35
  8. Stefan Banach and Alfred Tarski, Sur la décomposition des ensembles de points en parties respectivement congruentes, Fundamenta Mathematicae, 6, (1924), 244–277. Review at JFM
  9. ab Halmos, P.R., Naive Set Theory, D. Van Nostrand Company, Princeton, NJ, 1960. Reprinted, Springer-Verlag, New York, NY, 1974, ISBN 0-387-90092-6. trad. Française Introduction à la théorie des ensembles, Gauthier-Villars Paris 1965.
  10. voir le livre de Peter Aczel, Non-Well-Founded Sets, CSLI Lecture Notes, Vol.14, CSLI Publications, Stanford, California, 1988.

[modifier] Voir aussi

[modifier] Articles connexes

[modifier] Bibliographie

[modifier] Liens externes