La vraie réflexion qui m'anime est mieux illustrée par les questions suivantes que par le titre volontairement provocant :
1) Peut-on faire des mathématiques hors de tout cadre les formalisant (Théorie des ensembles telle ZF, théorie des catégories ...) ?
2) Doit-on faire des mathématiques dans un cadre les formalisant ?
3) Vaut-il mieux faire des mathématiques dans un cadre les formalisant ?
4) Fait-on de "meilleures" mathématiques dans un cadre les formalisant ?
5) Fait-on des mathématiques différentes hors de tout cadre les formalisant et dans un de ces cadres ?
J’ai mis "meilleures" entre guillemets pour laisser la plus libre interprétation possible à ce mot (plus efficaces, plus convaincantes, plus élégantes, plus simples, plus générales, etc. (à chacun d’y mettre le sens qui l’intéresse le plus avant de réagir))
Je pense qu'il est assez raisonnable de répondre "Oui" à la première question et "Non" à la deuxième (les contradicteurs sont les bienvenus).
Par la suite je ne parlerai que de ZF (donc, logique classique du premier ordre) comme cadre dans la mesure où mes connaissances de la théorie des catégories et en particulier de la logique catégorique ne me permettent pas de me positionner de façon suffisamment argumentée.
Les questions 3 et 4 sont plus polémiques (mais pas forcément plus intéressantes surtout si un esprit « de chapelle » contraint les réponses).
Pour ne pas me dérober à la polémique, je répondrais donc « Cela dépend » à la question 3, ce qui est justifié par ma réponse à la question 4 : « Oui et Non » ; pour développer, je dirais que faire des mathématiques dans le cadre de ZF permet de faire des mathématiques plus convaincantes quant à leur légitimité (d’où le « Oui »), mais moins simples et moins efficaces (d’où le « Non »).
Pour la question 5, je ne crois pas très polémique de répondre « Oui », mais ce qui m’intéresse ici, ce sont les implications épistémologique de ce « Oui ».
Pour illustrer cette question je crois préférable de donner quelques exemples (désolé pour l’aspect trop mathématique, mais je ne vois pas comment l’éviter), et je commence par le théorème de Cantor (un ensemble et l’ensemble de ses parties ne sont pas équipotents (il n’existe pas de bijection entre les deux)).
On pourrait me faire remarquer que je biaise le débat en choisissant un théorème très lié à la théorie des ensembles, mais ce choix est justifié par deux remarques :
1. Si j’avais choisi, par exemple, un théorème d’analyse, il aurait fallu, pour faire une comparaison, que je justifie la définition de l’analyse dans le cadre de ZF avant même de parler d’un théorème particulier, ce qui nous aurait entraîné sans doute un peu trop loin.
2. Le théorème de Cantor est bien utilisé hors du cadre de ZF, ne serait-ce que pour dire que n’est pas équipotent à , et autres exemples avec les ensembles (collections) utilisé(e)s par les mathématiciens classiques (je veux dire hors ZF dans leur pratique).
Théorème de Cantor : une démonstration par l’absurde, hors théorie des ensembles, pourrait commencer par (dans la phrase suivante, le mot ensemble doit être pris dans le sens de collection et non comme objet de ZF, bien sûr, mais je garde ce vocabulaire, puisque c’est celui usuellement adopté).
Pour tout ensemble E, il existe une bijection de E dans l’ensemble des applications de E dans {0, 1} …
La même démonstration dans le cadre de ZF pourrait commencer par
…
Différences notables :
Que veut dire « pour tout ensemble E » vs ?
« pour tout ensemble E » : cette phrase signifie que pour toute collection que l’on me présentera (ou que je peux imaginer) je serai capable de continuer la démonstration (avec ma casquette de mathématicien ne se préoccupant pas de ZF, « tous les ensembles » ne peut vouloir dire que « tous les ensembles dont je me sers »).
signifie de façon beaucoup plus précise « pour tous les objets de la théorie ZF ».
Que veut dire « Il existe une bijection … » vs
« Il existe une bijection … » : j’avoue que j’éprouve une certain difficulté à expliciter ce « Il existe », autant il est facile de dire ce qu’est une bijection entre une collection E et une collection F, autant dire « Il existe » pose plus de problèmes, si on parle d’un objet, on ne sait pas où il « vit », si on parle d’une construction, est-ce qu’on ne risque pas de se contraindre aux mathématiques constructives ?
signifie, là encore de façon plus précise « il existe un objet de ZF qui appartient à l’objet de ZF qui contient les objets de ZF qui sont des bijections de x dans z (notions définissable dans ZF cf. infra à propos de de l’objet de ZF noté x vers l’objet de ZF noté z ». Effectivement c’est plus précis, c’est aussi beaucoup plus tordu (on pourrait même dire : inutilement compliqué).
Que veut dire « Ensemble (ou collection) des applications … » vs
« Ensemble (ou collection) des applications … » : que dire de plus ?
: C’est l’objet de ZF qui contient exactement les applications (notion définissable dans ZF) de l’objet de ZF x vers l’objet de ZF {0, 1} (qui est aussi ). Cette définition est clairement plus précise que la précédente, cependant elle mérite quelques remarques (j’aurais pu faire les mêmes à propos de Bij(x , y)).
Μηδείς Αγεωμέτρητος Εισίτω
(Cette partie est destinée aux mathématiciens qui ne sont pas des spécialistes de ZF (ce qui suit serait trivial pour eux), et à ceux qui, sans être mathématicien, ne sont pas découragés par l’aspect un peu rébarbatif de certaines démonstrations)
Cliquez pour afficher
Dans la partie cachée ci-dessus j’ai eu à utiliser l’ensemble des parties d’un ensemble, notion qui, là encore, peut être intéressante hors de ZF (que soit isomorphe à , peut concerner tous ceux qui utilisent ces deux ensembles (collections)).
Définition de Wikipedia :
En mathématiques, l'ensemble des parties d'un ensemble désigne l'ensemble des sous-ensembles de cet ensemble.
Ou encore : Dans ZF la même définition devient :
Définition de Wikipedia :
Axiome de l'ensemble des parties : Pour tout ensemble E, il existe un ensemble dont les éléments sont précisément les sous-ensembles de E.
On sent déjà une légère différence dans l’affirmation « il existe un ensemble », mais écrit formellement c’est encore plus criant :
dans cette formule c’est y qui est l’ensemble des parties de x (z est un sous ensemble de x et t un élément de z (donc de x)).
La grosse différence c’est que dans cette formule il est « clairement » dit (pour l’œil accoutumé, je le reconnais) ce qu’est z (alors que l’on ne dit rien de A dans la première définition) : z est un ensemble, c’est à dire qu’il doit exister en tant qu’ensemble préalablement à sa reconnaissance en tant que partie de x, autrement dit l’ensemble des parties de x ne concerne que les parties (au sens de la première définition) qui sont des ensembles, et rien ne garantit dans ZF que « toutes les parties » au sens de la première définition veuille dire la même chose que « toutes les parties » au sens de la deuxième, puisque dans ce cas on ne considère que les parties qui sont des ensembles.
La grosse différence épistémologique est donc dans la signification (interprétation) de « toutes » lorsque l’on dit « l’ensemble de toutes les parties … ». Si je dis que cette différence est épistémologique c’est que les théorèmes sont les mêmes, seules leurs compréhensions sont légèrement différentes.
Cette différence est la raison pour laquelle il m’est arrivé quelque fois de réagir devant l’expression « même nombre d’éléments » pour des ensembles infinis.
Autrement dit : dans tout modèle de ZF il est possible trouver un objet qui ressemble beaucoup à l’ensemble des entiers naturels utilisé par les mathématiciens (l’ordinal ), mais dans ce même modèle on peut aussi trouver un objet fabriqué à partir de , en en prenant « Toutes les parties » (c’est un axiome de ZF), de la même façon que l’on peut construire à partir de , sauf que « Toutes les parties » dans ZF veut dire « Toutes les parties qui sont des ensembles », subtilité qui n’a évidemment pas cours hors de ZF, on peut même avoir un modèle dans lequel l’ensemble des parties de (qui est forcément de cardinal dans ce modèle) soit de même cardinal que vu de l’extérieur (ce résultat, connu sous le nom de paradoxe de Skolem, est une conséquence immédiate du théorème de Löwenheim-Skolem).
Théorème de Goodstein : cet énoncé est indécidable dans l’arithmétique de Peano, alors que c’est un théorème de ZF (pour les ordinaux). Je ne donne cet exemple que pour dire … que ce n’est pas un exemple, en effet cela ne montre pas que ZF est « meilleur », mais simplement plus « complet » sur ce point, cependant on aurait eu le même résultat en considérant la théorie Péano {théorème de Goodstein}.
Ce qui suit n’est qu’une analogie (à destination des non-mathématiciens (la partie en gras)) :
Il me semble que l’on peut faire une analogie (avec le même genre de non-dits et donc les mêmes questions) entre l’arithmétique de Robinson (arithmétique de Peano sans le schéma de récurrence) et l’exemple de la démonstration du théorème de Cantor : dans cette arithmétique, pour tout n et pour tout m on peut démontrer que , mais on ne peut pas démontrer que .
Si un modérateur pense que ce fil serait mieux dans le forum « Débats scientifiques », je ne vois aucun inconvénient à le transférer.
-----