DS03 - Probabilités et calcul matriciel

La correction du devoir surveillé est disponible dans l'onglet 'devoirs'. Je conseille fortement de reprendre l'ensemble des calculs matriciels car c'est une bonne préparation au programme de colle de cette quinzaine.
Je laisse également ici un lien vers un sujet d'oral de 2019 qui montre comment le modèle de diffusion d'Ehrenfest peut donner lieu à un sujet d'oral. A l'issue de votre lecture du corrigé du DS03, essayez de le traiter en 30 mn en notant que la question 4., plus probabiliste, est un bon complément au problème de samedi dernier.

Polynômes

Charles-Ange Laisant, polytechnicien d'origine nantaise (Indre, 1841 - Asnière-sur-Seine, 1920), successivement militaire, enseignant en classes préparatoires, député de la Loire inférieure puis de la Seine fortement engagé dans les mouvements républicains radicaux (boulangiste, dreyfusard, puis anarchiste) s'est toujours investi de façon active dans diverses sociétés mathématiques mais aussi dans plusieurs réformes de l'enseignement des mathématiques.
Il tente notamment de mettre en place une pratique de l'algèbre qui s'appuie sur les figures élémentaires de la géométrie, dégagée de l'analyse et des équations. Et c'est dans ce contexte qu'il reprend une méthode graphique, mécanique, permettant d'approcher les racines d'un polynôme de degré quelconque. Cette méthode n'est pas nouvelle. Elle a d'abord été imaginée par Johan Andreas Von Segnier en 1758, reprise par Eduard Lill, capitaine du génie, en 1867 [Résolution graphique des équations numériques de tous les degrés à une seule inconnue, et description d'un instrument inventé dans ce but, Nouvelles Annales de mathématiques (2), 6 (1867), 359-362] .

Vous trouverez ci-dessous le texte original, très court, d'Eduard Lill.
Pour vous aider à le lire, vous ouvrirez en parallèle le fichier Geogebra dans lequel a_3, a_2, a_1 et a_0 désignent les coefficients du polynôme : P(x)=a_3x^3+a_2x^2+a_1x+a_0.
Déplacez le point A' et confrontez les figures obtenues à celle proposée par Lill. Modifiez ensuite les coefficients du polynôme si vous le souhaitez.
Son article se termine par une question... Sauriez-vous y répondre ? Plus généralement, à l'appui du fichier Geogebra, sauriez-vous prouver que, si AA'=x, alors C'D=P(x) ? Vous aurez alors justifié graphiquement l'algorithme de HORNER dont je vous propose la preuve dans le notebook sur les polynômes dont voici le lien : Notebook-polynômes.

Et si vous aimez ce genre de visualisation algébrique, vous ne manquerez pas d'aller voir danser les racines ! Cette idée est proposée par un grand ami de Laisant, Edouard Lucas et joliment exposée .

Devoirs maison de probabilité

La correction du précédent devoir est en ligne. Prenez le temps de le lire et n'hésitez pas à réécrire les fonctions Python avant de les exécuter.

Quant au devoir maison n¨°3, vous pouvez consultez cet article du site "Image des maths" consacré à processus de Bienaymé-Galton-Watson...

Il devrait vous aider à comprendre ce qui vous est demandé !


La règle de Bayes

C'est deux ans après la mort de Bayes, en 1763, qu'est publié l'Essai en vu de résoudre un problème sur la doctrine des chances dans les Philosophical Transactions de la Royal Society. Membre de la Société Royale depuis 1742, fis d'un Ministre de l'église presbytérienne, lui même ministre non conformiste, son travail ne serait jamais paru si son ami, Richard Price, ne l'avait exhumé des archives du défunt pour le publier et en souligner l'intérêt. Il est pourtant passé complètement inaperçu et n'a suscité aucun commentaire jusqu'à ce que Laplace, en 1774, publie son Mémoire sur la probabilité des causes par les événements, dans lequel il présente une règle assez proche, sans pour autant avoir connaissance du texte de Bayes !
La formule de Bayes qui est à notre programme est, de fait, bien davantage le principe de Laplace qu'il formule ainsi :

"Si un événement peut être produit par un nombre n de causes différentes, les probabilités de l'existence des ces causes prises de l'événement sont entre elles comme les probabilités de l'événement prises de ces causes, et la probabilité de l'existence de chacune d'elles est égale à la probabilité de l'événement prise de cette cause, divisée par la somme de toutes les probabilités de l'événement prises de chacune de ces causes."

Humm... autorisons-nous une petite traduction en prenant le cas n=2 et posons E un événement qui peut être le résultat de l'une ou l'autre des deux causes A et B. Avec des notations qui sont les nôtres aujourd'hui, la première affirmation de traduit par le relation de proportionnalité :

\cfrac{P(A|E)}{P(B|E)}=\cfrac{P(E|A)}{P(E|B)}

Quant à la seconde, elle affirme que :

P(A|E) = \cfrac{P(E|A)}{P(E|A)+P(E|B)}

Ces deux égalités devraient pour le moins vous surprendre mais il faut comprendre que, sous les hypothèses laplaciennes P(A)=P(B). Vérifiez alors la véracité des relations précédentes. D'ailleurs, dans son Essai philosophique sur les probabilités, Laplace ne manque pas de compléter :

"Si ces diverses causes considérées a priori sont inégalement probables, il faut, au lieu de la probabilité de l'événement, résultante de cette cause, employer le produit de cette probabilité, par la possibilité de la cause elle même observée"

Soit  P(A|E) = \cfrac{P(E|A).P(A)}{P(E|A)P(A)+P(E|B)P(B)}

Mais revenons au sens de la formule écrite la première fois par Bayes. L'idée forte est d'évaluer la pertinence de ce qu’on croit savoir (H) à l’aune de l’information apportée par une observation (O). C'est un cas pratique extrêmement fréquent. Il suffit de penser au diagnostic médical qui est posé à partir des seuls symptômes, au droit pénal lorsqu'il s'agit d'évaluer le degré de culpabilité présumée d'un justiciable... Dans http://www.breves-de-maths.fr/la-petite-formule-de-tom/, Eric Parent (AgroParisTech) donne un exemple moderne d'application en considérant l'hypothèse du réchauffement moyen de notre planète et l'observation de la fonte de la calotte glaciaire.

Je vous propose pour ma part une formulation plus proche de votre cours : Considérons deux urnes A et B, l'une composée de 9 boules blanches et 1 boule noire, l'autre composée de 5 boules blanches et 5 noires. Pour déterminer l'urne dans laquelle le tirage aura lieu, on lance un dé non équilibré dont la probabilité d'obtenir face vaut 0.6. Sans avoir assisté ni au lancer de dé, ni au tirage, on nous tend une boule noire et on nous demande d'estimer la probabilité que le tirage ait eu lieu dans l'urne A... A priori, la probabilité de tirer dans l'urne A est supérieure à celle de tirer dans l'urne B (0.6 contre 0.4) mais cette observation de la boule noire extraite change la donne... Comment ?

 P(A|N)=\cfrac{P(N|A)P(A)}{P(N|A)P(A)+P(N|B)P(B)}=\cfrac{\frac{1}{10}\frac{6}{10}}{ \frac{1}{10}\frac{6}{10} +  \frac{1}{2}\frac{4}{10} }

ou encore P(A|N)=\cfrac{3}{13}<P(A)

La règle de Bayez est au fond une règle de prudence. Elle permet d'éviter une induction trop rapide à l'appui de quelques expériences passées, qui ferait dire ici que, puisque l'urne A est choisie 6 fois sur 10, il est raisonnable d'imaginer que la noire provient de l'urne A... Ce que nous apprend cette règle c'est que nous devons suspendre notre évaluation dans l'attente d'observations qui risquent de contredire notre hypothèse, comme c'est le cas dans l'exemple des urnes...

Par ailleurs, si on contextualise cette formule qui apparait en Angleterre dans la deuxième moitié du XVIIIè siècle, c'est-à-dire dans un contexte newtonien, on doit sentir les remous qu'elle provoque et le changement de paradigme qu'elle induit. En effet, comme l'écrit Jean-Pierre Cléro dans La portée physique et sociale de la règle de Bayes :

"Alors que la structure newtonienne élémentaire qui conduit à la loi se compose de phénomènes, d'un Auteur divin qui édicte la loi des choses, puis d'une activité d'induction et de mise en forme mathématique qui rejoint idéalement cette loi en reconstruisant schématiquement l'intermédiaire de phénomènes et de l'édiction autoritaire, la structure bayesienne comprend les phénomènes, une annonce d'espérance à leur égard et une évaluation de cette annonce d'espérance par confrontation de la combinaison sortie avec l'ensemble des combinaisons possibles.

[...] le support des probabilités est le sujet qui conjecture, pris entre les informations phénoménales dont il dispose et l'immense poids des possibles.

Concluons avec lui que la réalité bayesienne est complexe. Elle n'est pas celle d'une nature dont Dieu serait l'auteur. Elle est au contraire fortement "anthropologisée" ou "humanisée", révélée au fil de la lecture par un "I guess" systématique utilisé par Bayes dans chacune de ses démonstrations.

Arithmétique des infinis

Historiquement, ce sont les séries numériques (arithmétique des infinis initiée en grande partie par Wallis dès 1655) qui, dès l'élaboration du calcul intégrale au XVIIè siècle, s'avèrent avoir la plus grande intimité avec les problèmes dits "de quadrature", alors très à la mode.

Observons comment Nicolas Mercator, dans son Logarithmotechnia de 1668, justifie la formule qui porte aujourd'hui son nom (bien qu'obtenue sous une forme proche, mais non publiée, par Newton dès 1736) :

\ln(1+x)=x-\cfrac{x^2}{2}+\cfrac{x^3}{3}-\cfrac{x^4}{4}+\cdots

Dans un premier temps, les logarithmes ne semblent pas l'intéresser et il se concentre sur la quadrature de l'hyperbole en donnant le moyen d'approcher \displaystyle\int_1^{1+h}\cfrac{1}{t}dt .

Nous traduisons sa présentation aujourd'hui difficile à suivre car elle repose sur le langage des indivisibles (somme de lignes ou de petits rectangles de largeur infiniment petite), présentation d'ailleurs suffisamment compliquée pour que Wallis, la même année, en fournisse une réécriture que nous allons suivre :

  1. Il met en évidence la subdivision régulière sur l'intervalle [1,1+h] définie par c_k=1+k\cfrac{h}{n}, 0\leq k\leq n et écrit que \displaystyle\int_1^{1+h}\cfrac{1}{t}dt\approx \cfrac{h}{n}\displaystyle\sum_{k=0}^{n-1}\cfrac{1}{1+\frac{kh}{n}}
  2. Il montre [Prop. XIV] que \cfrac{1}{1+a}\approx 1-a+a^2-a^3+a^4 (&c).
    Il le fait non pas comme nous l'avons fait en cours, en utilisant la somme des termes d'une suite géométrique, mais en utilisant une division suivant les puissances croissantes de a.
    Notons que, même si la question de la convergence d'une telle somme ne se pose pas explicitement au XVIIè siècle, Wallis souligne que a ne doit pas être supérieur 1 (il va de soi que a est positif...).
  3. On peut penser qu'il suffit d'intégrer la relation qui précède pour obtenir la somme attendue sauf qu'il n'est pas du tout évident, à cette époque, que l'aire sous l'hyperbole soit un logarithme, autrement dit que : \int_0^{h}\cfrac{1}{1+t}dt=\ln(1+h)...
  4. La démarche est donc la suivante : \cfrac{1}{1+\frac{h}{n}}=1-\cfrac{h}{n}+\cfrac{h^2}{n^2}-\cfrac{h^3}{n^3}+\cdots
    \cfrac{1}{1+\frac{2h}{n}}=1-\cfrac{2h}{n}+\cfrac{4h^2}{n^2}+\cdots
    \cfrac{1}{1+\frac{3h}{n}}=1-\cfrac{3h}{n}+\cfrac{9h^2}{n^2}+\cdots
    \cdots
    \cfrac{1}{1+(n-1)\frac{h}{n}}=1-(n-1)\cfrac{h}{n}+(n-1)^2\cfrac{h^2}{n^2}+\cdots
  5. Or, comme : {\small \displaystyle\int_1^{1+h}\cfrac{1}{t}dt\approx \cfrac{h}{n}\left(1+\cfrac{1}{1+\frac{h}{n}}+ \cfrac{1}{1+\frac{2h}{n}}+\cfrac{1}{1+\frac{3h}{n}}+\cdots +\cfrac{1}{1+(n-1)\frac{h}{n}}\right)}
  6. On obtient en regroupant les termes :\displaystyle\int_1^{1+h}\cfrac{1}{t}dt\approx h-\cfrac{h^2}{n^2}\displaystyle\sum_{k=1}^{n-1}k+\cfrac{h^3}{n^3}\displaystyle\sum_{k=1}^{n-1}k^2-\cdots
  7. Or Wallis a démontré que \cfrac{1}{n^{i+1}}\displaystyle\sum_{k=1}^{n-1}k^i tend vers \cfrac{1}{i+1} quand n tend vers l'infini.
  8. Finalement, on a obtenu que : \displaystyle\int_1^{1+h}\cfrac{1}{t}dt\approx h-\cfrac{h^2}{2}+\cfrac{h^3}{3}-\cfrac{h^4}{4}+\cdots

Question : Sauriez vous redémontrer le point 7. ?

Quant à Mercator, son travail n'est pas fini car il s'assure dans un second temps du caractère logarithmique des aires hyperboliques obtenues, ce qui donne lieu à des calculs fastidieux.

Finalement, il obtient bien pour peu que |h|<1 :

\ln(1+h)=h-\cfrac{h^2}{2}+\cfrac{h^3}{3}-\cfrac{h^4}{4}+\cdots

Retenons que ce travail de Mercator préfigure l'adoption par les mathématiciens de la fin du XVIIè du développement en séries pour le calcul des logarithmes. Dans le même temps, ils identifieront désormais aires hyperboliques et logarithmes.

Quant à vous, bien loin des tâtonnements des débuts de l'histoire des logarithmes, vous relierez l'exercice 6 du TD 4 pour une preuve conforme à votre programme, que pour h=1, on a bien :

\ln(2)=\displaystyle\sum_{k=1}^{\infty}\cfrac{(-1)^{k-1}}
{k}

Les séries infinies, les voyages et la navigation...

En avril 1691, Leibniz rédige un article dans les Acta Eruditorum destiné à mettre à la portée des navigateurs les propriétés de la loxodromie : "Quadratura arithmetica communis sectionum conicarum quae centrum habent, indeque ducta trigonometria conanica ad quatamucunque in numeris exactis exactitudinem a tabularum necessitate" (Quadrature arithmétique commune aux section coniques à centre d'où sont déduites des règles de trigonométrie permettant d'obtenir tout l'exactitude qu'on souhaite, sans avoir besoin de tables).

Le calcul de la courbe loxodromique qui coupe les méridiens terrestres sous un angle constant fait partie des applications concrètes du développement en séries. L'idée est de conférer, dans les calculs d'approximation, la préférence aux "développements en séries" sur les tables numériques disponibles à l'époque. Il s'en expliquait d'ailleurs dans une lettre à Galloys de décembre 1678 :

"En retenant seulement dans la mémoire deux progressions très simples que j'y donne et qu'on ne saurait quasi oublier, quand on les a une fois apprise (;-), on pourra résoudre par là aisément tous les problèmes de Trigonométrie, sans les Tables, sans les instruments, et sans livres, avec autant d'exactitude qu'on voudra. Ce qui sera d'un grandissime usage pour les voyageurs, qui ne peuvent pas toujours porter leurs livres avec eux. avoir des tables est une commodité, mais ne pouvoir pas résoudre les problèmes sans les tables est une imperfection de la science, à laquelle je prétends d'avoir remédié."

Énigme : Sauriez-vous reconnaître et justifier les formules suivantes, données par Leibniz dans son article, en précisant que le sinus de l'ancienne géométrie correspond au produit du sinus moderne par le rayon du cercle, le sinus du complémentaire correspond au produit de notre cosinus par le rayon et le sinus verse à la différence entre le rayon et le sinus du complémentaire (soit r\cdot\left(1-\cos(a)\right)...) ?

"Soit donc un rayon égal à un, un arc a, t la tangente, s le sinus droit, v le sinus verse, l un logarithme, 1+n le nombre, nous aurons :

 a=\cfrac{1}{1}t-\cfrac{1}{3}t^3+\cfrac{1}{5}t^5-\cfrac{1}{7}t^7 etc.

s = a-\cfrac{a^3}{1.2.3}+\cfrac{a^5}{1.2.3.4.5} etc.

v = \cfrac{a^2}{1.2}-\cfrac{a^4}{1.2.3.4}+\cfrac{a^6}{1.2.3.4.5.6}etc.

l = \cfrac{1}{1}n-\cfrac{1}{2}n^2+\cfrac{1}{3}n^3-\cfrac{1}{4}n^4etc.

n = \cfrac{l}{1}+\cfrac{l^2}{1.2}+\cfrac{l^3}{1.2.3}+\cfrac{l^4}{1.2.3.4}etc

Ce à quoi il ajoutait :

"La grandeur dont les puissances apparaissent dans une série infinie doit toujours être plus petite que un, afin de devenir aussi petite qu'on veut à mesure qu'on la poursuit. [...]

J'ai préféré ne recopier que les séries de composition assez facile pour se fixer aisément dans la mémoire, susceptibles de suppléer en tout lieu le défaut de livres ou de tables. Je ne leur en adjoindrai qu'une seul, parce qu'elle est très simple et qu'elle a fourni le point de départ de cet article : soient c les sinus des angles complémentaires, les sinus directs ou plutôt ce qui revient au même, leurs inverses, auront pour logarithme :

\cfrac{1}{2}c^2+\cfrac{1}{4}c^4+\cfrac{1}{6}c^6+\cfrac{1}{8}c^8 etc."

Vous avez bien compris qu'il s'agissait de ln\left(\cfrac{1}{1-\cdots}\right)

Question : Sauriez-vous retrouver ce résultat au voisinage de 0 ?

Premier devoir et révisions de statistiques

La correction du premier devoir sur table est en ligne. Je vous en souhaite bonne lecture.
Dans l'onglet "Informatique", à la rubrique "TP", vous trouverez le notebook et les fonctions Python qui serviront de support à l'activité de lundi 20.

Défi : Vous trouverez en lien un dossier "visages" contenant le trombinoscope des visages de la classe. Saurez-vous compléter la fonction "visagesEtStats.py" afin qu'elle affiche le visage moyen de votre promotion ?

Complément sur les séries

je recommande, pour compléter le cours sur les séries numériques, la lecture de l'article intitulé "sommes de séries de nombres réels" publié sur le site Image des maths qui dépend du CNRS.

Vous y trouverez des résultats nouveaux mais vous reconnaîtrez, j'espère, de nombreuses séries à notre programme.

Et pour ceux d'entre vous qui souhaitez une approche plus ludique et brève, je suggère cette vidéo sur la série harmonique, en 5 mn chrono !