# Vecteurs aléatoires, notamment gaussiens

In [2]:
%reset -f
import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as stats
import pandas as pd
import seaborn as sns


from mpl_toolkits import mplot3d

np.set_printoptions(precision=3,suppress=True)
plt.style.use("default")


"une fonction utilitaire pour simuler des données"
def make_data():
    nbData=500
    X0=np.random.uniform(low=0,high=10,size=nbData)
    X1=np.random.poisson(lam=X0,size=nbData)
    """ on crée la dataFrame-transposée"""
    X=np.zeros([2,nbData])
    X[0,:]=X0
    X[1,:]=X1
    # on aurait aussi pu faire directement:
    #      X = np.stack([X0,X1],axis=1)
    return X

import matplotlib.patches as patches

" une fonction utilitaire pour dessiner des repères"
def showBasis(ax,vecs,lim=(-2,2),color0=(1,0,0),color1=(0,1,0), origine=(0,0)):
    "attention: c'est les colonnes de vecs qui sont les 2 vecteurs tracés"
    vec0=vecs[:,0]
    vec1=vecs[:,1]

    ax.set_aspect("equal")

    ax.arrow(origine[0],origine[1],vec0[0],vec0[1], head_width=0.1, head_length=0.2,color=color0)
    ax.arrow(origine[0],origine[1],vec1[0],vec1[1], head_width=0.1, head_length=0.2,color=color1)

    # plus simplement, on peut faire
    #ax.plot([origine[0],origine + vec0[0]],[origine[1],origine + vec0[1]],'r')
    #ax.plot([origine[0],origine + vec1[0]],[origine[1],origine + vec1[1]],'g')

    # attention avec plt.arrow il faut nécessaire préciser le domaine (sinon c'est moche)
    ax.set_xlim(lim[0],lim[1])
    ax.set_ylim(lim[0],lim[1])


## Préliminaire: Décomposition en valeurs singulières (SVD)



### Cas général $\triangleright$

C'est une factorisation en trois facteurs ayant des propriétés particulières.

***A vous:*** $(2\heartsuit)$  observez, déduisez quelles sont les propriétés de cette factorisation.

In [None]:
A=np.array([[1,2,3],[4,5,6]])
U,S,V = np.linalg.svd(A)

print("A\n",A)
print("U\n",U)
print("S\n",S)
print("V\n",V)

diag=np.zeros((2,3))
diag[0,0]=S[0]
diag[1,1]=S[1]

print("U@diag@V\n",U@diag@V)
print("U@U.T\n",U@U.T)
print("V@V.T\n",V@V.T)

### Interprétation géométrique $\triangleright$

Considérons une application linéaire $T : \mathbb R^n \to \mathbb R^m$, associée à la matrice $A$. On peut trouver des bases orthonormales de $\mathbb R^n$ et  $\mathbb R^m$ telles que $T$ associe au i-ème vecteur de base de $\mathbb R^n$ un multiple positif du i-ème vecteur de base de $\mathbb R^m$, les vecteurs restants ayant pour image 0. Dans ces bases, l'application $T$ est donc représentée par une matrice diagonale dont les coefficients sont des réels positifs.


***Exo:***  $(3\heartsuit)$ Quel est le lien entre le texte précédent et la formule `U,S,V = np.linalg.svd(A)`. Indiquez précisément quelles sont les bases. Attention:

* Il y a un piège. Pour l'éviter posez $W=V^T$.
* Ne  mélangez pas les lignes et les colonnes: on travaille avec la multiplication à droite, donc les vecteurs sont à dessiner en colonne.



***A vous:***

* Ci-dessous, observez l'application $T : \mathbb R^2 \to \mathbb R^2, x \to ax$.
* Commentez ($3\heartsuit$):  à quel moment fait-on une isométrie (laquelle?), une dilatation?

In [None]:
def showPoint(ax,point):
    ax.plot(point[0],point[1],'.')

fig,ax=plt.subplots(1,2)

"""matrice de l'application"""
a=np.array([[1,-1],[-0.7,0.1]])
"""observons comment elle transforme la base canonique et un point """
vecs=np.eye(2)
point=np.array([0.5,1])

"on utilise ici une fonction utilitaire définie tout au début"
showBasis(ax[0],vecs)
showPoint(ax[0],point)

showBasis(ax[1],a@vecs)
showPoint(ax[1],a@point)

In [None]:
""" observons maintenant les transformations pas à pas """
U,S,V = np.linalg.svd(a)
print("a\n",a)
print("U\n",U)
print("S\n",S)
print("V\n",V)

fig,ax=plt.subplots(1,4,figsize=(16,8))
showBasis(ax[0],vecs)
showPoint(ax[0],point)

showBasis(ax[1],np.eye(2),color0=(0,0,1),color1=(0,0,1))
showBasis(ax[1],V@vecs)
showPoint(ax[1],V@point)

showBasis(ax[2],np.diag(S),color0=(0,0,1),color1=(0,0,1))
showBasis(ax[2],np.diag(S)@V@vecs)
showPoint(ax[2],np.diag(S)@V@point)

showBasis(ax[3],U@np.diag(S)@V@vecs) # ou bien a@vecs
showPoint(ax[3],U@np.diag(S)@V@point)# ou bien a@point

### Cas symétrique défini positif $\triangleright$

***A vous:*** $(1\heartsuit)$  Quel est le lien entre la diagonalisation et la svd dans ce cas?

In [None]:
""" prenons une matrice symétrique, diagonalisons là"""
B=np.array([[2,-1],[-1,2]])

val_pr,vec_pr=np.linalg.eig(B)

print("B:\n",B)
print("val_pr:\n",val_pr)
print("vec_pr:\n",vec_pr)

### Exo $\triangleright$

In [None]:
X=np.random.randint(0,10,size=[3,10])
cov=X@X.T
print(X)
print(cov)

In [None]:
U, S2, V = np.linalg.svd(cov)
print("U:\n",U)
print("S2:\n",S2)

In [None]:
U_, S_, V_ = np.linalg.svd(X)
print("U_:\n",U_)
print("S_:\n",S_)

***A vous:*** Expliquez $(2\heartsuit)$ l'égalité entre `U` et `U_`. Trouvez une relation $(2\heartsuit)$ entre `S2` et `S_`.

## Vecteurs aléatoires


### Théorie


Un vecteur aléatoire $X \in \mathbb R^p$, c'est simplement une collection de $p$ variables aléatoires. Mathématiquement, on les dispose souvent en colonne:
$$
X= \begin{bmatrix}
X_0\\
X_1\\
\vdots\\
X_{p-1}
\end{bmatrix}
$$
Mais attention, en statistique, l'habitude est plutôt de les noter en ligne! Notamment si l'on dispose de plusieurs réalisations $X^{(0)},X^{(1)},...,X^{(i)}$ de $X$, on les disposera ainsi:
$$
\begin{pmatrix}
X^{(0)} \\
X^{(1)}\\
\vdots\\
X^{(i)}\\
\end{pmatrix}=
\begin{pmatrix}
\begin{bmatrix}X^{(0)}_0 & \dots & X^{(0)}_{p-1}\end{bmatrix}\\
\begin{bmatrix}X^{(1)}_0 & \dots & X^{(1)}_{p-1}\end{bmatrix}\\
\vdots\\
\begin{bmatrix}X^{(i)}_0 & \dots & X^{(i)}_{p-1}\end{bmatrix}
\end{pmatrix}
$$
Cette disposition des données s'appelle une ***dataFrame***. Imaginons que le vecteur aléatoire représente les caractérisitiques d'un individu (poids, taille, QI,...). Alors:

*  chaque ligne de la dataFrame représente un individu
*  chaque colonne représente une caractéristique

Cependant, pour simplifier le lien avec l'algèbre linéaire, nous n'adoptons pas la convention de la dataFrame: les réalisations des vecteurs seront rangées dans les colonnes d'une matrice `X`.
$$
\begin{pmatrix}
X^{(0)} &
X^{(1)}&
\dots&
X^{(i)}
\end{pmatrix}=
$$
$$
\begin{pmatrix}
\begin{bmatrix} X^{(0)}_0 \\ \vdots\\ X^{(0)}_{p-1} \end{bmatrix}&
\begin{bmatrix} X^{(1)}_0 \\ \vdots\\ X^{(1)}_{p-1} \end{bmatrix}&
\dots&
\begin{bmatrix} X^{(i)}_0 \\ \vdots\\ X^{(i)}_{p-1} \end{bmatrix}&
\end{pmatrix}
$$


On parlera alors de dataFrame-transposée


### Observons avec matplolib

Observons des réalisations d'un vecteur aléatoire `X=(X0,X1)` de dimension 2.

In [None]:
"Pour générer les données, nous utilisons une fonction définie tout au début."
X=make_data()
fig,ax=plt.subplots()
ax.plot(X[0,:],X[1,:],'.')
ax.set_aspect("equal")

###  Observons avec seaborn $\triangleright$


Lissons avec des noyaux gaussiens:

In [None]:
g=sns.jointplot(x=X[0,:], y=X[1,:], kind='kde',stat_func=None);
g.fig.set_size_inches(4,4)

***Exo:*** $(3\heartsuit)$ En observant la fonction `make_data`, indiquez si les deux composantes `X0` et `X1` sont indépendantes?  Justifiez votre réponse en décrivant la fonction
$$
x \to \text{Loi}(X_1/X_0=x)
$$

***Exo:*** $(4\heartsuit)$ $X_0$ admet-t-il une densité par rapport à la mesure de Lebesgue? Par rapport à la mesure de comptage? Même question pour $X_1$, et pour le couple $X=(X_0,X_1)$. Critiquez la visualisation faite avec `seaborn`.


***Exo:*** $(5\heartsuit)$ Refaite un `jointplot` (la fonction de seaborn), en mieux, avec `matplotlib`.  Tenez compte de la particularité des données en mettant un histogramme d'un côté et une densité estimée de l'autre. Voic le début du code.

In [None]:
"dans une grille 3*3"

"une boite qui part de (0,0), qui occupe 2 colonnes (et 1 ligne par défaut) "
ax1 = plt.subplot2grid((3, 3), (0, 0), colspan=2)

"une boite qui part de (1,0), qui occupe 2 colonnes et 2 lignes "
ax2 = plt.subplot2grid((3, 3), (1, 0), colspan=2,rowspan=2)

"une boite qui part de (1,2), qui occupe  2 lignes (et 1 colonne par défaut) "
ax3 = plt.subplot2grid((3, 3), (1, 2), rowspan=2)
ax1.set_xticks([]) # ou bien ax1.axis("off")
ax1.set_yticks([])
ax3.set_xticks([])
ax3.set_yticks([]);

## Espérance, Covariance, Corrélation




### Définition $\triangleright$

* L'espérance d'un vecteur aléatoire, est le vecteur des espérances: $\mathbf E[X]=(\mathbf E[X_0],\mathbf E[X_1],...)$. Notons $\mu$ ce vecteur.  

*  La matrice de covariance de $X$ c'est la matrice $\mathbf V[X]$, souvent noté $\Sigma^2$, définie par $\Sigma^2_{ij}= \mathrm{cov}(X_i,X_j)$. On peut l'écrire avec une multiplication matricielle:
$$
\mathbf V[X] = \mathbf E[ (X-\mu)  (X-\mu)^T ]
$$
 (où nous supposons, comme pour les vecteurs, que l'espérance d'une matrice aléatoire, c'est la matrice des espérances).  

* Les coefficients de corrélation sont définis par  
$$
c_{ij} = \frac{\mathrm{cov}(X_i,X_j)  }{ \sqrt{\mathbf V(X_i)}  \sqrt{\mathbf V(X_j)}  }
$$
Quelle $(1\heartsuit)$ fameuse inégalité permet d'affirmer que ces coefficients sont compris entre $-1$ et $+1$?


***Exo:*** Soit $a$ une matrice et $b$ un vecteur.

* $(1\heartsuit)$ Vérifiez que $\mathbf E[aX+b] =a \mathbf E[X]+b$.
* $(2\heartsuit)$ Vérifiez que $\mathbf V[aX+b] = a\mathbf V[X]a^T$.
* $(2\heartsuit)$ Vérifiez que $\mathbf V[X]$ est symétrique et que ses valeurs propres sont positives.  Aide pour les valeurs propres: il suffit de montrer qu'elle est semi-définie positive ($\forall v,  v^T \Sigma^2 v = ... \geq 0$).


### Estimation $\triangleright$

À partir d'une dataFrame (ou de sa transposée  dans notre cas), on peut estimer l'espérance et la matrice de covariance du vecteur aléatoire sous-jacent:

In [None]:
X=make_data()
cov=np.cov(X) #attention, avec une vraie dataFrame, il faudrait transposer
print("covariance toute faite:\n",cov)

mean=np.mean(X,axis=1)
print("mean:",mean)

X_cen=X - mean[:,np.newaxis]

print("vérif:",np.mean(X_cen,axis=1))

nb_data=X.shape[1]
cov_moi=(X_cen @ X_cen.T)/ (nb_data-1)
print("cov_moi:\n",cov_moi)

***Avertissement informatique:*** Par défaut la formule de `numpy`

* est la formule centrée pour la covariance, où on divise par $n\!-\!1$: `np.cov(X) = np.cov(X, ddof=1)` ;
* n'est pas la formule centrée pour l'écart-type, mais celle où on divise par $n$: `np.std(X) = np.std(X, ddof=0)`.

C'est ce genre d'incongruité qui peut être corrigée dans une des futures versions de `numpy`. C'est une bonne habitude de toujours verifier les procédures toutes faites.

***Avertissement mathématique:*** Ne confondez pas les espérances, variances, covariances théoriques, avec leurs estimations pratiques. Par exemple, pour la matrice de covariance, la formule théorique est:
$$
\Sigma^2= \mathbf E[ (X-\mu)  (X-\mu)^T ]
$$
alors que l'estimation est obtenue à partir d'une dataframe (cf. programme précédent).
        
***A vous:*** considérons le couple $(X_0,X_1)$ généré par `make_data()`. Estimez l'espérance et la matrice de covariance avec les fonctions `numpy`.

***A vous:***  (plus dur). On cherche maintenant les valeurs théoriques:

* Écrivez $(2\heartsuit)$ une formule explicite pour  l'espérance de $(X_0,X_1)$.
* Écrivez $(4\heartsuit)$ une formule explicite pour la matrice de covariance de $(X_0,X_1)$.

Aide: ces formules comporteront des symboles $\int$ et $\sum$ mélangés, puisque cette loi est un mélange de lois continue et discrète. Vous n'êtes pas obligés de simplifier ces formules.

### Interprétation géométrique de la covariance $\triangleright$


La matrice $\Sigma^2$ est symétrique et ses valeurs propres sont positives.   Donc on peut l'écrire
$$
\Sigma^2=U  S^2  U^T
$$
 avec $S^2$ la matrice diagonale formée des valeurs singulières (=valeurs propres) que l'on classe dans l'ordre décroissant $s_{0}^2\geq s_{1}^2 \geq\dots$,   et $U$  une matrice orthogonale.


Considérons un vecteur aléatoire $X$ de matrice de covariance $\Sigma^2= U S^2 U^T$. Notons $U_{i}$ les colonnes de $U$.   On note naturellement $s_i$ les racines carrées des $s^2_i=S^2_{i,i}$.   Elles sont ordonnées  $s_0\geq s_1 \geq ...$.   On note $\mu$ le vecteur espérance de $X$.    Si maintenant nous simulons des copies indépendantes de $X$, elles formeront un nuage de points autour de $\mu$, dont la dispersion sera décrite par  les $U_i$  et $s_i$ (cf. plot ci-dessous).


***Exo:***

* $(2\heartsuit)$ Soit $X$ un vecteur aléatoire de matrice de covariance  $\Sigma^2=U S^2 U^T$ et d'espérance $\mu$.  Notons $\Sigma = U S U^T.$  Quelle est la matrice de covariance de $\Sigma^{-1} (X-\mu)$ ?  Faites le lien avec le fait de centrer-réduire les v.a.
* Faites $(1\heartsuit)$ le même calcul que précédement en remplaçant $\Sigma$ par $\Gamma=U S$.  

In [None]:
U,S2,V =np.linalg.svd(cov)

S=np.sqrt(S2)
fig,ax=plt.subplots()

ax.plot(X_cen[0,:],X_cen[1,:],'.')

"déformons la base U par les élément de S"
U_s=U.copy()
U_s[:,0]*=S[0]
U_s[:,1]*=S[1]

showBasis(ax,  U_s ,lim=(-10,10))

***Attention:*** même en classant les valeurs propres par ordre décroissant, il n'y a pas unicité de la base $U$ (il y a des choix d'orientation et il faut aussi faire des choix de base quand on a des valeurs propres multiples).




### La covariance ne donne pas la forme du nuage $\triangleright$


Tous les vecteurs aléatoires ne se répartissent pas en patate. Sur [wikipedia](https://en.wikipedia.org/wiki/Correlation_and_dependence) ils proposent des simulations de vecteurs aléatoires de $\mathbb R^2$ qui admettent tous la matrice identité pour matrice de covariance.

***A vous:***  Simulez $(3\heartsuit)$ un ou deux nuages de points dont la covariance est l'identité  et qui a une forme pas banale.

## Vecteurs aléatoires gaussiens


Un vecteur aléatoire est gaussien si toutes les combinaisons linéaires qu'on peut en faire sont des v.a gaussiennes.
Je trouve cette définition classique très peu constructive. En voici une plus explicite, en deux étapes.

### gaussien standard $\to$  gaussien général

* Soit $Y\in \mathbb R^p$.
On dit que $Y$ est un vecteur gaussien standard, et on note $Y\sim \mathcal N_p(0,I)$  lorsque les composantes $Y_i$  sont des $\mathcal N(0,1)$ indépendantes.  Son espérance est $0=(0,...,0)$ et sa matrice de covariance c'est $I$.

* Les vecteurs gaussiens sont tous les vecteurs de la forme $a Y+b$ avec $a$ matrice, $b$ vecteur et $Y\sim\mathcal  N_p(0,I)$.

 Ainsi par construction, la famille des vecteurs gaussiens est stable par combinaison affine.


### gaussien général $\to$ gaussien standard


Ainsi, par définition, un vecteur gaussien général c'est $X= aY + b$ avec $Y \sim \mathcal  N_p(0,I)$.  L'espérance de $X$ est alors $\mu = b$ et  sa matrice de covariance est alors $\Sigma^2 = a a^T$.  

Définissons alors $Y' := \Sigma^{-1} (X-\mu)$ (attention, on ne retombe pas forcément sur $Y$).  On a que
$$
X = \Sigma Y' + \mu   \qquad \mathrm{ et } \qquad Y' \sim \mathcal N_p(0,I)
$$
Ci-dessus, on a une écriture "canonique" d'un vecteur Gaussien général (une écriture pas tout à fait unique à cause des choix arbitraires dans la SVD).  On voit bien avec cette écriture que la loi de $X$ ne dépend que de sa matrice de covariance $\Sigma^2$ et de son espérance $\mu$. On notera d'ailleurs:
$$
X \sim \mathcal  N_p(\mu, \Sigma^2)
$$


### Simulation $\triangleright$

Voyons comment on simule un tel vecteur avec `numpy`

In [None]:
""" choisissons une matrice de covariance """
Sigma2=np.array([[3,-1],[-1,0.5]])
print("Sigma2\n",Sigma2)
""" un vecteur espérance"""
mu=np.array([3,4])
""" simulons (on doit transposer le résultat)"""
X= np.random.multivariate_normal(mean=mu,cov=Sigma2,size=500).T

fig,ax=plt.subplots()
ax.plot(X[0,:],X[1,:],'.');

***A vous:***

* $(3\heartsuit)$ Sur la figure ci-dessus, ajoutez les directions principales du nuage de points, dilatée par les valeurs de $S$.
* $(1\heartsuit)$ Pourquoi le nuage de points est-il penché dans ce sens? (Et pas selon la première bisectrice par exemple.)
* $(1\heartsuit)$ Que se passe-t-il si l'on prend `cov` une matrice dégénérée? (Faites le!)
* $(3\heartsuit)$ En utilisant la théorie, simulez vous-même ce nuage de points sans utiliser `np.random.multivariate_normal` mais en partant simplement de v.a gaussiennes via `np.random.normal`. Aide: il vous faut aussi utiliser la décomposition SVD (et relire le paragraphe précédent).


## Densité d'un vecteur aléatoire $\flat$

Notre tout premier exemple de vecteur aléatoire n'admettait pas de densité par rapport à la mesure de Lebesgue, ni par rapport à la mesure de comptage. Mais dans de nombreux cas pratiques, une telle densité existe. Nous traitons ici de la densité par rapport à la mesure de Lebesgue.


#### Doublement bêta $\triangleright$

In [None]:
""" une dataFrame-transposée à deux colonnes """
def betaBeta(nbData):
    X0=np.random.beta(a=1,b=3,size=nbData)
    X1=np.random.beta(a=2,b=1,size=nbData)
    return np.stack([X0,X1],axis=0)

""" la densité correspondante """
def densityX(x,y):
    return stats.beta.pdf(x,a=1,b=3)*stats.beta.pdf(y,a=2,b=1)


lim=1
xx=np.linspace(0, lim, 100)
yy=np.linspace(0, lim, 100)
XX,YY=np.meshgrid(xx,yy)
den_square=densityX(XX,YY)
plt.imshow(den_square,extent=[0,lim,0,lim],origin="lower",cmap="jet")

X=betaBeta(500)
plt.plot(X[0,:],X[1,:],'.')
plt.gca().set_aspect('equal')


***Exo théorique:***  Les deux composantes  $X_0$ et $X_1$ sont-elles  indépendantes $(2\heartsuit)$? (Justifiez sans aucun calcul, à partir de la manière dont on les simule.) Comment est-ce que cela se lit sur la densité $(1\heartsuit)$?

***Exo informatique:*** $(5\diamondsuit)$ Refaites un programme similaire choisissant certains paramètres de la loi beta <1.  La difficulté c'est qu'on obtient des densités non bornées. Pour effectuer la multiplicaition `f0*f1` il faut alors supprimer les valeurs infinies. Pour cela vous pouvez

* soit restreindre le domaine en excluant les bords du carré $[0,1]^2$,
* soit limiter les densités, ex: `f0=np.minimum(f0,1000)`.

Mais même en prenant ces précautions, les densités seront moches car les couleurs seront saturées. Astuce: tracez le log de la densité (ce qui revient à changer l'échelle de couleur).

### Cas Gaussien

La densité des vecteurs gaussiens est fournie dans `scipy.stats`.

In [None]:
cov=np.array([[2,-1],[-1,1]])
print("cov\n",cov)
X= np.random.multivariate_normal(mean=[0,0],cov=cov,size=500).T
print("X.shape:",X.shape)

fig,ax=plt.subplots()
ax.plot(X[0,:],X[1,:],'.')
ax.set_aspect("equal")

lim=3
resolution=200
xx=np.linspace(-lim,lim,resolution)
XX,YY=np.meshgrid(xx,xx)
XY=np.stack([XX,YY],axis=2)
den=stats.multivariate_normal.pdf(XY,mean=[0,0],cov=cov)

ax.imshow(den,cmap="jet",extent=[-lim,lim,-lim,lim],origin="lower");

### Déformation par multiplication matricielle $\triangleright$

Soit $X\in \mathbb R^p$ un vecteur aléatoire de densité $f$. Soit $a$ une matrice inversible $p\times p$. Soit $b\in \mathbb R^p$. La densité de $aX+b$ est:
$$
x\to   \frac 1 {|  \mathrm{det} \,a  |} f \Big(  a^{-1} (x-b)  \Big )
$$

***A vous:***   Vérifiez $(4\diamondsuit)$ cette formule en utilisant la technique de la fonction test:
$$
\mathbf E[\phi(aX+b)] = \int_{\mathbb R^p} \phi(ax+b) \ f(x) \ dx = ...
$$
***A vous:*** Retrouvez $(2\diamondsuit)$ la densité de $\mathcal N_p(0,\Sigma^2)$ à partir de la densité de $\mathcal N_p(0,I)$. Aide: Avec la svd on sait qu'on peut écrire $\Sigma^2=\Sigma^T \Sigma$. Mais cette racine carrée $\Sigma$ (quelque peu arbitraire) ne doit pas apparaître dans l'expression finale.

Déformons les réalisations des vecteurs aléatoires `betaBeta`.

In [None]:
X=betaBeta(500)
a=np.array([[1,-1],[-0.7,0.1]])
print("X.shape:",X.shape)
aX=a@X

fig,ax=plt.subplots()
ax.plot(aX[0,:],aX[1,:],'.')
ax.set_aspect('equal')

Pour tracer informatiquement la densité déformée il faut bien réfléchir.

Observons ce que renvoie `meshgrid` sur un petit exemple. Voyons comment nous devons le transformer.  

In [None]:
xx=[1,2,3]
yy=[0,1,2,3]
""" meshgrid répète les abscisses et les ordonnées """
XX,YY=np.meshgrid(xx,yy)
print("XX\n",XX)
print("YY\n",YY)

""" on colle le tout"""
XY=np.stack([XX,YY])
print("XY.shape:",XY.shape)

""" on transforme les deux matrices en une liste de couple (abscisse,ordonnée)"""
XY_flat=np.reshape(XY,newshape=[2,4*3])
print("XY_flat.shape:",XY_flat.shape)
print("XY_flat\n",XY_flat)

"""sur chacun de ces couples, on effectue la multipliation matricielle"""
print("a@XY_flat\n",a@XY_flat)

In [None]:
def deform_density(density, x, y, a):
    a_inv=np.linalg.inv(a)
    xy=np.stack([x,y])
    axy=a_inv@xy
    ax=axy[0]
    ay=axy[1]
    return density(ax,ay)

lim=1
resolution=200
xx=np.linspace(-lim,lim,resolution)
XX,YY=np.meshgrid(xx,xx)
XY=np.stack([XX,YY])
print("XY.shape:",XY.shape)
XY_flat=np.reshape(XY,newshape=[2,resolution*resolution])
print("XY_flat.shape:",XY_flat.shape)
den_flat=deform_density(densityX, XY_flat[0], XY_flat[1],a)
print("den_flat.shape:",den_flat.shape)

den_square=np.reshape(den_flat,newshape=[resolution,resolution])
print("den_square.shape:",den_square.shape)


fig,ax=plt.subplots()
ax.imshow(den_square,cmap="jet",origin="lower",extent=[-lim,lim,-lim,lim],alpha=0.5)
ax.plot(aX[0,:40],aX[1,:40],'.')
ax.set_aspect('equal');

***Exo:*** Ajoutez $(4\heartsuit)$ les deux directions principales de ce nuage de points, en utilisant `showBasis`. Il y a plusieurs techniques pour les calculer:

* estimer la matrice de covariance avec `np.cov`,
* calculer exactement cette matrice (ici c'est très facile, il suffit de regarder la formule pour la variance d'une loi bêta, que l'on peut aussi avoir avec `stats.beta.std`),
* ou partir directement de la décomposition svd ou de la diagonalisation de la matrice `a`.