## Espace d'état infini


In [None]:
%reset -f
import numpy as np
import matplotlib.pyplot as plt
np.set_printoptions(precision=3,suppress=True)

### Récurrence/transience

Considérons un état $x$. Nous notons:
$$
T_x = \inf\{t>0 : X_t =x \}
$$

***Définitions:***

* On dit qu'un état $x$ est *récurrent* quand, presque-sûrement, la chaine passe sur cet état un nombre infini de fois. Cela équivaut au fait que le temps de retour en $x$ est p.s fini:
$$
\mathbf P_x[T_x<\infty] =1
$$
* Quand ce n'est pas le cas, on dit que $x$ est *transient*.

Supposons maintenant que $x$ est récurrent:
* On dit que $x$ est *récurrent-nul* quand le temps de retour en cet état a une espérance infinie:
$$
 \mathbf E_x[T_x]=+\infty
$$
* Sinon on dira que $x$ est *récurrent-positif*.
* Quand $x$ est *récurrent-nul* il est visité très peu souvent (puisque la chaine met longtemps à y revenir). Ainsi récurrent-nul peut être vu comme un cas intermédiaire entre transient et récurrent-positif.

  



Quand la chaine est irréductible, les états sont tous simultanément récurrent-nuls ou récurrent-positifs ou transients.


Quand l'espace d'état est fini:
* irréductible => on est toujours dans le cas récurrent-positif.
* Réductible => il y a des état transient (forcément), et les autres sont récurent-positifs.




### Classification cas fini

Notons $\dim(Inv)$ la dimension de l'espace vectoriel des mesures invariantes.



* Réductible $\Rightarrow \dim(Inv)$ est égal au nombre de classes absorbantes. La question intéressante est: quelle est la proba de finir dans telle ou telle classe absorbante.


* Irréductible $\Rightarrow \dim(Inv)= 1$.  une unique proba inv. Le théorème ergodique s'applique.
    * périodique de période $k$. On peut considérer les sous chaines de Markov de transition $P^k$.
    * apériodique $\Rightarrow$ convergence en loi
    





### Classification cas infini

    
    
Dans le cas infini c'est plus complexe:


* Réductible $\Rightarrow \dim(Inv)$ est suppérieur ou égal au nombre de classe-absorbante. La question intéressante est: quelle est la proba de finir dans telle ou telle classe absorbante.


* Irréductible

    * Transient $\Rightarrow \dim(Inv)\geq 1$, pas de proba inv
    * Récurrent $\Rightarrow \dim(Inv) =  1$
        
        * Récurrent nul $\Rightarrow$ pas de proba inv. Théorème ergodique généralisé.
       
        * Récurrent positif $\Rightarrow$ une proba inv, théo ergodique
            * périodique de période $k$. On peut considérer les sous chaines de Markov de transition $P^k$.
            * apériodique $\Rightarrow$ convergence en loi
        
            



#### ♡♡♡


Cette proposition apparait dans la classification:



> ***Proposition:*** dans le cas transient on ne peut pas avoir de probabilité invariante.

*Démonstration:* Supposons qu'il y ait une probabilité invariante $\pi$. Alors en démarrant la chaine de Markov avec la distribution $\pi$ on a
$$
\forall t \qquad \mathbf E[f(X_t)] = \int f \pi
$$
Prenons $A$ un ensemble fini, puisque $X$ est transient il ne passe qu'un nombre <font color="red"> □ □ □ </font> de fois en $A$ et donc:
$$
\lim_t 1_{X_t\in A} = \color{red}{\square \square \square}
$$
En utilisant le théorème de <font color="red"> □ □ □ </font> on trouve
$$
\lim_t \mathbf E[1_A(X_t)]=\color{red}{\square \square \square}
$$
Et donc $\pi(A)=0$. Mais ceci est vrai pour tout $A$ fini, donc $\pi(E)=0$ ce qui est absurde. $\square$


*Remarque:* Par contre il peut y avoir des mesures invariantes. Par exemple la mesure 1 dans le cas d'une marche aléatoire transiente.



### Théorème ergodique pour chaine récurrente nulle.


Le théorème ergodique marche encore dans le cas récurrent-nul, mais il s'exprime comme ceci:


> ***Théorème:*** Notons $\pi$ l'unique mesure invariante (à constante multiplicative près). On a:
$$
\lim_{T\to \infty} \frac{ \sum_{t<T}  1_{X_t = x} }{  \sum_{t<T}  1_{X_t = y}  }  = \frac{\pi(x)}{\pi(y)}
$$

Moralement: dans le cas récurrent nul, la chaine visite si peu souvent les états que $T \to \sum_{t<T}  1_{X_t = y}$ est négligeable devant $T\to T$. Mais quand on fait le rapport de deux négligeables on peut trouver quelque chose d'intéressant.





#### ♡♡♡

***A vous:*** Placez vous dans le cas récurrent positif. Montrer que les deux formulations du théorème ergogiques sont équivalentes (on peut passer de l'une à l'autre). Aide: vous avez uniquement à utiliser que $\pi$ est une mesure de masse finie.




**Remarque:** Dans la preuve précédente, on a un peut rapidement inversé une $\lim_{T\to \infty}$ et un $\sum_{x\in E}$. Si $E$ est fini, no-problem, sinon il faudrait encore bosser pour être rigoureux.

### Espérance du temps de retour


Dans le cas récurent positif on montre que
$$
\mathbf E[T_x/X_0=x] ={1 \over \pi(x)}
$$
C'est très naturel: le théorème ergodique nous indique que la fréquence de passage en $x$ est $\pi(x)$, donc la période entre deux passage en $x$ est $1/\pi(x)$.



Dans le cas récurent nul, le fait que la chaine visite les points que de loin en loin, se traduit mathématiquement par un temps de retour d'espérance infinie.


In [None]:
np.random.seed(1234)
fig,ax=plt.subplots()
nbEssaies=10
for i in range(nbEssaies):
    Xt=3
    X=[Xt]
    while Xt!=0:
        Xt+=np.random.choice(a=[-1,1])
        X.append(Xt)
    ax.plot(X)

## Infini transient $\flat$

#### Etude d'un exemple


Considérons un chaine de Markov $X$ sur $\mathbf Z$ ayant probabilités de transitions suivantes:
\begin{align*}
P(0,1) = \frac{1}{2}&,& P(0,-1) = \frac{1}{2} \\
P(x,x+1) = \frac 23 &,& P(x,x-1) = \frac 13 &,& \text{si } x > 0 \\
P(x,x+1) = \frac 13  &,& P(x,x-1) = \frac 23 &,& \text{si } x < 0\\
\end{align*}




           2/3   2/3   1/2  1/2   2/3   2/3
          <---  <---  <---  --->  --->  --->
       -3     -2    -1     0    1      2    3
          --->  --->  --->  <---  <---  <---
           1/3   1/3   1/3   1/3   1/3   1/3



En dehors de $0$ elle se comporte exactement comme une marche aléatoire sur $\mathbb N$ qui monte de $\frac 23$ et descend de  $\frac 13$.


> ***Proposition:*** Quelle que soit sont point de départ $X$ converge presque-surement vers $+\infty$ où $-\infty$:
$$
\forall x \qquad \mathbf P_x\big [\{\lim_t X_t = +\infty\} \cup \{\lim_t X_t = -\infty\} \big]  =1
$$









*Démonstration:* On va  construire deux processues $Z$ et $Y$ à partir du même générateur aléatoire $(\xi_t)$.




On définit $Z$ comme ceci:

* si $Z_t=0$ alors $Z_{t+1}=1$.

*  si $Z_t\neq 0$, alors $Z_{t+1}=Z_t+1$ quand $\xi_t > \frac 13$ et sinon $Z_{t+1}=Z_t-1$.


On définit $Y$ comme cela:
A chaque instant $t$,  $Y_{t+1}=Y_t+1$ quand $\xi_t > \frac 13$ et sinon $Y_{t+1}-Y_t-1$.  





On fait partir nos deux processus du même point de départ.



* $Y$ est une marche aléatoire sur $\mathbb Z$. L'espérance de son accroissement est strictement positive: la loi forte des grands nombres nous indique que $\lim_t Y_t = \infty$.

* Si $Y$ monte alors $Z$ monte aussi. Donc  $\forall t,  Z_t \geq Y_t$, donc $\lim_t Z_t = \infty$.

* Pour finir on constate que $|X|$ a même loi que $Z$. Ceci implique que $X$ tend vers $+\infty$ ou $-\infty$.


**Vocabulaire:** On dit que l'on a construit un couplage entre deux processus, pour pouvoir les comparer.

### Fonction invariante

On voit ainsi que notre processus est transient; alors que si on inverse les 1/3 et 2/3 dans la matrice de transition on imagine bien qu'on tombe sur le cas récurent.

Si on part de 0, par symmétrie on voit que les probas de converger en $+\infty$ et $-\infty$ valent toute les deux $1/2$. On en déduit facilement que pour tout $x$:

\begin{align*}
\gamma_+(x) &:= \mathbf P_x[\lim_t X_t = +\infty]>0\\
\gamma_-(x) &:= \mathbf P_x[\lim_t X_t = -\infty]>0
\end{align*}
Ces fonctions vérifient $P\gamma_\pm=\gamma_\pm$ (c'est exactement le même calcul que dans le cas fini).  


Ces fonctions ne sont pas proportionnelles entre elles car $\gamma_+$ est strictement croissante et $\gamma_-$ strictement décroissante.
En particulier, $\dim(Inv) \geqslant 2$.


On peut  interpréter une chaine de markov dont la matrice de transition est
$$(x,y)\to \frac {\gamma_+(y)}{\gamma_+(x)} P(x,y)$$
de la même manière qu'on le ferait pour une chaîne de Markov finie avec un état absorbant (voir $h$-transformation) : c'est la chaîne de Markov donnée par $P$, mais conditionnée par $\{X_\infty = +\infty\}$.

### Fonctions invariantes non-bornées



Supposons maintenant que $P(x,x+1) = \frac 3 4$ et $P(x,x-1)=\frac 1 4$. Ainsi on a:
$$
\mathbf P_x[\lim_t X_t = +\infty] = 1
$$

Donc $\gamma_+(x) = 1$ et $\gamma_-(x)=0$, on est dans une situation similaire au cas d'une chaine de Markov finie avec 1 point absorbant: mais ici le point est situé en $+\infty$.

On n'a donc trouvé qu'une seule fonction invariante par cette méthode, et c'est la fonction $x\to 1$ qu'on connaissait bien.   En fait, dans ce cas, toutes les fonctions invariantes bornées sont constantes (c'est un équivalent discret du théorème de Liouville).  Cependant: En essayant de résoudre le système $P\gamma=\gamma$ on tombe sur l'équation de récurrence
$$
\frac 34 \gamma(x+1) - \gamma(x) + \frac 14 \gamma(x-1)=0 ,
$$
dont les solutions sont
$$
x \to \lambda  + \mu 3^{-x} .
$$

Ainsi on trouve une seconde fonction invariante positive: $h(x)= 3^{-x}$. Cette seconde fonction "correspond" au point $-\infty$: si on fait la h-transformation avec, on obtient une chaine conditionnée à finir sa vie en $-\infty$; alors que la chaine initiale ne le pouvait pas.

De manière générale: à chaque direction de fuite possible dans le graphe, correspond une fonction invariante.

* Si cette direction est 'probable', la fonction est bornée. L'ensemble des directions de fuite probables est appelé la frontière de Poisson.  
* Si cette direction est 'improbable', la fonction associée est non-bornée. L'ensemble de toutes les directions de fuite est appelé frontière de Martin.


**Exemple simple:** si le graphe est constitué des 3 copies de $\mathbb N$ recolées en $0$, il y aura 3 fonctions invariantes linéairement indépendantes.

**Exemple plus compliqué:**  La marche aléatoire simple dans $\mathbb Z^3$ est transiente. Sa frontière de Martin est une sorte de sphère de dimension 2 à l'infini. Ainsi l'ensemble des solutions de  $P\gamma=\gamma$ est de dimension infinie. Et bien sûr, il en est de même pour les solutions de $\pi P =\pi$.


Retenez surtout que dans le cas où $E$ est infini, il peut y avoir moultes fonctions/mesures invariantes.