# Dataclasses

Très pratique pour créer des objets en python, sans trop écrire.

Les lib `stax` et `equinox` sont basées dessus.

## Qu'est-ce qu'un attribut de classe ?

In [50]:
class MaClasse:
    attribut_de_classe = "Je suis un attribut de classe"

    def __init__(self, nom):
        self.nom = nom

# Accès via la classe
print(MaClasse.attribut_de_classe)

In [51]:
# Accès via une instance
instance1 = MaClasse("Objet 1")
instance2 = MaClasse("Objet 2")
print(instance1.attribut_de_classe)
print(instance2.attribut_de_classe)

In [52]:
# Modification via la classe
MaClasse.attribut_de_classe = "J'ai été modifié via la classe"
print(instance1.attribut_de_classe)
print(instance2.attribut_de_classe)

In [53]:
# Modification via une instance (crée un attribut d'instance)
instance1.attribut_de_classe = "J'ai été modifié via l'instance 1"
print(instance1.attribut_de_classe) # Affiche l'attribut d'instance
print(instance2.attribut_de_classe) # Affiche l'attribut de classe

## Qu'est-ce qu'une dataclass

Le décorateur `@dataclass` génère automatiquement des méthodes spéciales (comme `__init__`, `__repr__`, `__eq__`) basées sur les *annotations de type* que vous avez fournies:

In [54]:
from dataclasses import dataclass

@dataclass
class MaDataclass:
    attribut_instance: str  # Ceci deviendra un paramètre de __init__ et un attribut d'instance
    attribut_classe_traditionnel = "Je suis un attribut de classe traditionnel" # Ceci reste un attribut de classe

# Création d'une instance
instance = MaDataclass(attribut_instance="Valeur de l'instance")

# Accès à l'attribut d'instance
print(instance.attribut_instance)

# Accès à l'attribut de classe traditionnel
print(MaDataclass.attribut_classe_traditionnel)
print(instance.attribut_classe_traditionnel) # On peut aussi y accéder via l'instance

# Essayer d'accéder à l'attribut de classe traditionnel via __init__ donnerait une erreur:
# instance_erreur = MaDataclass(attribut_classe_traditionnel="Essai") # Ceci provoquerait une erreur si non défini dans __init__

On peut aussi définir des attributs d'instances inititalisé, et des sans types.

In [55]:
from typing import Any
@dataclass
class MaDataclass:
    attribut_instance: str
    attribut_instance_initialisé: str = "Valeur par défaut"

    attribut_instance_sans_type:Any = None

    attribut_classe_traditionnel = "Je suis un attribut de classe traditionnel"

Comme pour les fonctions, les attributs initilisés doivent arriver en seconde position:

    @dataclass
    class MaDataclass:
        attribut_instance_initialisé: str = "Valeur par défaut"
        attribut_instance: str  
        
Ceci provoque une erreur.

### Rendre une Dataclass Hashable

Pour qu'une dataclass soit hashable, elle doit respecter deux conditions principales :

1.  **Tous les champs doivent être hashable :** Chaque attribut défini dans la dataclass doit être d'un type hashable. Les types built-in courants comme `int`, `float`, `str`, `bool`, et `tuple` sont hashable. Les types comme `list`, `dict`, et `set` ne le sont pas (sauf un `set` composé de hashable).

2.  **La dataclass doit être "frozen" :** Vous devez définir la dataclass avec le paramètre `frozen=True`. Cela rend les instances de la dataclass immuables, ce qui est une exigence pour être hashable. ité.

Lorsque `frozen=True`, Python génère une méthode `__hash__` pour la dataclass, ce qui la rend utilisable comme clé dans un dictionnaire

In [56]:
from dataclasses import dataclass
import sys

@dataclass(frozen=True) # frozen=True rend la dataclass immuable et hashable
class PointImmuable:
    x: int
    y: int
    description: str = "Un point dans l'espace" # Un champ avec valeur par défaut

# Création d'instances
point1 = PointImmuable(x=10, y=20)
point1bis = PointImmuable(x=10, y=20)

point2 = PointImmuable(x=10, y=20, description="Même point") # Même x et y, mais description différente
point3 = PointImmuable(x=30, y=40)

# Les instances de PointImmuable sont hashable
print(f"Hash de point1: {hash(point1)}")
print(f"Hash de point1bis: {hash(point1bis)}")
print(f"Hash de point2: {hash(point2)}") # Le hash dépend de tous les champs
print(f"Hash de point3: {hash(point3)}") # Le hash dépend de tous les champs

In [57]:
# Utilisation dans un set (qui nécessite des éléments hashable)
set_de_points = {point1,point1bis, point2, point3}
print(f"nombre de points différent: {len(set_de_points)}")

In [58]:
# Tenter de modifier une instance frozen lève une erreur
try:
    point1.x = 5
except Exception as e:
    print(f"\nErreur lors de la modification d'une instance frozen: {e}")

In [59]:
# Exemple de dataclass non hashable (car non frozen)
@dataclass
class PointModifiable:
    x: int
    y: int

point_mod = PointModifiable(x=1, y=1)

# Tenter de hasher une instance non frozen lève un TypeError par défaut si la classe ne définit pas __eq__ ou __hash__
# Si __eq__ est défini mais pas __hash__, l'instance est non hashable
try:
    hash(point_mod)
except TypeError as e:
     print(f"\nErreur lors du hachage d'une instance non frozen: {e}")

## Expliquez ceci

In [60]:
%reset -f
from dataclasses import dataclass

In [61]:
@dataclass
class Toto:
    a:int=1
    b:int=2
    c:int=3
    def __init__(self,d:int):
        self.d=d

toto1=Toto(4)
print(toto1)

In [62]:
toto2=Toto(5)
toto1==toto2

In [63]:
@dataclass
class Tata:
    a:int
    b:int
    c:int
    def __init__(self,a,b,c):
        self.a=a
        self.b=b
        self.c=c
tata1=Tata(1,2,3)
print(tata1)

In [64]:
print(toto1)

In [65]:
toto1==tata1

In [66]:
@dataclass(frozen=True)
class Bou:
    a:int=1
    b:int=2
    c:int=3
    def __init__(self,d:int):
        self.d=d
try:
    bou1=Bou(4)
except Exception as e:
    print(e)

In [67]:
@dataclass(frozen=True)
class Bou:
    a:int=1
    b:int=2
    c:int=3
    d:int=4
    def __init__(self,d:int):
        self.d=d
try:
    bou1=Bou(4)
except Exception as e:
    print(e)

On ne peut pas modifier les champs. Mais c'est pénible si on veut faire des calcules dans le constructeur. Heureusement il y a la `factory-design-pattern`

In [68]:
@dataclass(frozen=True)
class Bou:
    a:int=1
    b:int=2
    c:int=3

    @staticmethod
    def factory(d:int):
        return Bou(d,d//2,d//3)

bou1=Bou.factory(5000)
print(bou1)

C'est très commode. Cela permet même d'avoir plusieurs façon d'initialiser son objet

In [69]:
@dataclass(frozen=True)
class Bou:
    a:int=1
    b:int=2
    c:int=3

    @staticmethod
    def factory_from_d(d:int):
        a,b,c=d,d//2,d//3
        return Bou(a,b,c)

    @staticmethod
    def factory_from_ad(a:int,d:int):
        b=d//2
        c=d//3
        return Bou(a,b,c)


bou2=Bou.factory_from_ad(7,5000)
print(bou2)

## Les lib basées sur Dataclass

### Flax

Les modules que l'on crée avec `flax.linen` sont des dataclass.

In [70]:
import flax.linen as nn
from dataclasses import is_dataclass

# Définir un module simple pour l'inspection
class SimpleModule(nn.Module):
    num_features: int

    @nn.compact
    def __call__(self, x):
        x = nn.Dense(self.num_features)(x)
        return x

# Vérifier si SimpleModule est une dataclass
print(f"Est-ce que SimpleModule est une dataclass ? {is_dataclass(SimpleModule)}")

Ils ne sont pas frozen, cependant on ne peut pas modifier leur attribus sauf dans la méthode `setup`

### Equinox

In [71]:
!pip install -q equinox

Les modules que l'on crée avec equinox sont des dataclass frozen.

In [72]:
import equinox as eqx
from dataclasses import is_dataclass

# Définir un module simple pour l'inspection
class SimpleEquinoxModule(eqx.Module):
    weight: eqx.nn.Linear

    def __init__(self, in_features: int, out_features: int, *, key):
        self.weight = eqx.nn.Linear(in_features, out_features, key=key)

    def __call__(self, x):
        return self.weight(x)

# Vérifier si SimpleEquinoxModule est une dataclass
print(f"Est-ce que SimpleEquinoxModule est une dataclass ? {is_dataclass(SimpleEquinoxModule)}")

In [73]:
dataclass_params = SimpleEquinoxModule.__dataclass_params__
print(dataclass_params)