Module Train (Entraînement)

Script d’entraînement et d’enregistrement des modèles dans le Model Registry.

src.train.train.pipeline_mlops(champion_model: str = 'logistic_regression', run_challenger: bool = True)

Orchestrateur principal du cycle de vie du modèle (ML LifeCycle).

Ce Flow Prefect exécute séquentiellement : 1. La préparation de l’infrastructure de stockage (MinIO). 2. L’entraînement d’un modèle “Champion” (LogisticRegression) mis en production. 3. L’entraînement d’un modèle “Challenger” (RandomForest) pour comparaison.

src.train.train.prepare_minio()

Initialise le stockage S3 local (MinIO).

Vérifie l’existence du bucket “mlflow-models” et le crée si nécessaire. Cette tâche est résiliente (3 tentatives).

src.train.train.train_and_register(model_choice: str = 'logistic_regression', assign_production_alias: bool = True)

Entraîne un modèle et l’enregistre dans le registre MLflow.

Paramètres:
  • model_choice (str) – Le type de modèle à entraîner (« logistic_regression » ou « random_forest »).

  • assign_production_alias (bool) – Si True, définit ce modèle comme la version de production.

Renvoie:

None