Module Train (Entraînement)¶
Script d’entraînement et d’enregistrement des modèles dans le Model Registry.
- src.train.train.pipeline_mlops(champion_model: str = 'logistic_regression', run_challenger: bool = True)¶
Orchestrateur principal du cycle de vie du modèle (ML LifeCycle).
Ce Flow Prefect exécute séquentiellement : 1. La préparation de l’infrastructure de stockage (MinIO). 2. L’entraînement d’un modèle “Champion” (LogisticRegression) mis en production. 3. L’entraînement d’un modèle “Challenger” (RandomForest) pour comparaison.
- src.train.train.prepare_minio()¶
Initialise le stockage S3 local (MinIO).
Vérifie l’existence du bucket “mlflow-models” et le crée si nécessaire. Cette tâche est résiliente (3 tentatives).
- src.train.train.train_and_register(model_choice: str = 'logistic_regression', assign_production_alias: bool = True)¶
Entraîne un modèle et l’enregistre dans le registre MLflow.
- Paramètres:
model_choice (str) – Le type de modèle à entraîner (« logistic_regression » ou « random_forest »).
assign_production_alias (bool) – Si True, définit ce modèle comme la version de production.
- Renvoie:
None