wjboost.fr

Site internet

Analyse des ventes e-commerce B2B Segmentation client.

Ce projet a été entièrement réalisé avec Python en mobilisant plusieurs bibliothèques spécialisées. Pandas a servi à la manipulation et au nettoyage des données . Matplotlib et Seaborn ont permis la visualisation des tendances temporelles, géographiques et comportementales. Statsmodels a été utilisé pour les analyses statistiques inférentielles . Scikit-learn a alimenté l’algorithme de segmentation K-Means pour le clustering client.

Introduction


Dans un contexte de développement accéléré du commerce électronique, l’analyse des données transactionnelles constitue un levier stratégique majeur. Ce projet porte sur l’analyse du dataset Online Retail (UCI Machine Learning Repository), recensant l’ensemble des transactions d’un commerce en ligne B2B basé au Royaume-Uni sur la période décembre 2010 – décembre 2011. L’objectif est triple : produire des KPIs de performance, identifier des patterns temporels et géographiques, et segmenter la base clients pour formuler des recommandations marketing actionnables.

Notre mission

Nettoyage et préparation de 541 909 transactions brutes avec Python : suppression des 135 080 lignes sans identifiant client, élimination des 8 872 transactions annulées et création du KPI TotalPrice (Quantity × UnitPrice). Analyse exploratoire des ventes par géographie, mois, jour et heure. Validation statistique par test ANOVA et modèle de régression linéaire multiple (R²=0.83). Segmentation client par algorithme K-Means via modèle RFM (Récence, Fréquence, Montant) en 4 clusters distincts pour concevoir des stratégies CRM ciblées.

Les résultats

Après nettoyage, 392 732 transactions exploitables ont été analysées. Le chiffre d’affaires total s’élève à 8,89M£ avec un panier moyen de 479,46£ et 18 536 commandes sur 4 339 clients uniques. L’analyse géographique révèle une hyper-dépendance au marché britannique (7,28M£). Le pic de CA se situe en novembre (1,15M£) avec le jeudi comme jour le plus actif (1,97M£). Le test ANOVA confirme l’impact significatif du pays sur le panier moyen (p-value < 0.001). La segmentation K-Means identifie 4 clusters : 9 clients VIP (161 868£ de panier moyen), 47 Étoiles très engagés, 3 203 Standards et 1 080 Inactifs à réactiver via campagne CRM ciblée.

Vous êtes à un clic de booster votre présence en ligne. 👇

Appel gratuit sans engagement