الهدف الأساسي
- كان الهدف من المشروع هو التنبؤ بالمستخدمين الذين من المحتمل أن يتوقفوا عن استخدام المنصة، وتوفير رؤى عملية حول أسباب هذا التسرب، مع التركيز على توصيات تحسين الأداء.

1. إعداد البيانات (Data Preparation)
- قمت باستيراد البيانات من ملف خارجي وتحليلها مبدئيًا لتحديد الأعمدة الأساسية مثل وقت النشاط، نوع النشاط والمعلومات المرتبطة بالمنتجات.
- التعامل مع القيم المفقودة والبيانات المكررة لضمان جودة البيانات.

2. هندسة المزايا (Feature Engineering)
- حساب مقاييس رئيسية لكل مستخدم مثل عدد العروض، عدد الإضافات للسلة، وعدد عمليات الشراء.
- تطوير نسب مثل معدل التحويل من العرض إلى السلة ومن السلة إلى الشراء لتحديد نقاط ضعف تجربة المستخدم.
- تطبيع البيانات (Data Normalization) لتقليل تعقيد التحليل وتحسين الأداء.

3. تحليل السلوكيات (Behavior Analysis)
- تحليل توزيع الأنشطة (العرض، الإضافة للسلة، والشراء) لتحديد فئات العملاء (مثل العملاء المخلصين والعملاء ذوي النشاط المنخفض).
- إنشاء رسوم بيانية تُظهر العلاقة بين الأنشطة المختلفة والنسب المشتقة، مما يساعد في فهم ديناميكيات التفاعل.

4. إعداد البيانات لبناء نموذج التعلم الآلي (Prepare the data for modeling)
- تعريف مفهوم "churn" بناءً على النشاط الأخير للمستخدم، وتحديد ما إذا كان المستخدم قد توقف عن التفاعل لمدة تتجاوز 30 يومًا.
- ترميز(Encode) البيانات الفئوية باستخدام تقنيات مثل التشفير الترددي (Frequency Encoding).
- استخدام التقنيات الإحصائية مثل StandardScaler لتوحيد مقياس الأعمدة الرقمية.

5. التدريب على النموذج (Train the Model)
- استخدام XGBoost لتطوير نموذج التنبؤ بتسرب العملاء.
- تقسيم البيانات إلى مجموعات تدريب واختبار لضمان موثوقية التقييم.
- تحليل أداء النموذج باستخدام تقارير التقييم مثل الدقة والقدرة على التذكير.

التحديات
- لاحظت وجود مشكلة في عدم توازن البيانات (Bias) حيث كانت الفئات مائلة نحو تسرب المستخدمين.

النتائج والتوصيات
- المشروع نجح في تقديم رؤى قيمة حول سلوك المستخدمين وأنماط التفاعل.
- يمكن تحسين النموذج مستقبلًا من خلال تقنيات مثل Oversampling أو SMOTE لموازنة البيانات، وتحسين الأداء العام.

يمكنك الإطلاع على المشروع من هنا: https://mostaql.com/portfolio/2594448-e-commerce-churn-analysis-retain-grow
عن الموضوع

التعليقات (3)

منذ 8 أيام و23 ساعة
بالتوفيق لك أ/ محمود
منذ 8 أيام و12 ساعة
بالتوفيق دائما
و ممكن نضيف تحليل الوقت و تأثير المواسم
منذ 8 أيام و12 ساعة
شكرًا لتعليقك أخي م. محمد. كلامك دقيق، وبالفعل قمت بأخذ عامل الوقت بعين الاعتبار لتحليل أي نمط محتمل لهذا التحول، لكن لم أصل إلى نتائج مفيدة. كذلك حللت تأثير المواسم على معدل تحول العملاء، ولم تظهر أي أنماط ذات صلة.

العميل لم يكن هدفه تحليل هذه العوامل تحديدًا، بل كان تركيزه الأساسي على فهم السبب الرئيسي للتحول الكبير لعملائه وكيفية معالجته، خاصة أنه أثر بشكل واضح على توازن البيانات. لذلك، ركزت جهودي على تحليل نمط تحول العملاء الأساسي من البيانات المتوفرة.

في البداية، اشتبهت بأن المواسم قد تكون السبب، لكن التحليل أظهر أن معدل التحول شبه ثابت طوال العام، مما يشير إلى أن المشكلة لا ترتبط بالمواسم، بل قد تكون لها علاقة بعدم ارتباط العملاء بالمنصة بشكل عام وعلى هذا قثد قدمت له الحلول.

أضف تعليق

سجّل دخول لتتمكن من إضافة تعليق على هذا الموضوع.

عن الموضوع