سأقوم بتنظيف وتنظيم ملف CSV أو Excel واحد باستخدام Python، مع معالجة البيانات غير الصحيحة، حذف التكرار، تنسيق الأعمدة، وترتيب البيانات ليكون الملف جاهزًا للاستخدام أو التحليل، بحد أقصى 10 أعمدة و 5000 خلية.
*تنظيف البيانات من القيم المفقودة أو غير الصحيحة
*حذف الصفوف المكررة
*تنسيق وترتيب الأعمدة
*فلترة البيانات حسب شروط يحددها العميل
*تجهيز البيانات لتكون مناسبة لمشاريع Machine Learning، ويشمل:
- Encoding للبيانات النصية
- Normalization / Scaling
- تقسيم البيانات إلى Training / Testing
الأدوات المستخدمة:
* Python
* pandas
* numpy
* openpyxl
*تنفيذ العمل باستخدام Python لضمان الدقة
*تسليم ملف منظم وجاهز للاستخدام
*الالتزام بالوقت المحدد
*إمكانية التعديل حسب طلب العميل
*الحفاظ على سرية البيانات
تنظيف ملف اكبر 20 عموده و 10000 خلية كحد اقصى
5.00
|
|
تقسيم البيانات (تدريب و اختبار) وتجهيزها لتدريب machine learning models
10.00
|
|
تسليم المنتج خلال 6 ساعات كحد اقصى
10.00
|
تنظيف ملف اكبر 20 عموده و 10000 خلية كحد اقصى
5.00
|
|
تقسيم البيانات (تدريب و اختبار) وتجهيزها لتدريب machine learning models
10.00
|
|
تسليم المنتج خلال 6 ساعات كحد اقصى
10.00
|