ETL مع Python : استخراج وتحويل وتحميل البيانات
half-circle
vector

ETL مع Python : استخراج وتحويل وتحميل البيانات

Highlights

تم تصميم هذا المشروع "استخراج وتحويل واعاده تحميل البيانات باستخدام لغه البرمجه بايثون" للأفراد المهتمين بتعلم أساسيات عمليات ETL (الاستخراج والتحويل والتحميل) باستخدام Python. في هذا المشروع الذي يستغرق ساعة واحدة- سوف تتعلم: 1. اهميه عمليه ETL وكيفيه إعداد بيئة عمل ETL وكيفيه اعداد مشروع ETL بالتفصيل 2. تنفيذ ETL لاستخراج البيانات من المصدر (ملف CSV) وإعادة صياغة البيانات المحملة باستخدام Pandas 3. تحميل البيانات في الوجهة النهائيه لها (قاعدة بيانات MySQL) لنفترض ان لدينا شركة توظيف الكتروني عندها مئات من الوظائف التي تتم اضافتها علي موقعهم الالكتروني بشكل يومي. فريق تحليل البيانات بالشركة يواجهون مشكله كبيره وهي اضطرارهم الي العمل لمدة ١٦ ساعة بمعدل يومين عمل في كل مره يحتاجون فيها لاستخراج تقرير عن عدد الوظايف المتاحة علي الموقع لكل مسمى وظيفي ومتوسط المرتبات لكل مسمى وظيفي علي حدي. بعد مراجعه مهام الفريق تبين ان اكثر وقت مبذول يكون في استخراج (E) البيانات من ملف CSV يحتوي علي الوظائف المدرجه بالموقع الالكتروني ثم معالجه هذه البيانات وتحويلها (T) واخيرا تحميلها (L) مجددا بقاعده بيانات MySQL لتكون جاهزه للعمل عليها واستخراج التقرير المطلوب. بعد مراجعه المختصين تبين ان هذه الخطوات تشكل عمليه ال ETL او ما يعرف باستخراج وتحويل وتحميل البيانات والتي يمكن تنفيذها بلغه برمجه مثل بايثون لتتم بعد ذللك بشكل تلقائي في دقائق معدوده وتوفر الجهد والوقت المبذول من فريق تحليل البيانات في هذه الشركه ليكون تركيزهم الاكبر علي تحليل البيانات واصدار التقارير. مهمتنا في هذا المشروع هو تنفيذ ETL يقوم بهذه المهمه في دقائق معدودة. خلال هذا المشروع ، ستكتسب المهارات الأساسية المتعلقة بعمليات ETL مثل استخراج البيانات من ملفات CSV باستخدام مكتبة Pandas ، وتحويل البيانات باستخدام مكتبه Pandas في دفتر Jupyter وتحميل البيانات المحولة إلى قاعدة بيانات MySQL. هذا المشروع فريد من نوعه لأنه يوفر تطبيقًا عمليًا للمفاهيم الأساسية التي يمكن تطبيقها في مختلف الصناعات مثل التمويل أو الرعاية الصحية أو التسويق. لتجتاز المشروع ، يجب أن يكون لديك فهم أساسي لبناء جملة Python مثل تعيين المتغيرات والدوال ودوال lambda واستيراد المكتبات واستدعاء الدوال ومعالجة النصوص والتعامل مع الاخطاء البرمجيه وهياكل البيانات مثل المجموعات والقوائم والقواميس . يجب أن يكون لديك فهم أساسي لقواعد البيانات و MySQL بما في ذلك إنشاء قواعد البيانات والجداول والمستخدمين. يُفضل أن يكون لديك معرفة بدوال Pandas مثل [pd.read_csv, drop_duplicates, reset_index, apply, drop, head, info, isnull, duplicated, reset_index, unique, replace, to_csv]. كما يفصل ان يكون لديك معرفه بكيفيه تنفيذ السطور البرمجيه في Jupyter Notebook. من خلال إكمال هذا المشروع، ستكتسب خبرة قيمة في العمل باستخدام أدوات مثل Python و MySQL و Jupyter والتي يمكن أن تساعدك على العمل بكفاءة أكبر خلال حياتك المهنية. على سبيل المثال ، إذا كنت تعمل في مؤسسة تحتاج إلى معالجة كميات كبيرة من بيانات المعاملات المالية الأولية بشكل منتظم ، فيمكنك استخدام هذه المهارات لأتمتة العملية، مما يوفر الوقت والمال والجهد مع زيادة الدقة.

About the Course Provider

Coursera provides access to more than 3000+ courses across a wide variety of subjects in parntership with different universities and organizations.

Course by

  • self
    Self paced
  • dueration
    Duration 3 hours
  • domain
    Domain IT & Computer Science
  • subs
    Monthly Subscription Option not available
  • fee
    Buy Now Free
  • language
    Language Arabic