دليلك الشامل لتصبح عالم بيانات Data Scientist

11 22٬347

(آخر تحديث 14/11/2017)

من خلال محادثتي مع كثير من المهتمين بمجال ال Data Science ,لاحظت عدم وجود خريطة طريق تساعد المبتدئين (وحتى المحترفين) لتطوير مهاراتهم والتأكد من أنهم على الطريق الصحيح

في البداية لنبدأ بتحديد مستواك…… أين تقع مهاراتك على سلم التعلم ؟

 

ماذا يجب أن تتعلم في كل مستوى (بشكل عام)؟

المبتدأ:

  1. مبادئ رياضية وإحصائية (الجزء الأول)
  2. تعلم أداة لل Data Science , أما R أو Python
  3. تعلم مبادئ خوارزميات ال Machine Learning (الجزء الأول)

المتوسط:

  1. تعلم مبادئ خوارزميات ال Machine Learning (الجزء الثاني)
  2. بناء مشروعين على الأقل

المتقدم:

  1. تعلم مبادئ ال Deep Learning وبناء مشروع واحد على الأقل
  2. تعلم بناء عرض مميز للداتا Data Visualization
  3. استخدام أحد منتجات ال Cloud مثل AWS \ Azure \ Google ML

المتطور:

أصبحت في مستوى تستطيع تحديد ما ينقصك من مهارات  🙂

الشرح التفصيلي لكل مستوى :

المبتدأ:

مبادئ رياضية واحصائية (الجزء الأول):

الاحصاءات التوصيفية Descriptive Statistics :
  • كورس  Descriptive Statistics من  Udacity (مهم جدا) – الرابط
  • كتاب في الاحصاء أنصح بقرائته للتعرف على مبادئ الاحصاء ( اختياري) – الرابط

 

الاحتمالات Probability :
  • مقدمة في علم الاحتمالات من Edx – الرابط
  • كتاب Introduction to probability من جامعة ستانفورد –  الرابط

 

الإحصاءات الاستنتاجية Inferential Statistics
  • كورس  Intro to Inferential Statistics من  Udacity هذا الكورس ممتاز جدا و مهم جدا – الرابط
  • كتاب Online Stats Book , هذا الكتاب ستحتاجه دائما … احفظ اللينك في مكان قريب – الرابط

 

الجبر الخطي Linear Algebra :
  • كورس الجبر من أكاديمية خان … هو كورس مختصر وممتاز ويحتوي على كل شي ستحتاجه في الData Science – الرابط
  • كتاب Linear Algebra الذي يستخدم من قبل طلاب جامعة ستانفورد , أنصح بقراءته  – الرابط (يجب شراؤه)
  • كتاب The Manga guide to Linear Algebra يحتوي على مجموعة جيدة من الأمثلة , أنصح بقراءته ( اختياري)- الرابط (يجب شراؤه)

 

تعلم أداة لل Data Science , أما R أو Python:

R

  • كورس Interactive Intro to R Programming Language من DataCamp  برنامج ممتاز , سوف يعلمك كل ما تحتاجه عن R – الرابط
  • كتاب R for Data Science هو أفضل مرجع لك للغة R … سوف تحتاج الرجوع إليه مرارا- الرابط

Python

  • كورس Intro to Python for Data Science من DataCamp  يدربك على ما تحتاجه في ال Python لتحترف ال Data Science – الرابط
  • كتاب Python for Data Analysis يحوي كل ما تحتاجه للقيام بالمهام عالم البيانات الكتاب (manipulating, processing cleaning , visualizing) – الرابط  (يجب شراؤه)

 

مبادئ خوارزميات ال Machine Learning (الجزء الأول):

في المرحلة الأولى يجب أن تنتقن الخوارزميات التالية :

  • Linear Regression
  • Logistic Regression
  • Decision Trees
  • KNN (K- Nearest Neighbours)
  • K-Means
  • Naïve Bayes
  • Dimensionality Reduction

 

كورس Machine Learning من Coursera هو من أفضل الكورسات الموجودة على الانترنت – الرابط

هناك كورس آخر أنا شخصيا أحبه هو كورس Machine Learning Engineer Nano Degree من Udacity  – الرابط

كورس Machine Learning A-Z™ من Udemy  برنامج ممتاز أيضا … الأمثلة المطروحة  مقدمة بلغتي R\Python – الرابط

كتاب Introduction to Statistical Learning  أهم كتاب يجب قراءته في هذا المجال – الرابط

 

المتوسط:

مبادئ خوارزميات ال Machine Learning (الجزء الثاني)

  • Random Forests
  • Dimensionality Reduction Techniques
  • Support Vector Machines
  • Gradient Boosting Machines
  • XGBOOST

الكورسات المذكورة في الفقرة السابقة تشرح كل هذه الخوارزميات بشكل جيد

بالاضافة إليهم هناك كورس Data Science A-Z™ من Udemy يقدم مشاريع متعددة بالاضافة إلى مقدمة في تقديم البيانات Data Visualization باستخدام Tableau – الرابط

بناء مشروعين على الأقل:

بامكانك اختيار مشروعين على الأقل من المشاريع المذكورة في موقعنا لتضع ما تعلمته على المحك – الرابط

 

المتقدم:

تعلم مبادئ ال Deep Learning وبناء مشروع واحد على الأقل:

  • كورس Deep Learning Specialization من Coursera سوف يعطيك فكرة جيدة عن كل أساسيات التعلم العميق النظرية – الرابط
  • كورس Deep Learning من Udacity برنامج آخر يمكنك أن تعتمد عليه لتطوير معرفتك عن التعلم العميق – الرابط
  • كورس Deep Learning A-Z™ من Udemy برنامج متميز أيضا للتعرف على التعلم العميق باستخدام Python – الرابط
  • أذا كنت من محبي القراءة هناك كتابين أنصح بقراءتهما,
  • كتاب Deep Learning من جامعة MIT – الرابط
  • كتاب Stanford Deep Learning tutorial من جامعة Stanford – الرابط

 

سنتطرق لموضوع التعلم العميق بتفصيل أكثر في الأيام القادمة

 

تعلم بناء عرض مميز للداتا Data Visualization:

  • كورس Data Visualization and d3.js برنامج ممتاز من Udacity لتعلم مبادئ تقديم البيانات – الرابط
  • كتاب Interactive Data Visualization for the Web هو مصدر آخر جيد لتعلم تقنيات ال Visualization – الرابط (يجب شراؤه)

سنتكلم عن أدوات أخرى لل Data Visualization بمقال آخر

 

تعلم تقنيات البيانات الكبيرة (Big Data):

كورس Introduction to Big Data من Coursera من أفضل الكورسات الموجودة حاليا – الرابط

إذا كنت تريد تطوير مهاراتك بتقنية ال Apache Spark … فكورس Big Data analysis with Apache Spark  من Edx هو ما تحتاجه – الرابط

 

استخدام أحد منتجات ال Cloud مثل AWS \ Azure \ Google ML :

 

للاسف هناك بعض الكتب يجب شراؤها , لم أجد لها رابط مجاني للتحميل ,

أتمنى أن تجد هذه الدليل مفيد وواضح , حاولت جاهدا أن أضع معظم المصادر المفيدة فيه , واختصر قدر الإمكان لكي لا يكون مملا , كل ما عليك أن تفعله هو أن تبدأ بتخصيص ساعتين من وقتك على الأقل يوميا ,لتبدأ رحلتك في ال Data Science ,

إذا كنت تظن أن هنالك شئ مهم غير مذكور هنا , أو كان لديك أي سؤال أو استفسار أرجو أن تكتبه في تعليق وسأرد على جميع التعليقات بأسرع وقت ممكن,

إذا كان لديك خطة لدراسة ال Data Science مختلفة عن ما ذكر أعلاه , نرجو التواصل معنا و مشاركتها ليستفيد أصدقاؤك و تترك بصمة في مجتمع الذكاء الصناعي العربي  .

 

تحياتي,

Comments
Loading...