fbpx

لتصبح عالم بيانات إليك خريطة لتعلم الرياضيات

لتصبح عالم بيانات إليك خريطة لتعلم الرياضيات

كنت أظن في البداية لكي يصبح الشخص عالم بيانات، فإنه لا يحتاج لتعلم الرياضيات، ولا يتطلب الكثير من الرياضيات يكفي أن أكون ملم ببعض المؤشرات الإحصائية، مثل مؤشرات النزعة المركزية، وبعض المعادلات الحسابية البسيطة، ولكن مع الوقت أكتشفت أنه لابد من الرياضيات، لابد من الدراسة، لاكتساب الفهم والتوصل إلى استنتاجات دقيقة، لأن تخصص علم البيانات ليس قائمًا على تعلم لغات برمجية وحسب، بل قائم بالأساس على فهم عميق ومعرفة متقدمة بالرياضيات.

ولكن السؤال الذي كان يروادني من أين أبداً، ما هي الخطوات الواجب علي اتباعها، بعد حيرة وتساؤلات كثيرة، أكتشف أنه لا يوجد مخطط معروف. أو طريقة معينة اتبعها، لأن علم البيانات بطبيعته غير مرتبط بموضوع محدد، ولكن هناك بعض العلوم الأساسية التي لا يوجد خلاف عليها. في هذه التدوينة سوف اشارككم رحلتي مع الرياضيات خلال عام، وأوضح لكم المواضيع الواجب دراستها أو إتقانها.

أولاً: الإحصاء سلاح كل عالم بيانات

أعتقد أن أهم مدخل لتحليل البيانات أو علوم البيانات، هو الإحصاء، لابد أن تكون ملماً بالإحصاء والاحتمالات، يمكن للإحصائيات أن تلخص كميات كبيرة من المعلومات، وتُمكنك من اتخاذ قرارات بالاعتماد على بيانات، وتساعدك على تحديد الأنماط، مثل: تحديد الشركات التي تستثمر فيها أموالك بالاعتماد تحليل أسواق المال. فهم العلاقة بين انتشار البطالة والجريمة في مراكز الجمهورية، أو توقع نتيجة الإنتخابات المقبلة، اعلم أنه يكمن أن تخدعك البيانات ولكن مؤشرات لابد منها، كما يقول الصحفي الأمريكي Charles Wheelan في كتابة Naked Statistics: “من السهل الكذب مع الإحصائيات، لكن من الصعب قول الحقيقة بدونها.”

والسؤال هنا ما هي المواضيع الإحصائية التي ينبغي التركيز عليها، إجمالاً عليك بدراسة الإحصاء الوصفي والاحتمالات ثم الاحصاء الاستدلالي واختبار الفروض.

تفصيلاً لابد أن تتعلم:

  • ما هي البيانات وما هي البيانات الوصفية والكمية والبيانات النوعية والإسمية إلخ.
  • التحليل الوصفي للبيانات.
  • معرفة بعض المؤشرات الإحصائية مثل المتوسط والوسيط والمنوال وهي مقايس تساعدك في فهم تمركز البيانات وطبيعة توزيعها،  ذلك بالإضافة إلى مقاييس التشتت مثل الإنحراف، التباين (variance)، التغاير (covariance)، الارتباط (correlation) وهي مقاييس تساعدك في فهم مدة تجانس البيانات وتجعلك قادر على تحديد القيم المتطرفة التي تبعد بنسبة كبيرة عن أغلب البيانات.
  • أساسيات الاحتمالات: الأفكار الأساسية، التوقع، تفاضل وتكامل الاحتمالات، نظرية بايز (Bayes)، الاحتمالات الشرطية.
  • دوال توزيع الاحتمالات: موحد، طبيعي، ثنائي المتغيرات، مربع كأي، توزيع-t، نظرية الحد المركزي.
  • العينات، القياس، الخطأ، توليد الأرقام العشوائي.
  • اختبار الفرضيات، اختبار أ/ب، فترات الثقة، قيم P.
  • اختبار-t و تحليل التباين الأحادي Anova، وتحليل ONE WAY MANOVA – “تحليل التباين متعدد المتغيرات “أحادي الاتجاه”، تحليل التغاير الأحادي ANCOVA، و ONE WAY MANCOVA – تحليل التغاير متعدد المتغيرات “أحادي الاتجاه”.

ثانياً: الجبر الخطي Linear Algebra

الجبر الخطي أحد أهم فروع الرياضيات التي تمثل الظواهر المختلفة من حولنا بشكلٍ عددي قابل للحساب والحل عن طريق مساعدتنا على تحويل المتغيرات إلى رموزٍ ومعادلاتٍ قابلة للحساب.

تعلم الآلة يعتمد بشكل أساسي على الجبر الخطي  كلغة أساسية لوصف قيم وشكل البيانات وكذلك وصف الحلول بالإعتماد على نفس الأسس.

حتى تفهم العلاقة بشكل جيد نموذج التعلم الآلي  يخضع في البداية لمرحلة تعلم بحيث ييستطيع فهم كيفية التوصل إلى حلالمشكلات المحددة  ومن ثم تحسين الآداء عن طريق تكرار عمليات التعلم، ومن ثم التنبؤ بقيم الثوابت التي تؤدي لتنفيذ المهمة المطلوبة بأعلى دقة وكل ذلك يتم من خلال الجبر الخطي.

ولكن السؤال هنا، ما هي المواضيع التي يجب أن تعلمها في الجبر الخطي لفهم كيف تعمل معظم خوارزميات تعلم الآلة؟

  • الخواص الأساسية للمصفوفات والمتجهات – الضرب العددي، التحول الخطي، المنقول (transpose)، الرتبة (rank)، المحدد (determinant)، المرافق (conjugate).
  • المصفوفات الخاصة – المصفوفة المربعة، مصفوفة الوحدة، المصفوفة المثلثة، المصفوفات المتناثرة والكثيفة، المتجهات الأحادية، المصفوفات المتماثلة، المصفوفات الهرماتية.
  • الضرب الداخلي و الخارجي، قانون ضرب المصفوفات، معكوس المصفوفة.
  • مفهوم تحليل المصفوفات الى عوامل باستخدام التفكيك العلوي والسفلي، الإلغاء الجاوسي وجاوس-جوردان، حل نظام معادلات خطي Ax = b
  • قيم آيقن، متجهات آيقن، تفكيك القيم الأحادية، استقطار المصفوفة.
  • فضاء المتجهات، قاعدة المصفوفات، مدى المصفوفات، تعامد المصفوفات، التعامد الطبيعي، طريقة المربعات الصغرى.

ثالثًا: الرياضيات المتقطعة Discrete Mathematics

الرياضيات المتقطعة بسيطة لحد أنها تصلح للدراسة في مراحل دراسية مبكرة ربما للأطفال في المرحلة الأساسية، ففيها نظرية الأرقام ونظريقة النفي والاثباتات المنطقية وجدول الحقيقة ونظرية المجموعات والعلاقات بينها، تلك الأمرو التي ستتعلمها وتحلها بالورقة والقلم هي المحرك الأساسي وراء الكثير من عمل الأكواد البرمجية. إليك قائمة بأبرز الموضوعات التي عليك تعلمها في هذا التخصص:

  • المنطق
  • نظرية المجموعات
  • نظرية الرسم البياني
  • نظرية الأعداد
  • نظائر منفصلة للرياضيات المستمرة
  • الهندسة المنفصلة
  • النمذجة المنفصلة

رابعًا: التفاضل والتكامل 

سواء أحببت التفاضل والتكامل في الثانوية العامة أم لا، فلابد من تعلمه الآن حتى تستطيع فهم نمذجة البيانات: التي تعتبر الاستخدام الأهم للتفاضل والتكامل من أسس وحدود ولوغاريتمات والاقترنات المُثلثية إلخ.

لا ينكر أحد حقيقة أن التفاضل والتكامل أفضل من الجبر الخطي من حيث الحساب المتفوق. حساب التفاضل والتكامل أسهل بكثير من مجرد التكامل والتفاضل والحدود ، بالإضافة إلى أنها تعمل البيانات الأساسية المطلوبة للأغراض ، مثل الموترات والمتجهات.

ولكن ما هي المواضيع الواجب علينا دراستها؟

  • دالة المتغير الوحيد، النهاية (Limit)، الاستمرارية و التفاضل.
  • نظرية القيمة المتوسطة، الصيغة غير المعينة وقاعدة لوبيتال.
  • النقاط العظمى والصغرى.
  • قاعدة الضرب وقاعدة السلسلة.
  • متسلسلة تايلور، مفاهيم جمع و تكامل المتسلسلات اللانهائية.
  • نظرية القيمة الأساسية و نظرية القيمة المتوسطة لحساب التكامل، التكامل المحدد والتكامل غير المحدد.
  • دالتي غاما و بيتا.
  • دوال القيم المتعددة، النهاية، الاستمرارية، المشتقات الجزئية.
  • أساسيات المعادلة التفاضلية العادية و الجزئية (ليس متقدماً جداً).

في النهاية، تذكر أن عالم البيانات هو شخص ملم بالعديد من المجالات والتخصصات التي تساعده في مهمته في فهم البيانات ومعالجتها، الرياضيات وأحدة من أبرز هذه التخصصات، كل ما هو بالإعلى هو مجرد أساسيات ضرورية لكن قد تحتاج للتعمق بها إذا كنت سوف تتخصص في مجالات متقدمة في تعلم الآلة والتعلم العميق.

مقالات ذات صلة

التعليقات