fbpx

مراجعة لكتاب Confident Data Skills

Confident Data Skills

قد يبدو تعلم كيفية التعامل مع البيانات أمرًا مخيفًا أو صعبًا، ولكن بعد قراءة هذا الكتاب، ستتمكن من إتقان أساسيات التعامل مع البيانات، وزيادة قدراتك المهنية. يأخذك مؤلف كتاب Confident Data Skills في رحلة لتعلم خطوات التعامل مع البيانات من استخراج وجمع البيانات، وإعدادها، ومعالجتها وتحويلها، والنمذجة، وتصميم البيانات ثم عرضها.

فإذا كنت ترغب في التعرف على مجال علوم البيانات، أو نقل حياتك المهنية كعالم بيانات، أو يتعين عليك العمل جنبًا إلى جنب مع علماء البيانات أو بغض النظر عن البيئة التي ستكون فيها، يعطيك الكتاب تصورًا ممتازًا لجميع أنواع المهام التي يقوم بها عالم البيانات. حتى إذا انتقلت إلى بيئة عمل أخرى، فقد تصبح الأشياء التي تتعلمها هنا مفيدة في تلك المواقف.

الهدف الرئيسي من الكتاب هو تعليمك ما يفعله عالم البيانات. وهو القيام بالعديد من أنواع المهام المختلفة. ستساعدك مجموعة أدوات عالم البيانات المتوفرة في الكتاب في إتقانها جميعًا. بحلول نهاية الكتاب، يأمل المؤلف أن تكون على دراية بجميع الأساسيات التي يقوم بها علم البيانات .

لم يتم تصميم الفصول الأولى من الكتاب وفقًا لما يفعله عالم البيانات، ولكنها توضح سبب تحول علم البيانات إلى مجال ناشئ ومهم في اقتصاد العالم. على الرغم من أنه يبدو وكأنه قسم يجب عليك تخطيه، إلا أنني أقترح ألا تفعل ذلك. فنحن نعيش في أوقات يتم فيها التعامل مع علوم البيانات من قبل العديد من الناس على أنها موضة. يبدو الأمر كما لو أننا نعيش مرة أخرى في العصور المبكرة حيث تم اختراع أجهزة الكمبيوتر للتو حيث تكون تطبيقاتها العملية للشركات الصغيرة صغيرة، ولكن من المستحيل تحمل تكلفتها. لكن الزمن يتغير. الآن وجب جمع البيانات واستخدام البيانات بشكل أكثر فاعلية للوصول إلى النتيجة النهائية لعملك، مثل تحسين تجربة العملاء للحصول على معدلات احتفاظ أعلى أو إيجاد أنماط داخل عملك يمكن تحسينها من أجل تقليل التكاليف وتوفير أسعار أرخص لعملائك، لتحقيق الميزة التنافسية. 

Confident Data Skills

يحتوي الكتاب على أكثر من دراسة حالة توضح كيف استخدمت الشركات الكبرى علم البيانات ويشير إلى النقاط البارزة في طريقة استخدام هذه الشركات للبيانات في مؤسساتهم مقارنة بالشركات التي لم تبدأ بعد. Netflix و Amazon و Uber هي شركات بدأت من لا شيء وتوسعت في مجالات الأفلام والتجارة الإلكترونية والنقل في غضون بضع سنوات كانت هذه الشركات قد توسعت وغزت الأسواق مع وجود دليل قوي على كيفية تجاوز هذه الشركات حصة السوق من خلال إجراء خطوات مٌعتمدة  على البيانات التي تم جمعها.بعد أن ينتهي الكتاب من تقديمه للموضوع، فإنه ينتقل في كل خطوة من مجموعة أدوات علوم البيانات. وتتكون مما يلي:

أ. تحديد السؤال:

يعلمك تحسين مهاراتك الشخصية مع الآخرين، وكذلك سد الثغرات من الوصول إلى وجهتك. تكمن المشكلة في هذه الأيام في أن متطلبات العمل مجزأة للغاية بحيث يتعين عليك التواصل مع الكثير لفهم المشكلة بشكل أكثر وضوحًا. نأمل ، يومًا ما ، أن يتم تنظيم جميع المعلومات بشكل أفضل عبر الإنترنت بحيث يكون الجميع على نفس الصفحة. ولكن نظرًا لأن الواقع بالنسبة لمعظم المنظمات ليس كذلك ، عليك أن تبذل الجهد في أن تكون حولهم حتى تتمكن من أن تكون أُذنًا لمشاكلهم. كلما كان الشخص أقل تقنيًا أو أقل صلة بمعرفة كيفية عمل الشركة، كلما كان عليك ملء الفجوات في الوجهة التي يريد الوصول إليها. لهذا السبب، عليك أن تتواصل معهم عدة مرات حتى يتمكنوا من تحديد السؤال الصحيح الذي يحتاجون إليه للتعامل مع مشكلتهم. أخيرًا وليس آخرًا ، عليك إعطاء الأولوية للمشاكل التي تلقيتها في مؤسستك لتحقيق التأثير الأكثر إيجابية على الأعمال. 

هناك سببان لتحديد المشكلة:

1. معرفة بعض الأشياء داخل المنظمة ( كيف تعمل ، ما هي الأهداف التي حددتها وما هى أولوياتهم) والتي لا يمكنك العثور عليها بمفردك في البيانات.

 2. أن تثق بنفسك من خلال معرفة ما تفعله وكيف يمكنك مساعدتهم، بحيث يكون لديك القليل من السياسة معهم في المستقبل. في كلتا الحالتين ، تعلمنا أن جميع حلول الأعمال يجب أن تبدأ من منظور من أعلى إلى أسفل حتى لا ننحرف في مسار لا يتناسب مع ثقافة العمل. عليك تحديد أولويات المشاكل التي تلقيتها في مؤسستك لتحقيق التأثير الأكثر إيجابية على الأعمال. 

ب. إعداد البيانات:

للدخول في الجزء التقني من تلوث يديك بالبيانات. تتراوح الأشياء التي تتعلمها هنا من تعلم الأنواع المختلفة من الملفات التي ستعمل معها إلى إزالة سجلات البيانات واستبدالها ببيانات صحيحة بطريقة لا تؤدي إلى تشويه النموذج الذي ستستخدمه لاحقًا. على الرغم من أن هذا يبدو وكأنه طحن، إلا أنه مهم جدًا لمعرفة تنظيف البيانات بشكل صحيح، وإلا فإن بقية جهودك (تحليل البيانات ، وتمثيلها بصرياً ، والعروض التقديمية) يمكن أن تصل في النهاية إلى استنتاجات خاطئة.

ج- تحليل البيانات:

بتخصيص فصلين طويلين من الكتاب، يشرح المؤلف بالتفصيل كل طريقة . ليس ذلك فحسب ، فهو يصف حالات الاستخدام التي غالبًا ما تُستخدم كل خوارزمية داخل الشركة. إنه مثل وجود أستاذ لطيف للغاية يبسط لك مفهوم لم تسمعه من قبل. إنه يقوم بعمل جيد للغاية في تقديم هذه المفاهيم في الكتاب.

يقسم الكتاب تحليل البيانات إلى ثلاثة مواضيع، من الأسهل إلى الأصعب: المشاكل التي لدينا بيانات عنها والفئات معطاة بالفعل (التصنيف)، المشاكل التي لدينا بيانات عنها ولا نعرف فئاتها (المجموعات) ، المشكلات التي لا نجمع عنها بيانات كافية (التعلم المعزز Reinforcement Learning). بالنسبة للتصنيف ، فإنه يناقش أشجار القرار Decision Trees ، والغابات العشوائية Random Forest ، وأقرب الجيران K-nearest neighbors ، و Naive Bayes، والانحدارات اللوجستية Logistic regression. وبالنسبة للمجموعات، فإنه يناقش K-mean  العنقودية والتكتل الهرمي- Hierarchical clustering. وبالنسبة  للتعلم المعزز- Reinforcement Learning ، يناقش Confidence limits  و عينات طومسون-Thomson Sampling و اختبار أ / ب A/B Testing.

د. التصور:

عرض البيانات بصريا أفضل بكثير من التقارير الكتابية لأن المخططات البيانية يمكن أن تعطينا تفسيرات مختلفة أكثر عند ملاحظتها. يقدم لنا الكتاب الكثير من التوصيات حول كيفية جعل مخططاتك البيانية بسيطة ومنظمة. يتميز هذا الفصل عن الفصول الأخرى بتوفير عدة صفحات في كيفية استخدام الألوان والمخططات المناسبة ضمن العرض البصري للبيانات.

ه. العرض التقديمي:

قد يبدو هذا موضوعًا عامًا يمكنك أن تجده في أي تخصص آخر بخلاف علوم البيانات ، لكنه ضروري حتى يتمكن الآخرون من الاشتراك في الحل المقترح. وإلا فإن كل الجهود من الخطوات السابقة سوف تذهب إلى المرحاض. يعلمك هذا الفصل جميع الحيل الشائعة التي يقوم بها المقدمون لجعل عرضهم التقديمي جذابًا ومريحًا. سوف يمهد لك طريقك إذا كنت قد جلست في العديد من العروض التقديمية. إن إنشاء قصة منظمة من جميع الخطوات التي مررت بها (من تحديد المشكلة إلى الحل المقترح) في سياق محدد وواضح وتقديمها  لجمهورك  سيكون بالتأكيد عرضًا رائعاً. 

بشكل عام، لا يتحدث الكاتب عن موضوع واحد، ولكن خمسة مواضيع حول ما يفعله عالم البيانات. عندما يحتاج عالم البيانات إلى تحديد الأسئلة ، فإنه يظهر أنه يحتاج إلى مهارات اتصال لفظي جيدة، بالإضافة إلى مهارات الكتابة وتصميم البيانات لعروضه التقديمية.  يحتاج عالم البيانات إلى معرفة جميع الجوانب الفنية في تنظيف البيانات بشكل صحيح  و استخدام الخوارزميات الصحيحة في تحليله.             

يتحدث الفصل الأخير عن المهن المختلفة التي يمكنك أن تبدأها قبل أن تصبح عالم بيانات: محلل أعمال ، محلل بيانات ، عالم بيانات. يمنحك أيضًا نصائح للتميز عن البقية، مثل تحديد نقاط قوتك، وإقامة الروابط، والحفاظ على مهاراتك ذات الصلة، ومشاركة أعمالك واهتماماتك عبر الإنترنت.

مقالات ذات صلة

التعليقات