fbpx

مقابلة البيانات .. صياغة الفرضية وطرح الأسئلة

بيانات فرص البقاء علي سفينة تايتانك

تتمحور مهمة الصحفي حول طرح الأسئلة واقتناص الاجابات، كذلك صحفي البيانات فهو يحاور البيانات كما يحاور المصادر البشرية، يطرح عليها الأسئلة ويجيب هو أيضًا عليها، مستعينًا في ذلك بآلة الحاسبة أو برامج الكمبيوتر وعدد من المعادلات الحسابية البسيطة كحساب نسبة الغرقى من الذكور والإناث، وتوزيع الغرقى والناجين في كل درجة سياحية.

وكي لا تتحول هذه المقابلة لجولة من المبارزة بين الصحفي وجدول البيانات، ينبغي أن يحدها سياق عمل محدد يرسم مراحل سير هذه المقابلة، حيث يفضل أن تدور المقابلة حول فرضية واحدة محددة، يصبح الصحفي قادر على تحديد الفرضية عادة بعد الانتهاء من مرحلة استكشاف البيانات ومعالجتها، حيث تأتي عندما يصبح الصحفي على دراية كافية بما بين يديه من مدخلات. 

في بعض الأحيان ، عندما تتعامل مع مجموعات البيانات مثل هذه، يمكن أن يغلب الجانب الإنساني من القصة التحليل الإحصائي. لكن العاطفة وحدها لن تقودنا لكشف كافة التفاصيل بينما يمكننا التحليل الإحصائي ومعالجة الفرضية من الكشف عن بعض القصص الرائعة، والأكثر مأساوية أحيانًا.

يفضل أن لا تكون الفرضية بسيطة يسهل اثباتها أو ضحدها دون تحليل البيانات، كما لا يفضل في الوقت ذاته أن تكون معقدة وعصية الإثبات في ظل ما بين يدينا من بيانات. يمكننا القول أن الفرضية هنا يمكن أن تكون “ نجاة الأغنياء والنساء والأطفال دون غيرهم من الركاب” وهي الفرضية الكلاسيكية التي يسهل تصديقها دون الحاجة لبيانات، فهو الموقف الإنساني الأقرب في مثل هذه الظروف.

لتطوير الفرضية ضع قائمة قصيرة في ذهنك من الشروط التي ينبغي أن تشملها الفرضية:

  • أن تحتوي الفرضية على مؤشر يمكن قياسه.
  • أن تشمل الفرضية على استفسارات تدور حول المشكلة وأثرها وأسبابها وربما طرق حلها.
  • لا ينبغي أن تكون فرضيتك سليمة في النهاية، يمكن ان تصل في نهاية المقابلة لاكتشاف جديد.

وفقًا للمعايير السابق يمكن للفرضية أن تكون “النساء والأطفال من ركاب الدرجة السياحية الأولى كانوا الأكثر حظًا في النجاة بصحبة كافة أفراد عائلتهم في ظل تخصيص طاقة الباخرة العدد الأكبر من قوارب الإنقاذ لهم”.

فالفرضية الأن تحتوي على مؤشر يمكن قياسه من خلال البيانات، وهو نسبة النجاة في مقابل الغرقى من النساء والأطفال، كما تعكس الفرضية الأثر على فئة محددة وهي ركاب الدرجة السياحية الأولى وتحيل السبب في نجاتهم إلى وجودهم مع عائلاتهم. وهي فرضية ليسب بالبسيطة ولا يمكن اثباتها ولا ضحدها بالعين المجردة بل تتطلب فحص وتحليل للبيانات، وقد تكون لعكس ما فرضنا لكنها حتما ستقودنا نحو شيء ما يمكن تقديمه للجمهور.

ولإجراء مقابلة مع البيانات من خلال هذه الفرضية يمكننا طرح عدد من الأسئلة مثل:

  1. نسبة الغرقى والناجين من الذكور والاناث؟
  2. توزيع الناجين والغرقى من الجنسين وفقا للدرجة السياحية؟
  3. عدد الاطفال على الباخرة؟
  4. نسبة النجاة وفقا للفئة العمرية؟
  5. هل من ارتباط بين السعر المدفوع في التذكرة واحتمال النجاة؟
  6. نسبة النجاة والغرق وفقا لحجم العائلة؟

والآن دعنا نحفر أكثر ونلقي نظرة على تقسيمات النساء / الأطفال / الرجال. الإناث في الطبقة السياحية الألولى كان لديها معدل بقاء على قيد الحياة مرتفع. دعنا نحفر أعمق في البيانات ونستخدم خاصية الجداول المحورية في برنامج مايكروسوفت إكسل من أجل الحصول على صورة مجمعة لركاب كل درجة سياحية سواء كانو من الذكور أو الإناث.

خاصية الجداول المحورية في برنامج مايكروسوفت إكسل

من الجدول المحوري الذي صممناه بالأعلى لتلخيص قاعدة البيانات، يمكننا تحديد عدد الغرقى والناجين من كل جنس في كل درجة سياحية، ومن الواضح بالجدول بالأعلى أن الدرجة السياحية الثالثة كان لديها معدل بقاء أسوأ. سواء كانوا من الذكور أو الإناث.

المسافرين على الدرجة السياحية الأولى كان لديهم أعلى فرصة للبقاء على قيد الحياة. يمكن أن يكون مؤشرا على المعاملة التفضيلية لأولئك الذين دفعوا أكثر، فضلا عن حقيقة أن الركاب من الدرجة الأولى كانوا في الكبائن المخصصة في الجزء العلوي من السفينة. بينما المسافرين على الدرجة السياحية الثالثة لديهم أعلى معدل للوفيات. لأنهم على ألرجح يسكنون في كبائن في عمق الباخرة ويمكن أن يكون هذا قد ساهم في انخفاض معدل البقاء على قيد الحياة.

يظهر المخطط التالي توزيع الركاب وفقا للعمر حيث يتضح أن نسبة الأطفال دون سن الخامسة هي أعلى نسبة بين فئات الأطفال، في حين أن الأطفال لم يمثلوا إلا نسبة قليلة للغاية من ‘جمالي ركاب الباخرة وأن النسبة الأكبر كانت لفئة الشباب والتي تراوح عمرها ما بين سن العشرين وحتى الأربعين.

مخطط توزيع الركاب وفقا للعمر

ما يثير الاهتمام هنا هو أن معدل الوفيات أعلى في الحالات التي يكون فيها الراكب بمفرده بينما تزيد معدلات النجاة كلما كان حجم الأسرة من شخصين لأربع أشخاص، وهو ما يعكس صحة الفرضية حيث أن طاقم المركب كان يعطي الأفضلية للنساء اللواتي يحملن أطفال معهن كما أن فرص البقاء كانت أعلى لدى العائلات التي ربما كان يتم اجلائهم بشكل جماعي دون غيرهم.

فرص البقاء مقابل عدد افراد الاسرة

وهكذا تستمر المقابلة، وتستمر محاولات الصحفي في الحصول على اجابات للأسئلة التي حددها مسبقًا وفقا لفرضية محددة، مستخدمًا في ذلك كافة أدوات برنامج مايكروسوفت إكسل سوا في الفرز والتنقيح لأعمدة البيانات أو من خلال خاصية التنسيق الشرطي للبيانات والجداول المحورية.

الآن، حاول أن تصيغ فرضية جديدة للقصة من واقع قراءتك للبيانات، حاول توظيف كافة المعايير التي ذكرناه بالأعلى في فرضيتك، وحاول ال‘جابة عليها بالورقة والقلم، لا تشغل نفسك بقلة خبرتك في استخدام برنامج مايكروسوفت إكسل، فما يمكن الوصول إليه باستخدام البرنامج يمكن الوصول إليها أيضًا باتباع الطرق التلقيدية في النتيجة في الأغلب واحدة مع القليل من الفارق الزمني بين الطريقتين.

ما يهم الآن هو تمكنك من طرح الأسئلة الجيدة على جدول البيانات وليس الإجابة عليها.

مقالات ذات صلة

التعليقات