fbpx
مراحل عمل علم البيانات

الخطوات من البيانات وصولًا للقصة الصحفية

يتعامل الصحفيون مع البيانات منذ نشأة الصحافة، لكن زيادة حجم البيانات وما تبعه من خبرات ومهارات تتعلق بالتعاطي معها هو ما بلور مصطلح صحافة البيانات كما نعرفه في الوقت الحالي، وأوجدت تسريبات مثل وثائق ويكيليكس، التي حوت بيانات ضخمة، وما تبعها من تسريبات أخرى مثل وثائق بنما، الحاجة إلى التوسع في تطوير أدوات وطرق التنقيب في البيانات ذات الأحجام الهائلة، التي يصعب على العقل البشري التعامل معها دون استخدام تقنيات وبرمجيات متطورة.

الكم الهائل من الأسئلة عن صحافة البيانات، وعمليات البحث المطردة عن الأدوات والبرمجيات المرتبطة بها، دفعني إلى البحث عن إجابة واضحة لمراحل العمل كمتدربة على علم البيانات، تقضي أسبوعها الأول في برنامج زمالة “إنفوتايمز”، وهو ما أود مشاركته معكم هنا من خلال هذه التدوينة التي تحوي نتاج عمليات بحث مكثفة أجريتها، ونقاشات مطولة مع زملائي في “إنفوتايمز”، لرسم خريطة عملية لخطوات إنتاج قصة صحفية مدفوعة بالبيانات.

1- العثور على البيانات- Finding Data

نقطة البداية لأي قصة صحفية هي “العثور على البيانات”، ولكي تجد البيانات الخاصة بقصتك فأنت أمام مسارين: أولهما أن يكون لديك فكرة لقصة صحفية بحاجة إلى بيانات لدعمها، كأن يكون لديك رأس بحاجة إلى جسد، وثانيهما أن تنقب فيما لديك من بيانات عن قصص صحفية مخفية داخلها تستحق أن تروى، وهو أمر شبيه بالعثور على حجر من الألماس داخل منجم فحم.

وأيًّا ما كان مسارك الذي ستسلكه فأنت بحاجة إلى قاعدة بيانات، والتي قد  تقوم بإنشائها بنفسك، لدعم فكرتك، وهي طريقة مكلفة وتستهلك وقتًا أطول في إيجاد البيانات وجمعها وترتيبها بحيث تجيب على الأسئلة الرئيسة لفكرتك، أو أن تحصل على بيانات جاهزة قام آخرون بجمعها مسبقًا.

وبعد أن تختار السيناريو الذي يناسبك، ستنطلق في رحلة من عدة خطوات لكي تحصل على قصة صحفية متكاملة مدفوعة بالبيانات وجاهزة للنشر، وتذكر أن الخطوات التي نسردها لك لاحقًا، لن تتغير بتغير الطريقة التي اخترتها للحصول على البيانات، ستكون هي نفسها، وما يميز هذه الخطوات هو أنها متتابعة، ولا يمكن تغيير ترتيبها، الشيء الوحيد الذي سيتغير هو الوقت اللازم لإنجاز كل خطوة، وهو الأمر الذي يحدده نوع الجهد المطلوب لإنجازها، إذا كان جهدًا يدويًّا أو باستخدام برمجة ما، وهل هذه البرمجة متاحة أم سيتطلب الأمر تجهيزها للمرة الأولى من خلال الاستعانة بمبرمج متخصص.

إن الخطوة الرئيسة في بناء أي قصة صحفية مدعومة بالبيانات، هي الحصول على البيانات، وكلما كانت لديك مصادر متنوعة للحصول عليها، زادت فرص إتمامك لقصتك، أو حتى العثور على أكثر من قصة مخبأة داخل البيانات.

2- الحصول على البيانات – Getting Data

الوصول إلى البيانات لا يعني الحصول عليها، فيمكن مثلًا أن تكتشف أن البيانات التي أمدتك بها جهة حكومية ما أو تلك التي حصلت عليها من طريق استخلاصها، مشفرة بطريقة ما، أو أنها متاحة في شكل ملفات مكتوبة بصيغة PDF، أو أن البيانات التي حصلت عليها كومة من الأوراق، وهنا يتوجب عليك تحويل هذه البيانات إلى صيغة حاسوبية، وبالتحديد تحويلها إلى جداول excel.

وهكذا تختلف طرق الحصول على البيانات على حسب مصادرها، ووفق طبيعة هذه البيانات، فمثلًا لو أن البيانات التي حصلت عليها عبارة عن ملفات بصيغة PDF فيمكنك استخدام تقنية الـ (Optical character recognition (OCR التي تساعد على فك شِفرة هذه الوثائق، وتحويلها إلى ملفات Excel حتى يتسنى تحليلها؛ وهنا تجدر الإشارة إلى أن هذه التقنية تعمل بكفاءة أكثر مع الملفات المكتوبة باللغة الإنجليزية، وتكاد تكون غير قادرة على استبيان الوثائق المكتوبة بالعربية، ولذلك يجب عليك دائمًا أن تحاول الوصول إلى صيغة الملف الأصلية، لأنه لا يوجد ملف صيغته الأولية PDF، لتسهيل عملية استخراج المعلومات، وإن لم يتح ذلك فيتوجب عليك حينئذ أن تدخل البيانات بطريقة يدوية وترتيبها في ملف excel.

* في حالة بناء قاعدة البيانات الخاصة بك من البداية بنفسك، فعليك استخدام Excel أو Google sheets أو لغة البرمجة SQL وهي اختصار لـ Structured-Query-language، وهكذا بمجرد إتمام عملية إدخال البيانات تكون جاهزة للتعامل معها.

3- التحقق من البيانات – Verifying data

أول خطوة يتوجب عليك القيام بها بعد أن حصلت على البيانات؛ هي مراجعة الحقائق التي تحويها، وذلك قبل البدء في معالجتها وتحليلها، ويمكن إتمام ذلك على مستويين: الأول هو التحقق من المصدر، والثاني هو التحقق من المحتوى، ولكي تتحقق من المصدر عليك طرح بعض الأسئلة، مثل: من هو مصدر هذه البيانات؟ كيف جمعها؟ ومتى جمعها؟ وما الهدف من جمعها؟ وما هي الطريقة المستخدمة في الجمع؟ وما هي الدوافع وراء نشرها؟ وهل له علاقة بالأشخاص الذين تمسهم هذه البيانات؟ فإذا تحققنا أنه شخصية معروفة أو جهة موثوقة، وظيفته جمع البيانات، ومحايد، وأوضح طريقة جمع البيانات وإطارها الزمني، فهنا يمكننا البدء في التعامل مع البيانات.

* عملية التحقق تلك تستخدمها فقط في حال استعنت بالبيانات التي تتيحها جهة أو منظمة ما، لأنه ليس من المنطق طرح مثل هذه الأسئلة على نفسك في حال كنت أنت مصدر البيانات.

ويتمثل المستوى الثاني من عملية التحقق، في الفحص العشوائي للمعلومات المتضمنة في البيانات، والتأكد من سلامتها، مثل الأرقام الإجمالية، والأرقام التي تثير الشكوك بسبب مبالغتها أو تطرفها، أو تلك التي يمكن التحقق منها من أكثر من مصدر، مثل أرقام التعداد السكاني، والدخل القومي، وعجز الموازنة.

4- تنظيم البيانات – Organizing data

في هذه المرحلة تحدد وجهتك داخل البيانات، وتتبلور فكرتك الرئيسة وتبدأ في استبعاد الأفكار الفرعية التي قد تؤثر على انسيابية بياناتك، مثل الأعمدة الزائدة، أو تلك التي تقودك إلى وجهة فرعية غير مهمة في قصتك، وهنا عليك تحديد الخط الرئيس لقصتك واستبعاد الخطوط الفرعية التي قد تمثل عبئًا إضافيًّا عليك وعلى القارئ فيما بعد، في حال جرى تمثيل هذه البيانات الزائدة في العناصر البصرية اللاحقة.

* في مرحلة تنظيم البيانات يجب عليك أن تحتفظ دائمًا بالملف الأصلي للبيانات، وعمل كافة التعديلات في كل مرة على نسخة من هذا الملف، حيث يتيح لك ذلك فرصة للعودة مرة أخرى إلى الوراء في حال تطلَّب الأمر ذلك.

5- تنظيف البيانات – Cleaning data

وهنا ننتقل إلى مرحلة أكثر تقدمًا في معالجة البيانات، حيث نقوم باستبعاد الخانات المكررة أو تلك التي تحوي قيمًا خاطئة، أو علاج بعض القصور في عمليات الجمع والطرح أو العمليات الحسابية بشكل عام، بهدف تلافي بعض المشكلات الموجودة في الملف النهائي، وتهيئته للتحليل، مثل معالجة الأخطاء الكتابية، وتوحيد إملاء الكلمات المتماثلة، محاولة إكمال الـ missing values، التأكد من عدم وجود مسافات زائدة قبل أو بعد الكلمات باستخدام معادلة trim، عمليات الـ split مثلًا للتاريخ والتوقيت، عملية توحيد الـ format الخاصة بالتاريخ أو الأرقام، والقيام بعمليات الترتيب باستخدام الـ sort وما إلى ذلك من خطوات.

6- تحليل البيانات – Analyzing data

تتطلب منك هذه الخطوة التحلي ببعض المهارات الإحصائية الأساسية، حتى تتمكن من الحصول على إجابات عن تلك الأسئلة التي تدور في ذهنك كصحفي أو باحث يحقق في قصة أو مادة صحفية، ومن بين هذه العمليات الحسابية البسيطة التي يمكن استخدامها في هذه الخطوة هي حساب النسبة Ratio، والنسبة إلى المجموع percentage، ونسبة التغير Percentage of change، والوسط الحسابي، والنسب الأعلى، والأقل، وغيرها الكثير جدًّا من العمليات الحسابية التي يمكن الاستفادة منها في عملية تحليل البيانات، ومثال على ذلك إذا كنا أمام بحث في قاعدة بيانات الأطفال المخطوفين، فقد نستطيع تحديد أكثر طريقة شيوعًا للخطف من خلال عملية حسابية بسيطة دون الحاجة إلى مراجعة مئات أو ربما آلاف الخانات التي تتضمنها قاعدة البيانات.

7- التمثيل البصري – Visualization

هذه الخطوة هي تتويج للجهد السابق، وهي تحول عملية التحليل الإحصائي للبيانات إلي شكل بصري تفاعلي ربما أو ثابت، يمكِّن القارئ من فهم أكثر عمقًا وسهولة للبيانات الضخمة، وفي هذه الخطوة ننصح دائمًا بالعمل وفق هذه القاعدة “اعرض ولا تَقُل” Show, do not tell.

وتعتمد هذه الخطوة بشكل كبير على حجم البيانات وعلى علاقتها بعضها ببعض، وبناء على ذلك تختلف أشكال التمثيل البصري التي تستخدم لعرض النتائج. وهناك أنماط كثيرة للعرض البصري منها الثابت (Static)، أو التفاعلي (interactive) مثل السرد التمريري (scroll telling). وتعتمد أيضًا على طبيعة الوسيط الإعلامي الذي سيستخدم في عرض النتائج، فالقوالب البصرية التي تستخدم في الصحف أو المطبوعات تختلف عن تلك المستخدمة في المواقع الإلكترونية مثلًا، إلي جانب طبيعة البيانات المعروضة، لأن تقنيات التمثيل البصري للبيانات الخاصة بالموضوعات الجغرافية يختلف عن تلك الخاصة بمقارنة تغير الأسعار أو التطور الزمني لقضية ما.

8- كتابة القصة – Writing or publishing the story

ونختتم رحلتنا مع البيانات بالجزء الأخير الخاص بكتابة القصة أو النص الذي يروي النتائج ويشرح للقراء أهمية ما توصلت إليه بعد تحليل وفحص البيانات، ويساعدهم على فهم الرسوم التوضيحية والأرقام التي بنيت عليها قصتك، وفي هذه المرحلة عليك أن تتحلى بالمهارات الصحفية الأساسية في كتابة قصتك، ويجب أن يتضمن النص الذي تكتبه إجابات وافية على الأسئلة الصحفية الأساسية: من وماذا ومتى وأين وكيف، وكل ذلك دون إغراق القارئ في تفاصيل لا تعنيه.

9- النشرPublishing

وقبل أن تنشر قصتك عليك أن تراجع بعض النقاط المهمة التي تؤثر في استقبال الجمهور وتفاعله معها، مثل اختيار الوقت المناسب للنشر، فلا يصح أن تنشر قصتك في وقت يكون فيه تفاعل الجمهور مع منصتك أقل ما يكون، وتستطيع بأدوات بسيطة ومتاحة أن تعرف الوقت المثالي الذي يفضله جمهورك لزيارة منصتك. كذلك عليك أن تختبر شكل ومزايا قصتك بالدخول إلى منصتك باستخدام الموبايل مرة ومن خلال حاسوبك مرة أخرى، لتتأكد من ظهور قصتك كما ترغب، وأن جميع العناصر التفاعلية البصرية تعمل بكفاءة وفي مكانها الصحيح.  

مقالات ذات صلة

التعليقات