fbpx

كيف يمكن كشف التلاعب في المخططات البيانية؟

المخططات البيانية

لا شك أنك تعرف أن المخططات البيانية يمكن أن تكذب، والاحصائيات أيضًا في كثير من الأحيان تكون كاذبة، فصناعة التضليل هدف الكثيرين في مجالات عديدة، كأسواق المال وقطاع الأعمال وفي السياسة بالتأكيد. ترتكب هذه الأكاذيب إما عن عمد من ناشريها أو في أسواء الحالات من دون عمد، عند إساءة استخدام تطبيقات التمثيل البصري للبيانات.

لا نحتاج لبرهنة وجود الأكاذيب ولا البحث في أسباب حدوثها، ما نحتاج إليه حقًا هو التعرف على كيفية التحقق من المخططات البيانية للتأكد من أنها تخلوا من أي خدعة تجعلها مضللة، فأيا ما كان موضعنا كمحللين بيانات أو صحفيين أو باحثين أو متخذي قرار نحتاج دومًا للاطلاع على الرسوم البيانية، فهي تعطينا صورة قد تحمل خلفها الألاف الأرقام الخام ومئات الصفوف والأعمدة من المدخلات التي قد لا نملك الوقت للاطلاع عليها تفصيلًا، كما إنها لن تعطينا الرؤية التحليلية التي يمكننا المخطط البياني من معرفتها بمجرد الاطلاع عليه لثواني معدودة.

لذلك من المهم أن نتمكن من معرفة ما إذا كان الرسم البياني يوضح الحقيقة أم لا. فيما يلي عدد من النقاط التي عليك التحقق منها لمساعدتك على اكتشاف الأكاذيب في المخططات البيانية.

الحيل الشائعة

نذكر جميعًا صور استمارات الانتخابات التي تستخدم فيها الألوان كعنصر موجه للتصويت لصالح مرشح بعينه، فإذا وضع أغلب الناس بين الاختيار ما بين اللون الأخضر واللون الأحمر سوف يختارون على الأغلب اللون الأخضر لكونه لون مطمئن ويرمز للنمو والازدهار، هذه واحدة من أقدم الحيل المضللة الشائعة التي عليك التوقف عندها إذا وجدت في المخطط البياني الذي أنت بصدد تصفحه، هل الألوان تعكس معناها حقًا أما إنها وظفت لخلاف ذلك.

الاحجام أيضًا من العناصر التي يمكن التلاعب بها، بالطبع لن نحمل مسطرة وبرجل بحقيبتنا لنقيس دقة كل مخطط بياني نطالعه، لكن هناك بعض المخالفات التي يمكن رصدها بالعين المجردة، كأن تبدو القيمة الأقل بحجم أكبر سواء من خلال طول العمود البياني أو حجم الشريحة في مخطط الدائرة أو حتى من خلال نمط وحجم الخط المستخدمين في إبرازها دون غيرها فجميعها محاولات للفت الانتباه لهذا الرقم وجعله يبدوا أكثر أهمية من القيم الأكبر منه في المخطط البياني. ويوضح النموذج التالي هذه النقطة.

المخططات البيانية
مخطط بياني مضلل

أكثر تلك الحيل استخدامًا أيضًا هو المخططات ثلاثية الأبعاد والتي تعكس منظورًا غير متساوي لكتل المخطط فتجعل الجزء الذي يظهر في الأسفل عند نقطة تقعير الرسم البياني أكبر من غير من الأجزاء التي تأتي في الأعلى، وهذا قد يكون على عكس ما تحمله من قيمة، لذا عندما تجد مخططًا مجسمًا بأبعاد ثلاثية حاول أن تتجنب تأثيره البصري عليك وتحقق من قيم الأرقام أولًا.

يمكن أن تجدوا الكثير من النماذج السيئة التي استخدمت الحيل الشائعة في موقع https://viz.wtf فهو مرجعًا جيدًا لكل ما هو قبيح في التمثيل البصري للبيانات، ودائمًا ما استخدمه عند تكليف طلابي بالجامعة باكتشاف الأخطاء ونقد المخططات البيانية.

العنوان الموجه

يشكل العنوان جزءً أساسيًا من الرسالة التي يود ناشر المخطط البياني في توصيلها للجمهور، وقد لا تخلو من التلاعب أيضًا. تحقق من أن العنوان الرئيسي والعنوان الفرعي للمخطط البياني موضوعين بوضوح في القسم الأعلى من المخطط وأنهما يتضمنا معلومات موجودة بالفعل في المخطط، حيث يميل الناشرون عادة إلى اختصار العناوين وتقريب الأرقام واستخدام النسب المئوية للمقارنة بهدف تركيز الرسالة واستغلال أقل مساحة عرض ممكنة حتى لا يتحول التصميم إلى كتلة كبيرة من النصوص، لذا تأكد من أن:

عنوان المخطط البياني يتضمن:

  • السياق الزمني للبيانات.
  • وحدة قياس البيانات المستخدمة.
  • منهجية قياس البيانات.

عنوان المخطط البياني يخلو من:

  • أي اختصارات غير مفهومة.
  • الصفات التي تصبغ رأي الناشر على البيانات.
  • التركيز على أحد الأنماط في البيانات دون غيرها.

نموذج مضلل: نمو ملحوظ في مؤشر GDP العام الماضي

نموذج واضح: 4% ارتفاع في معدل الناتج المحلي الإجمالي خلال عام 2021 بالمقارنة بالعام السابق

الاتجاهات المعكوسة

لا يبغي أن يحدث اختلاف اللغة المستخدمة اختلافًا في اتجاه عرض البيانات على المخطط، حيث أنه من الأنسب أن تبدأ البيانات دائما من جهة اليسار. ليس ثمة قول علمي يؤكد هذا الأمر لكن جرت العادة على توحيد طريقة عرض البيانات بصريًا لتسير دائمًا من جهة اليسار إلى اليمين.

لنتخيل مثلًا أن هناك منحنى خطي يمثل المحور Y فيه خط الزمن، حيث يعرض البيانات وفقًا لسلسلة متصلة من السنوات المتتالية، فمن المعروف لدى الجميع أن الساعة وهي أحد وسائل قياس الزمن تتحرك من جهة اليسار إلى اليمين، لذا سوف يتوقع الجمهور أن يتحرك محور السنوات بنفس الكيفية أيضًا.

وهنا يميل المخادعون لعكس هذا التوقع الراسخ في الأذهان، لإيقاع الجمهور في فخ قراءة البيانات في الاتجاه العكسي ليصبح الصعود تراجعًا والتراجع صعودًا. تتكرر نفس الخدعة عند وضع المحور Y بالأعلى ورسم البيانات أسفل منه مع جعل محور Xكما هو بالقيم الموجبة، فهنا سوف يظن من يقرأ البيانات بهذه الطريقة أن البيانات تحت خط الصفر وسوف يعتقدون أن القيم الكبيرة قيم سلبية لأنها تبعد كثيرًا عن السفر في الاتجاه السالب بينما القيم الصغيرة قيم جيدة لأنها تقترب من حالة عدم التراجع وهو على عكس حقيقة البيانات.

المخططات البيانية
مقارنة بين منحنى خطي مضلل وآخر دقيق

وقعت رويترز في هذه الخطأ، ففي الرسم البياني على يسار الصورة الموضحة بالأعلى، نجد أن الأعلى يعني أسفل، والأسفل يعني أعلى.

هذا المثال هو تذكير كبير بأننا نقدم افتراضاتنا الخاصة لقراءتنا لأي تفسير للبيانات. فعلى المخطط باليسار سوف يرى معظم الناس انخفاضًا كبيرًا في عدد الوفيات الناجمة عن الأسلحة النارية بعد تجاوز Stand Your Ground. لكن هذا ليس ما تحمل البيانات من معلومات. حيث تكشف نظرة سريعة على المحور الرأسي أن عدد القتلى يحسب من أعلى (0) إلى أسفل (1000). وان أعلى قمم هي أقل قيمة في عدد الوفيات وأقلها هي الأعلى. وبعبارة أخرى ، فإن ارتفاع الخط يكشف عن انخفاض في عدد الوفيات بالأسلحة النارية. بينما الرسم البياني الموجود على اليمين – المقلوب أفقيًا ورأسيًا – أكثر سهولة بالنسبة لمعظم الناس: يعكس الخط الصاعد ارتفاعًا في عدد وفيات السلاح وانخفاضه يظهر تراجع عدد الوفيات.

وجود المحور الثالث

تُستخدم المخططات ثنائية المحور لإظهار سلسلتي بيانات مختلفتين بحجم مختلف (نطاق الأرقام) و / أو قياس مختلف كـ (إجمالي الناتج المحلي، متوسط ​​العمر المتوقع، إلخ). غالبًا ما يكون الهدف هو مقارنة اتجاهين مع بعضهما البعض. إن إعطاء القراء إمكانية القيام بذلك أمر منطقي للغاية – لكن يصبح الأمر مربكًا عندما يضاف إلى المخطط محور ثالث بوحدة قياس تختلف كليًا عن المحور المقابل له.

هنا تظهر المنحنيات فوق بعضها البعض لكن قد يحدث أن يكون المنحنى بالأعلى يمثل قيم أقل بكثير من المنحنى أسفل منه نظرًا لأن كلاهما رسم بمحور مختلف عن الآخر في وحدات القياس أو القيمة كمان أن تباعد النقاط بين نقطة الصفر على كل محور ليست متساوية.

من المهم أن تتذكر أن قول شيء ما باستخدام مخطط لا يختلف كثيرًا عن قوله في النص – فنحن فقط نستخدم مفردات مختلفة. سنرى أنه من الخطأ الفادح أن نقول “10 أكبر من 100” في الكتابة ، ولكن مع المخططات ثنائية المحور غالبًا ما نقول ذلك بصريًا. يجب أن يدق أجراس الإنذار نفسها في أذهاننا.

منحنى خطي مضلل

لا حظوا في المخطط بالأعلى كيف يتخطى المنحى باللون الأزرق الفاتح وهو صاحب القيم الأقل، ويظهر أعلى من المنحنى باللون الكحلي رغم أنه يمثل القيم الأكبر وفقًا للمحور على اليسار. كان ينبغي ان يظهر المنحنيان بشكل منفصل كل منهم في مخطط متباعد عن الآخر أو إذا كان من الضروري أن يكونوا في مخطط واحد فكان من الأدق هو وجودهم على محور قيمة واحد يبدأ من الصفر. كما هو ظاهر في المخطط التالي:


منحنى خطي دقيق

غياب الصفر عند خط الأساس

إن “إظهار الصفر” عند خط الأساس، قاعدة لا يمكن كسرها، إذا قرأت مقالات لخبراء التمثيل البصري للبيانات حول موضوع محاور القياس التي لا تبدأ من الصفر، فستجد موضوعًا مشتركًا واحدًا: معارضة قوية للفكرة. في كثير من الحالات يصبح وجود الصفر كنقطة أساس بطل أساسي لضمان دقة المخطط البياني، فمثلا تستخدم المخططات العمودية الطول كدليل مرئي يدل على القيمة التي يمثلها كل عمود، لذلك عندما يقوم شخص ما بجعل الطول أقصر باستخدام نفس البيانات عن طريق اقتطاع محور القيمة Y، سوف يظهر المخطط الاختلافات بشكل غير دقيق كما هو واضح تمامًا في هذه الصور، لاحظوا الفرق بين الصورة الصحيحة على اليسار والصورة الخاطئة على اليمين.

في المخطط في الجهة اليمنى، تتسع الفجوة بين المصروفات العامة والإيرادات وتظهر بصورة مبالغ فيها بينما على المخطط جهة اليسار تبدو الصورة منطقية بالنسبة لما تعكسه من بيانات لأننا أضفنا نقطة الأساس الصحيحة لمحور القيمة.

المقارنة عند نقاط متناظرة غير متساوية

رغم أن هذا الخطأ سهل اكتشافه بسرعة، إلا إنه قد يكون مربكًا لكثيرين من الذين لا يملكون الوقت الكافي لتدقيق الصورة، وملاحظة الاختلافات في محور القيمة في كل مخطط.

ينبغي عند اجراء المقارنات المتجاورة أن نتأكد من أن أساس المقارنة ومحور القيمة في كل المخططات تبدأ من نفس نقطة الأساس وأن تباعد النقاط متساوي عل كل محور.

أعتقد إنه من الممكن أن تفرقوا بسهولة بين الصورتين التالتين، وتحددوا بناء على المعلومات بالأعلى أي صورة منهم أكثر دقة.

رسم بياني مضلل
رسم بياني دقيق

غياب المصدر

لا تقرأ مخطط بياني لا يحتوي على مصدر البيانات بأسفله، فهو شي لا يمكن أن يسهو عن ذكره صانع المخطط البياني إلا وأن كان متعمدًا في قطع الصلة بينك وبين مصدر ما يقدمه من “حقائق”، لذلك لا تهدر وقتك في محاولة فهم ما ينقله المخطط من معلومات ولا تحاول البحث جاهدًا عن مصدر البيانات.

عندما يقرر صانع المخطط فعل ذلك، تيقن أن هناك ما يخفيه عنك من حقائق، فهو لا يردك قطعًا أن تعود إلى مصدر ما يقول وتتحقق بنفسك مما يعرضه في المخطط البياني، وهنا ينغي أن تشك.

يعد المصدر مكونًا أساسيًا من مكونات التمثيل البصري للبيانات والذي ينبغي أن يكون موضوعًا بوضوح أسفل كل مخطط، ومكتوبًا بطريقة تفصيلة تسهل على من يريد الاطلاع على البيانات المعروضة في صورتها الخام أن يعود إليها بكل سهولة دون بذل عناء البحث عنها في فضاء الإنترنت الواسع.

على الأغلب تفعل الجهات التي تسعى لتضليل الجمهور إلى إخفاء المصدر حال اجتزاءها ما يخدم تواجهاتها من البيانات واخفاء ما يتعرض مع تواجهاتها ومصالحها، كأن تعرض مخططًا للمساحات المزروعة للقمح من تاريخ يظهر استمرار الصعود بشكل مباشر كما هو موضوع في المنحنى الخطي التالي مع اقتطاع تلك الفترة الزمنية التي شهدت عدم نمو واستقرار في المساحة المزروعة بالقمح، لن يمكننا معرفة ذلك من دون العودة لمصدر البيانات الخام والاطلاع عليها تفصيليًا.

أرشح لكم الاطلاع على منتج أوراق تصميم البيانات المقدم من مدرسة البيانات، والذي يتضمن عشرات المخططات البيانية مع توضيح الطريقة الأمثل لعرضها بشكل دقيق.

مقالات ذات صلة

متى ينبغي أن تلقي بما لديك من بيانات في صندوق القمامة؟

بالتأكيد سمعت هذه العبارة من قبل Garbage in garbage out، والتي تعني أن المدخلات الرديئة تقود لمخرجات رديئة بالضرورة، وكذلك هو الحال في علم البيانات، فأن البيانات الردئية ستقودك إلى تحليلات خاطئة وبالتالي تؤدي بك إلى اتخاذ قرارت غير سليمة، لذا يتوجب عليك تجنب الوصول لهذه النهاية والتخلي عن ما لديك من بيانات رديئة بإلقاءها في صندوق القمامة.

التعليقات