المدونة--الفصل الثانيعلم البياناتجمع البيانات | الوحدة الثانية | الدرس الأول

جمع البيانات | الوحدة الثانية | الدرس الأول

جمع البيانات

جمع البيانات هو عنوان الدرس الأول من الوحدة الثانية التي تحمل اسم “جمع البيانات والتحقق من صحتها” من مقرر “علم البيانات”.

ستتعرف في هذا الموضوع على مصطلح جمع البيانات، والقدرة على تصنيف مصادر البيانات، وتصنيف معايير جودة المعلومات، والتعرُّف على منصات البيانات المفتوحة، وأهمية الحصول على الأذونات القانونية المناسبة قبل البدء بجمع البيانات.

جمع البيانات

لذا قم بقراءة أهداف التعلُّم بعناية، ثم أعد قراءتها وتأكَّد من تحصيل كافة محتوياتها بعد انتهائك من دراسة الموضوع.

أهداف التعلُّم

  • معرفة مصطلح جمع البيانات.
  • تصنيف مصادر البيانات.
  • تصنيف معايير جودة البيانات.
  • معرفة مفهوم منصات البيانات المفتوحة.
  • معرفة أهمية الحصول على الأذونات القانونية المناسبة قبل البدء بجمع البيانات.

هيا لنبدأ!

جمع البيانات (Data Collection)

تعد مرحلة جمع البيانات (Data Collection) أهم مراحل البحث العلمي أو دراسة ظاهرة معينة.

تمثل هذه المرحلة عملية جمع الحقائق والأرقام والمصطلحات للمتغيرات المستهدفة في ذلك البحث أو الدراسة.

يمكن جمع البيانات باستخدام أجهزة مختلفة مثل أجهزة الاستشعار وتسجيل البيانات.

تتطلب عملية جمع البيانات فهمًا عميقًا للمعاملات قيد الدراسة، بالإضافة إلى التخطيط والعمل الدؤوب للحصول على بيانات عالية الجودة، حيث تسهم البيانات عالية الجودة في إجراء التحليل المناسب لأداء المهام على الوجه المطلوب وذلك لاستخراج معلومات مفيدة حول الظاهرة قيد الدراسة.

تختلف طرائق جمع البيانات باختلاف نوع البيانات، ولكن يظل التحقق من صحة الخطوات المتعلقة بجمع البيانات ودقتها أمرً هامًا.

جمع البيانات

تعريف هام

جمع البيانات (Data Collection)

هي عملية جمع القراءات أو الحقائق وقياسها، وتشمل الحصول على البيانات وتسميتها وتحسينها.

لمزيد من المعلومات عن جمع البيانات، قم بالاطّلاع على الرابط التالي:

جمع البيانات – ويكيبيديا

مصادر البيانات (Sources of Data)

يوجد تصنيفان أساسيان لمصادر البيانات:

  • مصادر البيانات الرئيسة (Primary Data Source).
  • مصادر البيانات الثانوية (Secondary Data Source).

مصادر البيانات الرئيسة Primary Data Source

يحتوي مصدر البيانات الرئيسة على بيانات لم تجمع من قبل ويمكن جمعها من خلال أجهزة الاستشعار وأجهزة تسجيل البيانات وكذلك من خلال الاستبيانات.

من الأمثلة التي تدل على مصادر البيانات الرئيسة: مقياس درجة الحرارة الذي يجمع درجة حرارة الهواء، ومقياس سرعة الرياح الذي يقيس سرعة الرياح، وكذلك فإن اجراء استبانة للعملاء حول طبيعة الطقس الذي يفضلونه عند السفر للخارج يعد مصدرًا من مصادر البيانات الرئيسة.

جمع البيانات

مصادر البيانات الثانوية Secondary Data Source

تحصل على هذا النوع من البيانات من خلال استخدام بيانات أخرى من مصدر البيانات الرئيسة.

على سبيل المثال، يمكنك استخدام بيانات درجة حرارة الهواء وسرعة الرياح من جهازي استشعار مختلفين للحصول على البيانات من لمعامل آخر يسمى درجة حرارة الرياح الباردة (Wind-Chill Temperature)، يمكن حساب تلك الدرجة باستخدام صيغة درجة حرارة الرياح الباردة، والتي تتمثل في ضرب سرعة الرياح بالمعامل 0.7 ثم طرح الناتج من درجة حرارة الهواء التي تم تسجيلها.

بعبارة أخرى يمكنك أولاً استخدام مقاييس درجة الحرارة ومقاييس الرياح كمصادر بيانات أولية لحساب بيانات درجة الحرارة وسرعة الرياح، ثم يمكنك استخدام صيغة حساب درجة البرودة كمصدر بيانات ثانوي من أجل الحصول على بيانات درجة البرودة.

جمع البيانات

مصادر البيانات الداخلية والخارجية Internal and External Data Sources

يمكن تصنيف مصادر البيانات إلى مصادر داخلية وخارجية، تعكس مصادر البيانات الداخلية تلك البيانات التي تم جمعها داخليًا من قبل جهة العمل أو الجهة المسؤولة عن جمع البيانات.

بينما البيانات الخارجية هي التي يتم تحصيلها من خارج مجال جهة العمل.

على سبيل المثال، تعد البيانات التي تم جمعها من جهاز استشعار تابع لجامعة أو مؤسسة علمية بيانات داخلية، بينما تعد البيانات التي يتم الحصول عليها من مؤسسات أخرى أو أفراد أو من مصادر خارج الجامعة بيانات خارجية.

جودة المعلومات (Information Quality)

عندما تتم معالجة البيانات أو تنظيمها أو تقديمها في سياق معين فإنها تسمى معلومات وتوصف قيمتها لاستخدام معين بأنها جودة المعلومات.

تعد جودة المعلومات عاملاً مهمًا في قيمة تلك المعلومات ومدى مصداقيتها للاستخدام في اتخاذ القرارات.

مع زيادة جمع البيانات وحفظها، أصبحت جودة المعلومات الناتجة عن معالجتها ذات أهمية كبيرة ومتزايدة.

جمع البيانات

يساعد ضمان جودة المعلومات على:

  • التحديد الدقيق للاحتياجات الفعلية لتنفيذ المشروعات.
  • كذلك توجيه الخدمات بشكل فعال.
  • زيادة الكفاءة في العمل.

بالمقارنة يمكن أن تتسبب المعلومات غير الدقيقة في حدوث خلل في الأعمال، وتقلل من الكفاءة وتؤدي إلى التأخير في إنجاز المشروعات.

يمكن التحقق من جودة المعلومات من خلال معايير محددة تسمى معايير الجودة (Quality Standard)، وهي موضحة بالشكل التالي:

جمع البيانات

قبل جمع أي نوع من المعلومات من خلال موقع الكتروني وقبل الشروع في الخطوة التالية في علم البيانات (وهي خطوة المعرفة)، يجب عليك التحقق من جودة المعلومات التي نحن على وشك الحصول عليها من الموقع.

إذا كانت المعلومات ليست موثوقة، فلا يمكنك بكل تأكيد المضي قدمًا في استخراج المعرفة وهذا يعني أنه يجب التحقق من المعلومات باتباع معايير الجودة الخمسة التالية:

  1. الدقة Accuracy

الدقة هي التأكد من صحة المعلومات ويجب أن تكون المعلومات صحيحة لكي تعد عالية الجودة، ويتم التحقق من دقتها من خلال المصادر الموثوقة، حيث يسهل التأكد من خلوها من الأخطاء الحسابية أو اللغوية أو غيرها من الأخطاء.

  1. الملاءمة Appropriateness

يجب أن تكون المعلومات مرتبطة بموضوعك أو بالسؤال البحثي، فكلما كانت المعلومات متعلقة بما تبحث عنه، فكلما كانت ملاءمتها أفضل.

يؤدي الحصول على معلومات إضافية لا تتعلق بما تبحث عنه إلى إضاعة الوقت في محاولة العثور على المعلومات المطلوبة.

  1. التوقيت Timeliness

يعد تاريخ نشر المعلومات جزءًا مهمًا، حيث يوضح مدى حداثة المعلومات ومناسبتها لموضوع البحث.

لذلك يجب التأكد من الحصول على آخر تحديث للمعلومات، ويجب عليك التحقق دائمًا من مصدر المعلومات.

  1. مستوى التفاصيل Level of Detail

تحدد جودة المعلومات أيضًا من خلال النظر إلى مستوى التفاصيل التي تقدمها تلك المعلومات.

يعد وجود الكثير من التفاصيل على المعلومات المطلوبة أمرًا صعبًا، بينما تؤدي قلة التفاصيل إلى صعوبة فهم المعلومات.

يعتمد مستوى التفاصيل على المشكلة ودراستها، فإذا كانت بسيطة تحتاج إلى مستوى قليل من التفاصيل، وإذا كانت معقدة فإنك تحتاج إلى مستوى عالٍ من التفاصيل.

إن المقدار الصحيح من المعلومات هو المعيار الأساسي لجودتها.

  1. الكفاية Completeness

تعد كفاية المعلومات مقياسًا مهمًا للشمولية المطلوبة للتأكد من أن المعلومات المقدمة تعطي صورة كاملة عن الواقع.

إن عدم الحصول على جميع المعلومات المطلوبة يعني أنك لن تتمكن من استخدامها بشكل صحيح، مما يعني أن تلك جودة المعلومات ضعيفة وغير كاملة ولا يمكن اتخاذ القرارات الصحيحة بناء على تلك المعلومات.

جمع البيانات

منصات البيانات المفتوحة (Open Data Platforms)

منصات البيانات المفتوحة هي منصات تدعم وصول المستخدمين لمجموعة ن البيانات المفتوحة.

جمع البيانات

تقدم منصة البيانات المفتوحة النموذجية بيانات المؤسسة التي تستضيف هذه المؤسسة.

تستضيف الجهات الحكومية والمؤسسات غير الربحية منصات البيانات المفتوحة التي تتيح وصول الجمهور إلى البيانات، وعلى وجه التحديد فإنها تقوم بجمع البيانات وتنظيمها باستمرار من مجموعة متنوعة من القطاعات العامة.

يمكن استخدام مجموعات البيانات هذه دون تكلفة مالية أو تحديات تقنية للوصول إليها.

كما يمكن إعادة استخدام البيانات المفتوحة وإعادة توزيعها مع مراعاة المتطلبات التي يفرضها ترخيص البيانات.

كذلك يمكن استخدامها من قبل مواطني الدول الأخرى.

قد تقدم الشركات أيضًا بيانات مفتوحة من خلال برامج المسؤولية الاجتماعية للشركات.

هذه بعض الاستخدامات الشائعة لمنصات البيانات المفتوحة:

  • الشفافية في إعداد الموازنة الحكومية والاتفاق على خدمات الدولة.
  • احصائيات أداء المؤسسة.
  • بينات أداء مختلف القطاعات العامة للدولة كالتعليم والرعاية الصحية والنقل والتي يمكن استخدامها في إجراء الأبحاث التي تبرز الأداء العام داخل هذه الدولة.
  • يمكن دمج مجموعة البيانات معًا واستخدامها في تطبيقات أخرى.

يمكن العثور على منصات البيانات المفتوحة الحكومية في المملكة العربية السعودية على عنوان الموقع الالكتروني:

https://open.data.gov.sa

خصوصية البيانات (Data Privacy)

مصطلح “البيانات الشخصية” يطلق على البيانات المتعلقة بالأشخاص وهي تلك البيانات التي يتم من خلالها يتم تحديد هوية شخص معين مثل: اسم الشخص وعائلته ورقم هاتفه.

أدت عملة توسع وسائل التواصل الالكتروني إلى زيادة في المخاطر المتعلقة بالخصوصية والتي عليك حماية نفسك منها.

تتضمن خصوصية البيانات قدرة الشخص أن يقرر بنفسه متى وكيف وإلى أي مدى يمكن مشاركة معلوماته الشخصية مع الآخرين أو تزويد الآخرين بتلك المعلومات.

لمعرفة المزيد من المعلومات عن خصوصية البيانات، ثم بالاطّلاع على الرابط التالي:

الأذونات القانونية لجمع واستخدام البيانات (Legal permissions to Collect and Use Data)

يتطلب جمع البيانات واستخدامها في المشروعات البحثية توفر التصاريح القانونية المناسبة، وعادة ما يقوم مجلس المراجعة المؤسسية (IRB) في المؤسسات بمراجعة مقترحات المشروعات البحثية قبل البدء بها لتحديد ما إذا كان المشروع يتبع المبادئ الأخلاقية واللوائح القانونية.

تختلف هذه التصاريح في طبيعتها، ولكن العاملين الرئيسين اللذين يجب أخذهما بعين الاعتبار هما:

  • الموقع الذي سيتم فيه تخزين البيانات.
  • موقع المستفيدين الذين سيتعاملون مع تلك البيانات.

تحتاج الشركات والمؤسسات إلى التأكد من أن الخدمات التي تجمع البيانات وتستخدمها متوافقة قانونيًا مع بلدانها.

جمع البيانات

البحث الموجه ومقارنة البيانات (Targeted Research and Data Comparison)

يتم استخدام البحث الموجه للتركيز على قضايا معينة ظهرت من البحث الرئيس.

على سبيل المثال، إذا استخدمت قيم درجة الحرارة للتنبؤ بالطقس في مدينة ما، ثم لاحظت أن مناطق معينة من هذه المدينة سجلت قيمًا قصوى لدرجات الحرارة، يتعين عليك في هذه الحالة إجراء بحث حول تلك المناطق لتقييم تأثير العوامل الأخرى على درجة الحرارة فيها.

يتم إجراء مقارنة البيانات عند وجود أكثر من مجموعة بيانات مسجلة لنفس المنطقة في فترات زمنية متماثلة. على سبيل المثال، قد يكون لديك مجموعة بيانات لقيم درجة الحرارة المسجلة لمدينة مارس 2021 ومجموعات أخرى مسجلة في مارس 2022 وبوجود مجموعتي البيانات هاتين يمكنك بسهولة إجراء مقارنة البيانات من أجل اكتشاف التغييرات في درجات الحرارة أو التغيرات خلال سنوات.

بإمكانك مراجعة محتوى موضوع “جمع البيانات” من بدايته وحتى نهاية قسم “جودة المعلومات”، من خلال الرابط التالي:

اختبر تحصيلك لمحتوى الموضوع من خلال الرابط التالي:

الواجب الإلكتروني

إلى هنا يكون قد انتهى موضوع “جمع البيانات”، لا تنسوا مراجعة أهداف التعلُّم أعلى المقال، وانتظرونا في الموضوع القادم!

روابط هامة

مقررات الفصل الدراسي الأول

مشاركة المقال عبر:

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *