البيانات الضخمة..واستخداماتها

​إذا كانت البيانات هي أرقام وكلمات خام لأي عملية سواء كانت صغيرة أم كبيرة، فإن المعلومات هي معالجة هذه البيانات لإخراج مادة واضحة ومفهومة من خلال الأرقام أو الكلمات. وفي ضوء ذلك؛ تبدو أهمية البيانات، وخاصة البيانات الضخمة التي لها تعريفات متعددة. فهذه النوعية من البيانات إذا أردنا الاستفادة منها، وتوظيفها في اتخاذ القرارات، فسنحتاج إلى برمجيات وأدوات معقدة وغير معتادة لتحليلها؛ نظراً لكبر حجمها وتضاعفها في الثانية الواحدة، بالإضافة الى حاجتنا الى المختصين لتحليل هذه البيانات الضخمة بوسائل تحليل حديثة للتعامل معها، كما أنها تتطلب مهارات عالية في البرمجيات الحديثة. وكل هذا لأن المعلومة في الوقت الحالي أصبحت ثمينة جداً جداً. ولأن هناك قرارات مهمة ستستخدم نتائج التحليل والدراسات؛ فالخطأ في التحليل سيؤدى إلى نتائج سلبية في القرار المتخذ وستزيد التكاليف على المنظمات وقد يؤدي ذلك إلى كوارث على مستوى المنظمات ثم على مستوى الدول. فكيف نستفيد من تلك البيانات؟ وماهي استخداماتها في الحياة العصرية؟

مع ثورة المعلومات في الوقت الحالي واستخداماتنا المتنوعة لحواسبنا الشخصية، وهواتفنا المتنقلة، ومواقع الشبكة العنكبوتية (الإنترنت) والكثير من المواقع التي تتيح لنا مجموعة كبيرة من المعلومات والتي يتحتم علينا تسجيل بياناتنا الشخصية ومعلوماتنا داخل تلك المواقع، خاصة مواقع التواصل الاجتماعي؛ لكي نحصل على أقصى استفادة منها. فكل ذلك يتيح تكوين بيانات ضخمة بإمكان المُخوَلين الاستفادة منها واستخدامها حسب توجهاتهم. وكلما كانت البيانات صحيحة؛ كلما كانت ضخامتها ذات استدلال واعٍ. لذا فإن بعض المواقع تحتم علينا التوقيع على صحة البيانات قبل التسجيل.

وفي عام 2012م حددت الحكومة البريطانية البيانات الضخمة بأنها أحد ثماني تقنيات مستقبلية عظيمة؛ وذلك وفقاً للكم الهائل والمتنامي الذي تضيفه لنا هذه النوعية من البيانات في الثانية الواحدة على مستوى العالم. وطبقًا لشركة "IBM" فنحن ننتج يوميًا أكثر من 2,5 "كونتيليون" بايت من البيانات، وهذا الرقم يدل على أن 90% من حجم البيانات حول العالم قد تم إنتاجها في العامين الأخيرين فقط؛ بسبب زيادة الأجهزة الرقمية والتقنيات التي تنتج تلك البيانات. وبالرغم من ذلك، فإن 90% منها هي بيانات غير منظمة، بينما نجد 10% منها فقط التي تتصف بأنها منظمة.

وأشارت شركة Intel إلى أن حجم البيانات التي أنتجها البشر منذ أن بدأ يعرف الكتابة حتى عام 2003م تقدر بنحو 5 اكسابايت (أي 5 ملايين تيرابايت)، وتجدر الإشارة هنا إلى أن الاكسابايت الواحد يمكنه تسجيل 36000 سنة من الفيديو عالي الجودة. لكن هذا الرقم تضاعف 500 مرة حتى عام 2012م ليصل إلى 2,7 زيتابايت (زيتابايت يساوي 1000 اكسابايت).  ومن ذلك نلاحظ الكم الهائل الذي تولده البيانات، خاصة ما توفره لنا مواقع التواصل الاجتماعي يومياً من بيانات ومواد وصور وأفلام ونصوص، وهذا الرقم في تزايد كل ثانية لكثرة أعداد المتعاملين والمستخدمين لتلك المواقع في العالم. ونلفت هنا إلى أن تحليل البيانات الضخمة يساعد المحللين والباحثين وحتى التجار على اتخاذ قرارات أفضل وأسرع باستخدام تلك البيانات التي كان يتعذر الوصول إليها مسبقًا أو غير قابلة للاستخدام. فباستخدام تقنيات التحليلات المتقدمة مثل: تحليلات النصوص، والتعلم الآلي، والتحليلات التنبؤية، وتعدين البيانات، والإحصاءات، ومعالجة اللغات الطبيعية؛ يمكن للشركات تحليل مصادر البيانات غير المستغلة مسبقًا بشكل مستقل أو مع بيانات المؤسسة الحالية للحصول على رؤى جديدة تؤدي إلى اتخاذ قرارات أفضل وأسرع.

البيانات الضخمة صديق أم عدو؟

تعتبر معاملات ATM وعمليات شراء بطاقات الائتمان والسحب جزءًا من ملف تعريف البيانات الذي يساعد الشركات على التنبؤ بعاداتك في الإنفاق. فبإمكان التعرف على بيانات كثيرة عنك مثل: العمر، والجنس، والتوجه، والحالة الاجتماعية، ومستوى الدخل، والذوق، والهوايات، وغيرها من البيانات التي قد نعتبرها عادية، ولكنها تساعد الكثير من المنظمات في الحصول على الكثير من المعارف والتخطيط لمستقبلها من حيث الوصول لاحتياجاتنا من خلال هذه البيانات، وبإمكانهم جمع ما لا تنوي التصريح به بدون علمك. لذا حرصت الحكومات على دراسة طرق حديثه للتحكم في الحصول على تلك البيانات وتحليلها.  وفي المقابل بالإمكان الاستفادة منها لحماية حقوقنا وحقوق الحكومات نفسها ومكافحة الاحتيال وحتى الإرهاب، كذلك الاستفادة منها في عمليات البحوث العلمية والتنبؤات المستقبلية.

مصادر البيانات الضخمة: ذكرت اللجنة الاقتصادية لأوروبا في تقرير لها بعنوان "ماذا تعنيه البيانات الضخمة للإحصاءات الرسمية" تصنيفا لمصادر البيانات الضخمة على النحو التالي:

  • المصادر الناشئة عن إدارة أحد البرامج، سواء كان برنامجاً حكومياً أو غير حكومي، كالسجلات الطبية الإلكترونية وزيارات المستشفيات وسجلات التأمين والسجلات المصرفية وبنوك الطعام.
  • المصادر التجارية أو ذات الصلة بالمعاملات، الناشئة عن معاملات بين كيانين، على سبيل المثال معاملات البطاقات الائتمانية والمعاملات التي تجرى عن طريق الإنترنت بوسائل منها الأجهزة المحمولة.
  • مصادر شبكات أجهزة الاستشعار، على سبيل المثال، والتصوير بالأقمار الصناعية، وأجهزة استشعار الطرق، وأجهزة استشعار المناخ.
  • مصادر أجهزة التتبع، على سبيل المثال تتبع البيانات المستمدة من الهواتف المحمولة والنظام العالمي لتحديد المواقع.
  • مصادر البيانات السلوكية-على سبيل المثال-مرات البحث على الإنترنت عن منتج أو خدمة ما أو أي نوع آخر من المعلومات، ومرات مشاهدة إحدى الصفحات على الإنترنت.
  • مصادر البيانات المتعلقة بالآراء-على سبيل المثال-التعليقات على وسائط التواصل الاجتماعي.

أمثلة من الواقع على البيانات الضخمة:

  • لدى واتس آب أكثر من مليار مستخدم، و يتم تداول أكثر من 42 مليار رسالة و حوالي 1,6 مليار صورة  بشكل يومي.
  • فيسبوك تتعامل مع أكثر من 50 مليار صورة من مستخدميها.
  • جوجل تتعامل مع حوالي 100 مليار عملية بحث في الشهر.​
 
جميع الحقوق محفوظة: معهد الإدارة العامة