القائمة الرئيسية

الصفحات

البيانات الضخمة (Big data)

البيانات الكبيرة


تشير البيانات الضخمة إلى مجموعة البيانات الكبيرة جدًا أو المعقدة بحيث لا يمكن التعامل معها بواسطة برامج معالجة تطبيقات البيانات التقليدية . توفر البيانات التي تحتوي على العديد من الحقول (الصفوف) قوة احصائية أكبر ، بينما قد تؤدي البيانات ذات التعقيد العالي (المزيد من السمات أو الأعمدة) إلى معدل اكتشاف خاطئ . تشمل تحديات تحليل البيانات الضخمة التقاط البيانات ، وتخزين البيانات ، وتحليل البيانات ، والبحث ، والمشاركة ، والنقل ، والتصور ، والاستعلام ، والتحديث ، وخصوصية المعلومات ، ومصدر البيانات. ارتبطت البيانات الضخمة في الأصل بثلاثة مفاهيم أساسية : الحجم والتنوع والسرعة .  يمثل تحليل البيانات الضخمة تحديات في أخذ العينات ، وبالتالي كان يسمح في السابق فقط بالملاحظات وأخذ العينات. وبالتالي ، فإن المفهوم الرابع ، الصدق ، يشير إلى جودة البيانات أو بصيرتها. بدون الاستثمار الكاففي الخبرة للتحقق من صحة البيانات الضخمة ، يمكن أن ينتج عن حجم البيانات وتنوعها تكاليف ومخاطر تتجاوز قدرة المؤسسة على إنشاء القيمة والحصول عليها من البيانات الضخمة 

النمو غير الخطي لسعة تخزين المعلومات الرقمية العالمية وتضاؤل ​​التخزين التناظري1

يميل الاستخدام الحالي لمصطلح البيانات الضخمة إلى الإشارة إلى استخدام التحليلات التنبوئية ، أو تحليلات سلوك المستخدم ، أو بعض طرق تحليل البيانات المتقدمة الأخرى التي تستخرج القيمة من البيانات الضخمة ، ونادرًا ما تستخدم حجمًا معينًا من مجموعة البيانات. "ليس هناك شك في أن كميات البيانات المتاحة الآن كبيرة بالفعل ، ولكن هذه ليست الخاصية الأكثر صلة بهذا النظام البيئي الجديد للبيانات."  تحليل مجموعات البيانات يمكن أن يجد ارتباطات جديدة "لتحديد اتجاهات الأعمال ، والوقاية من الأمراض ، ومكافحة الجريمة وما إلى ذلك". 

 العلماء ورجال الأعمال والممارسون الطبيون والإعلان والحكومات على حد سواء ، تواجه بانتظام صعوبات مع مجموعات البيانات الكبيرة في مجالات تشمل عمليات البحث  الالكتروني تكنولوجيا المال ، وتحليلات الرعاية الصحية ، وأنظمة المعلومات الجغرافية ، والمعلوماتية الحضرية  ، والمعلوماتية التجارية . يواجه العلماء قيودًا في عمل العلوم الإلكترونية  ، بما فذلك الأرصاد  الجوية وعلم الجينوم وعلم الوصلات ومحاكاة الفيزياء المعقدة وعلم الأحياء والبحوث البيئية . 


.نما حجم وعدد مجموعات البيانات المتاحة بسرعة حيث يتم جمع البيانات بواسطة أجهزة مثل الأجهزة المحمولة ، وأجهزة إنترنت الأشياء  الرخيصة والمتعددة المستشعرة للمعلومات ، والهوائي ( الاستشعار عن بعد ) ، وسجلات البرامج ، والكاميرات ، والميكروفونات ، وتحديد الترددات الراديوية أجهزة قراءة (RFID) وشركات الاستشعار الاسلكية.  تضاعف نصيب الفرد من القدرة التكنولوجية في العالم لتخزين المعلومات كل 40 شهرًا منذ الثمانينيات.  اعتبارًا من عام 2012 ، يتم إنشاء 2.5 إكسابايت (2.5 × 2 60 بايت) من البيانات يوميًا . بناءً على تنبؤ تقرير IDC ، كان من المتوقع أن ينمو حجم البيانات العالمية بشكل كبير من 4.4 زيتابايت إلى 44 زيتابايت بين عامي 2013 و 2020. وبحلول عام 2025 ، تتوقع IDC أنه سيكون هناك 163 زيتابايت من البيانات.  وفقًا لـ IDC ، يُقدر الإنفاق العالمي على البيانات الضخمة وحلول تحليلات الأعمال (BDA) إلى 215.7 مليار دولار في عام 2021.  بينما تقرير Statisa ،  م ن المتوقع أن ينمو سوق البيانات الضخمة العالمية إلى 103 مليار دولار بحلول عام 2027.  في عام 2011 شركة ماكينزي  وشركات وفقًا للتقرير ، إذا كانت الرعاية الصحية في الولايات المتحدة ستستخدم البيانات الضخمة بشكل خلاق وفعال لدفع الكفاءة والجودة ، يمكن للقطاع أن يخلق أكثر من 300 مليار دولار في القيمة كل عام  في الاقتصادات المتقدمة في أوروبا ، يمكن للمسؤولين الحكوميين توفير أكثر من 100 مليار يورو (149 مليار دولار) في تحسينات الكفاءة التشغيلية وحدها باستخدام البيانات الضخمة.  ويمكن لمستخدمي الخدمات التي تم تمكينها بواسطة بيانات الموقع الشخصي الحصول على 600 مليار دولار من فائض المستهلك.  سؤال واحد للمؤسسات الكبيرة هو تحديد من يجب أن يمتلك مبادرات البيانات الضخمة التي تؤثر على المنظمة بأكملها.

غالبا ادارة قواعد البيانات العلائقية وحزم البرامج الإحصائية لسطح المكتب المستخدمة لتصور البيانات صعوبة في معالجة البيانات الضخمة وتحليلها. قد تتطلب معالجة وتحليل البيانات الضخمة "برمجيات متوازية بشكل كبير تعمل على عشرات أو مئات أو حتى آلاف الخوادم".  ما يوصف بأنه "بيانات ضخمة" يختلف باختلاف قدرات أولئك الذين يحللونها وأدواتهم. علاوة على ذلك ، فإن توسيع القدرات يجعل البيانات الضخمة هدفًا متحركًا. "بالنسبة لبعض المؤسسات ، قد تؤدي مواجهة مئات الجيجا بايت من البيانات لأول مرة إلى الحاجة إلى إعادة النظر في خيارات إدارة البيانات. وبالنسبة للآخرين ، قد يستغرق الأمر عشرات أو مئات التيرابايت قبل أن يصبح حجم البيانات اعتبارًا مهمًا. 



تعليقات