ایتنا- هیچ انسانی روی کره زمین نیست که بتواند از اطلاعات دور باشد و در زندگی روزمره اش با انواع مختلف دادهها درگیری نداشته باشد.
اتومبیل معمولی و نهچندان لوکس شما مانند مدل Fusion روزانه ۲۵۰ گیگابایت اطلاعات را به شرکت فورد ارسال میکند تا سیستمهای تحلیلگر پیشرفته آن را مورد بررسی قرار دهند و کوچکترین نقص یا اختلال در کوتاهترین زمان مشخص شود. حال حسگرهای فراوانی که در آیفون، ساعت مچی هوشمند یا دیگر ابزارهای روزمره به کار گرفته شدهاند را در نظر بگیرید که اطلاعاتی مربوط به پیامهای شخصی، سلامت جسمانی، قرارهای ملاقات، گشتوگذارهای اینترنتی، عکسها و تصاویر، موسیقی، ارتباطات فیسبوکی و... را ذخیره میکنند.
به گفته شرکت IBM، این همان دنیای کلان دادهها(Big Data) است که ما هر روز از صبح تا شب با آن سر و کار داریم.
شرکت IBM در گزارش جدید خود که این هفته منتشر کرده است میگوید هیچ انسانی روی کره زمین نیست که بتواند از اطلاعات دور باشد و در زندگی روزمره اش با انواع مختلف دادهها درگیری نداشته باشد.
حجم این اطلاعات همیشه در حال گسترش است و به گفته شرکت IBM، در سال ۲۰۲۰ میلادی هر ۷۳ روز یکبار حجم دادههای ذخیره شده در سراسر جهان مربوط به بخش سلامت و بهداشت دو برابر افزایش مییابد.
اما توجه داشته باشید علم امروز هر اندازه هم که پیشرفت کرده است، هنوز نمیتواند از این منبع بزرگ استفاده کند و ۸۰ درصد اطلاعاتی که در طول روز تولید میشود سازماندهی نشدهاند و کاربرد خاصی برای انسان ندارند.
بمباران اطلاعاتی بخش تحقیق و توسعه در شرکت IBM بر اساس جدیدترین بررسی جامع خود به این نتیجه رسیده است که هماکنون در جهان ۷/۲ زتابایت اطلاعات موجود است. برای آنکه فهم دقیقتری از این حجم اطلاعات به دست آید، عدد ۷/۲ را با ۲۱ صفر مقابل آن در نظر بگیرید تا متوجه شوید جهان دیجیتال چقدر بزرگ شده است.
این بررسی پیشبینی میکند که در سال ۲۰۲۰ میلادی حجم اطلاعات جهانی نسبت به مقداری که هماکنون در اختیار داریم ۵۰ برابر بیشتر میشود و هر یک از کاربران در این رشد فزاینده نقش مؤثری برعهده دارند. کارشناسان میگویند اطلاعات و دادههایی که هر کاربر امروزی ظرف دو روز تولید میکند با اطلاعات بهجا مانده از ابتدای عصر دیجیتال تا پایان سال ۲۰۰۳ برابر است.
میزان استفاده از اطلاعات در جهان همچنان رو به افزایش است و پیشبینی شده است در سال ۲۰۲۰ در هر روز بیش از ۴۵۰ میلیارد نقل و انتقال اطلاعاتی در سراسر جهان انجام شود و برای ساماندهی این فرآیند، مرکز Akamai هر روز ۷۵ میلیون اتفاق اطلاعاتی تحلیل میکند تا آگهیهای تبلیغاتی بهتر و دقیقتر متناسب با نیازهای کاربران در اختیار آنها قرار گیرد.
شرکتها و سازمانهایی که با صرف هزینههای چند میلیون دلاری ابزارهای مخصوص تحلیل کلان دادهها را در اختیار گرفتهاند، تنها ۱۲ درصد آنها را مورد استفاده قرار میدهند و هر روز ۸۸ درصد از اطلاعات ارزشمندی که در سازمانهای مختلف به وجود میآید، دور ریخته میشود.
اهمیت این اتفاق به قدری افزایش یافته است که کارشناسان میگویند فرصت شغلی در بازار جهانی برای کسب افرادی که در زمینه کلان دادهها تخصص دارند سالانه ۴۶ درصد افزایش مییابد.
«راب بیردن» از مدیران IBM در این خصوص میگوید: «ارزش اصلی کلان دادهها را سازمانهای بزرگ میفهمند. حجم اطلاعاتی که این مراکز تولید میکنند از هماکنون تا سال ۲۰۲۰ میلادی ۵۰ برابر افزایش مییابد. نکته جالب در اینجاست که ۸۵ درصد دادههای مذکور از منابع جدید به دست میآیند.
این منابع همان دستگاههای موبایلی، شبکههای اجتماعی، اینترنت اشیا و... هستند که بزودی تمامی سازمانها را هدف قرار میدهند». در سال ۲۰۱۴ میلادی میانگین دستمزد هر کارشناس حوزه کلان دادهها در جهان ۱۲۰ هزار دلار بود و اگر او در سطح مدیریتی فعالیت میکرد، تا ۱۶۰ هزار دلار حقوق میگرفت.
اما کارشناسان میگویند رقم یاد شده برای سال جاری رشد ۵۰ درصدی را تجربه میکند تا بر این اساس متخصص امور اطلاعات و داده یکی از بیشترین دستمزدها در صنعت جهانی آیتی را دریافت کند.
اما به جز شرکتها و سازمانها، کاربران عادی در زمینه تولید داده و استفاده از آن نقش مهمی برعهده دارند. در سال ۲۰۱۲ میلادی گوگل در هر دقیقه بیش از ۲ میلیون کلیدواژه ارائه شده توسط کاربران جهانی را جستوجو کرد و با رشد باورنکردنی پایان سال ۲۰۱۴ میلادی گفته شد که ۴/۲ میلیارد کاربر آنلاین در جهان هر دقیقه ۴ میلیون کلیدواژه را در گوگل جستوجو کردهاند.
هر دقیقه در دنیای مجازی ۵/۲ میلیون واحد اطلاعات در فیسبوک ایجاد میشود، کاربران ۳۰۰ هزار توئیت جدید منتشر میکنند، اینستاگرام نزدیک به ۲۲۰ عکس جدید در اختیار میگیرد، روی یوتیوب معادل ۷۲ ساعت تصویر ویدیویی منتشر میشود، ۵۰ هزار ابزار از فروشگاه اینترنتی اپل بارگذاری میشود، ۲۰۰ میلیون پست الکترونیکی بین کاربران جهانی رد و بدل میشود، آمازون معادل ۸۰ هزار دلار کالا را به صورت اینترنتی میفروشد و همه اینها کلان دادههایی است که کاربر در طول روز با آنها سر و کار دارد و به صورت مستقیم یا غیرمستقیم حضور آنها را در زندگی روزمره خود احساس میکند.
دستاوردهای علمی بسیاری از دولتها اهمیت کلان دادهها را کشف کردهاند و با تمرکز بر آن میکوشند اهداف خود را پیش ببرند. برای مثال، «باراک اوباما» در سال ۲۰۱۲ میلادی متبحرترین کارشناسان اطلاعاتی جهان را در اختیار گرفت و به کمک آنها کلان دادهها را تحلیل کرد و در پایان مشخص شد تنها برگ برنده او برای پیروزی در انتخابات همین مسأله بوده است.
از آن زمان به بعد کاخ سفید اعلام کرد که مهمترین مشکلات پیشروی دولت امریکا باید با تحلیل کلان دادهها برطرف شود و این مسأله باعث شد ۸۴ برنامه جامع تحلیل کلان داده در ۶ وزارتخانه بزرگ این کشور به مرحله اجرا برسد.
در دیگر کشورها نیز فواید کلان دادهها بخوبی دیده شده است دولت هند در انتخابات ریاست جمهوری سال ۲۰۱۴ میلادی توضیح داد که تنها به کمک تحلیل اطلاعات وسیع مربوط به عموم مردم توانسته است پیروزی خود را تضمین کند.
در بریتانیا کلیه امور بهداشتی و درمانی به کلان دادهها واگذار شده است و سیستمهای بزرگ تمام اطلاعات مربوط به شهروندان این کشور را برای استفاده از خدمات سلامت بررسی میکنند.
سازمان ملل متحد نیز طرحهای بزرگی را با پشتیبانی از سیستمهای تحلیلی کلان دادهها تعریف کرده است که به کمک آنها مطالعات جهانی خود را دقیقتر جلو میبرد.اما شرکت IBM که بزرگترین تولیدکننده سیستمهای تحلیلگر کلان دادهها در عرصه پزشکی محسوب میشود، معتقد است که این بخش جدید در صنعت آیتی به جز دولتها میتواند در دیگر بخشهای جامعه هم کاربرد داشته باشد.
برای مثال زمانی که تلسکوپ SDSS سال ۲۰۰۰ میلادی فعالیت خود را آغاز کرد، در چند هفته نخست فعالیت خود موفق شد معادل کل تاریخ ستارهشناسی اطلاعات ارزشمند جمعآوری کند. این سیستم هر شب ۲۰۰ گیگابایت اطلاعات تولید میکرد و در مجموع موفق به جمعآوری ۱۴۰ پتابایت شد. اما هماکنون پیشبینی میشود که سال ۲۰۱۶ میلادی تلسکوپهای جدید این حجم از اطلاعات را هر ۵ روز یکبار تولید کنند.
در بخش پزشکی همچنین گفته میشود که کشف رمز سیستم ژنتیکی هر انسان به طور میانگین ۱۰ سال به طول میانجامد و هماکنون با استفاده از سیستمهای تحلیلی کلان دادهها میتوان این کار را در کمتر از یک شبانهروز انجام داد.
مرکز NCCS به عنوان بزرگترین شبیهساز وضعیت آبوهوایی جهان وابسته به سازمان ناسا هر روز ۳۲ پتابایت اطلاعات را از ماهوارهها و ایستگاههای زمینی دریافت میکند که این حجم گسترده از اطلاعات هم توسط سیستمهای تحلیلگر کلان دادهها کاربردی میشود.
با این اطلاعات و بررسیهای شرکت IBM، انسان کنونی دریای گستردهای از اطلاعات را پیشروی خود میبیند که اگر شنا کردن در آن را بلد نباشد، به طور یقین غرق خواهد شد.