داده شامل اطلاعات است؛ اما این همهي ماجرا نیست. جزئیات یک حادثه یا اخباری دربارهی سلامت انسان دادهای نیست که ما با آن سروکار داشته باشیم. وقتی ما از داده صحبت میکنیم درواقع منظورمان مجموعهی داده، سازماندهی و ذخیرهسازی آن است.
در عصر اینترنت شرکتها و سازمانها در سراسر جهان دادههای بسیاری جمعآوری کردهاند که در ادامه به مقیاس گستردهی آنها میپردازیم. اکنون که کلان داده وجود دارد تاثیر بسیار بزرگی بر زندگی ما میگذارد.
کلان داده مجموعهی بسیار بزرگی از دادهها است که ابزارهای سنتی ما برای مدیریت این اطلاعات به کار نمیآیند. کلان داده میتواند اشکال مختلفی داشته باشد.
رایانههای شخصی ما بطور کلی توانایی مدیریت حجم کمی از دادهها را دارند. کل اطلاعاتی را که میتوانید وارد یک کامپیوتر کنید، در نظر بگیرید؛ در عین حال نرمافزارهای پایگاهداده قابلیت مدیریت حجمهای بزرگتری از اطلاعات را دارند. این ابزارها میتوانند روی دادههای یک درایو سخت قرار بگیرند؛ البته ممکن است به قفسههایی شامل نوتبوکها و پوشهها نیاز داشته باشند. اما این ابزارها برای رسیدگی به کل حجم اطلاعاتی که ما بهعنوان کلان داده به آنها اشاره میکنیم کافی نیستند. به همین خاطر روشهای جدیدی توسعه یافتهاند.
محاسبات ابری کارها را از کامپیوترهای ما روی سرورهای راه دور تخلیه میکند. به همین دلیل روشهای زیادی برای دسترسی و استفاده از اطلاعات وجود دارد.
کلان داده به خودیِ خود به وجود نیامده؛ چندین روند، علت وجود آن را تقویت کردهاند.
کلان داده و اینترنت اشیاء کاملا به یکدیگر وابستهاند. سازمانها باید بدانند با حجم انبوهی از اطلاعاتی که جمعآوری میشود، چهکاری باید انجام دهند. اشیاء از طریق اینترنت و به لطف دادههایی که در دسترسشان است میتوانند خودشان اقداماتی را صورت بدهند. هرچه دستگاههای بیشتری به این روش عمل میکنند دادههای بیشتری تولید میشود.
منظور از یادگیری ماشین در واقع توانایی یادگیری کامپیوتر بر مبنای دادهها است؛ همین توانایی اساس شکلگیری وضعیتهای مختلف رادیو اینترنتی پاندورا به سَبک مخصوص شما است. همچنین یادگیری ماشین در پشت پردهی پیشنهادات محتوای یوتیوب و نتفلیکس قرار دارد.
این پیشبینیها مبتنی بر الگوریتمها هستند. الگوریتم جستجوی گوگل و نیز الگوریتمی که تعیین میکند چه چیزی در فید خبری فیسبوک مشاهده کردهاید همگی مبتنی بر توانایی یادگیری ماشین هستند.
هوش مصنوعی گام بعدی پس از یادگیری ماشین است. در هوش مصنوعی نه تنها یادگیری کامپیوتر باز دادههاوجود دارد، بلکه کامپیوتر از این اطلاعات در راستای تصمیمگیری متکی به خود و شکلدهی رفتار خودش استفاده میکند. مایکروسافت و گوگل نمونههایی از تلاش برای ساخت رباتهای انسانی هستند؛ فیسبوک نیز هوش مصنوعی را برای کمک به جلوگیری از خودکشی به کار گرفته است. فناوری به سرعت در حال پیشرفت است، تا جایی که نمونههای متعددی وجود دارد که “تفکر کردنِ کامپیوتر” بهتر از نوع بشریِ آن عمل میکند.
منابع کلان داده به خودی خود هیچگونه اطلاعاتی را در اختیار ما نمیگذارند، در واقع شخصی باید باشد که مفهوم این اطلاعات را دریابد. در واقع کل کاری که در تجزیه و تحلیل کلان داده باید انجام شود به این صورت است: بررسی حجم زیادی از اطلاعات غیر قابل فهم و سپس فهمیدن آنچه میتوان از آن استخراج کرد.
کلان داده همواره در جهت بهبود روند زندگی کاربرد زیادی داشته است؛ در این بخش برخی از موارد کاربرد کلان داده را بررسی خواهیم کرد:
صنعت بیمه سلامت در زمینه اقتباس تکنولوژیهای جدید سرعت خوبی ندارد. برخی از ارائهدهندگان بیمههای بهداشتی، درمانی و سلامت در حال مهاجرت از کاغذ به ابزارهای ذخیرهسازی دیجیتالی هستند. با این وجود کلان داده در برخی زمینهها تفاوتهایی را ایجاد کرده است؛ یکی از این زمینهها یکپارچگی دادهها است. بیمهگذاران و ارائهدهندگان در حال کار روی ترکیب دادههای منابع مختلف هستند، دادههایی مانند مانند مطالبات، اشعه ایکس، یادداشتها و نسخههای پزشکان.
بسیاری معتقدند که اگر دادههای بیمه سلامت بهتر یکپارچهسازی میشدند میتوانستند بیمهی بهتری با هزینهای کمتر ارائه بدهند. در حالی که آمازون، برکشایر هاتاوی و جان پیرپونت مورگان اوایل سال جاری اعلام کردند در زمینه بیمه سلامت با یکدیگر همکاری میکنند، تکنولوژی را به عنوان نقطه تمرکز خود (مانند صفحه اصلی روزنامه گاردیَن) اعلام کردند
صنعت مالی کاملا مصرّ بر تصمیمگیریهای مبتنی بر تحلیلهای کامپیوتری است. سقوط آنی سهام وال استریت به علت معاملات خودکار از طریق ماشینهایی بود که بدون دخالت انسان سهام را به سرعت با قیمتی پایینتر میفروختند و با توجه به آنچه در بازار درحال رخ دادن بود سایر فروشندگان را وادار به فروش کرده و نسبت به فروش تحریک میکردند. این نوع تجارت، تجارت بسامد بالا نامیده میشود.
اکنون دانشمندانِ دادههای مالی، با استفاده از کلان دادهها پیشبینی میکنند که کدام سهام موفق خواهد بود و کدام یک احتمال دارد سقوط کند. همچنین بانکها هم به کلان دادهها به عنوان راهی برای افزایش درآمد نگاه میکنند
بازاریابی مدرن به دادهها وابستگی شدیدی دارد و ما هم با هر خریدی که انجام میدهیم اطلاعات زیادی تولید میکنیم. در این رابطه کلان داده وعدههای بسیاری به حوزهی بازاریابی داده است که اصلی ترین آنها پاسخ به دو نیاز اصلی است.
اول به کمک آنها میتوان درباره شخص خریدار، زمان، مکان، نوع و قیمت خرید اطلاعات کسب کرد؛ و مورد دوم به دست آوردن ارتباطی منطقی بین محصولاتی که مشتریان میبینند یا در موردشان میخوانند یا میشنوند و در نهایت چیزی که خریداری میکنند. برخی فروشگاهها با ردیابی کارتهای اعتباری و وفاداری مشتریان از طریق دوربین یا ردیابی تلفنشان میفهمند کدام بخش از فروشگاه بیشتر توجه آنها را جلب کرده است. مشتریان قبل از خرید باید به صورت آنلاین حسابهایی ایجاد کنند که این کار به سایتها اجازه میدهد نه تنها خریدهای آنها بلکه هر قلمی که آنها مشاهده میکنند را نیز ردیابی کنند.
در عوض تکنیکهایی مثل هدفگیری و شناسایی مشتری که نیمی از بودجهی بازاریابی را هدر میدهند و تنها برای کوتاهمدت اثربخش هستند، پاسخ به این دو نیاز بسیار اثربخشتر است.
در واقع فروشگاهها طرحهای خود را بر مبنای علاقه و رفتار مشتریان پایهگذاری میکنند تا شرایط همکاری بهتری را در تجارت پیدا کنند. فروشندگان آنلاین بر مبنای اطلاعات جمعیتشناختی و سایر معیارها دربارهی چیزی که ما میخواهیم ببینیم تصمیم میگیرند. فروشگاههای جدید غیر مجازی آمازون نمونهای از ادغام دو دنیا هستند.
همانطور که کلان داده با وعدههایی همراه است ریسکهایی نیز دارد؛
کاهش حریم خصوصی از جمله معایب بزرگ کلان داده است؛ اکثریت مردم بیشتر از هر زمان دیگری در تاریخچهی بشری دربارهی ما اطلاعات دارند. نه تنها پیدا کردن محل زندگی ما، بلکه دانستن در مورد جایی که میرویم، شخصی را که دوست داریم، نحوهی زندگی ما، و تفکرات ما نیز آسان است. این موضوع باعث میشود که مسائل شخصی و اجتماعی بیشتر در معرض دستکاری قرار بگیرند. ممکن است ما فریب بخوریم و رمز و شماره کارت اعتباری خود را از دست بدهیم یا تحت تاثیر قرار بگیریم تا به کاندیداهایی رای بدهیم که تمایلی به حمایت از آنها نداریم. دادههای بیشتر راههای بیشتری برای تبلیغکنندگان و شرکتهای رسانهای فراهم میکند تا میلها و ارزشهای ما را شکل دهند. نسبت به گذشته اطلاعات و دادههای بیشتری دربارهی ما وجود دارد و این دادهها در مکانهای بیشتری نگهداری میشوند و این مسئله باعث میشود اهداف بیشتری در معرض حمله قرار بگیرند. در حال حاضر سرقت دادههای ما به صورت غیر قابل کنترل و بی وقفه رخ میدهد. حتی شرکتهایی که روند درستی برای حفاظت از دادههای ما در مقابل حملات خارجی دارند اغلب خودشان فعالیتهای مشکوکی روی دادههای ما انجام میدهند، همانند چیزی که در فیسبوک شاهد بودیم. مسئلهی ریسک بعدی پیشبینیهایی است که افراد از طریق اطلاعات کلان داده انجام میدهند. مثلا آیا برای بیمهی سلامتی افرادی که عادتهای غذایی ناسالم دارند بیشتر هزینه کنیم؟ آیا باید امنیت و ارامش را در مناطقی که پیشبینی میکنیم افزایش بدهیم؟ آیا قیمت برای خریداران آنلاین که در مناطق فقیر زندگی میکنند افزایش مییابد؟
یافتن راههایی برای حفاظت از داده، احترام به حریم خصوصی و حفظ ارزشهایمان به صورت چالشهایی مداوم با روندی در جهت کلان دادهها ادامه خواهد داشت.
نشانی ایمیل شما منتشر نخواهد شد. بخشهای موردنیاز علامتگذاری شدهاند *
ذخیره نام، ایمیل و وبسایت من در مرورگر برای زمانی که دوباره دیدگاهی مینویسم.