الهام عابدی بدون دیدگاه

اهمیت big data

 

همانند اتفاقاتی که تو جهان هستی میفته و تعجب همه ی ما رو بر می انگیزه، دنیای کامپیوتر و هر چی که به اون مربوط میشه به همون اندازه عجیب؛ زیبا و قابل تامله! این موضوع رو فقط یه گیک یا کسی که فاصله ی نزدیکی با گیک شدن داره درک میکنه!

یکی از این موضوعاتی که تو زمره ی این عجایب جا داره، داستان داده ها در فضای صفر و یک هست!

حالا شاید براتون جالب باشه که من یا شمای نوعی چه سهمی در تولید دیتاها خواهیم داشت. طبق آمارهای جهانی، روزانه 3   Quintillion  بایت تولید دیتا داریم. یعنی  بایت. عددی که از تصور و حتی توصیف مون خارجه!

اگه بخوایم به عقب برگردیم؛ مثلا سال 2005 که اوج شکوفایی اینترنت بود، تا الان که سال 2017 رو پشت سر گذاشتیم تعداد کاربران اینترنتی از 1024 میلیون به 3578 میلیون رسیده، جدا از کسانی که واسطه مند به نت متصلن. که طبق این، تولید دیتا ها نیز با سرعتی چند برابر روندی صعودی داشته به خصوص در سه سال اخیر.

طبق تصویر زیر، برگرفته از سایت اوراکل این روند صعودی ذخیره دیتا تا سال 2020 پیش بینی شده که آمار خیره کننده ای داره.

در واقع در حال حاضر که اینترنت به جزئی جدا ناپذیر تو زندگی ما تبدیل شده در هر ثانیه ای که میگذره کلی داده، چند برابر قبل در حال ذخیره شدنه! میشه داده رو گوله برفی تعبیر کرد که با غلتوندن اون روی حجم بسیاری برف، که اونو به دیتا سنتر جهانی تشبیه میکنم، هی بزرگ و بزرگتر بشه.

ممکنه به خودتون بگید که اصلا داده ها شامل چه چیزایی هست ؟! در یک جمله میگم که داده ها می تونه هر چیزی رو در بر بگیره یعنی هر چیزی که بهش فکر می کنید و حتی فکر نمی کنید! تمام فعالیت هایی که در فضای نت انجام می گیره از کلیک ها و لمس و ضربه به مانتیتور ها گرفته تا ارسال ها و دریافت ها و لحظه لحظه هایی که تو جایی از وب توقف داشتیم و هر چیزی که قابل ذخیره شدن هست.

شاید براتون جالب باشه که بدونید پر استفاده ترین دیتاهایی که سراسر جهان در حال ذخیره شدنه، برای هر کدوم به چه میزانه. جدول زیر بیانگر این مسئله هست.

 

پر استفاده ترین

داده های جهانی

توئیت ها

(twitte)

روزانه

فعالیت های

face book

دیتاهای

پردازش شده

در google

آپلود ویدئو

در you tube

در دقیقه

تعداد ایمیل

دریافتی در

ثانیه

داده های

کاربران از

وسایل هوشمند

خرید و فروش

در amazon

مصارف

خانگی

روزانه

مقادیر

یا درصد کل

50 میلیون 700 بیلیون 24 پتابایت 20 ساعت ویدئو 2.9 میلیون 1.3 اگزابایت 60 درصد داده های کل 375 مگابایت

 

حالا جنبه ی با حال تره قضیه استفاده های مستقیم و غیر مستقیم از این داده هاست. یا به تعبیری سوء استفاده ها. چیزی که سال های اخیر خیلی رو بورسه همین مسنجر های ارتباطی هست که دزدیدن داده در راس اهداف شکل گیریشون قرار گرفته. یا مثلا شبکه های اجتماعی که با هر حرکت و فعالیت ما می تونن به علاقه مندی هامون، دوستی هامون، رفتارمون، عکس و فیلم های ما، حقایق زندگی ما و به هر چیز قابل ذخیره شدن به عنوان اطلاعات؛ پی ببرن و در نهایت یا استفاده کنن یا استفاده نکنن. همه ی داده هایی که خودمون به مرور زمان ارسال کردیم و گستره ای از روابط و شباهت ها رو به وجود اوردیم. نه تنها ما بلکه افراد اطراف ما رو نیز تحلیل کنن. مثلا شما حتما یه سری جاها به گزینه های پیشنهادی برخورد کردین. این گزینه ها حاصل تحلیل داده های شماست. حاصل بررسی خصوصیات شماست و حاصل دیدن ارتباطاتتان با دیگر افراد.

اینجاست که جهان کامپیوتر مشهور ترین و یا شاید هم محبوب ترین جهان شناخته شده در میان قشرهاست. علی الخصوص اقشار سیاسی!

جنگ ها، پیروزی ها، توافقات و اساسنامه هایی که بر پایه دزدیدن داده ها صورت می گیره علت علاقه ی سیاسیون به دیتا های بزرگه! علاقه ای که تجارت و استارتاپ بزرگی پشت اون نهفته هست.

در مورد تجارت الکترونیکی و یا تبلیغات اینترنتی هم هر کلیک کاربر، می تونه علاقه مندی های اونو برای شرکت های خرید و فروش دیجیتالی مشخص کنه. که این باز می تونه کاربر رو با توجه به روحیات و علاقه مندی ها به سمت خرید و فروش محصولاتشون راهنمایی کنه. در واقع این سایت های خرید و فروش؛ دیتاسنتر های عظیمی هستن که سیل عظیمی از داده های ما رو در اختیار دارن. اگه توسط شبکه های معروف اجتماعی به عضویت اون در بیاید جای هیچ تردیدی درش نیست!

یا گروهی تو همین مسئله ی تجارت بتونن اخبار و اطلاعاتی از رکود دریافت کنن و با همین داده ها با احتیاط به خرید و فروش بپردازن و از ورشکستگی جلوگیری یا سود زیادی رو کسب کنن.

همچنین گروهی دیگه می تونن از روی سیگنالای وسایل دیجیتالی، تجمع افراد رو در یه مکان مشخص کنن که این باز خود نشون دهنده ی شلوغی اون مکان یا اگه بخوایم نگاه کاربردی به این قضیه داشته باشیم مکان پرطرفداری برای خرید، سرگرمی و … افراد خواهد بود.

همه ی این ها مواردی هستن که نشون دهنده ی اهمیت دیتاها خواهد بود. موضوعی که شاید کمتر به اون فکر کنیم در حالیکه چه هوشمندانه مورد استفاده قرار می گیره!

bobz بدون دیدگاه

سخنی در مورد پیشتیبانی – Backup (قسمت اول)

همه ما میدانیم که باید از اطلاعاتی که بر روی کامپیوترهایمان ذخیره میکنیم یک نسخه پشتیبانی تهیه کنیم، با این حال خیلی از ما یا اینکار رو بصورت مرتب انجام نمیدهیم و یا به هر دلیلی پشت گوش میندازیم در این مطلب میخواهیم کمی در این مورد بیشتر صحبت کنیم پس با ما همراه باشید…

در دنیای گیک‌ها کلمه backup یکی از کلماتی هست که زیاد مورد استفاده قرار میگیرد اما اگر با خودمان روراست باشیم خیلی از ما تا زمانی که حداقل یکبار با تجربه تلخ و شخصی از دست دادن اطلاعاتمان رو به رو نشده ایم به اهمیت این موضوع پی نمیبریم.
خیلی وقتها پیش آمده که دوستان در گفتگوهای خودشان با غم و اندوه در مورد آن روز شومی صحبت کرده اند که یا سیستم عامل دستگاه کرش کرد و اطلاعات را از دست دادن و یا محل کارشان مورد سرقت قرار گرفت و اطلاعات مهم و حیاتی شرکت نیز با تجهیرات دیگر از دست رفت و یا انواع و اقسام بلاهای طبیعی از قطعی برق گرفته تا سیل و زلزله و…
جالب آنجاست که بعضی از این دوستان از این موضوع عبرت نگرفته و شاهد آن هستیم که اینگونه مشکلات چندین بار و به صورتهای مختلف برای آن‌ها بوجود آمده است ولی متأسفانه باز هم به روش قبلی خود ادامه میدهند.
در اینجا قصد ندارم یک روش قاطع و ثابت برای پشتیبانی گرفتن از فایلهای موجود روی سیستم را معرفی کنم تا همه از آن پیروی کنیم. منظور اصلی از نگارش این مطلب این هست که اهمیت پشتیبانی گرفتن از اطلاعات رو باید بخشی از زندگی گیکی خودمان محسوب کنیم.
باید به خودمان یاد بدهیم اگر در حال استفاده از هر نرم افزاری هستیم که خروجی آن میتواند یک فایل ذخیره شده بر روی کامپیوتر باشد در مرحله اول حداقل هر ۱ دقیقه یک بار دکمه ترکیبیctrl+s را بزنیم تا آخرین تغییرات را همیشه در اختیار داشته باشیم. باید یاد بگیریم در پایان هر روز یک کپی از تمامی فایلهایی که در آن روز با آن‌ها کار کرده‌ایم را بر روی یک فضای ذخیره سازی خارج از کامپیوتر ذخیره کنیم

و همزمان نسخه دیگری از آن را برروی سروری در اینترنت قرار دهیم تا در صورتی که در همان شب اتفاقی برای کامپیوترهایمان افتاد زحماتمان که ساعتها بر روی آن‌ها وقت صرف کرده‌ایم (فرق نمیکند که قطعه‌ ای از یک کد باشد یا عکس و …) را از دست ندهیم.
اینکه چگونه میتونیم فایلهای خودمان را (در اینجا بحث فایلهای شخصی میباشد و ما با برنامه ها و سیستم عامل کاری نداریم) از خطر نابودی نجات بدیم در‌ واقع بیشتر به این بر میگردد که آن فایل را چگونه بدست آوردیم. مثلاً اگر شما عکسی را در کنار ساحل با یکی از دوستان خود گرفته باشید از دست دادن این عکس میتواند ضربه‌ای جبران ناپذیر در زمینه از دست دادن اطلاعات محسوب شود و در عین حال اگر شما مثلاً قسمتی از یک سریال را دانلود کرده باشید با توجه به اینکه آن را دانلود کرده‌اید میتوانید در صورتی که آن را از دست بدهید دوباره نسبت به تهیه آن اقدام نمايد(البته بدون در نظر گرفتن هزینه و زمانی که نیاز است تا آن را دوباره دانلود کنید)

در مثال عکس بهترین کار این است که علاوه بر داشتن کپی از آن بر روی کامپیوتر یک کپی پشتیبانی از آن را در سرور شخصی خود بر روی اینترنت نگهداری کنید تا در صورتی که به هر دلیلی کامپیوتر شما در دسترس نبود (دزدیده شدن، خرابی فیزیکی، مشکلات نرم افزاری و ….) بتوانید با مراجعه به سرور خود بر روی اینترنت دوباره به آن دسترسی پیدا کنید.

علاوه بر این هیچ‌کس نمیتواند منکر آسانی و راحتی در دسترس بودن اطلاعات موجود بر روی سرورها شود.
بد نیست بعنوان یک گیک یاد بگیریم که از سرورها به جز برای اشتراک گذاری فایل با دیگران می‌شود استفاده های دیگری هم کرد مثلاً محلی برای نگهداری نسخه های پشتیبان مهم و حیاتی.

ادامه دارد…

parisa67 بدون دیدگاه

داده کاوی

تعریف داده کاوی

یعنی استخراج اطلاعات پیش بینی از پایگاه داده های بزرگ را داده کاوی گویند که یک فناوری جدید قدرتمند با توانایی بالا برای کمک کردن به شرکت ها با تمرکز بر روی مهمترین اطلاعات موجود در انبار داده های آن ها، می باشد. داده کاوی فرایند کشف اطلاعات عملی از مجموعه های بزرگ داده است و از تجزیه و تحلیل ریاضی برای استخراج الگوهای و روند هایی که در داده ها موجود است استفاده می کند. به طور معمول این الگوها را نمی توان از طریق اکتشاف داده های سنتی کشف کرد زیرا روابط بسیار پیچیده است و یا این که اطلاعات زیادی وجود دارد. داده کاوی شامل یک سری ابزار است این ابزارها چگونگی روند و رفتار های آینده را پیش بینی می کنند و به تجارت های کسب و کار و غیره اجازه تصمیم گیری بر اساس دانش را می دهد. تجزیه و تحلیل ارائه شده توسط داده کاوی فراتر از تجزیه و تحلیل ها با روش های ارائه شده گذشته است. ابزارهای داده کاوی به سوالات تجاری کسب و کارهای مختلف که با استفاده از روش های سنتی خیلی وقت گیر بود جواب می دهد آنها پایگاه های داده را برای یافتن الگوهای نهان موجود جست و جو می کنند و اطلاعات اشتباه که ممکن است کارشناسان را به اشتباه بیاندازد پیدا می کنند چونکه این اطلاعات خارج از انتظار آنها است. بیشتر بدانید