با خطرناک ترین ویروس های کامپیوتری تاریخ آشنا شوید

بهتر است قبل از نگهداری اطلاعات خود فقط بر روی هارد کامپیوتر با ویروس ها وخطرات آن آشنا شوید وقتی کامپیوتر کرم دارد! با خطرناک ترین ویروس های کامپیوتری تاریخ آشنا شوید

ویروس های کامپیوتری در واقع هیچ قصدی به جز از کار انداختن کامپیوتر شما و تبدیل آن به یک ماشین بلا استفاده ندارند. آنها بی رحمانه به دنیای مجازی خصوصی شما وارد می شوند و هر چه را که به آن دسترسی پیدا کنند را از بین می برند؛ به طور کلی آنها برای آزار شما خلق شده اند. در مواجهه با آنها ،شما دو راه دارید؛ یا در کمال آرامش و بیخیالی سیستم خود را به یک زامبی تبدیل می کنید که با هر تماس زندگی یک نفر دیگر را هم تبدیل یه کابوس می کند (معمولا سیستم های مورد استفاده در کافی نت ها و دانشگاه ها این روش را به کار می گیرند!) یا مجبورید دست به کارهایی بزنید که عمدتا باب میلتان نیست؛ مثلا بخشی از اطللاعاتتان را پاک کنید، یا حتی مجبور شوید کل اطلاعات را پاک کنید یا ویندوزتان را عوض کنید. شاید هم متوسل به استفاده از برنامه های آنتی ویروسی شوید که همیشه در منابع غیر رسمی اعلام می شود آنها خود عامل خلق این ویروس ها هستند، آن هم فقط به خاطر فروش بیشتر.البته به لطف نبود قوانین کپی رایت در کشور ما از این قضیه مستثنا هستیم…بگذریم. با ما باشید با معرفی ۵ ویروس خطرناک کامپیوتری در کل تاریخ دنیای سایبری.

I Love You

شاید این ویروس کینه ای ترین ویروسی باشد که تا به حال ساخته شده.هدفش خرابکاری کامپیوترهای سرتاسر دنیا بود که با آلوده کردن حدود ۱۰ درصد از کامپیوتر های متصل به اینترنت در دنیا و ایجاد خسارتی ۱۰ میلیارد دلاری به نوعی تا حدی به خواسته اش رسید. این ویروس به وسیله ایمیلی با موضوع I Love You که یک جمله محرک برای همه انسان هاست، منتقل می شد و برای اینکه فریبنده تر نیز باشد،ایمل حاوی یک فایل با مضمون Love-Letter-For-You.TXT.vbs نیز بود.به محض اینکه شخص فایل مربوطه را باز می کرد، ویروس به صورت اتوماتیک خود را برای ۱۰ نفر از لیست مخاطبان موجود در Adress Book ویندوز، ایمیل می کرد تا شاید آنها هم به این ویروس آلوده شوند.با این گسترش تصاعدی عجیب هم نیست که چرا این ویروس توانست این حجم بالای کاربر ها را آلوده کند.

Melissa

Melissa در مارس ۱۹۹۹ پس از ضربه زدن به سیستم ارسال ایمل مدرن آن زمان در صدر اخبار قرار گرفت. این ویروس که به وسیله David L ساخته شده بود از طریق ایمیلی حاوی فایل list.doc منتشر می شد.وقتی شخص فایل را باز می کرد، ویروس با پیدا کردن لیست مخاطبین Outlook ،ایمل آلوده را به ۵۰ نفر از افراد موجود در لیست ارسال می کرد و با ارسال پیامی با مضمون “Here is the list you asked for…do not show anyone” آنها را فریب می داد. بعدها FBI ، David L را بازداشت و او را ۵۰۰۰ دلار به خاطر ساخت خطرناک ترین ویروس آن زمان جریمه کرد.

My Doom

My Doom در سال ۲۰۰۴ با رشد تصاعدی غیر قابل کنترلی که توسط ارسال ایمیل یا مضامین متفاوت برای افراد متفاوت بدون استفاده از الگویی خاص ایجاد شد، دنیای سایبری را تحت تاثیر خود قرار داد. این ویروس به روش های مختلفی کاربران را آلوده می کرد و جالب ترین آن زمانی بود که کاربر با یک اخطار به ظاهر بسیار معمولی “Mail Transaction Failed” مواجه می شد و با کلیک کاربر بر روی آن محتوای ویروس پخش و کرم جاسازی شده در آن در سیستم رها می شد و به طور خودکار به سراغ لیست مخاطبان موجود می رفت و خود را برای آنها ارسال می کرد.با این مکانسیم هوشمندانه، مطمئنا باور ضرر ۳۸ میلیارد دلاری آن به استفاده کنندگان از سرویس های ایمل، سخت نخواهد بود.

Code Red

این ویروس با نفوذ به سرور Microsoft Internet Information توانست به بسیاری از سرورهای دنیا نفوذ کند.نکته جالب در مورد این ویروس آن است که این ویروس برای آلوده کردن سیستم شما حتی نیاز به یک فایل ارسال شده از طریق ایمیل یا حتی باز کردن یک فایل ندارد و فقط و فقط با وجود یک ارتباط فعال به اینترنت می توانست پخش شود.با باز کردن یک صفحه وب، بعد از تخریب حالت گرافیکی آن، یک پیام روی صفحه نمایش کاربر نمایان می شد: “Hacked By Chinese” و به همین سادگی سیستم آلوده به این ویروس خطرناک می شد که توانست در عرض کمتر از یک هفته، ۲.۶ میلیارد دلار ضرر ایجاد کند و نزدیک به ۴۰۰.۰۰۰ سرور اینترنتی از جمله سرور کاخ سفید را از کار بیاندازد.

Sasser

Sasser یک کرم اینترنتی بود که در سال ۲۰۰۴ کشف شد. کرمی که سیستم میلیون ها کاربر را با اثرات مخرب و عذاب آورش آزار داد. این کرم ،ابتدا سیستم را کند و به تدریج با تاثیر بر زیرساخت های سیستم، آن را از کار می انداخت؛ حتی کار را به جایی می کشاند که مجبور بودید برای راه اندازی مجدد سیستم، بیخیال دستورات سیستم عامل شوید و کامپیوتر را از برق بکشید. این کرم با تاثیر گذاری بر روی LSASS که قوانین امنیتی حساب اصلی رایانه را بررسی می کرد باعث کرش کردن آن می شد. Sasser در مدت زمان حضورش بیش از یک میلیون کاربر را آلوده کرد که شامل سیستم های مورد استفاده در زیرساخت های حیاتی نظیر بنگاه ها، بیمارستان ها، خطوط هوایی و مراکز حمل و نقل عمومی می شد.

انواع راهکارهای ذخیره سازی و نگهداری اطلاعات

انواع راهکارهای ذخیره سازی و نگهداری اطلاعات

. Storage Area Network یا SAN یک شبکه با سرعت بالا می باشد که از تجهیزات ذخیره سازی اطلاعات که آنها نیز به نوبه خود به سرورهای سخت افزاری یا مجازی متصل شده اند تشکیل شده است. ساختار ذخیره سازی اطلاعات در این نوع شبکه ها به صورت Block Level می باشد که همین موضوع باعث می شود که نرم افزارهای کاربردی که بر روی سرورهای شبکه وجود دارند براحتی بتوانند از طریق شبکه به اطلاعات موجود در SAN دسترسی پیدا کنند. دستگاه های ذخیره سازی اطلاعات SAN می توانند شامل Tape Library هم باشند اما در بیشتر موارد از هارد دیسک های سخت افزاری تشکیل شده اند که در کنار هم قرار گرفته اند و در قالب RAID در SAN کار می کنند.

مقایسه کارایی SAN و DAS

شاید این سئوال برای شما پیش بیاید که چرا سازمان ها و شرکت های بزرگ از SAN برای ذخیره سازی اطلاعات استفاده می کنند و این نوع ساختار ذخیره سازی اطلاعات را به استفاده از DAS یا Direct Attached Storage ترجیح می دهند ، پاسخ این سئوال بسیار ساده است دستگاه های SAN دارای انعطاف پذیری ، دسترسی پذیری و کارایی بسیار بالاتری نسبت به دستگاه های ذخیره سازی Direct Attached Storage یا DAS هستند. با توجه به اینکه دستگاه های SAN وابستگی دستگاه های ذخیره سازی اطلاعات به سرورها را حذف می کنند و بصورت مجزا می توانند در شبکه ایفای نقش کنند طبیعی است که هر نرم افزاری بر روی هر سروری در شبکه می تواند به این منابع ذخیره سازی دسترسی پیدا کند و همین موضوع باعث بالا بردن کارایی هر چه بیشتر تجهیزات SAN در شبکه می شود. اگر قرار باشد به فضای ذخیره سازی فعلی خود هارد دیسکی اضافه کنید اینکار را صرفا بر روی دستگاه SAN انجام می دهید و براحتی منابع ذخیره سازی اطلاعات خود را افزایش می دهید ، این امر خیلی می تواند در کاهش فضای مصرفی در اتاق سرور یا Data Center کاربردی باشد. در کنار آن هزینه های یک سازمان نیز کاهش پیدا می کند زیرا برای اضافه کردن هارد دیسک های بیشتر دیگر نیازی به اضافه کردن سرور جدید در شبکه نمی باشد. دستگاه های ذخیره سازی SAN Storage امروزه فقط از ارتباطات فیبر نوری برای انتقال اطلاعات بین سرورها و SAN استفاده می کنند و این بدین معناست که سرعت رد و بدل شدن اطلاعات در این میان بسیار سریعتر از دستگاه های DAS می باشد.

امروزه ما این نوع ارتباطات فیبر نوری درون SAN را به Fibre Channel SAN Storage می شناسیم ، البته پروتکل های دیگری هم وجود دارند اما این روش سریعترین روش و کارا ترین روش ارتباطی می باشد. با توجه به اینکه بر روی یک SAN Storage ارتباطات شبکه ای زیادی می توان برقرار کرد و سرورهای مختلف را حتی در فضاهای کاری دور به هم ارتباط داد این امر باعث بالا رفتن کارایی و دسترسی پذیری سرورها می شود ، معمولا ساختارهای کلاسترینگ در شبکه های بزرگ را با استفاده از همین تجهیزات SAN انجام می دهیم. در نهایت جدا کردن فضای ذخیره سازی اطلاعات از روی سرورها و قرار دادن آن بر روی یک SAN Storage باعث بالا رفتن و بهینه تر شدن قدرت پردازشی CPU های موجود بر روی سرور خواهد شد. DAS ها خواه ناخواه کمی قدرت پردازشی را به خودشان اختصاص می دهند.
تجهیزات SAN Storage می توانند وظایف مدیریتی شبکه را ساده تر کنند

SAN Storage ها برای انجام دادن فرآیندهای Backup گیری و پیاده سازی Disaster Recovery ها بسیار بسیار کارآمد هستند. در یک SAN شما می توانید براحتی اطلاعاتی را از هارد دیسک های یک SAN به SAN دیگر منتقل کنید و در این میان حتی کوچکترین ارتباطی با سرور اصلی مالک اطلاعات برقرار نکنید ، این یعنی عدم وابستگی اطلاعات به سرورها و چنین قابلیتی Backup گیری را به شدت کارا می کند. تصور کنید که می خواهید یک Backup از اطلاعات موجود در هارد دیسک موجود بر روی SAN تهیه کنید ، در حالت معمول و بر روی سرورهای فیزیکی این عملیات می تواند به شدت CPU های سرور را درگیر کند اما در چنین مواقعی اصلا CPU های سرور پردازشی را انجام نخواهند داد. برخی از SAN ها از تکنولوژی های شبکه ای استفاده می کنند که می تواند به SAN این قابلیت را بدهند که در فواصل طولانی نیز به سرویس دهی خود ادامه دهد ، تکنولوژی Fibre Channel از این دسته از تکنولوژی هاست ، شما می توانید دو عدد Data Center داشته باشید که بر روی هر کدام از آنها دو دستگاه SAN Storage داشته باشید و این دستگاه ها از طریق لینک های فیبر نوری اطلاعات را با همدیگر Replicate کنند و در نتیجه شما می توانید Backup های خود را در محل های بسیار دورتر از محل اصلی قرار گیری اطلاعات قرار دهید و یک Off Site Backup ایجاد کنید. با راه اندازی SAN storage بعضا شما دیگر نیازی به استخدام نیروهای زیاد برای انجام کارهای مدیریتی شبکه نیستید و از همه بهتر اینکه با وجود SAN شما می توانید سرورهای خود را از طریق هارد دیسک های SAN بوت کنید و این باعث کاهش زمان بوت یک سیستم و از طرفی سهولت در جایگزینی سرورها خواهد شد.

 ( راهکارهای جایگزین SAN Storage )

قبل از اختراع تجهیزات ذخیره سازی SAN سازمان ها بیشتر از دستگاه های ذخیره سازی به نام Direct Attached Storage یا DAS استفاده می کردند. همانطور که از نام این دستگاه مشخص است Direct Attached Storage ها مستقیما به سرور متصل می شوند. برخی از سازمان ها امروزه نیز همچنان از DAS استفاده می کنند ، دلیل استفاده از این دستگاه هزینه پایین و پیاده سازی ساده تر نسبت به تجهیزات SAN است. به هر حال برای سازمان های بزرگ مزایایی که SAN Storage ها به کارایی سرورهای سازمان می دهند با هزینه ای که برای آن پرداخت می شود کاملا تناسب دارد.
برخی اوقات پیش می آید که مردم دو کلمه را با هم اشتباه می گیرند ، SAN و NAS که مخفف کلمات Networked Attached Storage می باشد. مهمترین روش تشخیص این دو واژه در ترکیب کلمات آن است ، SAN یک مجموعه از دستگاه ها می باشد که به خودی خود شبکه ای برای ذخیره سازی اطلاعات ایجاد می کنند در حالیکه NAS ها فقط یک یا چندین هارد دیسک می باشند که با یک سیستم عامل ساده در شبکه قابل دسترس می باشند و هیچگونه پیچیدگی خاصی در آنها وجود ندارد. SAN ها ساختار Block Level برای ذخیره سازی اطلاعات و سرورها ارائه می دهند در حالیکه NAS ها ساختار File Level در اختیار کاربران قرار می دهند. در خصوص تفاوت های کلی این دو دستگاه پیشنهاد می کنم مقاله خودم با عنوان تفاوت NAS و SAN را که در انجمن تخصصی فناوری اطلاعات ایران یا ITPRO نوشته ام را در همین لینک مراجعه کنید.

پیاده سازی یک Storage Area Network یا SAN

برای پیاده سازی یک SAN ساده شما نیاز به سه قسمت اصلی دارید ، SAN Switch ، یک دستگاه ذخیره سازی و یک سرور . همچنین شما برای متصل کردن دستگاه SAN با سرورها و ارتباطات بین آنها با نرم افزار مدیریتی SAN به کابل نیز نیازمند هستید. در بسیاری از موارد واقعی پیاده سازی SAN Storage یک SAN می تواند شامل سویچ ها ، دستگاه های ذخیره سازی و سرورهای مختلفی باشد ، و شاید در همین ساختار ما نیاز به روتر و Bridge و حتی Gateway نیز برای گسترش دادن شبکه SAN و برقراری اتصال با نقاط دیگر Data Center را داشته باشیم.توپولوژی های پیاده سازی SAN Storage ها در شبکه کاملا با اندازه و نیازهای یک سازمان بایستی در نظر گرفته شود. فرآیند پیاده سازی SAN نیازمند یک سری اقدامات است
اول اینکه شما باید طراحی SAN خود را انجام دهید ، تمامی نیازهای فعلی و آینده سازمان خود را در نظر بگیرید. دوم اینکه شما باید برای پیاده سازی SAN یک برند خاص را انتخاب کنید و سری تجهیزات سخت افزاری و نرم افزاری لازم مربوطه را تهیه کنید ، معمولا در حال حاضر SAN Storage های شرکت HP و EMC بیشترین استفاده را در سازمان های دولتی و خصوصی دارند. در آخر شما نیاز به نصب سخت افزارها و نرم افزارها و انجام پیکربندی های لازم بر روی نرم افزار مدیریتی دستگاه هستید که بتوانید SAN خود را مدیریت کنید. پیاده سازی SAN Storage ها معمولا یک فرآیند پیچیده است که نیازمند دانش و تخصصی ویژه در خصوص دستگاه های SAN می باشد ، مخصوصا اگر دستگاه خود را می خواهید در طراحی های پیشرفته و حرفه ای استفاده کنید قطعا به کارشناسان حوزه Storage نیاز خواهید داشت.

استانداردهای مورد استفاده در Storage Area Network ها یا SAN

شرکت های مختلفی در زمینه تولید تجهیزات ذخیره سازی SAN Storage در دنیا فعالیت می کنند که از مهمترین آنها می توان به شرکت HP و EMC اشاره کرد ، همین سازندگان برای خود یک سری استانداردها برای SAN Storage ها ایجاد کرده اند و از آن تبعیت می کنند. از مهمترین استانداردهای مورد استفاده در SAN Storage ها می توان به Storage Networking Industry Association یا SNIA و Storage Management Initiative Specification یا SMI-S و همچنین استانداردهای دیگر مشابه اشاره کرد. حتی در خصوص شیوه استفاده SAN Storage ها از ارتباطات فیبر نوری نیز در قالب استانداردی مثل Fibre Channel Industry Association یا FCIA تعریف می شود. ارتباطات فیبر نوری یا Fibre Channel امروزه بیشترین استفاده را در تجهیزات SAN دارند اما راهکارهای SAN فقط به فیبر نوری محدود نمی شود و استاندارهای دیگری مثال iSCSI نیز وجود دارد که ارتباطات iSCSI را فراهم می کند و حتی شما می توانید از FCOE یا Fibre Channel Over Ethernet نیز در این زمینه استفاده کنید.

SAN Fabric چیست ؟

سخت افزاری که Workstation ها و Server های ما را به دستگاه های موجود در SAN Storage متصل می کند در اصطلاح فنی FABRIC گفته می شود. SAN Fabric این امکان را برای ما ایجاد می کند که هر سروری بتواند به هر دستگاه ذخیره سازی SAN ای با استفاده از تکنولوژی سویچینگ فیبر نوری متصل شود. امیدوارم مورد توجه شما قرار گرفته باشد. ITPRO باشید
نویسنده : محمد نصیری
منبع : انجمن تخصصی فناوری اطلاعات ایران
هرگونه نشر و کپی برداری بدون ذکر منبع و نام نویسنده  دارای اشکال اخلاقی می باشد .

Big data چیست ؟

Big data  چیست ؟
Big data اصطلاحی است برای مجموعه داده های حجیم که بزرگ ، متنوع ، با ساختار پیچیده و با دشواریهایی برای ذخیره سازی ، تحلیل و تصویرسازی (نمایش) ، پردازشهای بیشتر یا نتایج میباشد. پروسه تحقیق بر روی داده های حجیم جهت آشکارسازی الگوهای مخفی و راز همبستگی ها ، تجزیه و تحلیل big data نامیده میشود. این اطلاعات مفید برای سازمانها وشرکتها در جهت کسب بینش غنی تر و عمیق تر و موفقیت در رقابت کمک میکند. به همین دلیل اجراهای big data نیاز دارند تا در صورت امکان ، تحلیل شوند و به طور دقیق اجرا شوند. این گزارش خلاصه ای از محتوای big data ، هدف ، مثالها ، روشها ، منافع و چالش ها ارائه میدهد و در خصوص نگرانیهای حفظ حریم خصوصی در big data بحث میکند.

مقدمه

Big data و تجزیه و تحلیلش در مرکز علوم و تجارتهای مدرن هستند. این داده ها از تراکنشهای online ، email ها ، ویدئوها ، صوتها ، کلیک کردن ها ، log ها و ارسالها ، درخواستهای جستجو ، یادداشتهای درست ، تعاملات شبکه های اجتماعی ، داده های علمی ، سنسورها و تلفنهای همراه و برنامه های کاربردی آنها تولید میشوند. آنها بر روی پایگاه داده ها که به شکل حجیم رشد میکنند ، ذخیره میشوند و ضبط ، شکل دهی ، ذخیره سازی ، مدیریت ، به اشتراک گذاری ، تحلیل و نمایش آنها از طریق ابزارهای نوعی نرم افزار پایگاه داده ها ، دشوار میشود. پنج اگزا بایت (۱۰ به توان ۱۸ بایت) دیتا تا سال ۲۰۰۳ به وسیله انسان به وجود آمده است. امروزه این مقدار اطلاعات در دو روز تولید میشود. در سال ۲۰۱۲ داده های دنیای دیجیتال به ۲.۷۲ زتا بایت ( ۱۰ به توان ۲۱ بایت) توسعه پیدا کرد. پیش بینی میشود که این مقدار هر دو سال ، دو برابر شود وبه حدود ۸ زتا بایت داده در سال ۲۰۱۵ میرسیم.
IBM نشان داد که هر روز ۲.۵ اگزا بایت داده تولید میشود و همچنین %۹۰ از داده ها در ۲ سال اخیر تولید شده است. یک کامپیوتر شخصی حدود ۵۰۰ گیگا بایت (۱۰ به توان ۹ بایت) داده نگه میدارد ، بنابراین برای ذخیره سازی همه داده های دنیا به حدود ۲۰ میلیارد PC نیاز است. در گذشته پروسه آشکارسازی ژنهای بشر تقریباً ۱۰ سال وقت میگرفت ، هم اکنون بیشتر از یک هفته نمیشود. داده های چند رسانه ای وزن بزرگی در ترافیک اینترنت دارند و انتظار میرود به %۷۰ در سال ۲۰۱۳ افزایش یابد. فقط google بیش از یک میلیون سرور در دور جهان دارد. ۶ میلیارد اشتراک موبایل در دنیا وجود دارد و هر روز ۱۰ میلیارد متن پیام (message) ارسال میشود. در سال ۲۰۲۰ ، ۵۰ میلیارد دستگاه به شبکه ها و اینترنت متصل خواهند بود.
در سال ۲۰۱۲ مواجهه بشر با big data به عنوان یک پروژه جهانی انجام شد با مرکزیت مجموعه ای بلادرنگ که مقدار بزرگی از داده ها را نمایش میدهد و تحلیل میکند. بر اساس این پروژه خیلی آمارها نتیجه گرفته شد. Facebook ، نهصد و نود و پنج میلیون حساب کاربری فعال ماهانه با ۷۰ زبان دارد ، ۱۴۰ میلیارد تصویر آپلود شده است ، ۱۲۵ میلیارد اتصالات دوستها و روزانه ۳۰ میلیارد قطعه های با محتوا و ۲.۷ میلیارد like و comment ارسال میشود. هر دقیقه ۴۸ ساعت ویدئو آپلود میشود و هر روز ۴ میلیارد view در YouTube اجرا میشود. Google خدمات بسیاری را پشتیبانی میکند از جمله ۷.۲ میلیارد page را هر روز مونیتور میکند و همچنین ۲۰ پتا بایت (۱۰ به توان ۱۵ بایت) داده را روزانه به ۶۶ زبان ترجمه میکند. یک میلیارد Tweet هر ۷۲ ساعت از بیشتر از ۱۴۰ میلیون کاربر فعال در Twitter داریم. ۵۷۱ وبسایت جدید در هر دقیقه ساخته میشود. در حدود دهه بعد ، تعداد اطلاعات ۵۰ برابر افزایش پیدا خواهد کرد اما تعداد متخصصان تکنولوژی اطلاعات که همه آن اطلاعات را کنترل میکنند ، ۱.۵ برابر افزایش پیدا خواهد کرد.در قسمت ۱ پیامدهای اساسی ، مزایا ، چالشها ، بررسی نتایج ، مثالها ، روشها و اکتشاف دانش از big data ارائه داده شده است و در قسمت ۲ پیامدهای مهم در پیامدهای امنیتی بازبینی میشود و قسمت ۳ مزایا ، موانع بالفعل ، چالشها و موانع big data را ارائه میدهد و قسمت ۴شامل کارها می باشد.

۱.BIG DATA

در این قسمت پیامدهای مهم بازبینی میشوند و در بخشهای مختلف شرح داده میشوند.
۱-۱.پیامد های مهم
Big Data به یک گام چرخشی رو به جلو از تحلیل داده های سنتی نیاز دارد که با سه مؤلفه اصلی اش توصیف میشود: variety (تنوع یا گوناگونی) ، volume (حجم) ، velocity (سرعت).

  • Variety (تنوع وگوناگونی): تنوع ، Big Data را واقعاً بزرگ میکند. Big Data از یک تنوع بزرگ از منابع می آید و عموماً این سه نوع را دارد: structured (ساخت یافته) ، semi structured (نیمه ساخت یافته) ، unstructured (بدون ساخت) ، داده های ساخت یافته در یک انبار داده قبلاً برچسب زده شده insert میشود و به راحتی ذخیره میشود. اما داده های بدون ساخت ، رندوم هستند و تحلیل آنها دشوار است. داده های نیمه ساخت یافته ، با فیلدهای ثابت تطبیق داده نمیشوند اما شامل برچسبهایی جهت جداسازی عناصر داده میباشند.
  • Volume (حجم): حجم یا اندازه داده ، هم اکنون بزرگتر از ترا بایت(۱۰ به توان ۱۲ بایت) و پتا بایت(۱۰ به توان ۱۵بایت) است. مقیاس بزرگ و پیشرفت داده ها ، روشهای سنتی ذخیره سازی و تکنیک های تحلیل را پشت سر میگذارد.
  • Velocity (سرعت): سرعت نه تنها لازمه Big Data است ، بلکه لازمه همه پردازشها است. برای پردازشهای محدود به زمان ، Big Data باید مورد استفاده قرار بگیرد همانطور که در سازماندهی به منظور به حداکثر رساندن ارزش خود، جریان دارد.در کنار کثرت این اطلاعات ، مؤلفه دیگر ، تصدیق جریان داده است. کنترل داده بزرگ مشکل است ، بنابراین امنیت داده باید تأمین شود. بعلاوه پس از تولید و پردازش Big Data ، آن باید یک مقدار اضافه جهت سازماندهی ایجاد کند. برخی سؤال و جوابهای مهم وجود دارد که در زیر خلاصه شده است که توسط مؤسسه TDWI جهت مدیریت حرفه ای داده ، پرسیده شده و مورد بررسی قرار گرفته است.
    1. پس از سازماندهی نوعی از تجزیه و تحلیل Big Data که به کار برده شده ، این منافع اتفاق می افتد: بازاریابی هدفمندتر ، بینش های کاری صریح تر ، تقسیم بندی بر مبنای مشتری ، تشخیص فروشها و شانسهای بازار.
    2. در طول تکمیل شدن تحلیل Big Data ، این پیامدها موانع مستعد هستند: چیزهای بی تخصص ، هزینه ، محرومیت از ضمانت و حمایت از کار ، سختی طراحی سیستم های تحلیل ، فقدان نرم افزار پایگاه داده فعلی در زمینه تجزیه و تحلیل.
    3. از آنجاییکه جمعیت قابل توجهی Big Data را هم اکنون تعریف کرده اند و در آینده Big Data به دلیل تجزیه و تحلیل جامع یک فرصت است و برخی از آنها Big Data را به دلیل مدیریت کردن یک مشکل می بینند.
    4. انواع داده های حجیم که ذخیره میشوند و به وسیله تکنیک های پیشرفته امروزی استفاده میشوند ، عبارتند از : ساخت یافته ، نیمه ساخت یافته ، رویداد (event) و داده های بدون ساخت.
    5. در حین جابه جایی سکو (platform) ، این مشکلات اتفاق می افتد: نمیتواند با حجم بزرگی از داده ها تطبیق داده شود ، نمیتواند مدلهای تجزیه و تحلیل مورد نیاز را پشتیبانی کند ، نیاز به سکوی تجزیه و تحلیل پیشرفته و اینکه فناوری اطلاعات (IT) ، نمیتواند به تقاضاها و نیازها رسیدگی کند.

همانطور که از بررسی ها دیده میشود ، تجزیه و تحلیل داده های حجیم هنوز به توجه بیشتر نیاز دارد. تجزیه و تحلیل داده های حجیم متواند به صدها سرور نیاز داشته باشد که با نرم افزار موازی به شکل انبوه اجرا میشود. آن چیزی که داده های حجیم را جدا از تنوع و حجم و سرعت آن واقعاً متمایز میکند، پتانسیل تحلیل آن برای آشکارسازی بینش های جدید جهت بهینه سازی تصمیم گیری است.

۲-۱.نمونه هایی از داده های حجیم

نمونه های واقعاً در دسترس از داده های حجیم عبارتند از : در ستاره شناسی ، علوم جوی ، ژنومیک(علم تجزیه وتحلیل داده های ژنتیکی) ، بیوژئوشیمی (شیمی زیستی جغرافیایی) ، علوم و تحقیقات زیستی ، دولت ، حوادث طبیعی ، منابع مدیریت ، بخش خصوصی ، مراقبت نظامی ، خدمات مالی ، جزئیات ، شبکه های اجتماعی ، وبلاگها ، متون ، اسناد ، عکاسی ، صوت ، ویدئو ، جریان کلیک کردن ، جستجو ، اندیس گذاری ، سوابق جزئیات تماس ، اطلاعات اعتباری ، شناسایی فرکانس رادیویی(RFID) ، تلفنهای همراه ، شبکه های حسگر و ارتباطات از راه دور. سازمانها در هر صنعتی که دارای داده های حجیم هستند ، میتوانند از تحلیل های دقیق خود در کسب بینش و دقیق بینی جهت حل مشکلات واقعی نفع ببرند.مؤسسه جهانی McKinsey پتانسیل داده های حجیم را در ۵ موضوع اصلی مشخص کرده است:

  1. بهداشت و درمان (healthcare): سیستمهای پشتیبانی تصمیم گیری بالینی ، تجزیه و تحلیل فردی به کار برده شده برای مشخصات بیمار ، پزشکی شخصی ، عملکرد مبتنی بر ارزشگذاری برای پرسنل ، تحلیل الگوهای بیماری ، بهبود سلامت عمومی.
  2. بخش عمومی (public sector): ایجاد شفافیت به واسطه داده های وابسته در دسترس ، کشف نیازها ، بهبود عملکرد ، اقدامات سفارشی برای محصولات مناسب و خدمات ،تصمیم گیری با سیستمهای اتوماتیک برای کاهش ریسکها ، نوآوری در محصولات جدید و خدمات.
  3. جزئی (retail): در تحلیل رفتار ذخیره سازی ، بهینه سازی قیمت و تنوع ، طراحی تبلیغ محصول ، توسعه عملکرد ، بهینه سازی ورودی کار ، بهینه سازی تدارکات و توزیع ، بازارهای مبتنی بر web .
  4. ساخت (manufacturing): توسعه پیش بینی تقاضا ، برنامه ریزی زنجیره تأمین(ذخیره) ، پشتیبانی فروش ، توسعه عملیات تولید ، برنامه های کاربردی مبتنی بر جستجو در web .
  5. داده های مکانهای شخصی(personal location data): مسیر یابی هوشمند ، تبلیغات جغرافیایی هدفمند یا واکنش های اضطراری ، برنامه ریزی شهری ، مدلهای کسب و کار جدید.

Web همچنین نوعی از فرصت ها را برای داده های حجیم فراهم میکند. به عنوان مثال ، تحلیل شبکه های اجتماعی جهت درک هوش کاربر برای تبلیغات هوشمندتر ، کمپینهای بازاریابی و برنامه ریزی ظرفیت ، رفتار مشتری و الگوهای خرید و همچنین تجزیه و تحلیل احساسات. بر اساس این استنتاجها، شرکتها محتوای خود را و تدبیر توصیه خود را بهینه سازی میکنند. برخی از شرکتها نظیر گوگل و آمازون، مقالات مربوط به کار خود را چاپ میکنند. با الهام از نوشته های چاپ شده ، توسعه دهندگان تکنولوژی های مشابهی نظیر نرم افزارهای open source از قبیل Lucene ، Solr ، Hadoop و HBase را توسعه دادند.

Facebook ، Twitter و LinkedIn یک قدم جلوتر رفتند بدین شکل که پروژه های open source را برای داده های حجیم را چاپ کردند. مثل Cassandra ، Hive ، Pig ، Voldemort ، Storm ، IndexTank.علاوه بر این ، تجزیه و تحلیل های پیش گویانه بر روی جریان ترافیک و یا شناسایی خلافکارها و تهدید کردن از طریق ویدئوهای مختف و صدا و بازخورد های داده از مزایای داده های حجیم هستند.در سال ۲۰۱۲ دولت اوباما اعلام کرد در طرحهای Big Data بیش از ۲۰۰ میلیون دلار در تحقیق و توسعه برای بنیاد ملی علوم ، مؤسسه ملی بهداشت ، وزارت دفاع ، وزارت انرژی ، سازمان زمین شناسی ایالات متحده ، سرمایه گذاری شده است. این سرمایه گذاریها برای کسب یک گام رو به جلو در ابزارها و روشها برای دستیابی ، سازماندهی و جمع آوری یافته ها از حجم زیادی از داده های دیجیتال ، انجام شده است.

تفاوت هارد اکسترنال با یک دستگاه ذخیره سازی

درایوهای اکسترنال را DAS نیز می‌نامند. DAS مخفف عبارت Direct-Attached Storage به معنی «فضای ذخیره‌سازی اتصال مستقیم» است. علت این نام‌گذاری نیز این است که آنها، به طور مستقیم به میزبان (که می‌تواند یک رایانه، یک سرور یا یک پلیر باشد) متصل می‌شوند و تبدیل به یک فضای ذخیره‌سازی افزایشی (Extended) جدید در میزبان شوند. دو نوع هارد درایو اکسترنال وجود دارد: قابل‌حمل (Portable) و رو‌میزی (Desktop).

  • نوع اول: هارد دیسک‌های اکسترنال قابل‌حمل (Portable External Drives)

به این نوع از هارد درایوهای اکسترنال، Laptop External Drive نیز می‌گویند. این نوع دستگاه‌ها بر اساس هارد دیسک‌های ۲.۵ اینچی داخلی لپ‌تاپ‌ها، HDDها و SSDها ساخته می‌شوند که عموماً کم‌حجم، کم‌وزن و قاعدتاً به راحتی قابل‌حمل هستند.

درایوهای قابل‌حمل، معمولاً از داریوهای یگانه (در مقابل درایوهای چندگانه) محسوب می‌شوند و اکثـر آن‌ها با Bus Power سـازگار هستند. درایوهای سازگار با باس پاور، از کابل دیتـــا خود، برای دریافت انرژی (برق) از میزبان استفاده کرده و شما را از به همراه داشتن کابل و آداپتور برای راه‌اندازی هارد درایو بی‌نیاز می‌نمایند.

درایوهای پرتابل، برای افرادی طراحی شده‌اند که بایـــد اطلاعات خود را همراه داشته باشند یا مناسب افرادی است که مجبور هستند، اطلاعات از رایانه‌ای به رایانه دیگر منتقل کنند.

  • نوع دوم: هارد دیسک‌های اکسترنال رومیزی (Desktop External Drives)

درایوهای اکسترنال رومیزی، جزو هارد‌ دیسک‌های ۳.۵ اینچی هستند، که فضاهای ذخیره‌سازی آن‌ها می‌تواند از درایوهای یگانه یا چندگانه باشند. درایوهای رومیزی، همواره به یک آداپتور برق جداگانه برای تامین انرژی، نیازمند هستند، چرا که هیچ کدام از پورت‌های جانبی (مثلاً باس پاور)، قادر نیستند انرژی کافی برای این ابزارها فراهم کنند. به همین دلیل، این نوع درایوها معمولاً به صورت دائمی به یک میزبان متصل می‌شوند. جابه‌جایی این‌گونه هارد دیسک‌ها به خاطر وزن زیاد آن‌ها مشکل‌تر است.

  • معایب هارد دیسک‌های اکسترنال

مهمترین ضعف درایوهای اکسترنال، ناتوانی آن‌ها در به اشتراک‌گذاری فضای ذخیره‌سازی خود با رایانه‌ای به غیر از رایانه متصل به آن است. درایوهای قابل‌حمل نیز به خاطر احتمال آسیب پذیری به دلیل افتادن بر روی زمین، گم‌شدن و به سرقت رفتن، می‌توانند باعث از دست رفتن اطلاعات کاربر شوند.

  • فضای ذخیره‌سازی مبتنی بر شبکه (NAS)

NAS مخفف عبارت Network-Attached Storage است. NAS بزرگــــترین ضعــــف هـــــارد دیسک‌های اکستــــــرنال را رفــــع می‌کند. NAS به شبکه متصل شده و فضای ذخیره‌سازی خود را برای تمام کاربران شبکه، به اشتراک می‌گذارد. برای شبکه‌های خانگی یا شرکت‌های تجاری کوچک، دو نوع NAS وجود دارد: NAS سرورهای اختصاصی و روتر‌های دارای NAS

  •  سرور اختصاصی NAS یا Dedicated NAS Server

NAS سرور، یک هارد درایو اکسترنال محسوب می‌شود که به جای اتصال به یک کامپیوتر به شبکه متصل می‌شود. NAS سرورها معمولاً از طریق کابل شبکه به روتر یا سوئیچ متصل می‌شوند. NAS سرورها، مشابه سرورهای واقعی هستند که میزبان تعداد زیادی فضای ذخیره‌سازی می‌باشند، یعنی در یک NAS سرور، چندین دیسک سخت به شکل RAID در کنار یکدیگر قرار می‌گیرند. با این تفاوت که ماوس، صفحه‌کلید و صفحه‌نمایش ندارد. در مقابل می‌توان آن‌ها را از طریق یک رابط‌کاربری مبتنی بر وب کنترل و مدیریت نمود. برای بهره‌مندی از ویژگی‌های NAS سرورها، باید آن‌ها را طوری به شبکه متصل کنید که از کابل‌هایی با پهنای باند چند ترابایت استفاده می‌کند،

بسته به نوع پیکربندی، NAS Server، می‌تواند کاری بیش از ارائه فضای ذخیره‌سازی اشتراکی ارائه کند. NAS سرور می‌تواند به عنوان استریمینگ سرور، ارائه محتویات دیجیتالی صوتی-تصویری، فضای ذخیره‌سازی راه‌دور در هنگام استفاده کلاینت‌ها از اینترنت و حتی اجرای اپلیکیشن‌های طراحی شده برای NAS سرورها مورد استفاده قرار بگیرد.در حال حاضر، نمونه‌های موجود در بازار، امکاناتی بسیار فراتر از حد انتظار کاربر عرضه می‌کنند.

  • مزیت‌های NAS

NAS در مقایسه به DAS، امکانات بیشتری را در اختیار کاربران می‌گذارد و به چند کاربر مختلف امکان می‌دهد، به طور همزمان به فضای ذخیره‌سازی و منابع شبکه دسترسی داشته باشند. علاوه بر این امکان دسترسی راه دور نیز برای کاربران برای خطر از دست رفتن اطلاعات یا آسیب‌های سخت‌افزاری وجود دارد. در مواردی مانند دانلود حجم زیادی از اطلاعات، NAS Serverها به شما امکان می‌دهند بدون نیاز به روشن کردن رایانه، به هدف خود برسید.

تفاوت اصطلاح ذخیره سازی و حافظه

ذخیره‌سازی و حافظه

دو واژه ذخیره‌سازی (Storage) و حافظه (Memory)، شاید در موارد مختلف به جای هم استفاده شوند. اما این دو واژه تفاوت‌های زیادی با یکدیگر دارند.

  • ذخیره‌سازی (Storage): به طور مختصر، ذخیره‌سازی مربوط به محلی است که اطلاعات گوناگون مانند عکس‌ها، تصاویر، فایل‌های متنی، نرم‌افزارها و… در آن قرار می‌گیرد. در یک کامپیوتر، سیستم‌عامل (ویندوز، مک و…) هم در فضای ذخیره‌سازی داخلی (هارد دیسک)، ذخیره می‌شود. فضای ذخیره‌سازی، غیرفرّار است. به این معنی که با خاموش شدن دستگاه میزبان (کامپیوتر)، اطلاعات همچنان در دستگاه ذخیره بوده و از بین نمی‌روند و با راه‌اندازی رایانه، اطلاعات، مجدداً قابل دسترسی هستند. دقیقاً مشابه یک کتاب یا دفترچه یادداشت که همیشه قابل خواندن و نوشتن است.
  • حافظه (Memory): حافظه با نام‌های دیگر مانند RAM، حافظه تصادفی (Random Memory Access) و… شناخته می‌شود. حافظه، جایی است که داده‌های نرم‌افزارها برای اجرا شدن باید در آن قرار بگیرند. داده‌های موجود در حافظه یا RAM، فرّار هستند. به این معنی که با خاموش شدن دستگاه، اطلاعات موجود در آن پاک شده و حافظه خالی می‌شود. به طوری که انگار هیچ اطلاعاتی در آن نبوده است. این حافظه، چیزی شبیه حافظه کوتاه‌مدت ذهن انسان است. حافظه کوتاه‌مدت در هنگام فعالیت‌هایی مانند خواندن و نوشتن، متون و تصاویر را پردازش می‌کنند ولی بلافاصله پس از توقف کار، اطلاعات آن پاک شده و متوجه فعالیت بعدی می‌شود.

توضیح: هنگام روشن نمودن رایانه، بخشی زیادی از زمان بوت، صرف انتقال سیستم‌عامل از فضای ذخیره‌سازی داخلی (مثلاً هارد دیسک) به حافظه (RAM) می‌شود. پس از انجام این فرآیند، سیستم‌عامل آماده سرویس‌دهی و انجام دستورات کاربر خواهد بود.

علیرغم تفاوت میان فضای ذخیره‌سازی و حافظه، رابطه‌ای قوی میان این دو وجود دارد. برای مثال، یک فایل Word که شما در حال کار بر روی آن هستید، در حافظه (RAM) دستگاه قرار دارد، اما پس از آنکه آنرا ذخیره نمودید، یک نسخه از آن در فضای ذخیره‌سازی رایانه کپی می‌شود. وقتی نرم‌افزار به صورت کامل بسته شود، تنها یک نسخه از فایل در فضای ذخیره‌سازی موجود خواهد بود و نسخه‌ آن در RAM، موجود نخواهد بود، مگر اینکه مجدداً نرم‌افزار را اجرا کنید.تمام این‌ها به این معنی است که شما به طور واقعی، فضای ذخیره‌سازی را تجربه نکرده و نمی‌بینید. آنچه از طریق صفحه‌نمایش یا اسپیکر به شما ارائه می‌شود، از حافظه (RAM) فراهم شده است. اما قبل از آن، باید از فضای ذخیره‌سازی دستگاه شما در حافظه قرار بگیرد لود شودبه طور کلی، حجم حافظه‌های رم بسیار کمتر از حجم فضای ذخیره‌سازی است. در حال حاضر اغلب کامپیوترها با حافظه‌ای بین ۲ تا ۸ گیگابایت عرضه می‌شوند. البته حافظه رم نسبت به فضای ذخیره‌سازی گران‌تر است.به یاد داشته باشید که حافظه تنها یکی از فاکتورهای عمل‌کرد رایانه محسوب می‌شود. فضای ذخیره‌سازی، فاکتور دیگری است که می‌تواند از نوع هارد درایو (هارد دیسک)  SSD  و یا دستگاههای تخصصی ذخیره سازی باشد.ذخیره سازی و نگهداری اطلاعات در هر دستگاهی به غیر از دستگاههای تخصصی ذخیره سازی  مانند هارد اکسترنال و کارت حافظه مشکلات و معایب خود را مانند عمر مفید دستگاهها ؛ مشکلات فیزیکی ؛ نوسانات برق و عدم امنیت را به همرا خواهد داشت.