پیشگفتار
در دنیای فناوری اطلاعات، NOC محلی است مرکزی که تکنیسن های IT میتوانند مستقیما نرم افزارهای RMM،( Remote Monitoring & Management) را بکار برند.
به گزارش
ایتنا این تیم میبایست به صورت 24 X 7 X 365 تمامی اجزای شبکه را مانیتور نموده و در واقع به مانند چشم سازمان جهت برآورده سازی هدف تضمین Uptime 99.99% عمل کند. تغییر اندازه و رشد سازمانهای IT منجر شد تا در گزارش 176 IT Professionals سازمان NetQOS به این امر اشاره شود که ساختارهای سنتی NOC ها نیازهای امروزه سازمانها را برآورده نمیکند. در عوض، به منظور رفع نیاز های حیاتی امروزه، NOC ها میبایست به شیوه مناسب تری از کارآیی منابع نرمافزاری و سختافزاری خود بهره گیرند تا بتوانند هرچه سریعتر و بهتر نیازهای سازمان را در عیب یابی و رفع مشکلات برآورده سازند.
این گزارش اشاره دارد که دیدگاه مرسوم و سنتی به NOC که اغلب به صورت واحدی صرفا واکنشی بوده و به مانند آتش نشان عمل کند، باعث می شود که این واحد وسیعا وظایف خود را معطوف به مانیتور کردن شبکه کند. این گزارش متذکر می شود که عدم توانایی NOC در شناسایی تبعات حاصل از یک امر و جلوگیری از رخ دادن آن از وظایف اصلی آن است که عدم اجرای صحیح این بخش از وظایف منجر به سلب اعتبار سازمان در نگاه کاربر میگردد.
برای مثال به منظور روشن شده این بخش فرض کنید که واحد NOC ظرفیت فعلی منابع ذخیره سازی و نرخ رشد تولید محتوا را نادیده بگیرد و تنها به مانیتور کردن وضعیت سلامت شبکه و دستگاه های آن در شرایط فعلی بپردازد. در این حالت هنگامی که وضعیت منابع سخت افزاری به شرایط بحرانی رسید و تولید آلارم کرد واحد NOC متوجه این آلارم شده و واکنش نشان می دهد. در این حالت با وجود اینکه NOC وظیفه سنتی تعریف شده خود را به درستی و صحیح انجام داده است، ولی در ساختار های جدید که نقش پیشگیرانه برای NOC متصور است این وظیفه انجام نشده است و در نهایت سازمان متحمل خساراتی شد که قابل پیش بینی و جلوگیری بود.
در بخشی از این گزارش، طی مصاحبه هایی که با کارشناسان حوزهIT در صنایع مختلف از جمله صنایع انرژی، رسانه، بانکداری و ... انجام شده است در خصوص این موضوع سوال شده است که آیا پرسنل واحد NOC تنها مشکلات را اعلام میکنند و یا اینکه علاوه بر اعلام صرف مشکل جهت روشن شدن دلایل اصلی مشکل نیز همکاری دارند و راهنمایی موثر می کنند. این مصاحبه بین دو طیف از کارشناسان IT این سازمان ها انجام شده است. اشخاصی که خودشان در واحد NOC فعالیت داشتند و افرادی که در واحد های دیگر IT به غیر از NOC فعال بودند. نتیجه گزارش موردی جالب و در عین حال حساس را مشخص میکند:
تقریبا 3 درصد از مصاحبه شوندگان عقیده داشتند که این امر جزو مسئولیت های NOC نیست. لذا کاملا مشخص است که از نه تنها از دیدگاه متخصصین شبکه بلکه از دیدگاه دیگر کارشناسان IT نیز میبایست در ساختار های سنتی مسئولیت NOC تغییراتی ایجاد شود.
پاسخ گویی به عیوب و محدوده مسئولیتها
بخش عظیمی از سازمان ها حد اقل یک فرآیند و پالیس تشدید (Escalation Policy) داشتند که طی آن در هنگام بروز مشکلات سلسله مراتب لازم جهت ارجاع و رفع مشکل انجام میشود. این سلسله مراتب شدت به ماهیت کسب و کار سازمان، اهداف، ماموریتها، ابزار موجود و فرهنگ سازمانی وابسته است لذا نمیتوان برای آن الگو و ساختار از پیش تعیین شده ای ارائه داد. نکته لازم به ذکر این است که در هر حال و در هر شرایطی می بایست واحد NOC در سازمان قوانین مدون و مشخصی جهت ارجاع در شرایط پس از وقوع رخداد داشته باشد.
جهت تعریف اینگونه ساختار ها و ماموریت ها و ظایف استفاده از Framework های استاندارد بسیار کمک کننده است. از آنجا که مبحث مورد نظر ما در واقع یکی از زیرمجموعه های IT است لذا جهت تعریف این ساختار ها، استفاده از استانداردهای ITIL توصیه میشود.
در اینجا نموداری که نشان دهنده تمرکز مانیتورینگ واحد NOC است نشان داده میشود:
در نمودار زیر نشان داده میشود که تیم NOC میباست چه مواردی را مانیتور کنند. این نظر سنجی از دیدگاه کار کنان NOC و دیگر پرسنل IT غیر از NOC است.
مفروضات در طراحی چهار چوب ساختاری واحد
NOC
با توجه به تمامی توضیحات ارایه شده مشخص است که واحد NOC سنتی سازمان ها میبایست هرچه سریعتر پوست اندازی کرده و ساختار های تازه و پویای خود را تشکیل دهد. از آنجا که سه جزء اصلی و تشکیل دهنده این واحد
افراد،
ابزار و
فرآیند ها هستند؛ این تغییرات میبایست نه تنها در بدنه کارشناسی و نیروی انسانی شکل گیرد، بلکه در حوزه ابزار، تکنولوژی ها و همچنین فرآیند ها نیز انجام شود. لذا چهارچوب اصلی این واحد می بایست بر اساس اصول ذیل بنا شود:
فرآیندهای کارا
این مطلب به معنی زیر و رو کردن همه فرآیند ها نیست. بلکه به این مفهوم که با بررسی اهداف و ماموریت های سازمان و کلاسه بندی سرویس ها و فرآیند ها تا جای ممکن اقدام به تسهیل فرآیند های اجرایی شود. در این بخش اصل پارتو و قوانین 80-20 بسیار می تواند کمک کند به این مفهوم که غالبا 20 درصد از فرآیند ها هستند که 80 درصد از اهداف و ماموریت های سازمان را عهده دار هستند. لذا اولویت ایجاد تغییرات و تسهیل کردن آنها می بایست از همین 20 درصد فرآیند ها انجام شده و تا جای ممکن آنها رل ساده، کوتاه و قابل فهم و با خروجیهای قاطع نمود.
تمرکز بر روی کارآیی
امروزه NOC ها میبایست بیشتر از دسترس پذیری تمرکز خود را برروی کار آیی معطوف دارند. به این مفهوم که در مانیتور کردن اجزا ( دستگاه ها، لینک ها، سرویس ها و ...) نه تنها این مطلب را مد نظر قرار دهند که این سرویسها در دسترس هستند؛ بلکه می بایست مد نظر قرار دهند که این سرویس ها به چه صورت و با چه کیفیتی برای مشتریان ارایه می شود. از آنجا که ارایه سرویس نا مناسب و با کیفیت پایین خود ضد تلبیغ برای سازمان و اهداف اوست لذا توجه به SLA مورد نظر و تصویب شده در مانیتورینگ می بایست مد نظر باشد.
·کارشناسان باتجربه
متاسفانه تجربه شخصی من این گونه نشان داده است که در بسیاری از سازمان های ما واحد NOC و یا مانیتورینگ محل ورود پرسنل جدید IT است. اشخاصی که تجربه کاری کم داشته و در واقع به این واحد تحت عنوان آموزشگاهی حین خدمت نگاه می شود. البته درست است که یکی از اصول اولیه هر سازمان تولید نیروی متخصص داخلی است زیرا نه تنها این نیرو ها بیشتر با ساختار سازمان و هنجار های آن آشنا میشوند بلکه تعهد اخلاقی و سازمانی بیشتری نیز پیدا میکنند. ولی باید به نسبت معقول بین افراد با تجربه و افراد کم تجربهتر دقت ویژهای شود چرا که در صورت سهل انگاری در این بخش هیچکدام از اهدافی که پیشتر در باره آن توضیح داده شد میسر نمیشود.
ابزار های هوشمند و خودکار
بسیاری از کارکنان NOC ها شیف کاری خود را با نشستن جلوی صفحات نمایش و اعلام رخدادها و واکنش هایی انجام میدهند که می توان آن ها را از طریق ابزار های هوشمند خودکار کرد. راهکار هایی چون EEMو Auto Alerting که توسط بسیاری از ابزار های هوشمند ارایه میشوند میتواند تا 25 درصد از وقت کارشناسان NOC را ذخیره کند. این ذخیرهسازی زمان از دوجنبه برای سازمان مفید است. اول آنکه کارشناسان وقت بیشتری به منظور انجام و پیاده سازی فرآیندهای پیشگیرانه و تحلیل شرایط سرویس ها دارند. و در نهایت دستیابی به SLA تفاهم شده ساده تر میسر است. دوم اینکه با 25 درصد ذخیره سازی در زمان کارشناسان NOC درواقع می توان خوش بین بود که اندازه واحد NOC نیز به نسبتی کوچکتر خواهد شد.
مجموعه ابزار های یکپارچه
تعدد ابزار های مانیتوریگ و مدیریتی استفاده شده در واحد NOC در بسیاری از موارد نه تنها سود و آورده ای برای سازمان ندارد؛ بلکه به دلیل الگو های متفاوتی که این ابزار ها دارند گاها موجب سردرگمی و تحلیل های نادرست بالاخص برای کارشناسان کم تجربه تر خواهد شد. از این رو توصیه می شود تا جای ممکن از ابزار های یکپارچه و مجتمع در واحد NOC استفاده شود. علاوه بر این تعدد ابزار ها هزینه های جانبی نگهداری آنها را نیز شامل خواهد شد که این امر نیز برای سازمان ها مطلوب نیست. گفتنی است که موارد مربوط به راهکارهای بشتیبان در مواقعی که ابزاری از دسترس خارج می شود کاملا معقول و پذیرفتنی است. در اینجا منظور تعدد بیرویه ابزار هایی است که نه تنها آورده ای جدید برای سازمان نداشته بلکه مشکلات و سردرگمیهایی را نیز به NOC و به طبع آن به سازمان تحمیل میکند.
تمرکز بر موارد امنیتی
بنا بر تعریف ارایه شده از واحد NOC تحت عنوان چشم سازمان رعایت اصول امنیتی در این واحد بسیار حائز اهمیت است. مواردی چون حفظ محرمانگی، جلوگیری از روش های مهندسی اجتماعی، نشت اطلاعات، کلاسه بندی اطلاعات در هنگام ارجاع مشکلات و Escalation و ... همگی مواردی است که در هنگام تعریف فرآیند های اجرایی باید مد نظر قرارگیرد و پرسنل NOC ملزم به اجرای آنها گردند. از طرفی از آنجا که NOC نقطه مرکزی است که از طریق آن می توان به تمامی تجهیزات شبکه اشراف و دسترسی داشت لذا پیاده سازی الزامات امنیت در خصوص امنیت فیزیکی (تردد، پالیسی های BYOD، امنیت فیزیکی تجهیزات و ...) و همچنین امنیت ارتباطات و نرم افزار ها ( استفاده است ارتباطات امن، رمز نگاری، ذخیره سازی امن اطلاعات، انتقال امن داده ها و اطلاعات،نرم افزار های مورد تایید امنیتی و ...) نیز می بایست به شدت مورد توجه قرار گیرد.
ساختار پیشنهادی جهت استقرار NOC
بر اساس توضیحات ارایه شده، ساختار نوین پیشنهادی جهت استقرار درون سازمانی واحد NOC از بخش های کلی زیر تشکیل می شود. از آنجا که گفته شد که واحد های جدید NOC مبتنی بر سرویس می بایست وظایف خود را انجام دهند؛ لذا می توان اینگونه انگاشت که واحد NOC هم سرویس های خاصی به سازمان ارایه می دهد که برای ارایه مطلوب این سرویس ها می بایست SLA مشخصی را رعایت کند. این SLA در بخش های زیر تعریف می شود و معیار های اندازه گیری آن به شرح ذیل است:
Term |
Measurement Parameter |
Network |
Uptime/Throughput |
Service |
Availability/Capacity |
Data Storage & Computing |
Speed/Completion |
Power |
Availability/Reliability |
Environmental Control |
Compliance |
Facility Secure Access |
Compliance |
نیاز مندی های ساختاری جهت تضمین SLA تصویب شده به شرح ذیل است: