Uploaded by Essam Hamdy

البيانات الكبيرة و إدارة مكونات المشروع

advertisement
‫البيانات الكبيرة و إدارة مكونات المشروع‬
‫مع زيادة التركيز علي كل أنواع األنظمة األوتوماتيكية و أداواتها المناسبة المتاحة لحفظ هذه‬
‫البيانات نظ ار إلنخفاض تكاليف تخزين البيانات ‪ ،‬وصلت الصناعات في كل المستويات لعصر ‪،‬‬
‫ما نسميه البيانات الكبيرة ‪ ،‬البيانات الضخمة من المعلومات او حتي البيانات الخام المتحصل‬
‫عليها من كل انواع األنظمة األوتوماتيكية‪ .‬يبحث عادة كل من المشروعات ‪ ،‬و المستخدمين ‪ ،‬و‬
‫بالتأكيد المنظمين الحكوميين للوصول لكل البيانات التي تغطي الصفقات (المعامالت) عبر الوقت‬
‫و من ثم توقع توافر هذه البيانات للوصول و التحليل خالل فترات سابقة‪.‬‬
‫اصبحت القدرة علي الحصول علي هذه البيانات و تخزينها اسهل عبر السنوات األخيرة‬
‫إلنخفاض تكاليف تخزين البيانات في هذه األيام‪ .‬عندما انخفضت تكاليف تخزين البيانات ‪ ،‬تزايدت‬
‫كميات و احجام تجميع البيانات و تخزينها بطريقة مذهله‪ .‬و بالتركيز علي احتياجات المعرفة‬
‫للمراجعة الداخلية‪ .‬يقدم هذا الفصل نظره علي مفاهيم البيانات الكبيرة و مناقشة الحوكمة و المخاطر‬
‫و قضايا اإللزام الخاصة بالبيانات الكبيرة المرتبطة بأمن المعلومات و عمليات المراجعة الداخلية‬
‫لمراجعة الرقابة الداخلية في بيئة البيانات الكبيرة‪.‬‬
‫مفهوم البيانات الكبيرة ‪:‬‬
‫" البيانات الكبيرة هي اصل معلوماتي كبيرة الحجم و السرعة و التنوع و الذي يتطلب‬
‫كفاءة تكاليف ‪ ،‬و تشغيل المعلومات بطريقة مبتكرة لتعزيز الرؤية و صنع القرار"‪.‬‬
‫خصائص البيانات الكبيرة ‪:‬‬
‫تتمثل خصائص البيانات الكبيرة بعدد من الخصائص متمثلة فى ‪ :‬السرعة ‪ ،‬الحجم ‪،‬‬
‫التنوع ‪ ،‬عرفت تلك الثالث ‪ V's‬الخاصة بالحجم الكبير ‪ ، Volume‬السرعة ‪ ،Velocity‬و التنوع‬
‫‪ Variety‬البيئة الشائعة بطريقة تقليدية والذي استخدمت مسبقا لتعريف ووصف قضايا البيانات‬
‫الكبيرة‪ .‬و لقد اضافت كثير من المصادر الحالية ‪ V‬رابعة و هي ‪ Veracity‬الصدق (الصحة)‬
‫كعامل إضافي مهم للبيانات الكبيرة‪ .‬و يشير مصطلح الصدق (الصحة) كعامل اضافي مهم‬
‫للبيانات الكبيرة‪ .‬حيث يشير مصطلح الصدق (الصحة) إلي الدقة والصحة لهذه الجماهير للبينات‬
‫الكبيرة و يعتبر هذا المصطلح (المفهوم) مهم خاصة للمراجعيين الداخليين عند اخذ البيانات الكبيرة‬
‫في اإلعتبار من منظور المراجعة و الرقابة‪.‬‬
‫‪1‬‬
‫أوال ‪ :‬الحجم‬
‫‪Volume‬‬
‫يشير الحجم إلي الكميات المنشورة من البيانات الشائعة للتطبيق المعطي او النظام باإلعتماد‬
‫علي الحجم النسبي للمشروع‪ .‬يوجد تنسيق شائع في حاالت كثيرة للحجم الزائد يمكن ان يعد تقليديا‬
‫بالسجل الخام "‪ "rows‬و ‪ /‬او بمصطلح المساحة التخزينية المطلوبة‪ .‬مثال علي بيانات االحجام‬
‫العمالقة سجالت االحداث الخام لخوادم االحجام العالية‪ .‬و آخر يمكن ان يكون حجم المعامالت‬
‫للمبيعات الموسمية للوحدات المتعددة (فروع) بيع التجزئة‪.‬‬
‫ثانياً ‪ :‬السرعة ‪Velocity‬‬
‫تشير السرعة إلي سرعة نقل و‪/‬او تغير البيانات‪ .‬تعتبر مشكلة السرعة واحدة في التجميع و‬
‫االستجابة‪ .‬عندما تأتي اعداد كبيرة من العمليات او الرسائل بسرعة في تطبيق المشروع او الموقع‬
‫االلتكتروني ‪ ،‬و التي يحتاج المشروع لتجميع و تشغيل هذه البيانات ذات السرعة العالية (السرعة‬
‫العالية لهذه البيانات)‪ .‬و هذه ليست مشكلة مكونات و عادة ليست مرتبطة بحجم او تنوع البيانات‬
‫الكبيرة ايضا‪ .‬و مثال شائع علي السرعة العالية للبيانات هو كذلك ما يعرف بـ ‪Twitter fire‬‬
‫‪ hose‬خرطوم الحريق لـ ‪ Twitter‬التيار المستمر لكل التوثيقات (التغريدات) التي عبرت نظام‬
‫‪ Twitter‬بعض األحداث او تعليقات ‪ Twitter‬قد تؤدي الي عدد حجم من عمليات االستجابة‬
‫(التعليقات) رغم ان ‪ Twitter‬تطلب فقط تصنيف و تجميع هذه الرسائل الهائلة ‪ ،‬السرعة العالية‬
‫قد تسبب تحديات للنظام‪.‬‬
‫ثالثاً ‪ :‬التنوع ‪Variety‬‬
‫يشير التنوع في البيانات الكبيرة لعده مصادر وانواع البيانات المهيكلة و غير والمهيكلة من‬
‫مصادر مثل الجداول االلكترونية ‪ ،‬وقواعد البيانات ‪ ،‬وروابط الفيديو ‪ ،‬والرسوم البيانية ‪ ،‬وأجهزة‬
‫المراقبة والمزيد ناد ار ما تقدم البيانات نفسها في شكل محدد مرتب وجاهز للتشغيل وهذا التنوع‬
‫الغير مهيكل للبيانات ممكن ان تخلق مشكلة للتخزين ‪ ،‬والتشغيل والتحليل‪.‬‬
‫رابعاً ‪ :‬الصحة ‪Veracity‬‬
‫تتعامل الصحة مع االهتمامات بغض النظر عن البيانات غير المؤكدة وغير الدقيقة مثل‬
‫التحيز والضوضاء وغير الطبيعي في البيانات وعند تعامل اإلدارة العامة لتكنولوجيا المعلومات‬
‫وبالتأكيد المراجعة الداخلية مع مواقف انظمة البيانات الكبيرة يجب ان تسأل عن مدي مناسبة‬
‫‪2‬‬
‫البيانات التي تم تغشيلها وتخزينها لطبيعة المشكلة التي يتم تحليلها‪ .‬في انظمة قواعد البيانات‬
‫التقليدية وبالطبع في االنظمة التي تم مراجعتها من المراجعة الداخلية عن الرقابة الداخلية لها ومدي‬
‫كفايتها ‪ ،‬فهناك دائما االفتراض ان تطبيقات البيانات مؤكدة و واضحة و دقيقة‪.‬‬
‫حوكمة البيانات الكبيرة ‪:‬‬
‫تجذب البيانات الكبيرة تحديات جديدة في شكل الحوكمة و قضايا األمن كزيادة التنظيمات‪.‬‬
‫بينما تبقي معظم حوكمة تكنولوجيا المعلومات ‪ ،‬و الخطر ‪ ،‬و قضايا االلزام غير متغيرة بال شك‬
‫سيوظف احجام التطبيقات و احجام البيانات‪ .‬ينتج مشغلي األنظمة و المشروعات في بيئة البيانات‬
‫الكبيرة بعض القضايا اإلضافية و تحديات للمراجعين الداخليين في ادائهم لمراجعة الرقابة الداخلية‬
‫في بيئة البيانات الكبيرة‪ .‬نقطتان هنا هي انه يجب علي المراجعين الداخليين ان يكونوا علي فهم‬
‫و دراية جيدة بـ ‪ CBOK‬و علي معرفة بقضايا الرقابة الداخلية للبيانات الكبيرة‪ .‬و كما ان االعمال‬
‫و االنظمة تنموا سينموا معها ايضا المراجعيين الداخلين بالمقابل ألنظمة البيانات الكبيرةو يحتاجوا‬
‫لفهم قضايا الرقابة الداخلية‪.‬‬
‫تعرض التطبيقات الحالية للبيانات الكبيرة و بدايات تكنولوجيا المعلومات لبناء و تشغيل هذه‬
‫البيانات ‪ ،‬فرص هامة للمشروعات للنمو عبرها و فهم مستبصر ألعمالهم ‪ ،‬و لكن يوجد ايضا‬
‫أهمية للحوكمة في مخاطر الرقابة الداخلية‪ .‬و بمراجعة الخطوة األولي يجب علي المراجع الداخلي‬
‫فهم الحقائق او العناصر األربعة للبيانات الكبيرة و هي الحجم ‪ ،‬و السرعة ‪ ،‬و التنوع ‪ ،‬و الصحة‪.‬‬
‫كما تم مناقشتها في األجزاء السابقة ‪ ،‬و كيف يتم تطبيقهم في التطبيقات المعطاه كما في وظائف‬
‫بيانات تكنولوجيا المعلومات تحت المراجعة‪ .‬يمكن ان يساعد مستوي النشاط في اي او كل هذه‬
‫المناطق توكيد المراجعين الداخليين حتي لو كان يواجه موقع البيانات الكبيرة‪.‬‬
‫يجب علي المراجعين الداخليين لرقابة الحوكمة المرتبطة و مجموعات البيانات الحوكمية‬
‫المبنية او المهيكلة جيدا للعمليات عند مراجعة الرقابة الداخلية في بيئة البيانات الكبيرة‪.‬‬
‫* آلية الرقابة لمنع تسرب البيانات‬
‫تسريب البيانات من اهتمامات اليوم لعصر البيانات الكبيرة‪ .‬يعتبر تسريب البيانات هو النقل‬
‫غير المصرح به للبيانات او المعلومات من خالل المنظمة لجهه او مستقبل خارجي‪ .‬يعرف تسريب‬
‫البيانات توزيع مقصود او غير مقصود لبيانات خاصة او حساسة لجهه غير مصرح لها‪ .‬قد يتسبب‬
‫‪3‬‬
‫قصور امن المعلومات او اي تسريب للملفات مع البيانات الكبيرة في نقل ماليين من السجالت‬
‫لجهات غير مصرح لها‪.‬‬
‫تحتوي البيانات الحساسة علي حقوق ملكية فكرية ‪ ،‬و معلومات مالية ‪ ،‬و معلومات طبيقة‬
‫للمرضي ‪ ،‬و بيانات بطاقة االئتمان ‪ ،‬و اي معلومات اخري تعتمد علي االعمال او الصناعة‪.‬‬
‫عالوة علي ذلك ‪ ،‬قد يتم نشر البيانات الحساسة في كثير من الحاالت بين المساهميين المختلفين‬
‫مثل الموظفين العاملين داخل المبني من خارج المنظمة ‪ ،‬و شركاء االعمال ‪ ،‬و الزبائن و الذي‬
‫يؤدي لزيادة خطر وقوع المعلومات السرية في ايدي غير مصرح لها‪.‬‬
‫‪21-6 Enterprise Content management Internal Controls‬‬
‫الرقابة الداخلية إلدارة مكونات المشروع‬
‫بمجرد ان ظهر مصطلح البيانات الكبيرة اصبح مهم و متطور للمشروع و لوظائف تكنولوجيا‬
‫المعلومات و المراجعين الداخليين ‪ ،‬ادارة مكونات المشروع (‪ )ECM‬مصطلح جديد و يتطور‬
‫بسرعة و الذي يجب ان يكون جزء من ‪ CBOK‬للمراجع الداخلي للفهم و األلفة‪ .‬يشرح (‪)ECM‬‬
‫االستراتيجيات ‪ ،‬و الطرق ‪ ،‬و األدوات التي تحصل بها ‪ ،‬و تدير ‪ ،‬و تخزن ‪ ،‬و تحفظ ‪ ،‬و تنقل‬
‫المحتوي و الوثائق المتعلقة بعمليات المشروع‪ .‬يغطي (‪ )ECM‬العمليات التي تساعد ادارة‬
‫المعلومات في المجال الداخلي للمشروع ‪ ،‬اذا كان في شكل ورقي (وثائق ورقية) ‪ ،‬و ملفات‬
‫الكترونية ‪ ،‬و تيار مطبوع لقواعد البيانات ‪ ،‬و صورة كود الصنف ‪ ،‬او حتي بريد الكتروني‪.‬‬
‫يعتبر (‪ )ECM‬مصطلح يغطي تحت مظلته ادارة الوثائق ‪ ،‬و ادارة مكونات الموقع االلكتروني‬
‫‪ ،‬و البحث ‪ ،‬و التعاون ‪ ،‬و ادارة السجالت ‪ ،‬و األصول الرقمية ‪ ،‬و ادارة خرائط العمل ‪ ،‬و‬
‫الحصول علي الوثائق ‪ ،‬و عمليات المسح ‪ ،‬و االكثر من ذلك‪ .‬يساعد (‪ )ECM‬بداية في ادارة‬
‫دورة حياة المعلومات من بداية النشر او الخلق في الطريق خالل الطريق لالرشفه او حتي التخلص‪.‬‬
‫تهدف اإلدارة الجيدة والرقابة الجيدة لعمليات (‪ )ECM‬لتسهيل عمل ادارة معلومات المشروع من‬
‫خالل التخزين البسيط ‪ ،‬و االمن ‪ ،‬و رقابة االصدار ‪ ،‬و عملية الـ ‪ routing‬و االسترجاع‪ .‬و‬
‫تتضمن الفوائد للمشروع في تحسين الكفاءة ‪ ،‬و رقابة داخلية افضل ‪ ،‬و تخفيض التكاليف ‪ ،‬علي‬
‫سبيل المثال تستخدم بنوك عديدة عمليات (‪ )ECM‬لحفظ نسخ من الشيكات الموقعة من العمالء‬
‫في مقابل الطرق القديمة لحفظ الشيكات الطبيعية في مستودعات ورقية ضخمة‪ .‬في النظام القديم‬
‫طلب العميل لنسخة من الشيك قد يأخذ اسبوع ‪ ،‬حيث يجب علي البنك ان يتصل بالمستودع‬
‫‪4‬‬
‫(المخزن) للبحث عن الصندوق الصحيح ن و الملف ‪ ،‬حيث يوجد الشيك‪ .‬و يجب بعد ذلك‬
‫الحصول علي الشيك و نسخه و ارساله بالبريد للبنك ‪ ،‬حيث بعد ذلك يرسل للعميل‪ .‬مع نظام‬
‫(‪ )ECM‬البديل ‪ ،‬يطلب موظف البنك الشيك ‪ .‬عندما تظهر صورة الشيك علي الشاشة ‪ ،‬يكون‬
‫البنك قادر علي ارساله في الحال عبر البريد االلكتروني للعميل عادة ‪ ،‬بينما يكون العمليل مازال‬
‫علي الهاتف‪.‬‬
‫‪Exhibit 21-4 Auditing Big Data Internal control‬‬
‫الرقابة الداخلية لمراجعة البيانات الكبيرة‪.‬‬
‫‪ .1‬مراجعية اختيار تطبيقات البيانات الكبيرة‪:‬‬
‫أ‪ .‬مراجعة حجم البيانات ‪ ،‬و احصائيات نشاط المعامالت ‪ ،‬و عوامل اخري لتحديد‬
‫تطبيقات البيانات الكبيرة‪.‬‬
‫ب‪ .‬مجال التوثيق لتحديد تطبيقات البيانات الكبيرة ‪ ،‬وتضمين نظام تغذية آخر واالتصال‬
‫باالنترنت‪.‬‬
‫ت‪ .‬استخدام ادوات تحديد المخاطر لتخطيط الم ارجعة الداخلية لتقييم مخاطر تطبيقات‬
‫البيانات الكبيرة و ما يرتبط بها للمراجعة‪.‬‬
‫‪ .2‬عوامل بيئة مشروع البيانات الكبيرة‪:‬‬
‫أ‪ .‬توثيق البرامج المتخصصة المستخدمة لتطبيقات البيانات الكبيرة و تحديد تلك‬
‫االصدارات المحدثة عادة‪.‬‬
‫ب‪ .‬تحديد ان الرقابة العاملة لتكنولوجيا المعلومات من المراجعات األخري في مكانها و‬
‫تعمل لتحديد تطبيقات البيانات الكبيرة‪.‬‬
‫‪ .3‬القابلية للتطبيق و توافق مصادر البيانات الكبيرة‪:‬‬
‫أ‪ .‬مراجعة و توثيق االنواع و موارد التشغيل الفوري لتحديد تطبيقات البيانات الكبيرة‪.‬‬
‫ب‪ .‬مراجعة الرقابة المكانية لقبول البيانات من الموارد المرتبطة فقط‪.‬‬
‫‪5‬‬
‫ت‪ .‬تحديد ان قواعد الحوكمة للبيانات قد انشأت و قد تم توصيلها لمستخدمي التطبيقات‬
‫المعنيين‬
‫‪ .4‬تجميع المعلومات من المصادر المعنية‪:‬‬
‫أ‪ .‬تحديد ان رقابة األمن قد تم تثبيته لمعامالت المدخالت المصرح بها والصالحة و‬
‫المقبولة فقط‪.‬‬
‫ب‪ .‬مراجعة االجراءات للمعامالت المصرح بها و الصالحة لتحديد ان المعامالت تظهر‬
‫لتاتي م المصادر الصالحة فقط‪.‬‬
‫‪ .5‬تكامل و صالحية المعلومات التي تم جمعها‪:‬‬
‫أ‪ .‬مراجعة اجراءات الولوج (الدخول) و القطع (الخروج) لتحديد ان وقت معامالت االدخال‬
‫في مسارها‪.‬‬
‫ب‪ .‬مراجعة اجراءات اخطاء الولوج للتطبيقات المختاره و المحددة و المرتبطة بعمليات‬
‫القبول ‪ /‬الرفض في مكانها‪.‬‬
‫ت‪ .‬مراجعة عمليات خدمة العمالء لتحديد الرقابة و ضبط االخطاء و تصحيح مشاكل‬
‫االدخال للنظام‪.‬‬
‫‪ .6‬تخزين المعلومات و عمليات االسترجاع‪:‬‬
‫أ‪ .‬تحديد ان المعامالت و انشطة العمليات محافظ عليها بكفاءة و متوافقة مع رقابة ادارة‬
‫استم اررية المشروع‪.‬‬
‫ب‪ .‬تحد يد ما اذا كانت مسارات المراجعة واضحة كجزء من تطبيقات البيانات الكبيرة‬
‫المختارة‪.‬‬
‫‪ .7‬تصنيف وتحليل المعلومات‪:‬‬
‫أ‪ .‬تحديد و مراجعة مكان عمليات المراجعة التحليلية‪.‬‬
‫ب‪ .‬تحديد ان مكونات مراجعة ادخال معلومات البيانات الكبيرة في اماكن متنوعة و مرتبطة‪.‬‬
‫ت‪ .‬مقابلة العديد من مستخدمي تطبيقات البيانات الكبيرة لتحديد ما اذا كان لديهم فهم جيد‬
‫لمراجعة الموردين و تقنيات الرقابة و مراجعة االخطاء‪.‬‬
‫‪6‬‬
‫‪ .8‬تحديد رقابات مستخدم البيانات الكبيرة‪:‬‬
‫أ‪ .‬رقابة المراجعة للسماح بالتصنيفات المختلفة للمستخدمين للوصل الي تطبيقات البيانات‬
‫الكبيرة المراجعة‪.‬‬
‫ب‪ .‬اختيار عينة من المعامالت العديدة للتبطيقات المسجلة حديثا و تحديد انها ادت من‬
‫اشخاص مصرح لهم‪.‬‬
‫ت‪ .‬تحديد ان المدخالت و رقابة التطبيقات قد وثقت و وصلت لمجتمع المستخدمين كما تم‬
‫تخطيطه‪.‬‬
‫‪ .9‬االرتباط مع البرامج األخري المتعلقة‪:‬‬
‫أ‪ .‬من خالل المناقشة مع مدير قواعد بيانات تكنولوجيا المعلومات توضع الوظيفة‬
‫والمستخدمين لتطبيقات اخري تتداخل مع تطبيقات البيانات الكبيرة و تقييم ما اذا كانت‬
‫الروابط المتعلقة تظهر(واضحة)‪.‬‬
‫ب‪ .‬تحديد ان التقارير الكافية للحركة متوفره لمراقبة االنشطة مع التطبيقات األخري‪.‬‬
‫‪.10‬‬
‫رقابة التوازن والقطع (االختصار)‪:‬‬
‫أ‪ .‬تحديد االجراءات المتوازنة االوتوماتيكية (المأتمتة) في مكان لتحديد الرقابة المتوازنة كافية‪.‬‬
‫ب‪ .‬تقييم المالئمة و الصلة لمراجعة تطبيقات البيانات الكبيرة كعنصر من اصول تكنولوجيا‬
‫المعلومات للمشروع‪.‬‬
‫تغطي عمليات (‪ )ECM‬الكثير من المناطق للمشروع الحديث‪ .‬يبين الشكل ‪ 5-21‬نظرة‬
‫عامة علي مفاتيح عمليات (‪ )ECM‬فمن الممكن ان يثبت اي مشروع بعض منها ان لم يكن كل‬
‫هذه العمليات إلدارة بيانات و معلومات انظمة المشروع‪ .‬عدد كبير من الموردين مثل ‪، EMC‬‬
‫و ‪ ، IBM‬و ‪ ، Microsoft‬و ‪ ، Oracle‬تعرض حلول مواقع منتجات (‪ .)ECM‬يجب ان‬
‫يجمع المراجع الداخلي بعض المعلومات عن انواع و حالة اي برنامج (‪ )ECM‬تم تثبيته كجزء‬
‫من رقابة و مراجعة تكنولوجيا المعلومات العامة او البنية التحيتية و اكتساب بعض المعرفة العامة‬
‫عن مالمحها و امكانياتها‪ .‬هذا المجال الكلي لـ (‪ )ECM‬يتغير بسرعة كتطور التكنولوجيا الجديدة‬
‫و كحركتها بعيدا عن االستقالل التاريخي من الوثائق الورقية األولية في االتجاه نحو السجالت‬
‫المعتمدة علي الصور الرقمية‪.‬‬
‫‪7‬‬
Download