البيانات الكبيرة و إدارة مكونات المشروع مع زيادة التركيز علي كل أنواع األنظمة األوتوماتيكية و أداواتها المناسبة المتاحة لحفظ هذه البيانات نظ ار إلنخفاض تكاليف تخزين البيانات ،وصلت الصناعات في كل المستويات لعصر ، ما نسميه البيانات الكبيرة ،البيانات الضخمة من المعلومات او حتي البيانات الخام المتحصل عليها من كل انواع األنظمة األوتوماتيكية .يبحث عادة كل من المشروعات ،و المستخدمين ،و بالتأكيد المنظمين الحكوميين للوصول لكل البيانات التي تغطي الصفقات (المعامالت) عبر الوقت و من ثم توقع توافر هذه البيانات للوصول و التحليل خالل فترات سابقة. اصبحت القدرة علي الحصول علي هذه البيانات و تخزينها اسهل عبر السنوات األخيرة إلنخفاض تكاليف تخزين البيانات في هذه األيام .عندما انخفضت تكاليف تخزين البيانات ،تزايدت كميات و احجام تجميع البيانات و تخزينها بطريقة مذهله .و بالتركيز علي احتياجات المعرفة للمراجعة الداخلية .يقدم هذا الفصل نظره علي مفاهيم البيانات الكبيرة و مناقشة الحوكمة و المخاطر و قضايا اإللزام الخاصة بالبيانات الكبيرة المرتبطة بأمن المعلومات و عمليات المراجعة الداخلية لمراجعة الرقابة الداخلية في بيئة البيانات الكبيرة. مفهوم البيانات الكبيرة : " البيانات الكبيرة هي اصل معلوماتي كبيرة الحجم و السرعة و التنوع و الذي يتطلب كفاءة تكاليف ،و تشغيل المعلومات بطريقة مبتكرة لتعزيز الرؤية و صنع القرار". خصائص البيانات الكبيرة : تتمثل خصائص البيانات الكبيرة بعدد من الخصائص متمثلة فى :السرعة ،الحجم ، التنوع ،عرفت تلك الثالث V'sالخاصة بالحجم الكبير ، Volumeالسرعة ،Velocityو التنوع Varietyالبيئة الشائعة بطريقة تقليدية والذي استخدمت مسبقا لتعريف ووصف قضايا البيانات الكبيرة .و لقد اضافت كثير من المصادر الحالية Vرابعة و هي Veracityالصدق (الصحة) كعامل إضافي مهم للبيانات الكبيرة .و يشير مصطلح الصدق (الصحة) كعامل اضافي مهم للبيانات الكبيرة .حيث يشير مصطلح الصدق (الصحة) إلي الدقة والصحة لهذه الجماهير للبينات الكبيرة و يعتبر هذا المصطلح (المفهوم) مهم خاصة للمراجعيين الداخليين عند اخذ البيانات الكبيرة في اإلعتبار من منظور المراجعة و الرقابة. 1 أوال :الحجم Volume يشير الحجم إلي الكميات المنشورة من البيانات الشائعة للتطبيق المعطي او النظام باإلعتماد علي الحجم النسبي للمشروع .يوجد تنسيق شائع في حاالت كثيرة للحجم الزائد يمكن ان يعد تقليديا بالسجل الخام " "rowsو /او بمصطلح المساحة التخزينية المطلوبة .مثال علي بيانات االحجام العمالقة سجالت االحداث الخام لخوادم االحجام العالية .و آخر يمكن ان يكون حجم المعامالت للمبيعات الموسمية للوحدات المتعددة (فروع) بيع التجزئة. ثانياً :السرعة Velocity تشير السرعة إلي سرعة نقل و/او تغير البيانات .تعتبر مشكلة السرعة واحدة في التجميع و االستجابة .عندما تأتي اعداد كبيرة من العمليات او الرسائل بسرعة في تطبيق المشروع او الموقع االلتكتروني ،و التي يحتاج المشروع لتجميع و تشغيل هذه البيانات ذات السرعة العالية (السرعة العالية لهذه البيانات) .و هذه ليست مشكلة مكونات و عادة ليست مرتبطة بحجم او تنوع البيانات الكبيرة ايضا .و مثال شائع علي السرعة العالية للبيانات هو كذلك ما يعرف بـ Twitter fire hoseخرطوم الحريق لـ Twitterالتيار المستمر لكل التوثيقات (التغريدات) التي عبرت نظام Twitterبعض األحداث او تعليقات Twitterقد تؤدي الي عدد حجم من عمليات االستجابة (التعليقات) رغم ان Twitterتطلب فقط تصنيف و تجميع هذه الرسائل الهائلة ،السرعة العالية قد تسبب تحديات للنظام. ثالثاً :التنوع Variety يشير التنوع في البيانات الكبيرة لعده مصادر وانواع البيانات المهيكلة و غير والمهيكلة من مصادر مثل الجداول االلكترونية ،وقواعد البيانات ،وروابط الفيديو ،والرسوم البيانية ،وأجهزة المراقبة والمزيد ناد ار ما تقدم البيانات نفسها في شكل محدد مرتب وجاهز للتشغيل وهذا التنوع الغير مهيكل للبيانات ممكن ان تخلق مشكلة للتخزين ،والتشغيل والتحليل. رابعاً :الصحة Veracity تتعامل الصحة مع االهتمامات بغض النظر عن البيانات غير المؤكدة وغير الدقيقة مثل التحيز والضوضاء وغير الطبيعي في البيانات وعند تعامل اإلدارة العامة لتكنولوجيا المعلومات وبالتأكيد المراجعة الداخلية مع مواقف انظمة البيانات الكبيرة يجب ان تسأل عن مدي مناسبة 2 البيانات التي تم تغشيلها وتخزينها لطبيعة المشكلة التي يتم تحليلها .في انظمة قواعد البيانات التقليدية وبالطبع في االنظمة التي تم مراجعتها من المراجعة الداخلية عن الرقابة الداخلية لها ومدي كفايتها ،فهناك دائما االفتراض ان تطبيقات البيانات مؤكدة و واضحة و دقيقة. حوكمة البيانات الكبيرة : تجذب البيانات الكبيرة تحديات جديدة في شكل الحوكمة و قضايا األمن كزيادة التنظيمات. بينما تبقي معظم حوكمة تكنولوجيا المعلومات ،و الخطر ،و قضايا االلزام غير متغيرة بال شك سيوظف احجام التطبيقات و احجام البيانات .ينتج مشغلي األنظمة و المشروعات في بيئة البيانات الكبيرة بعض القضايا اإلضافية و تحديات للمراجعين الداخليين في ادائهم لمراجعة الرقابة الداخلية في بيئة البيانات الكبيرة .نقطتان هنا هي انه يجب علي المراجعين الداخليين ان يكونوا علي فهم و دراية جيدة بـ CBOKو علي معرفة بقضايا الرقابة الداخلية للبيانات الكبيرة .و كما ان االعمال و االنظمة تنموا سينموا معها ايضا المراجعيين الداخلين بالمقابل ألنظمة البيانات الكبيرةو يحتاجوا لفهم قضايا الرقابة الداخلية. تعرض التطبيقات الحالية للبيانات الكبيرة و بدايات تكنولوجيا المعلومات لبناء و تشغيل هذه البيانات ،فرص هامة للمشروعات للنمو عبرها و فهم مستبصر ألعمالهم ،و لكن يوجد ايضا أهمية للحوكمة في مخاطر الرقابة الداخلية .و بمراجعة الخطوة األولي يجب علي المراجع الداخلي فهم الحقائق او العناصر األربعة للبيانات الكبيرة و هي الحجم ،و السرعة ،و التنوع ،و الصحة. كما تم مناقشتها في األجزاء السابقة ،و كيف يتم تطبيقهم في التطبيقات المعطاه كما في وظائف بيانات تكنولوجيا المعلومات تحت المراجعة .يمكن ان يساعد مستوي النشاط في اي او كل هذه المناطق توكيد المراجعين الداخليين حتي لو كان يواجه موقع البيانات الكبيرة. يجب علي المراجعين الداخليين لرقابة الحوكمة المرتبطة و مجموعات البيانات الحوكمية المبنية او المهيكلة جيدا للعمليات عند مراجعة الرقابة الداخلية في بيئة البيانات الكبيرة. * آلية الرقابة لمنع تسرب البيانات تسريب البيانات من اهتمامات اليوم لعصر البيانات الكبيرة .يعتبر تسريب البيانات هو النقل غير المصرح به للبيانات او المعلومات من خالل المنظمة لجهه او مستقبل خارجي .يعرف تسريب البيانات توزيع مقصود او غير مقصود لبيانات خاصة او حساسة لجهه غير مصرح لها .قد يتسبب 3 قصور امن المعلومات او اي تسريب للملفات مع البيانات الكبيرة في نقل ماليين من السجالت لجهات غير مصرح لها. تحتوي البيانات الحساسة علي حقوق ملكية فكرية ،و معلومات مالية ،و معلومات طبيقة للمرضي ،و بيانات بطاقة االئتمان ،و اي معلومات اخري تعتمد علي االعمال او الصناعة. عالوة علي ذلك ،قد يتم نشر البيانات الحساسة في كثير من الحاالت بين المساهميين المختلفين مثل الموظفين العاملين داخل المبني من خارج المنظمة ،و شركاء االعمال ،و الزبائن و الذي يؤدي لزيادة خطر وقوع المعلومات السرية في ايدي غير مصرح لها. 21-6 Enterprise Content management Internal Controls الرقابة الداخلية إلدارة مكونات المشروع بمجرد ان ظهر مصطلح البيانات الكبيرة اصبح مهم و متطور للمشروع و لوظائف تكنولوجيا المعلومات و المراجعين الداخليين ،ادارة مكونات المشروع ( )ECMمصطلح جديد و يتطور بسرعة و الذي يجب ان يكون جزء من CBOKللمراجع الداخلي للفهم و األلفة .يشرح ()ECM االستراتيجيات ،و الطرق ،و األدوات التي تحصل بها ،و تدير ،و تخزن ،و تحفظ ،و تنقل المحتوي و الوثائق المتعلقة بعمليات المشروع .يغطي ( )ECMالعمليات التي تساعد ادارة المعلومات في المجال الداخلي للمشروع ،اذا كان في شكل ورقي (وثائق ورقية) ،و ملفات الكترونية ،و تيار مطبوع لقواعد البيانات ،و صورة كود الصنف ،او حتي بريد الكتروني. يعتبر ( )ECMمصطلح يغطي تحت مظلته ادارة الوثائق ،و ادارة مكونات الموقع االلكتروني ،و البحث ،و التعاون ،و ادارة السجالت ،و األصول الرقمية ،و ادارة خرائط العمل ،و الحصول علي الوثائق ،و عمليات المسح ،و االكثر من ذلك .يساعد ( )ECMبداية في ادارة دورة حياة المعلومات من بداية النشر او الخلق في الطريق خالل الطريق لالرشفه او حتي التخلص. تهدف اإلدارة الجيدة والرقابة الجيدة لعمليات ( )ECMلتسهيل عمل ادارة معلومات المشروع من خالل التخزين البسيط ،و االمن ،و رقابة االصدار ،و عملية الـ routingو االسترجاع .و تتضمن الفوائد للمشروع في تحسين الكفاءة ،و رقابة داخلية افضل ،و تخفيض التكاليف ،علي سبيل المثال تستخدم بنوك عديدة عمليات ( )ECMلحفظ نسخ من الشيكات الموقعة من العمالء في مقابل الطرق القديمة لحفظ الشيكات الطبيعية في مستودعات ورقية ضخمة .في النظام القديم طلب العميل لنسخة من الشيك قد يأخذ اسبوع ،حيث يجب علي البنك ان يتصل بالمستودع 4 (المخزن) للبحث عن الصندوق الصحيح ن و الملف ،حيث يوجد الشيك .و يجب بعد ذلك الحصول علي الشيك و نسخه و ارساله بالبريد للبنك ،حيث بعد ذلك يرسل للعميل .مع نظام ( )ECMالبديل ،يطلب موظف البنك الشيك .عندما تظهر صورة الشيك علي الشاشة ،يكون البنك قادر علي ارساله في الحال عبر البريد االلكتروني للعميل عادة ،بينما يكون العمليل مازال علي الهاتف. Exhibit 21-4 Auditing Big Data Internal control الرقابة الداخلية لمراجعة البيانات الكبيرة. .1مراجعية اختيار تطبيقات البيانات الكبيرة: أ .مراجعة حجم البيانات ،و احصائيات نشاط المعامالت ،و عوامل اخري لتحديد تطبيقات البيانات الكبيرة. ب .مجال التوثيق لتحديد تطبيقات البيانات الكبيرة ،وتضمين نظام تغذية آخر واالتصال باالنترنت. ت .استخدام ادوات تحديد المخاطر لتخطيط الم ارجعة الداخلية لتقييم مخاطر تطبيقات البيانات الكبيرة و ما يرتبط بها للمراجعة. .2عوامل بيئة مشروع البيانات الكبيرة: أ .توثيق البرامج المتخصصة المستخدمة لتطبيقات البيانات الكبيرة و تحديد تلك االصدارات المحدثة عادة. ب .تحديد ان الرقابة العاملة لتكنولوجيا المعلومات من المراجعات األخري في مكانها و تعمل لتحديد تطبيقات البيانات الكبيرة. .3القابلية للتطبيق و توافق مصادر البيانات الكبيرة: أ .مراجعة و توثيق االنواع و موارد التشغيل الفوري لتحديد تطبيقات البيانات الكبيرة. ب .مراجعة الرقابة المكانية لقبول البيانات من الموارد المرتبطة فقط. 5 ت .تحديد ان قواعد الحوكمة للبيانات قد انشأت و قد تم توصيلها لمستخدمي التطبيقات المعنيين .4تجميع المعلومات من المصادر المعنية: أ .تحديد ان رقابة األمن قد تم تثبيته لمعامالت المدخالت المصرح بها والصالحة و المقبولة فقط. ب .مراجعة االجراءات للمعامالت المصرح بها و الصالحة لتحديد ان المعامالت تظهر لتاتي م المصادر الصالحة فقط. .5تكامل و صالحية المعلومات التي تم جمعها: أ .مراجعة اجراءات الولوج (الدخول) و القطع (الخروج) لتحديد ان وقت معامالت االدخال في مسارها. ب .مراجعة اجراءات اخطاء الولوج للتطبيقات المختاره و المحددة و المرتبطة بعمليات القبول /الرفض في مكانها. ت .مراجعة عمليات خدمة العمالء لتحديد الرقابة و ضبط االخطاء و تصحيح مشاكل االدخال للنظام. .6تخزين المعلومات و عمليات االسترجاع: أ .تحديد ان المعامالت و انشطة العمليات محافظ عليها بكفاءة و متوافقة مع رقابة ادارة استم اررية المشروع. ب .تحد يد ما اذا كانت مسارات المراجعة واضحة كجزء من تطبيقات البيانات الكبيرة المختارة. .7تصنيف وتحليل المعلومات: أ .تحديد و مراجعة مكان عمليات المراجعة التحليلية. ب .تحديد ان مكونات مراجعة ادخال معلومات البيانات الكبيرة في اماكن متنوعة و مرتبطة. ت .مقابلة العديد من مستخدمي تطبيقات البيانات الكبيرة لتحديد ما اذا كان لديهم فهم جيد لمراجعة الموردين و تقنيات الرقابة و مراجعة االخطاء. 6 .8تحديد رقابات مستخدم البيانات الكبيرة: أ .رقابة المراجعة للسماح بالتصنيفات المختلفة للمستخدمين للوصل الي تطبيقات البيانات الكبيرة المراجعة. ب .اختيار عينة من المعامالت العديدة للتبطيقات المسجلة حديثا و تحديد انها ادت من اشخاص مصرح لهم. ت .تحديد ان المدخالت و رقابة التطبيقات قد وثقت و وصلت لمجتمع المستخدمين كما تم تخطيطه. .9االرتباط مع البرامج األخري المتعلقة: أ .من خالل المناقشة مع مدير قواعد بيانات تكنولوجيا المعلومات توضع الوظيفة والمستخدمين لتطبيقات اخري تتداخل مع تطبيقات البيانات الكبيرة و تقييم ما اذا كانت الروابط المتعلقة تظهر(واضحة). ب .تحديد ان التقارير الكافية للحركة متوفره لمراقبة االنشطة مع التطبيقات األخري. .10 رقابة التوازن والقطع (االختصار): أ .تحديد االجراءات المتوازنة االوتوماتيكية (المأتمتة) في مكان لتحديد الرقابة المتوازنة كافية. ب .تقييم المالئمة و الصلة لمراجعة تطبيقات البيانات الكبيرة كعنصر من اصول تكنولوجيا المعلومات للمشروع. تغطي عمليات ( )ECMالكثير من المناطق للمشروع الحديث .يبين الشكل 5-21نظرة عامة علي مفاتيح عمليات ( )ECMفمن الممكن ان يثبت اي مشروع بعض منها ان لم يكن كل هذه العمليات إلدارة بيانات و معلومات انظمة المشروع .عدد كبير من الموردين مثل ، EMC و ، IBMو ، Microsoftو ، Oracleتعرض حلول مواقع منتجات ( .)ECMيجب ان يجمع المراجع الداخلي بعض المعلومات عن انواع و حالة اي برنامج ( )ECMتم تثبيته كجزء من رقابة و مراجعة تكنولوجيا المعلومات العامة او البنية التحيتية و اكتساب بعض المعرفة العامة عن مالمحها و امكانياتها .هذا المجال الكلي لـ ( )ECMيتغير بسرعة كتطور التكنولوجيا الجديدة و كحركتها بعيدا عن االستقالل التاريخي من الوثائق الورقية األولية في االتجاه نحو السجالت المعتمدة علي الصور الرقمية. 7