البيانات الضخمة: البرامج مفتوحة المصدر فتحت الأبواب للابتكار في المكتبات

المؤلفون

  • زينب عبد الواحد سلمان

الكلمات المفتاحية:

البيانات الضخمة، المكتبات الجامعية، منصة هادوب، معالجة البيانات، الأنظمة مفتوحة المصدر

الملخص

في هذا البحث تم استعراض كيفية التعامل مع البيانات الضخمة، إذ إن جمع وتخزين المعلومات والتحليل للبيانات اصبح مسألة لا يمكن السيطرة عليها من خلال برامج معالجة البيانات بأحجامها التقليدية، سابقا كانت واحدة من أكبر العقبات التي تواجه شركات التكنولوجيا والمؤسسات الناشئة ومحللي البيانات هي كيفية القدرة على معالجة مثل هذه الأحمال الكبيرة من البيانات والتي كانت عائقًا كبيرًا للعديد من الشركات الناشئة أو المؤسسات البحثية غير الربحية ، لكن البرامج الحديثة مفتوحة المصدر مثل Hadoop وغيره أزالت هذه الحواجز، Hadoop هو منصة أو إطار عمل برمجي يسمح بتخزين ومعالجة البيانات على نطاق واسع، وهو مجاني ومتاح لجميع المبرمجين والمطورين. يهدف البحث الى تحديد كيفية التعامل مع مجموعة من البيانات التي يتجاوز حجمها قدرة برامج قواعد البيانات المعروفة لالتقاطها وتخزينها وإدارتها وتحليلها والذي يتطلب أشكالا مبتكرة وفعالة لمعالجتها تختلف عن معالجة البيانات العادية بحيث تمكن مستخدميها من تحسين الرؤيا واتخاذ القرارات. عينة البحث هي الرسائل والاطاريح الجامعية المتاحة بشكل رقمي بصيغة PDF وبصيغة Word والمتوفرة في المكتبة المركزية للجامعة المستنصرية، وقد بلغت (107345) رسالة وأطروحة جامعية تمثل 2،49 تيرا بايت مقابل 25661 كتابًا إلكترونيًا مخزنة في هذه المكتبة، وتمثل 5852 ميغا بنصها الكامل، وبهذا بلغ العدد الإجمالي للبيانات المؤرشفة 3،08 تيرابايت. وعلى الرغم من تنوع قواعد البيانات بين مكتبات الجامعة المختلفة، لكن السمة الغالبة في البحث هي حسب الموضوع أو المؤلف أو العنوان. ويتم استخدام طريقة البحث هذه في معظم أنواع قواعد البيانات المكتبية، ومن خلال عدة معايير منها الوقت والدقة وحجم المصادر التي يتم استدعاؤها في وقت واحد توصلت الباحثة في نتائج بحثها بان الوضع الحالي غير مرضي وربما يستمر كذلك في المستقبل بسبب التزايد المستمر في أعداد وأحجام الرسائل والاطاريح الجامعية وما يقابله من تنافس قوي من قبل البحوث العلمية إذ اصبح الباحثين يتوجهون لها في الوقت الحاضر ومع تعقيدات الوصول الى المعلومات الكاملة لمحتوى تلك الرسائل والاطاريح وعدم إتاحتها بالنص الكامل في اغلب قواعد البيانات وذلك بسبب عدم استخدام التقنيات الملائمة للتعامل مع البيانات الضخمة واستيعاب هذا الكم من البيانات فهذا يعني تردي الطلب على الاطاريح الجامعية قياسا بتزايد قوة الطلب على البحوث العلمية بسبب تعقيدات الوصول لمحتوياتها بالنص الكامل وعدم ملاءمة استراتيجيات البحث التقليدية لمواكبة احتياجات المستفيدين خاصة مع تزايد إتاحة الكتب بشكل رقمي رغم وجود بعض المحددات للوصول الى المحتوى الرقمي الكامل للكتب الرقمية. أوصت الباحثة انه من الضروري استخدام تقنيات تستجيب لاستراتيجيات البحث خاصة في البيانات الضخمة والبحث المتقدم عبر استخدام برنامج Hadoop لتغطية المخرجات الفكرية في المستقبل، وإمكانية استثمار Hadoop في مجال البيانات الضخمة واختيار المكتبة المركزية في الجامعة المستنصرية نموذجاً للتعامل مع البيانات الضخمة وكيف يمكن إن تساهم في تنظيمها.

التنزيلات

منشور

2023-02-24

إصدار

القسم

مقالات