INI

الاثنين، 19 نوفمبر 2012

خفايا المحتوى الرقمي العربي بين يدي سد مأرب


الشرق الاوسط:
187 ألف مدونة عربية لكن المدونات الفاعلة والنشيطة قد لا تتجاوز الثلاثين!
* نسبة التكرار في المحتوى العربي الرقمي تصل إلى 68% بينما في المحتوى الإنجليزي الرقمي تبلغ 12% فقط.
نهاية هذا الشهر، سيصبح في متناول الجمهور العربي قاعدة بيانات إحصائية، توضح أسرارا كثيرة حول المحتوى الرقمي العربي الذي ما يزال بعيدا عن الرصد والدراسة العلميتين. وبكبسة زر سيصبح بمقدورنا التعرف على المواقع العربية الأكثر زيارة، والمدونات الفاعلة، والأماكن التي تستحق أن نوظف فيها إعلاناتنا. مشروع ما يزال في أوله لكنه قفزة علمية يبنى عليها ويعتمد، خاصة أن دراسة تحليلية للمحتوى ستصدر أول يناير (كانون الثاني)، وهذه خطوة إضافية أخرى ستشرع أبوابا كثيرة لمن يشتهي.


وبدأت «مؤسسة الفكر العربي» العمل منذ ما يقارب العامين على مشروع رائد يدرس المحتوى الرقمي العربي ويحلله، وباشرت مؤخرا، بإجراءات تسجيل الملكية الفكرية لهذا المشروع، الذي يتيح للجمهور الاطلاع على المحتوى الرقمي العربي بلمسة إصبع، وفقا لمعايير النوعية، والبلدان، وقنوات النشر، والخصائص، والحجم. ويتيح هذا المشروع غير المسبوق في العالم العربي، توفير مجموعة من الخدمات؛ من ضمنها تصنيف يصدر كل ثلاثة أشهر لأهم عشرة مواقع عربية على شبكة الإنترنت. وهو تصنيف يتجاوز المعايير التي يأخذ بها مؤشر «ألكسا» Alexa ويعتمد على مجموعة معايير مستحدثة خاصة بمؤسّسة الفكر العربي. كما ستسهم هذه القاعدة الرقمية في تحديد القيمة المالية لمختلف قنوات النشر العربية المتوافرة على الإنترنت ومنها المواقع والمدوّنات.

ويشرح لنا الدكتور سليمان عبد المنعم، الأمين العام لـ«مؤسسة الفكر العربي»، أن هدف المشروع هو التعرف على المحتوى الرقمي العربي على الشبكة، ما حجمه؟ ما مؤشراته الإحصائية في مختلف المجالات سواء على شبكات التواصل الاجتماعي Social Media أم على المواقع الإلكترونية الـWebsites؟ ومعرفة قضايا المحتوى الرقمي العربي وأوجه الضعف فيه؟ وآفاق تطوره؟

العمل جارٍ على شقين. الشق الأول هو إنتاج قاعدة بيانات إحصائية عن المحتوى الرقمي العربي على شبكة الإنترنت، تحمل اسم «مأرب» سيتم وضعها على الموقع الإلكتروني لـ«مؤسسة الفكر». تتيح هذه القاعدة لزوارها التعرف على نسبة الوجود العربي على شبكة الإنترنت على أصعدة شتى. فيمكن مثلا معرفة نسبة هذا الوجود على صعيد نوعية المحتوى في القضايا الاجتماعية أو الثقافية أو الاقتصادية أو السياسية، وكذلك على صعيد الخصائص مثل جودة هذا المحتوى والملكية والجماهيرية، وأيضا على صعيد قنوات النشر مثل المواقع والمدونات والمنتديات والشبكات الاجتماعية وشبكات الفيديو و«تويتر» والقوائم البريدية. وعلى صعيد التوزيع الجغرافي تتيح قاعدة «مأرب» التعرف على حجم المحتوى العربي في كل دولة عربية على حدة.

أما الشق الثاني فهو إصدار تقرير تحليلي ونقدي عن المحتوى الرقمي العربي على شبكة الإنترنت. وهذا التقرير النقدي سيصدر في شكل ورقي ويعتبر مكملا لقاعدة البيانات الرقمية. وهكذا يصبح لدينا تصور مكتمل عن تشخيص ووصف المحتوى الرقمي العربي من ناحية وعن الرؤية النقدية لهذا المحتوى من ناحية أخرى.

الموضوع لا يتعلق بالجانب المعرفي فقط بحسب ما يشرح لنا الدكتور عبد المنعم، فهناك جدوى اقتصادية أيضا. «فمثلا من خلال التعرف على المواقع الأكثر جماهيرية على الإنترنت تتضح إمكانات الاستثمار العربي على الشبكة. كما سيكون لهذا المشروع مخرجات أخرى مثل إصدار تصنيف دوري كل أربعة أشهر لأهم عشرة مواقع عربية على شبكة الإنترنت. وهذا التصنيف يستند إلى معايير أخرى جديدة غير المعايير التي يعتمد عليها حاليا تصنيف (أليكسا) الشهير».

وسيتم إطلاق قاعدة البيانات الإحصائية «مأرب» نهاية هذا الشهر. أما التقرير التأسيسي للمحتوى الرقمي العربي فمن المتوقع أن يتم إطلاقه في أوائل يناير (كانون الثاني) المقبل. وللمشروع هيئتان؛ تقنية واستشارية. الهيئة التقنية تضم فريقا من الخبراء والباحثين تحت إشراف جمال غيطاس، خبير المعلوماتية العربي المعروف، والدكتور خالد الغمري وهو أكاديمي بارز يعمل في جامعة عين شمس. أما الفريق الاستشاري فيضم الدكتور عماد بشير الأكاديمي المرموق في الجامعة اللبنانية وكان له دور كبير في الإعداد والتحضير لهذا المشروع والدكتور سعد أبو جبل الأستاذ بجامعة الإسكندرية ودوره الأساسي هو الإشراف على التقرير التأسيسي للمحتوى الرقمي العربي - رؤية تحليلية ونقدية. بالإضافة إلى فريق عمل مؤسسة الفكر العربي.

وعند الحديث عن المحتوى الرقمي العربي فالمقصود به «كل ما هو مكتوب بحروف عربية على شبكة الإنترنت، وكل ما هو مسجل بأصوات عربية، وما هو مصوّر بشكل يستدل به على مصدره العربي. فكل هذا المحتوى النصي والسمعي والبصري يشكل المحتوى العربي سواء صدر من داخل الدول العربية أم من خارجها، وأيا كان مالكه أو منتجوه أو مستهلكوه. بطبيعة الحال لا يمكن رصد (كل) هذا المحتوى لأنه يتجدد بصورة دائمة ومستمرة. وقاعدة البيانات الإحصائية (مأرب) ترصد المحتوى العربي حتى أول يناير (كانون الثاني) 2012. ولكن يمكن بطبيعة الحال تحديث المحتوى العربي الجديد أولا بأول على نحو دوري كل ستة أشهر أو كل عام مثلا».

الأمر المؤرق في هذه الحالة، هو أن عددا كبيرا من الشبان العرب يكتبون على الشبكة لغتهم العربية بحرف لاتيني، وآخرين لا يقلون عددا يستخدمون الإنجليزية للتعبير على الإنترنت أو الفرنسية وربما لغات أخرى، وبالتالي هم خارج نطاق الدراسة كليا، وهو أمر يجعل عربا كثيرين خارج نطاق المحتوى الرقمي لأمتهم.

ويعلق الدكتور عبد المنعم على هذا الموضوع بالقول: «استخدام الشباب العربي للحرف اللاتيني لا شك أنه يتحول من مجرد سلوك شريحة عمرية من الشباب إلى ظاهرة مقلقة بل وخطيرة. لنا أن نتخيل ما يمكن أن تؤول إليه هذه الظاهرة المتفاقمة بعد أربعين أو خمسين عاما من الآن. ويجب ألا ننسى أبدا ما حدث للغة اللاتينية. يجب أن يبقى درس اللاتينية حاضرا في ذاكرتنا. لا يكفي أن نلوذ بالسلبية والسكوت مرددين الآية القرآنية (إنا نحن نزلنا الذكر وإنا له لحافظون). فالله منزّه وبريء من تفسيرنا الكسول. لا أريد أن أكون متشائما إذا قلت إن انتشار ظاهرة الكتابة بالحرف اللاتيني تعبيرا عن أفكار وكلمات عربية يمكن أن يقودنا بعد مائة عام مثلا إلى ازدواجية جديدة هي أخطر من الازدواجية الحالية بين لغة عربية متحفية ومهجورة تتداولها النخبة وتكتب بها الأوراق الرسمية والكتب وبين لغة لاتينية الحرف عربية المضمون يتداولها الناس عبر الوسائط الرقمية الحديثة. وعلينا ألا ننسى أن هذه الوسائط الرقمية الحديثة ستكون في المستقبل بديلا عن استخدام الورق كدعامة للكتابة».

قاعدة «مأرب» إذن لا تحصي من يكتبون بغير الحرف العربي، وتقدم وصفا لنسب المحتوى العربي على شبكة الإنترنت، أي مجرد وصف ساكن بحسب النوعية أو المجال أو التوزيع الجغرافي أو قنوات النشر.. الخ. وبحسب عبد المنعم فقد «بلغ حجم هذه القاعدة من البيانات نحو عشرين مليون و451 ألف وحدة معلوماتية وتتضمن وحدات التحليل ملفات ملحقة أو مرتبطة بها تبلغ 126 مليونا و12 ألفا بين نص وصورة وفيديو وPDF وهو رقم كبير وهائل لأنه يحتوي داخله على مليارات من المعلومات الداخلية». لكن قيمة هذه القاعدة أنه يمكن تطويرها والبناء عليها مستقبلا بحيث يمكن أن تتحول مثلا إلى محرك بحث عربي، لكن هذا يتطلب تمويلا كبيرا ومدة زمنية طويلة. ويعلق عبد المنعم: «المهم الآن أن لدينا قاعدة بيانات إحصائية يمكن أن تعطينا الكثير من المؤشرات والدلالات الهامة. فمثلا نكتشف من هذه القاعدة أن الوجود العربي أكثر بكثير على شبكات التواصل الاجتماعي الـSocial Media مقارنة بالمواقع الـWebsites. وهو ما قد يعني أن مساحة (الثرثرة) الإلكترونية لدينا تفوق المحتوى المعلوماتي الجاد والمفيد. كما أن نسبة التكرار في المحتوى العربي الرقمي تصل إلى 68% بينما في المحتوى الإنجليزي الرقمي تبلغ 12% فقط».

معلومات لا يبدو أنها تدعو للتفاؤل خاصة لو علمنا أن العاملين على المشروع وجدوا أن أول مدوّنة عربية ترجع لعام 1990، وأن على الشبكة حاليا ما يقارب 187 ألف مدونة عربية لكن المدونات الفاعلة والنشيطة قد لا تتجاوز الثلاثين، وفي أحسن الحالات العشرات.

نطرح سؤالا على عبد المنعم: تقولون إنكم عملتم على مدى جغرافي واسع وشامل للمرة الأولى، شمل 22 دولة عربية، لكنكم أيضا تقولون إن ثلث المحتوى العربي الرقمي مجهول الهوية أو المصدر؟ ما معنى ذلك ودلالاته؟ يجيب «نقصد طبعا بالمدى الجغرافي الواسع لرصد المحتوى العربي هو شموله لكل الدول العربية، وهناك مدخل جغرافي للحصول على نسب المحتوى الرقمي الخاص بكل دولة عربية على حدة وذلك في أي مجال من المجالات المطلوبة. لكن يقصد بالمصدر المجهول أن ثلث هذا المحتوى العربي لا نعرف مصدره لأنه لا يندرج ضمن نطاق ما نسميه العلم الوطني الإلكتروني. فمثلا المحتوى اللبناني يكون تحت lb والمصري eg والسعودي sa. الواقع أن هناك محتوى عربيا مكتوبا بحروف عربية لكنه لا يندرج تحت أحد هذه النطاقات الجغرافية أو الأعلام الإلكترونية، وبالتالي فنحن لا نعرف أين مصدره، وهل صدر من داخل دولة عربية أم من خارجها. وهذه مسألة جديرة بالاهتمام. أما المحتوى العربي مجهول الهوية فهو المحتوى الذي نجده على شبكة الإنترنت من دون أن نعرف هويته: ذكور أم إناث، فرد أم مؤسسة أم هيئة حكومية».

لا ينفي عبد المنعم أن هناك مشاريع أخرى مهمة وجادة تعنى بالمحتوى الرقمي العربي تقوم بها مؤسسات ثقافية وجامعات ومكتبات. لكن معظم هذه المشاريع تهتم بالمحتوى الرقمي العربي على صعيد الكتب والتراث الحضاري فتنقلها من الحالة الورقية إلى الحالة الرقمية وتضعها على الإنترنت إما بهدف نشر الثقافة أو البيع، وكذلك الأمر بالنسبة للاهتمام بالأغاني أو الأفلام العربية مثلا. لكن مشروع «مؤسسة الفكر» لا ينصب على قطاعات أو مجالات رقمية بعينها لكنه يرصد المحتوى في صورته الحية كما هو موجود على الإنترنت من خلال أدوات الرصد والتحليل وجمع المادة الخام. فقاعدة البيانات الرقمية «مأرب» ترصد الحالة العامة للمحتوى الرقمي العربي من خلال تقسيم ثماني يضم: المحتوى الاجتماعي (بنية المجتمع تركيبته، مستويات التعليم والفقر والصحة وحركة المجتمع المدني). المحتوى الثقافي (الإنتاج الفني والثقافي والمعلومات الخاصة بالنخب الثقافية والفكرية). المحتوى الاقتصادي (زراعة وتجارة وتصنيع وبنوك وجمارك ومعلومات البناء والإسكان والسجل التجاري وغيرها). المحتوى العلمي (البحوث الأكاديمية وأنشطة التطوير والابتكار والاختراع). المحتوى التعليمي (المناهج والمدارس والجامعات وقضايا التعليم) . المحتوى السياسي والقانوني، وكذلك المحتوى العسكري والأمني، والمحتوى الإعلامي.

ليست هناك تعليقات:

إرسال تعليق

المتابعون