ذكاء صنعي

07/03/2012 10:06:25

التنقيب في المعطيات و الاستخدام الذكي للمعلومات

بعد أن قامت معظم المؤسسات العالمية الكبرى بأتمتة أعمالها، و بناء نظم معلومات خاصة بها، بدأت بالتفكير جدياً في طرق جديدة للاستفادة من الكم الهائل من المعطيات المتعلقة بها، و مساعدة متخذ القرار على الاستفادة من المعلومات المتوفرة لديه، لأنه بالتأكيد لن يقوم بالاطلاع على أكوام التقارير الواردة إليه من نظم المعلومات التي تم بناؤها، و صُرفت عليها مبالغ هائلة للوصول إلى نتائج تحسّن من أداء الأعمال ضمن مؤسسته، و تمكنه من اتخاذ أنسب القرارات.

 

 

لذلك ظهر مصطلح جديد يعالج المشكلات السابقة هو مصطلح ذكاء الأعمال. طرح مصطلح ذكاء الأعمال أول مرة غارتنر Gartner في نهاية العام 1980. يمكن اعتبار ذكاء الأعمال مجموعة من الإجراءات الموجهة نحو المستخدم و التي تقوم بالوصول إلى المعلومات و استكشافها، ثم تحليل هذه المعلومات، و تطوير طريقة فهمها، مما يؤدي إلى تحسين طريقة اتخاذ القرارات. و يمكن ببساطة تفسير ذكاء الأعمال بأنه الذكاء في فهم أعمالك، فبإمكانك فهم أعمالك بتحليلك للعمليات التي تقوم بها في عملك.

 

 

يعتمد مفهوم ذكاء الأعمال بوجه عام على تحليل الأعمال، عن طريق تجميع المعلومات عن العمليّات التي تقوم بها مؤسستك، كعمليات التسويق، و البيع، و أنشطة الخدمات، و سلوك الزبائن كاستجابة لهذه الأنشطة، و سلوك الأنظمة الداخلية، و أنظمة المورّدين استجابة لسلوك الزبائن. و بعد القيام بتجميع هذه المعلومات (يجب إجراء عملية التجميع هذه، وليس مرّة واحدة فقط) يجري تنظيم و تخزين هذه المعلومات بطريقة تسهل الوصول إليها، و معالجتها، و عرضها باستخدام العديد من التقنيّات كالتقارير، و الاستعلامات، و التحليلات، وأنظمة المعالجة التحليليّة على الخط OLAP[1]، و أدوات التنقيب في المعطيات. في النهاية، يمكن استخدام نتائج تطبيق هذه التقنيات لتحسين العمليّات ضمن المؤسسة و بدء دورة تحليل جديدة مرة أخرى.

 

يمكن لإجراء ذكاء الأعمال إعطاء نتائج مؤثرة، و تفصيليّة. فباستخدام تقنيات و إجراءات ذكاء الأعمال يمكنك جعل أعمالك أكثر كفاءةً، و زيادة مواردك، وتقليص تكاليفك، و تحسين علاقاتك بزبائنك و مورّديك.

 

يوضح الهرم التالي التموضع المنطقي للتقنيات المختلفة لذكاء الأعمال وفقاً لقيمتها الكامنة، باعتبارها أساساً لقرارات الأعمال الاستراتيجيّة و التكتيكيّة.

بوجه عام، تتزايد قيمة المعلومات التي ستدعم اتخاذ القرار ابتداءً من أسفل الهرم و حتى أعلاه. فالقرارات التي تعتمد على المعطيات الموجودة في الطبقات السفلى، حيث يوجد عادةً ملايين من سجلات المعطيات، تؤثر على تحويل عميل وحيد فقط. أما القرارات التي تعتمد على المعطيات عالية التجميع الموجودة في الطبقات العليا من الهرم، فتؤثر على أقسام الشركة، و حتى على كامل الشركة. لذلك فإننا نجد عادةً أنماطاً مختلفة من المستخدمين وفقاً للطبقات المختلفة الموجودة على الهرم. يعمل مدير قاعدة المعطيات بالدرجة الأولى على قاعدة المعطيات الموجودة في مستوى مصادر المعطيات data sources، و مخزن المعطيات data warehouse، أما الأشخاص التنفيذيّون و محلّلو الأعمال فيعملون في المستويات العليا في الهرم.

 

من أجل إيصال ذكاء الأعمال إلى أوسع جمهور ممكن، و الاستفادة العظمى من الفوائد الناجمة عن استخدام التقنيات المتعلقة به، يجب نشره باستخدام بنية أساسية مناسبة قادرة على تحقيق إجراءات ذكاء الأعمال التي ذكرناها سابقاً، و دعم مجال التطبيقات المناسب لكل مستخدم في كل نمط. أما أهم المحاور المتعلقة بذكاء الأعمال فهي:

 

التنقيب في المعطيات Data Mining

 

مع أنّ كميات المعطيات في عالمنا تتزايد تزايداً مضاعفاً كلّ عام، فإنّ النتيجة المفاجئة، هي أنّ كميّة المعلومات المفيدة تتناقص بسرعة. والسبب الأهم للتزايد الكبير للمعطيات هو الإنتاج الميكانيكي للنصوص، إذ تقوم الكثير من المنظمات العالميّة بإنتاج معلومات خلال أسبوع، قد لايستطيع الكثير من الناس قراءتها طوال حياتهم. ولقد أصبح هذا الوضع أشد خطراً في الشبكات العالميّة كشبكة الإنترنت. فكلّ يومٍ هناك المئات من ملايين الميغا بايتات التي توزّع حول العالم، إلا أنه لا توجد طريقة لمراقبة هذا التطوّر السريع لأنّ تزايد المعلومات يأخذ شكلاً أسيّاً. وهو مانعبّر عنه بالعبارة: "معطيات أكثر تعني معلومات أقل".

 

لذلك بدأ الاهتمام بحقل جديد في هذا المجال وهو ما يدعى بالتنقيب في المعطيات. فكما نعرف يجري خلال عملية التنقيب التخلّص من كمية هائلة من الأحجار والحصى قبل الحصول على الذهب والجواهر. وبالمثل، تستطيع تلقائيّاً الحصول على المعلومة الجوهرة بين أطنان المعطيات (الحصى) وذلك في قاعدة معطياتك، وهو بالطبع أمر مفيد جداً.

 

تساعد تقنية التنقيب على المعطيات في استكشاف المعرفة المخفيّة والنماذج غير المتوقّعة، إضافةً إلى استكشاف قواعد جديدة موجودة في قواعد معطيات كبيرة. ويُنظر إليها الآن على أنها العنصر المفتاحيّ لعملية أكثر تعقيداً تدعى بعملية استكشاف المعرفة في قواعد المعطيات، والمرتبطة إلى حدّ بعيد بعمليّة تطوير أخرى مهمة جداً هي مخازن المعطيات. ومخزن المعطيات كما ذكرنا سابقاً هو المستودع المركزي للمعطيات التي تمّ الحصول عليها من المعطيات العملياتيّة. وتكون المعلومات في مخزن المعطيات موجهة نحو الموضوع، وغير متغّيرة، كما أنها مرتبطة بعامل الزمن. لذلك فإن مخازن المعطيات تتجه إلى احتواء مجموعات هائلة جداً من المعطيات. وتساعد عملية التوافق بين مخازن المعطيات ونظم دعم القرار وعملية التنقيب في المعطيات، على إنشاء تقنيّة جديدة محدّثة لإدارة المعلومات. وحتى الآن، بُنيت أنظمة المعلومات لدعم الإجراءات العمليّاتيّة للمؤسسة، على حين عملية استكشاف المعرفة في قواعد المعطيات والتنقيب في المعطيات تساعد على رؤية المعلومات ضمن هذه المؤسسة بطريقة مختلفة و أكثر شمولية.

تساعد عمليّة مكاملة تقنيات التنقيب في المعطيات مع أنظمة دعم القرار على الحصول على نتائج مفيدة جداً. ثم إنّ مخزن المعطيات يساعد على تزويدنا بالمعلومات اللازمة لاتخاذ القرارات المناسبة. وفي بعض الحالات بإمكانك استخدام لغة SQL من أجل دعم القرار، لكنك عندما تحتاج إلى مقارنة ملايين التسجيلات دون أن تعرف تماماً نمط المعلومات التي تحتاجها تماماً، أو عندما ترغب في البحث عن المعطيات المخفيّة، حينئذ ستكون بالتأكيد بحاجة إلى استخدام تقنيات التنقيب عن المعطيات.

 

لذلك فإنّه من المتوقّع أن يحقّق مجال التنقيب في المعطيات ثورةً خلال السنوات العشر القادمة، و أن يصبح أحد أهم 10 مجالات سوف تغيّر العالم....

لكن ماذا تفيد عمليّة التنقيب في المعطيات عملياً؟ وهل طبّقت فعليّا،ً أم مازالت في طور الاختبار؟

 

الجواب هو أنّ التنقيب في المعطيات طبّق بالفعل. ومن الواضح أنّ الولايات المتحدة الأمريكيّة قد تجاوزت أوروبا في هذا المجال بأشواط، فالعديد من المؤسسات الكبيرة مثل American Express و AT&T قد استخدمت تقنيات استكشاف المعرفة في قواعد المعطيات لتحليل ملفات زبائنها. أما في المملكة المتحدة، فلقد طبّقت محطة BBC تقنيات التنقيب في المعطيات من أجل تحليل أشكال العرض. وفي العديد من البلدان الأوربيّة، ثم إن العديد من البنوك الكبيرة وشركات التأمين والتي قامت بتجارب مبدئيّة على تقنيات استكشاف المعرفة في قواعد المعطيات.

 

لذلك يجب أن تتضمن حلول ذكاء الأعمال دعماً لتقنيات التنقيب في المعطيات، و بخاصة تلك التي تقدّم لنا مجالاً واسعاً من الخوارزميّات التي يمكنها العمل مع المعطيات الموجودة في مخازن المعطيات.

 

مخازن المعطيات Data Warehouse

 

مخزن المعطيات هو تجميع لقواعد معطيات متكاملة، موجّهة نحو الموضوع، و مصمّمة من أجل أنظمة دعم القرار DSS[2]، و ترتبط فيها كل وحدة معطيات مع أزمان معيّنة. فهو مجرد عن نظام إدارة قواعد معطيات علائقية مصمّم خصوصاً من أجل الاستجابة لمتطلبّات أنظمة معالجة المناقلات[3].

 

الهدف الأساسي لمخزن المعطيات هو إنشاء عرض منطقي وحيد لمعطيات المؤسسة ( يقع عادةً ضمن قاعدة معطيات منفصلة مادياً)، و يستطيع المطوّرون و متخذو القرار الوصول إليه.

 

تعتبر مخازن المعطيات من التقنيات الجديدة و الفعاّلة التي تمكّننا من استحصال المعطيات العمليّاتيّة المؤرشفة، والتغلب على عدم التناسق الموجود بين مختلف أنماط المعطيات. وبالإمكان تحسين إمكانات التنقيب في المعطيات إذا جرى تجميع المعطيات المناسبة و تخزينها في مخازن المعطيات.

 

أنظمة المعالجة التحليليّة على الخط OLAP

 

تستخدم أنظمة المعالجة التحليليّة على الخط OLAP لتزويدنا بنتائج لاستعلامات أكثر تعقيداً من تلك الخاصة بأنظمة معالجة المناقلات على الخطOLTP[4]  أو أنظمة قواعد المعطيات، وبشكل مختلف تماماً عن استعلامات قواعد المعطيات. تتضمّن أنظمة الـOLAP عادةً تحليلاً للمعطيات الحاليّة، لذلك يمكن اعتبارها توسيعاً لبعض دالات التجميع الأساسيّة المتاحة في لغة SQL.

 

يمكن استخدام أنظمة الـOLAP مع مخازن المعطيات أو متاجر المعطيات Data Marts. الهدف الرئيسي لأنظمة الـOLAP هو دعم الاستعلامات المباشرة[5] اللازمة لأنظمة دعم القرار. و يعتبر عرض المعطيات المتعدّد الأبعاد أساسياً لأنظمة الـ OLAP.

 

يمكن تقسيم طرق الـ OLAP إلى ROLAP[6] و MOLAP[7]. فمع تطبيقات الـ MOLAP يمكن نمذجة المعطيات و رؤيتها و تخزينها مادياً ضمن قاعدة معطيات متعدّدة الأبعاد MDD[8]. و مع أنها تحتاج إلى حجوم تخزين عالية جداً، فإنها تستخدم لتسريع المعالجة. أما تطبيقات الـROLAP فيجري بواسطتها تخزين المعطيات في قاعدة معطيات علائقية، و يقوم مخدّم الـROLAP بإنشاء عروض متعدّدة الأبعاد للمعطيات.

 

هناك طريقة ثالثة يمكننا التطرق إليها و هي الـ HOLAP[9] أو الـ OLAP الهجين، والذي يدمج أفضل الميزات الموجودة في الصنفين ROLAP و MOLAP. إذ يجري تخزين المعطيات التي لا يجري تعديلها مراراً في قاعدة معطيات متعددة الأبعاد MDD، أما المعطيات التي يجري تحديثها مراراً فتخزّن ضمن قاعدة معطيات علائقية RDB.

 

تعتبر أنظمة الـOLAP محوراً أساسيّاً من محاور حلول ذكاء الأعمال. فهي تعتبر أكثر التقنيات استخداماً لإجراء التحليلات. لذلك يجب أن تزوّدنا حلول ذكاء الأعمال بإمكانية دعم الـ OLAP ضمن قواعد معطياتها، بالإضافة إلى دالات OLAP وواجهات استخدامها، مع إمكانية بنائها و إدارتها.

 

أخيراً، بعد أن عرضنا لأهم الأفكار المتعلقة بتقانات التنقيب في المعطيات و ذكاء الأعمال، ألا يحق لنا التساؤل متى ستبدأ مؤسساتنا بالاستخدام الذكي للمعلومات. !!؟

 

حواشي سفلية

 

تجربة داوجونز DowJones

تعتبر الأسواق المالية من التطبيقات الهامة لتقنيات التنقيب في المعطيات. يمكننا هنا أن نأخذ مثلاً سوق الأوراق المالية DowJones التي تقوم بتزويد متعامليها بالعديد من المواقع الإعلامية العاملة على مدار الساعة، منها مثلاً Wall Street Journal Online و Barron\'s Online و Opinion Journal و Career Journal و College Journal وغيرها. لدى هذه الشركة أكثر من 675000 مشتركاً ويدخل إلى مواقعها على الإنترنت أكثر من ثلاثة ملايين زائر شهرياً.

 

ونظراً لأن زيادة عدد المشتركين تعتبر الهدف الرئيسي لأية أعمال تقوم بها هذه الشركة، لأنّ هذه الزيادة تمكنها من زيادة مدخولها السنوي. كان لابد من اعتداد سلوك المشتركين وطرق جذبهم أهمّ أوليات هذه الشركة. لذلك قامت بإنشاء قسم خاص لمحاولة فهم ماهية الأشخاص الذين يزورون مواقع الشركة، وما الذي يقومون بعمله

 

ضمن الموقع. ويعتمد هذا القسم على ربط المعلومات الموجودة في ملفات التسجيل، التي يولدها موقع الوب، بملفات الزبائن. يمكنك بالطبع تخيّل مدى صعوبة القيام بهذا الربط يدوياً، والوقت اللازم لإنجازه.

 

لذلك قامت شركة DMX Group المتخصصة في مجال التنقيب في المعطيات بالعمل على جلب ملفات تسجيل الوب Web Logs Files الخاصة بمواقع جرائد DowJones ونقلها عبر الإنترنت إلى مركز معطيات خاص بها. قامت بعدها باستخدام تقنيات التنقيب في المعطيات لتحليل هذه الملفات وتوليد تقارير خاصة يومياً تساعد على فهم سلوك مشتركي هذه المواقع.

لذلك يقوم مديرو أقسام WSJ Online يومياً بالولوج إلى مجموعة الإحصائيات التحليلية الموجودة في موقع خاص بشركتهم، والتي تساعدهم على تحديد مجموعات الزبائن الذين يكون من غير المفيد صرف مبالغ تسويقية من أجلهم، أو تساعدهم على تحديد النماذج ذات السعر الأنسب.

ومن الأدوات الهامة التي جرى تزويدهم بها: مدير فرز الزبائن Customer Segment Manager الذي يسمح لهم بتعريف مجموعات خاصة للمشتركين وفقاً لخصائصهم: كسلوكهم، وتوزعهم الديموغرافي، وغير ذلك. يجري بعد ذلك مراقبة هذه المقاطع على الدوام لمعرفة أكثر الأنماط أهمية للمشتركين، وتأثير الحملات الإعلانية على مقاطع المشتركين.

 

تجربة شركة Nordstrom

تعتبر شركة Nordstrom إحدى أكبر الشركات الأمريكية العاملة في مجال الموضة وبيع الألبسة، وذلك منذ أكثر من قرنٍ تقريباً. ولقد دخلت هذه الشركة مجال الأعمال الإلكترونية eBusiness وذلك من خلال موقعها الموجود على شبكة الإنترنت www.Nordstrom.com والذي يعتبر من أكثر المواقع العالمية شهرةً لما يتميّز به من وجود الكثير من أسماء شركات الأزياء العارضة، والمتخصصة في مجال الألبسة والأحذية واللوازم.

 

أرادت شركة Nordstrom زيادة واردات مبيعاتها وذلك بمحاولة إيجاد أفضل الطرق التي تساعد على جذب أكبر عدد من الزبائن وإقناعهم بشراء منتجاتها بواسطة موقعها على الإنترنت. لذلك كان السيناريو الأمثل لتحقيق ذلك هو استخدام تقنية العناصر المرتبطة Related Items الخاصة بقوائم منتجاتها، والتي تنصح زوار موقعها بشراء منتجات إضافية مرتبطة بالمنتجات التي يرغبون في شرائها.

في البداية، قامت بهذه العملية بطريقة يدوية وذلك نظراً لنقص الخبرات الكافية التي تساعدها على أتمتة هذه العملية أتمتة كاملة. لكن بالطبع كانت الطريقة اليدوية غير كاملة، وكان هناك نقص كبير في إنجازها على كامل المنتجات.

 

لذلك كان لابدّ لهم من التفكير باستخدام تقنيات التنقيب في المعطيات من أجل العناصر المرتبطة لزيادة فرص نجاح هذه الطريقة.

 

وجدت إدارة الموقع أن الحلّ الأمثل هو باستخدام الخدمة Switched-On Buy Driver. زوّدت هذه الخدمة شركة Nordstrom بطريقة مؤتمتة ومتكاملة لإنجاز تقنية العناصر المرتبطة من أجل زيادة مبيعات الشركة لزبائنها على الشبكة. و سمحت هذه الخدمة للشركة باختصار أكثر من 100 ساعة عمل مضنية شهرياً، وتخفيض تكلفة هذا العمل إلى الثلث تقريباً.

 

النتيجة المذهلة حقاً، ازدياد تسويق العناصر المرتبطة بنسبة 41%، و ازدياد مبيعات الوحدات من خلال العناصر المرتبطة بنسبة 54%.

 



[1] OLAP: OnLine Analytical Processing

[2] Decision Support Systems

[3] Transaction Processing Systems

[4] Online Transaction Processing

[5] ad hoc queries

[6] Multidimensional OLAP

[7] Relational OLAP

[8] MultiDimensional Databases

[9] Hybrid OLAP

 


مشاركة/حفظ

الكاتب:

مصدر الخبر: د. مهيب النقري

عودة عودة إلى ذكاء صنعي عودة عودة إلى الصفحة الرئيسية طباعة طباعة إرسال إلى صديق إرسال إلى صديق

التعليقات

  • من قبل thaqif alazany في 07/10/2013 22:28:27
    can you help me
    i read all thing ragard data werehousing and data mining but in my assignment that all about if you can help me i will be grateful for your help if you agree on the helping send to me your email i will communicate with you in facebook or in email this is my email (thakeef1@yahoo.com ) my regard to to you

أضف تعليق


تصنيفات الموقع