المنتدى الطلابي الأول في طرطوس .. والحاضر يعلم الغايب


    محركات البحث (Search Engines

    شاطر
    avatar
    MR HACKER
    جامعي ذهبي
    جامعي ذهبي

    ذكر
    عدد المساهمات : 2364
    العمر : 31
    المكان : Syrian Arab Rebablic
    المزاج : معصب و مكهرب دوما
    الدراسة : اقتصاد
    السنة الدراسية : 4
    المستوى : 56
    نقاط : 4906
    تاريخ التسجيل : 21/05/2009

    محركات البحث (Search Engines

    مُساهمة من طرف MR HACKER في الجمعة يوليو 17, 2009 1:06 am


    ما هو محرك البحث؟
    محرك البحث (search engineهو برنامج يُتيح للمُستخدِمين البحثَ عن كلمات محددة ضمن مصادر الإنترنت المختلفة (مواقع الويب ومواقع FTPو تلنت (Telnet))، ويتألف محرك البحث من ثلاثة أجزاء رئيسة هي:
    •برنامج العنكبوت .(spider program)
    برنامج المُفهرِس .(indexer program)
    •برنامج محرك البحث.


    ومضة: من الجدير بالذكر أن بعض محركات البحث تُستخدَم للبحث ضمن موقعٍ واحد فقط.
    شرح وظيفة البرامج المكونة لمحرك البحث:
    1. برنامج العنكبوت

    تَستخدِم محركاتُ البحث برنامجَ العنكبوت (spiderلإيجاد صفحات جديدة على الويب لإضافتها، ويسمى هذا البرنامج أيضاً الزاحف (crawler)لأنه يُبحر في الإنترنت بهدوء لزيارة صفحات الويب والاطلاع على محتوياتها، ويأخذ هذا البرنامج مؤشرات المواقع من عنوان الصفحة (title)، والكلمات المفتاحية (keywordsالتي تحويها، إضافة إلى محتويات
    محدِّدات الميتا (Meta tags) فيها. ولا تقتصر زيارة برنامج العنكبوت على الصفحة الأولى للموقع بل يتابع البرنامج تَعقُّبَ الروابط (links)الموجودة فيها لزيارة صفحات أخرى. أما الغاية من هذه الزيارات فهي وضع النصوص المنتقاة في نظام الفهارس لمحرك البحث، ليتمكن المحرك من العودة إليها فيما بعد، ولم تغب فكرة تغير المحتوى في الموقع عن بال مصممي محرك البحث، إذ ينظم محرك البحث زيارات دورية للمواقع الموجودة في الفهرس للتأكد من التعديلات التي تصيب المواقع المفهرسة.

    2. برنامج المُفهرس

    يُمثل برنامج المُفَهرِس (index program)، الكتالوج (catalogue)أحياناً، قاعدة بيانات(databaseضخمة تُوَصِّف صفحات الويب، وتَعتمد في هذا التوصيف على المعلومات التي حَصَلت عليها من برنامج العنكبوت
    (spider) كما تعتمد على بعض المعايير مثل الكلمات الأكثر تكراراً من غيرها، وتختلف محركات البحث عن بعضها في هذه المعايير، إضافة إلى اختلافها في خوارزميات المطابقة (ranking algorithms).


    3. برنامج محرك البحث

    يبدأ دور برنامج محرك البحث (search engine program)عند كتابة كلمة مفتاحية(keyword)في مربع البحث
    (search box)
    ؛ إذ يأخذ هذا البرنامج الكلمة المفتاحية ويبحث عن صفحات الويب التي تحقق الاستعلام الذي كونه برنامج المُفهرس في قاعدة بيانات الفهرس (index database)، ثم تُعرَض نتيجة البحث المتمثلة بصفحات الويب التي طلبها المُستخدِم في نافذة المُستعرض .(browser window)


    أمثلة على محركات البحث:
    يوجد عدد كبير من محركات البحث التي تنتشر على الويب نذكر منها على سبيل المثال لا الحصر

    Lycos
    AltaVista

    Excite


    وتختلف محركات البحث عن بعضها في أسلوب العمل، فمثلاً: تحتفظ قاعدة بيانات ألتافيستا (AltaVista)بكل تفاصيل صفحة الويب المخزنة، أما غيرها من آليات البحث الأخرى فقد يحتفظ بالعناوين الرئيسة للصفحة فقط، مما يؤدي إلى اختلاف نتائج شكل ودقة نتائج البحث الظاهرة للمُستخدم

    آليات البحث

    ذكرنا سابقاً أن محركات البحث تستخدم في بحثها عن مواقع الويب ما يدعى الكلمات المفتاحية (keywords)التي يمكن أن تكون كلمة أو عبارة (phrase). وتَستخدِم آلياتُ البحث عادةً بعضَ المعاملات (operators)، مع هذه الكلمات المفتاحية، لتوفير خيارات إضافية لعملية البحث. ونعرض في الجدول التالي كيفية عمل بعض هذه المعاملات، إلى جانب بعض الأمثلة عليها:



    طريقة عمله وأمثلة على ذلك
    مُعامل البحث

    يُستخدَم هذا المُعامل للبحث عن عبارة محددة.

    “computer technology”

    (تُعرَض عندها مواقع الويب التي تحوي هذه العبارة مع مراعاة ترتيب كلماتها)
    " "

    تُستخدَم مع مجموعة من الكلمات للبحث عن مواقع تحوي هذه الكلمات (منفردة أو مجتمعة).

    Computer + technology

    (تُعرَض عندها المواقع والصفحات التي تحتوي كلمة computer وكلمة technology ولكن ليس بالضرورة أن توجد الكلمتان مع بعضهما في الموقع نفسه).

    AND أو
    يُستخدَم مع مجموعة من الكلمات للبحث عن كل من هذه الكلمات المفتاحية على حدة.

    Computer OR technology

    (تُعرَض المواقع التي تحوي كلمة computerبمفردها، والمواقع التي تحتوي كلمة technologyبمفردها)

    يجب مراعاة ترك مسافة قبل OR وعدم ترك مسافة بعدها.

    OR
    يُستخدَم رمز النجمة للبحث عن كلمة عُلِمَ أحد مقاطعها، ويسمى البحث باستخدام المحارف البديلة (wildcard search).

    مثال: Tech*

    تعرض المواقع التي تبدأ كلماتها بالمقطع Tech مثل:(technology, technician, technical, ..)

    النجمة *

    ويمكن استخدام مجموعة من هذه المعاملات مع بعضها لتشكيل جُمل بحث متقدمة. ويمكن في محركات البحث تحديد مجالات البحث للوصول إلى نتائج أكثر دقة
    أدلة البحث :(Search directories)

    يُعَدُّ دليل الويب (Web directory)، أو المُرشد أو الكتالوج (catalogue or guide)، وسيلةً أخرى للبحث عن المعلومات في شبكة الويب العالمية. وخلافاً لمحركات البحث، يحوي دليل الويب، وهو موقع على الويب، روابطَ مُنظمة ومُرتبة (تنظم عادة حسب مواضيع عامة وأخرى فرعية) تُؤدي إلى مصادر المعلومات. وتُنشِئ هذه الأدلة من قِبل بعض الجهات أو المؤسسات، ثُمَّ يجري تحديد مصادر المعلومات التي ستشير الروابط إليها، وتُجمع، وتُراجع، وتُنظم، وتُصنف لتوضع في النهاية في أدلة الويب

    محركات البحث العربية


    ظهر مؤخراً بعض محركات البحث التي تدعم البحث باللغة العربية، ويكمن السبب في قلة هذه المحركات وتأخر ظهورها إلى التقنيات المعقدة التي يحتاجها البحث باللغة العربية. إذ تختلف طبيعة اللغة العربية عن الإنجليزية، فاللغة العربية لغة صَرفية (morphological)، بينما الإنجليزية لغة لصقية (affixational). ومن هنا كان لا بد للشركات التي تطرح محركات بحث عربية قوية أن تمتلك التقنيات اللازمة لمعالجة اللغة العربية آلياً.

    وقد ظهر أثر ذلك في محركات البحث الموجودة التي انقسمت إلى مجموعتين:

    •المجموعة الأولى:

    قلَّدت هذه المجموعة محركات البحث الإنجليزية ولذلك فقد جاءت نتائجها ضعيفة لاعتمادها في البحث على المطابقة الحرفية
    (string matching)
    لكلمات البحث، مما يتسبب في حجب الكثير من المعلومات التي تتوافق مع الكلمات المراد البحث عنها (التي قد تختلف بأحرف زائدة بسيطة).

    •المجموعة الثانية:

    اعتمدت هذه المجموعة من محركات البحث على تقنيات متقدمة لمعالجة اللغة العربية، ومن أبرز الأمثلة عليها:
    أراب فيستا (Arabvista) و الإدريسي؛ الذي أصدرته شركة صخر لبرامج الحاسب الآلي.
    تتميز المجموعة الثانية بإمكانات إضافية مثل: لاصقة]البحث باللواصق، مشتق]والبحث بالمشتقات
    وقد استفاد محرك الإدريسي من التقنيات المتقدمة التي ابتكرتها شركة صخر في معالجة اللغة العربية، فتميز عن غيره بعدة أمور مثل
    1. البحث بالمترادفات: تُستخدم للبحث عن نصوص عربية متشابهة المعنى كما هو مبين في المثال.


    مثال: البحث عن كلمة "مساعدة" سيعطي من بين نتائج البحث كل الصفحات التي تحوي كلمات عربية مثل: (مساعدة، معونة، مؤازرة، .. الخ).
    [face=font]2. [/face]البحث بالمعاني والترجمة: تُستخدم للبحث عن نصوص إنجليزية عن طريق كلمة عربية يجهل المستخدم معناها.

    مثال: البحث عن كلمة "مساعدة" سيعطي من بين النتائج كل الصفحات التي تحوي كلمات إنجليزية مثل: (help, assistance, aid).
    3. إمكانية التعامل مع التشكيل بشكل جيد ومن الجدير بالذكر أن معظم محركات البحث العربية تقوم بعد معالجة الكلمة أو العبارة المراد البحث عنها بترجمتها إلى اللغة الإنجليزية، ليجري البحث عنها بعدة لغات في مواقع الويب المُفهرسة لديه.

    • خاصة عنوان الصفحة (title)، وأول خمس وعشرين كلمة من النص الوارد، إضافة إلى محتويات مُحدِّدات الميتا (Meta tags)

    تُشتق الكلمات في اللغة العربية من جذورها، ولذلك فمن الممكن أن توجد الكلمة الواحدة في عشرات الأشكال، وذلك بالتصاقها بأحرف زائدة (حروف جر، حروف عطف، ضمائر متصلة،...) في البداية والوسط والنهاية.

    مثال: (وبمدرستهم، ومدرستهم، لمدرستهم، مدرستنا، مدارسكم، ...)، وتعود جميع هذه الكلمات بعد تجريدها من الزوائد إلى كلمة (مدرسة) والتي تعود إلى الجذر (درس)


    ملطوش و منقول
    avatar
    روحنا_الوسوف
    جامعي فضي
    جامعي فضي

    ذكر
    عدد المساهمات : 1943
    العمر : 30
    المكان : صافيتا
    المزاج : ولا أحلا
    الدراسة : اقتصاد
    السنة الدراسية : 4
    المستوى : 13
    نقاط : 2487
    تاريخ التسجيل : 04/11/2008

    رد: محركات البحث (Search Engines

    مُساهمة من طرف روحنا_الوسوف في السبت يوليو 18, 2009 5:25 am

    ألف شكر3/4 من المحركات مابعرفن

      الوقت/التاريخ الآن هو الأحد نوفمبر 19, 2017 1:00 am