جستجو

خدمات جستجو موتور جستجو

موتور جستجو   - وب سایتی که امکان جستجوی اطلاعات در اینترنت را فراهم می کند. اکثر موتورهای جستجوگر در وب سایتهای جهانی به دنبال اطلاعات هستند ، اما سیستمهایی نیز وجود دارند که می توانند فایلها را در سرورهای ftp ، محصولات موجود در فروشگاههای آنلاین و اطلاعات در گروههای خبری Usenet جستجو کنند. اخیراً نوع جدیدی از موتورهای جستجو بر اساس فناوری RSS و همچنین در بین انواع مختلف داده های XML ظاهر شده است.

مجموعه ای از برنامه هایی که قابلیت موتور جستجو را فراهم می کنند نامیده می شود موتور جستجو  یا موتور جستجو. معیارهای اصلی برای کیفیت موتور جستجوگر مربوط بودن ، کامل بودن بانک اطلاعاتی و حسابداری برای مورفولوژی زبان است. اطلاعات بصورت ویژه فهرست بندی می شوند جستجو روبات ها. عمده ترین مشکلات عملکرد موتورهای جستجو در مقاله توضیح داده شده است. وب عمیق. بهبود عملکرد موتورهای جستجو یکی از اولویت های اینترنت امروز است.
  داستان

جدول زمانی
سالسیستمرویداد
1993 Alliwebراه اندازی
1994 وبگردیراه اندازی
1994 لیکوراه اندازی
1995 آلتاویستاراه\u200cاندازی (ایجاد شده توسط DEC)
1995 هیجان زدهراه اندازی
1996 اینتکتومیتأسیس شده توسط
1996 از جویو بپرسیدتأسیس شده توسط
1996 رامبلرراه اندازی
1996 اسپورتراه اندازی
1997 نور شمالیراه اندازی
1997 یاندکسراه اندازی
1998 گوگلراه اندازی
1999 Allthewebراه اندازی
2000 تئوماتأسیس شده توسط
2004 یاهو! جستجوراه اندازی نهایی
(نتایج اول خود)
2004 جستجوی خانمراه اندازی بتا
2005 جستجوی خانمراه اندازی نهایی
2006 وبالتاتست عمومی را شروع کنید
توجه: سال پرتاب در نظر گرفته شده است
سالی که فرصت بوجود آمد
نتایج جستجو را در سرتاسر جهان دریافت کنید.

نخستین موتور جستجوی شبکه جهانی وب Wendex بود ، شاخص ضعفی که World Wide Web Wanderer را ایجاد کرد ، یک ربات که توسط متیو گری از انستیتوی فناوری ماساچوست در سال 1993 ساخته شد. همچنین در سال 1993 یک موتور جستجوی ظاهر شد. "علیوه" هنوز کار می کند. اولین جستجوی متن کامل (به اصطلاح "خزنده مبتنی بر" - یعنی ایندکس کردن منابع با استفاده از ربات) موتور جستجوگر WebCrawler بود که در سال 1994 راه اندازی شد. برخلاف پیشینیان خود ، به کاربران این امکان را می داد که هر کلید واژه ای را در هر وب جستجو کنند. از آن زمان به بعد ، در تمام موتورهای جستجوگر اصلی استاندارد شده است. علاوه بر این ، این اولین موتور جستجو بود که به طور گسترده شناخته شده بود. در سال 1994 ، لیکو ، که در دانشگاه کارنگی ملون توسعه یافته بود ، راه اندازی شد.

به زودی بسیاری از موتورهای جستجوگر رقیب دیگر مانند Excite ، Infoseek ، Inktomi ، Northern Light و AltaVista ظاهر شدند. به یک معنا ، آنها با دایرکتوری های آنلاین محبوب مانند Yahoo! رقابت کردند. کاتالوگ های بعدی ادغام شده یا به خودشان اضافه شدند موتورهای جستجوبرای افزایش کارایی در سال 1996 ، الحاقات مورفولوژیکی به موتور جستجوی Altavista و موتورهای جستجوی اصلی Rambler و Aport روسی در دسترس کاربران اینترنت روسی زبان قرار گرفت. در 23 سپتامبر 1997 موتور جستجوی Yandex افتتاح شد.

علاوه بر موتورهای جستجوگر برای شبکه جهانی وب ، موتورهای جستجوگر پروتکلهای دیگری مانند Archie برای جستجوی سرورهای FTP ناشناس و Veronica برای جستجو در Gopher وجود داشتند.
  موتورهای جستجو محبوب
  چند زبانه: Google (18٪ از بخش روسی زبان)
  یاهو! (1٪ Runet) و موتورهای جستجو متعلق به این شرکت: Overture
  اینتکتومی
  آلتاویستا
  Alltheweb FAST-Engine

MSN (2٪ Runet) (متعلق به مایکروسافت)

انگلیسی و بین المللی: AskJeeves (مکانیسم Teoma)

روسی زبان - اکثریت موتورهای جستجوگر "روسی زبان" و در بسیاری از زبانها به جستجوی متون می پردازند - اوکراینی ، بلاروسی ، انگلیسی ، و غیره. آنها از نظر سیستمهای "چند زبانه" که همه اسناد را به صورت متوالی فهرست می کنند ، متفاوت هستند ، زیرا آنها عمدتا منابع موجود در مناطق دامنه را فهرست بندی می کنند. جایی که روسیه بر آن تسلط دارد یا به روش های دیگر روبات های خود را به سایت های روسی زبان محدود می کند. Aport (1٪ Runet)
  Rambler (18٪ Runet)
  Yandex (47٪ Runet)
  Mail.ru (7٪ از Runet ، از موتور جستجوی Yandex استفاده می کند)
  وبالتا
  برترین عناصر Runet - در صفحات اصلی جستجو کنید

آلمانی: Wseeker.com
  Abacho.de
de.Ez2find.com

فرانسوی: fr.Ez2Find.com
  فرانسیس
  مکان
  نامزد
  وویل

اوکراینی: A.UA (جستجو بر اساس Yandex.XML است)
  متا
  Bigmir) خالص (جستجو بر اساس Yandex.XML اجرا شده است)
  جستجوی I.ua

استونیایی: www.ee
  neti.ee

چک: seznam.cz

ازبک: Voydod.uz

داده های پوشش روسی زبان نمایش داده شد  مطابق آمار LiveInternet نشان داده شده است

موتورهای جستجو تخصصی
  جستجوی تصویر Yandex جستجوی تصویر Yandex
  جستجوی تصویر Google
  جستجوی تصویر یاهو
  جستجوی تصویر Picsearch

موتورهای جستجو با فیلترهای Scandoo: با اسکن سایت برای ویروس ها ، نرم افزارهای مخرب جستجو کنید

جستجوی وب عمیق: Yahoo! اشتراک ها: جستجو در سایت های اشتراک
  CompletePlanet: جستجوی پایگاه داده ها و موتورهای ویژه
  QProber: طبقه بندی و جستجو برای پایگاه داده های پنهان
  MetaQuerier: کاوش و ادغام وب عمیق

جستجوی پرونده: Filesearch.ru

جستجوی قطعات الکترونیکی: eINFO.ru
  eFind.ru

جستجوی کد برنامه: http://www.google.com/codesearch
  Koders.com
  Codase.com

جستجوی بدافزارها (ویروس ها ، تروجان ها و غیره): جستجوی بدافزار

جستجوی ترک و انبار: گروه امنیتی Astalavista: جستجو در تمام موتورهای "اینترنت زیرزمینی"
  astalavista.box.sk: موتور جستجوگر محبوب

جستجو برای اخبار: نوتکوا خودکار و خوشه بندی اخبار ، بایگانی اخبار از سال 2003.
  موتور جستجوی اخبار ردترام بیش از 4500 منبع خبری را جستجو می کند.

سیستم های Metasearch: Metabot.ru

موتورهای جستجو موضوعی: جستجوی مطالب برنامه نویسی Progler.Ru

همچنین ببینید
جستجوی اطلاعات
  بهینه سازی موتور جستجو
  آمار پرس و جو
  وب عمیق
  خوراک RSS
  هرزنامه را جستجو کنید
  فهرست منابع آنلاین
  جستجوی متا
  جستجوی داده
  نیگما

معماری موتور جستجو به طور معمول شامل موارد زیر است:

دانشنامه YouTube

    1 / 5

    درس 1 - نحوه کار موتور جستجو

    موتور جستجو داخل

    موتور جستجوی بینگ

    نحوه نصب موتور جستجو در مرورگر گوگل  کروم

    سخنرانی 14: چگونه موتور جستجو کار می کند

    زیرنویس

داستان

جدول زمانی
سال سیستم رویداد
1993 W3catalog راه اندازی
Alliweb راه اندازی
جهش راه اندازی
1994 وبگردی راه اندازی
Infoseek راه اندازی
لیکو راه اندازی
1995 آلتاویستا راه اندازی
داوم بنیاد
متن را باز کنید  فهرست وب راه اندازی
ماژلان راه اندازی
هیجان زده راه اندازی
ساپو راه اندازی
یاهو! راه اندازی
1996 سگ سگ راه اندازی
اینتکتومی بنیاد
رامبلر بنیاد
Hotbot بنیاد
از جویوها بپرسید بنیاد
1997 نور شمالی راه اندازی
یاندکس راه اندازی
1998 گوگل راه اندازی
1999 Alltheweb راه اندازی
Genieknows بنیاد
ناور راه اندازی
تئوما بنیاد
ویویسمو بنیاد
2000 بایدو بنیاد
تعالی بنیاد
2003 اطلاعات راه اندازی
2004 یاهو! جستجو راه اندازی نهایی
A9.com راه اندازی
سوگو راه اندازی
2005 جستجوی خانم راه اندازی نهایی
ask.com راه اندازی
نیگما راه اندازی
نیکوکار راه اندازی
جستجو بنیاد
2006 ویکیزک بنیاد
Quaero بنیاد
جستجوی زنده راه اندازی
چاچا راه\u200cاندازی ( بتا)
guruji.com راه\u200cاندازی ( بتا)
2007 ویکیزک راه اندازی
Sproose راه اندازی
جستجوی ویکی راه اندازی
Blackle.com راه اندازی
2008 داداکو برو راه اندازی
توبی راه اندازی
Picollator راه اندازی
Viewzi راه اندازی
کولی راه اندازی
بوگامی راه اندازی
ماهی دریایی راه\u200cاندازی ( بتا)
جنگل راه اندازی
وادلو راه اندازی
Powerset راه اندازی
2009 بینگ راه اندازی
KAZ.KZ راه اندازی
یبول راه\u200cاندازی ( بتا)
مگوردی بسته شدن
پیشاهنگ راه اندازی
2010 کولی بسته شدن
بلککو راه\u200cاندازی ( بتا)
Viewzi بسته شدن
2012 وازوب راه اندازی
2014 ماهواره راه\u200cاندازی ( بتا)

در مرحله اولیه توسعه اینترنت تیم برنرز لی  لیستی از سرورهای وب که در سایت میزبانی شده اند را حفظ کرده است سرن  . تعداد سایت های بیشتر و بیشتری وجود داشت و حفظ چنین لیست به صورت دستی بیشتر و سخت تر می شد. در سایت NCSA  بخش ویژه "تازه چه خبر!" ( انگلیسی چه جدید است!) ، جایی که آنها پیوندهایی به سایتهای جدید منتشر کردند.

اولین برنامه کامپیوتری که در آن جستجو می کند اینترنت  یک برنامه بود آرچی (انگلیسی بایگانی  - بایگانی بدون حرف "c"). این دانشگاه در سال 1990 توسط آلن امتاژ ، بیل هیلان و جی پیتر دویچ ، دانشجویان علوم کامپیوتر در دانشگاه ایجاد شد دانشگاه مک گیل  در مونره  . این برنامه لیست همه پرونده ها را از همه ناشناس های موجود بارگیری می کند FTP  - سرورها و دیتابیس ایجاد کرده است که در آن امکان جستجو با نام پرونده ها وجود دارد. با این حال ، برنامه Archie محتوای این پرونده ها را فهرست بندی نکرد ، زیرا حجم داده آنقدر کوچک بود که همه چیز را می توان به راحتی دستی یافت.

توسعه و توزیع پروتکل شبکه گوفر  در سال 1991 توسط مارك مك كاهيل در سال اختراع شد دانشگاه مینسوتا  منجر به ایجاد دو موتور جستجوی جدید شد ، ورونیکا  و کلاهبرداری. مانند Archie ، آنها به جستجوی نام پرونده ها و سرصفحات ذخیره شده در سیستم های فهرست بندی Gopher پرداختند. ورونیکا ( انگلیسی فهرست وب بسیار گسترده ای از گشودگی جوندگان به بایگانی رایانه ای ) به شما امکان می دهد کلمات کلیدی اکثر عناوین منوی Gopher را در تمام لیست های Gopher جستجو کنید. برنامه Jughead ( انگلیسی حفاری و نمایش کلیت سلسله مراتب جهانی جونزی ) اطلاعات منو را از سرورهای خاص Gopher بازیابی کرد. اگرچه نام موتور جستجو Archie مربوط به چرخه طنز نبود. آرچیبا این حال ، Veronica و Jughead شخصیت های این کمیک ها هستند.

تا تابستان سال 1993 ، یک سیستم واحد برای جستجوی وب وجود نداشت ، اگرچه بسیاری از دایرکتوری های تخصصی بصورت دستی نگهداری می شدند. اسکار Nierstrasz در دانشگاه ژنو  یک سری از اسکریپت ها را نوشت پرل که بطور دوره ای این صفحات را کپی می کند و آنها را با فرمت استاندارد بازنویسی می کند. این پایه و اساس شد W3catalog، اولین موتور جستجوی اولیه وب در تاریخ 2 سپتامبر 1993 راه اندازی شد.

احتمالاً اولین ربات جستجو که در پرل نوشته شده است شبکه جهانی وب سرگردان  - ربات متیو گری (متیو گری) از ژوئن سال 1993. این ربات یک فهرست جستجو ایجاد کرد " Wandex  " هدف از سرگردان اندازه گیری اندازه شبکه جهانی وب و یافتن تمام صفحات وب حاوی کلمات موجود از پرس و جو بود. در سال 1993 ، موتور جستجوی دوم " Alliweb  " Aliweb استفاده نکرده است ربات جستجو  اما در عوض ، او در مورد وجود یک فایل فهرست بندی با فرمت خاص در سایت های خود از مدیران وب سایت خبر می داد.

جهشدر دسامبر سال 1993 توسط جاناتان فلچر ایجاد شد ، صفحات وب را جستجو و فهرست های آنها را با استفاده از موتور جستجو ساخت و مورد استفاده قرار داد فرم وب  به عنوان واسط برای فرمول سؤالات جستجو. این اولین ابزار جستجو در اینترنت بود که سه عملکرد مهم یک موتور جستجو (اعتبارسنجی ، نمایه سازی و جستجوی واقعی) را در هم آمیخته بود. با توجه به منابع محدود رایانه های آن زمان ، فهرست بندی و به همین دلیل جستجو فقط به نام ها و عناوین صفحات وب که توسط یک ربات جستجو یافت می شد محدود بود.

موتورهای جستجوگر شرکت کردند حباب دات کام  اواخر دهه 1990 چندین شرکت به طور مؤثر وارد بازار شده اند و در طول دوره خود سود رکوردی کسب کرده اند ارائه عمومی اولیه  . برخی از بازار موتورهای جستجوی عمومی را رها کردند و فقط با بخش شرکت ها شروع به کار کردند ، به عنوان مثال ، نور شمالی.

گوگل ایده فروش کلمات کلیدی را در سال 1998 پذیرفت ، سپس این شرکت کوچک بود که موتور جستجو را در goto.com ارائه می داد. این مرحله برای موتورهای جستجوگر تغییر از رقابت با یکدیگر به یکی از سودآورترین مشاغل تجاری در اینترنت بود. موتورهای جستجو شروع به فروش اولین مکان های نتایج جستجو به شرکتهای منفرد کردند.

گوگل از اوایل دهه 2000 برجسته بود. این شرکت به دلیل نتایج خوب جستجو با استفاده از الگوریتم به موقعیت بالایی رسیده است پیکرانک  . این الگوریتم در مقاله ای به نام آناتومی موتور جستجو ، نوشته شده توسط سرگئی برین و لری پیج ، بنیانگذاران گوگل ، در معرض دید عموم قرار گرفت. این یکی الگوریتم تکراری صفحات وب را براساس تخمین تعداد لینک های مربوط به یک صفحه وب ، فرض می کند که صفحات "خوب" و "مهم" بیشتر از دیگران پیوند دارند. رابط گوگل به سبک اسپارتان طراحی شده است ، برخلاف بسیاری از رقبای خود که موتور جستجو را در یک پورتال وب ایجاد کرده اند هیچ چیز اضافی وجود ندارد. موتور جستجوی Google آنقدر مشهور شده است که سیستم های مشابه را شبیه به آن می کند جستجوگر رمز و راز(موتور جستجوی مخفی).

جستجوی اطلاعات به زبان روسی

در سال 1996 ، جستجو با در نظر گرفتن مورفولوژی روسی در موتور جستجوی Altavista انجام شد و موتورهای اصلی جستجوگر روسی راه اندازی شد رامبلر  و اسپورت  . در 23 سپتامبر 1997 موتور جستجوگر افتتاح شد. یاندکس  . 22 مه 2014 توسط رستلکوم  یک موتور جستجوی ملی افتتاح شد ماهواره  ، که در زمان سال 2015 در آزمایش بتا است. 22 آوریل 2015 افتتاح شد خدمات جدید  ماهواره کودکان به طور خاص برای کودکانی که ایمنی بیشتری دارند.

روشها محبوبیت زیادی کسب کردند. تجزیه و تحلیل خوشه ای  و جستجو توسط ابرداده  . از بین دستگاههای بین المللی از این نوع ، معروف ترین آنها بود "خوشه"  شرکت ویویسمو. در سال 2005 در روسیه با حمایت از دانشگاه ایالتی مسکو  موتور جستجو راه اندازی شد نیگما  "پشتیبانی خودکار خوشه بندی  . در سال 2006 ، یک متاماشین روسی افتتاح شد کوینتورا  ارائه خوشه بندی بصری در قالب برچسب ابرها  . نیگما همچنین با خوشه بندی بصری آزمایش کرد.

موتور جستجو چگونه کار می کند

اجزای اصلی یک موتور جستجو: ربات جستجو , ایندکس , موتور جستجو.

به عنوان یک قاعده ، سیستم ها به صورت مرحله ای کار می کنند. ابتدا ربات جستجو محتوا را دریافت می کند ، سپس ایندکس ایندکس یک شاخص جستجو را تولید می کند و سرانجام موتور جستجو عملکردی را برای جستجوی داده های فهرست شده فراهم می کند. برای به روزرسانی موتور جستجو ، این چرخه فهرست بندی تکرار می شود.

موتورهای جستجو با ذخیره اطلاعات در مورد بسیاری از صفحات وب که از آنها دریافت می کنند کار می کنند HTML  صفحات جستجوی ربات یا "خزنده" ( انگلیسی خزنده) - برنامه ای که بطور خودکار تمام پیوندهای موجود در صفحه را طی می کند و آنها را انتخاب می کند. خزنده ، بر اساس پیوندها یا بر اساس لیست از پیش تعریف شده آدرس ، اسناد جدیدی را که هنوز برای سیستم جستجو مشخص نیست ، جستجو می کند. صاحب سایت می تواند صفحات خاصی را با استفاده از برنامه حذف کند robots.txt  با استفاده از آنها می توانید فهرست بندی پرونده ها ، صفحات یا فهرستهای یک سایت را ممنوع کنید.

موتور جستجو برای فهرست بندی بیشتر محتوای هر صفحه را تجزیه و تحلیل می کند. کلمات را می توان از عناوین ، متن صفحه یا قسمت های ویژه استخراج کرد - تگ های متا  . ایندکسر ماژولی است که پس از تجزیه آن به قطعات ، با استفاده از الگوریتم های لغوی و مورفولوژیکی خود ، یک صفحه را تجزیه و تحلیل می کند. تمام عناصر صفحه وب جداگانه و تجزیه و تحلیل می شوند. داده های صفحه وب برای استفاده در سؤالات بعدی در یک پایگاه داده فهرست ذخیره می شوند. این فهرست به شما امکان می دهد تا به درخواست کاربر اطلاعات را به سرعت پیدا کنید. تعدادی از موتورهای جستجو مانند Google کل یا بخشی از صفحه اصلی ، به اصطلاح را ذخیره می کنند حافظه نهان  و همچنین اطلاعات مختلفی در مورد صفحه وب سیستمهای دیگر مانند سیستم AltaVista هر کلمه ای از هر صفحه موجود را ذخیره می کنند. استفاده از حافظه نهان به سرعت بخشیدن به اطلاعات از صفحات قبلاً بازدید شده کمک می کند. صفحات ذخیره شده همیشه حاوی متنی هستند که کاربر در جستجوی جستجو مشخص کرده است. در صورت به روزرسانی صفحه وب ، این می تواند مفید باشد ، یعنی دیگر متن درخواست کاربر را شامل نمی شود ، و صفحه موجود در حافظه پنهان همچنان قدیمی است. این وضعیت با از دست دادن لینک ها مرتبط است ( انگلیسی پیوند ) و کاربر پسند ( قابلیت استفاده) رویکرد Google. این فرض می کند که قطعات کوتاه متن حاوی متن پرس و جو از حافظه نهان برگردانده می شوند. بازیگری است اصل حداقل تعجب  ، کاربر معمولاً انتظار دارد کلمات جستجو را در متون صفحات دریافت شده مشاهده کند ( انتظارات کاربر) علاوه بر این واقعیت که استفاده از صفحات ذخیره شده باعث افزایش جستجو می شود ، صفحات موجود در حافظه نهان ممکن است حاوی اطلاعاتی باشد که دیگر در هیچ کجا موجود نیست.

موتور جستجو با فایلهای خروجی دریافت شده از فهرستگر کار می کند. موتور جستجو پرس و جوهای کاربر را می پذیرد ، آنها را با استفاده از فهرست پردازش می کند و نتایج جستجو را برمی گرداند.

هنگامی که کاربر یک پرس و جو را وارد موتور جستجو می کند (معمولاً با کلمات کلیدی) ، سیستم فهرست خود را بررسی می کند و لیستی از مناسب ترین صفحات وب (مرتب سازی بر اساس برخی معیارها) ، معمولاً با یک یادداشت مختصر حاوی عنوان سند و بعضی مواقع بخش هایی از متن را نشان می دهد. فهرست جستجو با استفاده از تکنیک ویژه و براساس اطلاعاتی که از صفحات وب استخراج می شود ساخته شده است. از سال 2007 موتور جستجوی گوگل  به شما امکان می دهد تا بر اساس زمان ، اسناد مورد نظر را جستجو کنید (با منو "ابزارهای جستجو" تماس بگیرید و یک بازه زمانی را مشخص کنید). بیشتر موتورهای جستجو از سؤال در پشتیبانی استفاده می کنند. اپراتورهای بولی  AND ، OR ، NOT ، که به شما امکان می دهد لیست کلمات کلیدی جستجو را پالایش یا گسترش دهید. در این حالت ، سیستم دقیقاً همانطور که وارد شده است ، کلمات یا عبارات را جستجو می کند. برخی موتورهای جستجوگر این قابلیت را دارند جستجوی تقریبیدر این حالت ، کاربران با نشان دادن فاصله از کلمات کلیدی ، جستجو را گسترش می دهند. همچنین وجود دارد جستجوی مفهومیکه از تجزیه و تحلیل آماری استفاده از کلمات و عبارات جستجو شده در متون صفحات وب استفاده می کند. این سیستم ها به شما امکان می دهند نمایش داده شد به یک زبان طبیعی. نمونه ای از چنین موتور جستجو یک وب سایت است. بپرسید کام.

سودمندی موتور جستجو بستگی دارد ربط  صفحاتی که او پیدا کرد اگرچه میلیون ها صفحه وب ممکن است شامل یک کلمه یا عبارت خاص باشند ، ممکن است برخی از آنها نسبت به سایرین از اهمیت بیشتری برخوردار باشند. اکثر موتورهای جستجوگر برای رتبه بندی نتایج "برتر" در بالای لیست از روش های رتبه بندی استفاده می کنند. موتورهای جستجو تصمیم می گیرند که کدام صفحات بیشتر مرتبط هستند و نتایج را به چه ترتیب نشان می دهد. روش های جستجو ، مانند اینترنت ، با گذشت زمان تغییر می کنند. بنابراین دو نوع اصلی موتورهای جستجو ظاهر می شوند: سیستم های کلمات کلیدی از پیش تعریف شده و سلسله مراتبی مرتب شده و سیستم هایی که در آنها شاخص معکوس  بر اساس تجزیه و تحلیل متن

بیشتر موتورهای جستجو مشاغلی هستند که از این طریق درآمد کسب می کنند تبلیغات  ، در برخی موتورهای جستجو می توانید مکانهای اول را در نتایج جستجو برای کلمات کلیدی داده شده با هزینه خریداری کنید. آن دسته از موتورهای جستجوگر که برای ترتیب نتایج پول نمی گیرند ، از تبلیغات متنی استفاده می کنند ، در حالی که پیام های تبلیغاتی با درخواست کاربر مطابقت دارند. چنین تبلیغاتی در صفحه ای با لیستی از نتایج جستجو نمایش داده می شود و موتورهای جستجو هر بار که کاربر بر روی پیام های تبلیغاتی کلیک می کند ، درآمد کسب می کنند.

انواع موتورهای جستجو

چهار نوع موتور جستجو وجود دارد: روباتهای جستجوی انسان محور ، ترکیبی و متا سیستم.

  • سیستم های با استفاده از موتورهای جستجو
   شامل سه بخش: خزنده  ("Bot" ، "ربات" یا "عنکبوت") ، فهرست  و نرم افزار موتور جستجو یک خزنده برای دور زدن شبکه و ایجاد لیست صفحات وب لازم است. ایندکس یک بایگانی بزرگ از کپی صفحات وب است. هدف این نرم افزار ارزیابی نتایج جستجو است. با توجه به اینکه ربات جستجو در این مکانیزم دائماً شبکه را کاوش می کند ، اطلاعات مربوط به آن بیشتر است. اکثر موتورهای جستجو مدرن سیستمهایی از این نوع هستند.    این موتورهای جستجو لیست صفحات وب را دریافت می کنند. فروشگاه شامل آدرس ، عنوان و شرح مختصر سایت می باشد. فهرست منابع فقط نتایج توصیف صفحه را که توسط وب مسترها ارسال شده است جستجو می کند. مزیت دایرکتوری ها این است که کلیه منابع به صورت دستی بررسی می شوند ، بنابراین کیفیت مطالب در مقایسه با نتایج به دست آمده توسط نوع اول سیستم بطور خودکار مقایسه می شود. اما یک اشکال وجود دارد - این فهرست ها به صورت دستی به روز می شوند و می توانند به طور قابل توجهی از وضعیت واقعی عقب مانده باشند. رتبه بندی صفحه نمی تواند فوراً تغییر کند. نمونه هایی از چنین سیستم هایی عبارتند از: دایرکتوری یاهو, dmoz  و کهکشان.
  • سیستم های ترکیبی
   موتورهای جستجو مانند یاهو , گوگل , خانم  ، عملکرد سیستمها را با استفاده از موتورهای جستجو و سیستمهای کنترل شده توسط انسان ترکیب کنید.
  • سیستم های متا
   سیستم های Metasearch نتایج چندین موتور جستجو را به طور همزمان ترکیب و رتبه بندی می کنند. این موتورهای جستجو زمانی مفید بودند که هر موتور جستجوگر دارای یک شاخص منحصر به فرد بود و موتورهای جستجو کمتر "هوشمند" بودند. از آنجا که اکنون جستجو بسیار بهبود یافته است ، نیاز به آنها کاهش یافته است. مثالها: متاکراولر  و جستجوی MSN.

بازار موتور جستجو

گوگل محبوب ترین موتور جستجوی جهان است که سهم بازار آن 68.69٪ است. بایدو مقام دوم را به دست می آورد ، سهم آن 17.17٪ است.

محبوب ترین موتورهای جستجو در جهان:

موتور جستجو سهم بازار در ژوئیه 2014 سهم بازار اکتبر 2014
گوگل 68,69 % 58.01 %
بایدو 17,17 % 29.06 %
بینگ 6.22 % 8.01 %
یاهو! 6.74 % 4.01 %
آول 0,13 % 0.21 %
هیجان زده 0.22 % 0,00 %
بپرس 0,13 % 0,10 %

آسیا

در کشورهای آسیای شرقی و روسیه گوگل محبوب ترین موتور جستجو نیست. به عنوان مثال در چین محبوب تر است موتور جستجوگر Soso.

در کره جنوبی ، پورتال جستجوی خود توسعه یافته ناور  حدود 70٪ از ساكنان استفاده می كنند یاهو! ژاپن و یاهو! تایوان به ترتیب محبوب ترین موتورهای جستجو در ژاپن و تایوان هستند.

موتورهای جستجوگر روسیه و روسیه

با توجه به LiveInternet در ژوئن 2015 درمورد پوشش پرس و جوهای جستجوی روسی زبان:

برخی از موتورهای جستجو از الگوریتمهای جستجوی خارجی استفاده می کنند.

داده های کمی جستجوی Google

تعداد کاربران اینترنت و موتورهای جستجو و نیاز کاربر برای این سیستم ها به طور مداوم در حال افزایش است. برای افزایش سرعت جستجوی اطلاعات لازم ، موتورهای جستجوگر بزرگ شامل تعداد زیادی سرور هستند. سرورها معمولاً در مراکز سرور (مراکز داده) گروه بندی می شوند. با موتورهای جستجوگر محبوب ، مراکز سرور در سراسر جهان پراکنده هستند.

در اکتبر سال 2012 ، گوگل پروژه "جایی که اینترنت زندگی می کند" را راه اندازی کرد که در آن به کاربران امکان داده می شود تا با مراکز داده این شرکت آشنا شوند.

درباره کار جستجوی مراکز داده سیستم Google  موارد زیر شناخته شده است:

  • ظرفیت کل مراکز داده Google تا سال 2011 220 مگاوات برآورد شده است.
  • هنگامی که در سال 2008 گوگل تصمیم گرفت مجتمع جدیدی را در اورگان باز کند ، متشکل از سه ساختمان با مساحت 6.5 میلیون متر مربع. مجله هارپر تخمین زده است که چنین مجتمع بزرگی بیش از 100 مگاوات برق مصرف می کند ، که قابل مقایسه با مصرف انرژی یک شهر با 300000 نفر جمعیت است.
  • تعداد تخمینی سرورهای Google در سال 2012 1000،000 است.
  • مخارج گوگل در مراکز داده 1.9 میلیارد دلار در سال 2006 و 2.4 میلیارد دلار در سال 2007 بود.

اندازه وب جهانی که در دسامبر 2014 توسط گوگل نمایه شده است تقریباً 4.36 میلیارد صفحه است.

موتورهای جستجوی ممنوعیت مذهبی

گسترش جهانی اینترنت و محبوبیت روزافزون وسایل الکترونیکی در ایران عربی  و مسلمان  جهان به ویژه در کشورها خاورمیانه  و شبه قاره هند  در توسعه موتورهای جستجوگر محلی که به حساب می آیند کمک کرده است اسلامی  روایات این موتورهای جستجو حاوی فیلترهای ویژه ای هستند که به کاربران کمک می کند تا به سایت های ممنوعه دسترسی پیدا نکنند ، به عنوان مثال سایتهایی که دارای مستهجن هستند و به آنها اجازه می دهند فقط از سایتهایی استفاده کنند که محتوای آنها با ایمان اسلامی منافات ندارد. کمی قبل از ماه مسلمان ماه رمضان  ، در ژوئیه 2013 ، به جهان معرفی شد حلالگوگل  - سیستمی که فقط کاربران را صادر می کند حلال  پیوندهای "درست" ، فیلتر کردن نتایج جستجو از سایر موتورهای جستجو ، مانند گوگل  و بینگ  . دو سال قبل ، در سپتامبر 2011 ، موتور جستجوی IhHalal برای خدمت به کاربران در خاورمیانه راه اندازی شد. با این حال این خدمات جستجو  به گفته صاحب ، به دلیل کمبود بودجه مجبور شد به زودی تعطیل شود.

عدم سرمایه گذاری و سرعت کم انتشار فناوری در جهان اسلام مانع پیشرفت و مانع موفقیت یک موتور جستجوی جدی اسلامی شد. عدم موفقیت سرمایه گذاری های عظیم در پروژه های وب شیوه زندگی مسلمانان بدیهی است که یکی از این موارد بود Muxlim. او میلیونها دلار سرمایه گذار از قبیل Rite Internet Ventures دریافت کرده است ، و اکنون - مطابق با آخرین پیام IhHalal قبل از بسته شدن آن - با این ایده مشکوک مطرح می شود که "بعدی فیس بوک  یا Google فقط ممکن است در کشورها ظاهر شود خاورمیانه  اگر از جوانان درخشان ما حمایت می کنید. " با این وجود سالهاست که کارشناسان اسلامی در زمینه اینترنت می دانند چه چیزی مناسب است یا نه. شریعت  و طبقه بندی وب سایت ها به عنوان " حلال  "یا" حرام  " همه موتورهای جستجوگر گذشته و حال اسلامی به سادگی یک مجموعه داده خاص فهرست شده یا موتورهای اصلی جستجو مانند Google هستند ، یاهو  و بینگ ، با یک سیستم فیلتر خاص برای جلوگیری از دسترسی کاربران به سایت های هارا مانند سایت های برهنگی ، دگرباشان  قمار و هر چیز دیگری که موضوع آن ضد اسلامی به حساب می آید.

در میان دیگر موتورهای جستجوگرای مذهبی گرا ، جودوگو - یهودی - متداول است نسخه گوگل  و SeekFind.org یک سایت مسیحی است که شامل فیلترهایی برای محافظت از کاربران در برابر مطالبی است که می تواند ایمان آنها را تضعیف یا تضعیف کند.

نتایج شخصی و حباب فیلتر

بسیاری از موتورهای جستجو مانند Google و Bing از الگوریتم هایی استفاده می کنند تا بطور انتخابی حدس بزنند که کاربر براساس اقدامات گذشته خود در سیستم می تواند چه اطلاعاتی را ببیند. در نتیجه ، وب سایت ها فقط اطلاعاتی را نمایش می دهند که با علایق گذشته کاربر سازگار است. این اثر "حباب فیلتر" نامیده می شود.

همه اینها منجر به این واقعیت می شود که کاربران اطلاعات بسیار کمتری دریافت می کنند که با دیدگاه آنها مغایرت دارد و از نظر فکری در "حباب اطلاعاتی" خود منزوی می شوند. بنابراین ، "اثر حباب" می تواند عواقب منفی برای شکل گیری افکار مدنی داشته باشد.

تعصب موتور جستجو

اگرچه موتورهای جستجوگر برای رتبه بندی وب سایت ها بر اساس برخی از محبوبیت و اهمیت برنامه ریزی شده اند ، اما در واقعیت ، مطالعات تجربی نشان می دهد که عوامل مختلف سیاسی ، اقتصادی و اجتماعی تأثیر می گذارد. نتایج جستجو.

چنین تعصب می تواند نتیجه مستقیمی از فرآیندهای اقتصادی و تجاری باشد: شرکت هایی که در موتور جستجو تبلیغ می شوند می توانند در نتایج یک جستجوی منظم در آن محبوبیت بیشتری پیدا کنند. حذف نتایج جستجو که مطابق با قوانین محلی نیست نمونه ای از تأثیر روندهای سیاسی است. به عنوان مثال ، گوگل برخی از وب سایت های نئو نازی را در فرانسه و آلمان نمایش نمی دهد که انکار هولوکاست غیرقانونی است.

تعصب همچنین می تواند نتیجه ای از فرایندهای اجتماعی باشد ، زیرا الگوریتم های موتور جستجو غالباً برای رد کردن دیدگاههای غیر قالب بندی شده به نفع نتایج "محبوب تر" طراحی شده اند. نمایه سازی الگوریتم برای موتورهای جستجوگر اولویت را به سایت های آمریکایی می دهد.

جستجوی بمب  - یک نمونه از تلاش برای مدیریت نتایج جستجو به دلایل سیاسی ، اجتماعی یا تجاری.

همچنین ببینید

یادداشت ها

ادبیات

  • اشمانوف I.S.  ، ایوانف A.A.  ارتقاء وب سایت در موتورهای جستجو. - م: ویلیامز ، 2007 .-- 304 ص. - شابک 978-5-8459-1155-1.
  • Baykov V.D.  اینترنت جستجوی اطلاعات. ارتقاء وب سایت - SPb. : BHV-Petersburg، 2000 .-- 288 ص. - شابک 5-8206-0095-9.
  • Kolisnichenko D.N.  موتورهای جستجو و ارتقاء وب سایت در اینترنت. - م: دیالکتیک ، 2007 .-- 272 ص. - شابک 978-5-8459-1269-5.
  • Lande D.V. به جستجوی دانش در اینترنت بپردازید. - م: دیالکتیک ، 2005 .-- 272 ص. - شابک 5-8459-0764-0.