Читать курсовая по информатике, вычислительной технике, телекоммуникациям: "Сравнительный обзор современных поисковых систем" Страница 2

назад (Назад)скачать (Cкачать работу)

Функция "чтения" служит для ознакомления с работой. Разметка, таблицы и картинки документа могут отображаться неверно или не в полном объёме!

Браузер предназначен для визуального использования страниц, а паук работает с HTML кодом напрямую. Чтобы посмотреть "сырой" исходник нажмите в меню браузера: Вид- Просмотр HTML кода.

Crawler («путешествующий» паук) – программа, которая автоматически уходит по всем внешним ссылкам страницы. Ее задача - поиск не известных (или измененных) документов и в расстановке приоритетов, куда дальше должен идти Spider.

Indexer (индексатор) - программа-анализатор скаченных пауками веб-страниц. Она "разбирает" на части скачанную страницу и анализирует ее элементы, такие как текст, служебные html-теги, заголовки, особенности стилистики и структурные формы.

Database (база данных) – хранилище для скачанных и обработанных страниц - общая база данных поисковой машины.

Search engine results engine (система выдачи результатов) – извлекает результаты поиска из базы данных поисковой системы. Именно она решает, какие страницы более соответствуют запросу пользователя и отсортировывает их в нужном порядке. Модуль работает согласно заданным поисковой системой алгоритмам ранжирования.

Самые популярные поисковые системы

Доля каждой поисковой системе в Рунете

Русскоязычные

Англоязычные

Яndex

Google

Google

MSN search

Rambler

Yahoo

Аport

Aol

MSN Search

Lucos

Yahoo

Cuil

AltaVista

Ask Jeeves

Mail.ru

LookSmart

Анализ трафика – июнь 2008г.Рейтинг поисковых систем в России

Количество переходов с поисковых систем

Сравнительный обзор и классификация поисковых системы

Общее соотношение поисковых систем в англоязычных странах

Таблица 1

Google

Яndex

Rambler

1997г.Службаоснована наработе crawler’ов,охватывающейвсю Сеть. Приоритетноеместо занимаетрелевантностьрезультатови их соответствиезапросу. Вотличие отмногих поисковиков,роботы Google индексируютвсе страницы,а не толькосамые главные.Есть меню, гдес легкостьюсможете находитьв Сети изображения,обсуждения,проходящиев группахновостей, читатьновости илипроводитьпоиск товаров.Можно получитьдоступ к информациииз Open Directory (ОткрытогоКаталога, DMOZ).Системадолго хранитпроиндексированныероботами страницыв своем кэше,что позволяет«оживлять»мертвые, удаленныес серверовстраницы, иливидеть старыеверсии толькочто обновленныхстраниц. Системапредоставляетотличную проверкуправописания,легкий доступк словарнымопределениям,просмотр биржевыхставок, дорожныеатласы, базыномеров телефонови многое другое.ПрограммаAdWordsразмещаетрекламныеобъявленияна сайтах Googleи его партнеров.Также Googleявляетсябесплатнымпоставщикомрезультатовпоисковыхзапросовнекоторыхдругих поисковыхсистем.

1997г.Всистеме производитсяпоиск с учетомморфологиирусского языка,поиск с учетомрасстояния,и тщательноразработанныйалгоритм оценкирелевантности.Реализованестественно-языковойзапрос: теперьпоисковикможно спрашивать«по-русски»,задавая длинныевопросы. Например:«где купитьхолодильник».Поисковыйробот позволяетпредоставитьвозможностипоиска по разнымзонам


Интересная статья: Быстрое написание курсовой работы