Читать курсовая по информатике, вычислительной технике, телекоммуникациям: "Сравнительный обзор современных поисковых систем" Страница 2
- 1
- 2
- 3
- 4
- . . .
- последняя »
Браузер предназначен для визуального использования страниц, а паук работает с HTML кодом напрямую. Чтобы посмотреть "сырой" исходник нажмите в меню браузера: Вид- Просмотр HTML кода.
Crawler («путешествующий» паук) – программа, которая автоматически уходит по всем внешним ссылкам страницы. Ее задача - поиск не известных (или измененных) документов и в расстановке приоритетов, куда дальше должен идти Spider.
Indexer (индексатор) - программа-анализатор скаченных пауками веб-страниц. Она "разбирает" на части скачанную страницу и анализирует ее элементы, такие как текст, служебные html-теги, заголовки, особенности стилистики и структурные формы.
Database (база данных) – хранилище для скачанных и обработанных страниц - общая база данных поисковой машины.
Search engine results engine (система выдачи результатов) – извлекает результаты поиска из базы данных поисковой системы. Именно она решает, какие страницы более соответствуют запросу пользователя и отсортировывает их в нужном порядке. Модуль работает согласно заданным поисковой системой алгоритмам ранжирования.
Самые популярные поисковые системы
Доля каждой поисковой системе в Рунете
Русскоязычные | Англоязычные |
Яndex | |
MSN search | |
Rambler | Yahoo |
Аport | Aol |
MSN Search | Lucos |
Yahoo | Cuil |
AltaVista | Ask Jeeves |
Mail.ru | LookSmart |
Анализ трафика – июнь 2008г.Рейтинг поисковых систем в России
Количество переходов с поисковых систем
Сравнительный обзор и классификация поисковых системыОбщее соотношение поисковых систем в англоязычных странах
Таблица 1
Яndex | Rambler | |
1997г.Службаоснована наработе crawler’ов,охватывающейвсю Сеть. Приоритетноеместо занимаетрелевантностьрезультатови их соответствиезапросу. Вотличие отмногих поисковиков,роботы Google индексируютвсе страницы,а не толькосамые главные.Есть меню, гдес легкостьюсможете находитьв Сети изображения,обсуждения,проходящиев группахновостей, читатьновости илипроводитьпоиск товаров.Можно получитьдоступ к информациииз Open Directory (ОткрытогоКаталога, DMOZ).Системадолго хранитпроиндексированныероботами страницыв своем кэше,что позволяет«оживлять»мертвые, удаленныес серверовстраницы, иливидеть старыеверсии толькочто обновленныхстраниц. Системапредоставляетотличную проверкуправописания,легкий доступк словарнымопределениям,просмотр биржевыхставок, дорожныеатласы, базыномеров телефонови многое другое.ПрограммаAdWordsразмещаетрекламныеобъявленияна сайтах Googleи его партнеров.Также Googleявляетсябесплатнымпоставщикомрезультатовпоисковыхзапросовнекоторыхдругих поисковыхсистем. | 1997г.Всистеме производитсяпоиск с учетомморфологиирусского языка,поиск с учетомрасстояния,и тщательноразработанныйалгоритм оценкирелевантности.Реализованестественно-языковойзапрос: теперьпоисковикможно спрашивать«по-русски»,задавая длинныевопросы. Например:«где купитьхолодильник».Поисковыйробот позволяетпредоставитьвозможностипоиска по разнымзонам |
- 1
- 2
- 3
- 4
- . . .
- последняя »
Похожие работы
Интересная статья: Быстрое написание курсовой работы

(Назад)
(Cкачать работу)