- 1
- 2
- 3
- . . .
- последняя »
ФЕДЕРАЛЬНОЕ АГЕНСТВО ПО ОБРАЗОВАНИЮ
Государственное образовательное учреждение
высшего профессионального образования
“САМАРСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ”
Механико-математический факультет Кафедра информатики и вычислительной математики Специальность “прикладная математика”Моделирование Web-графа.
Курсовая работа Выполнил студент
4 курса группы 1241
Труфанов Александр Николаевич _____________________________ Научный руководитель
Борисова С. П. _____________________________ Работа защищена
“______”_________________2006г. Оценка________________________ Зав. кафедрой
д.ф.-м.н., профессор
Степанов А.Н. ______________________________ Самара 2006
Оглавление.Введение. 2 Модель ACL. 8 Модель “Развивающейся” сети. 9 Копирующая модель сети. 11 Модель “Растущей сети”. 12 Многослойная модель. 13Заключение. 15Библиография. 16
Введение.
Web-граф. Применение и ценность исследования.
Под Web-графом понимается орграф, вершинами которого являются документы (в основном статические html страницы) сети Интернет, а дугами – гипертекстовые ссылки между ними. Изучение его свойств представляет большой научный интерес и имеет огромную практическую ценность. Основная область применения накопленных о Web-графе данных – информационно поисковые системы (ИПС), такие как Google, MSN, Altavista.
Подавляющее большинство запросов пользователей содержат не более 3-5 слов, и число релевантных им документов измеряется десятками тысяч. Естественно, пользователю предоставляются ссылки на первые 10-15 самых “лучших” страниц. Ранжирование результатов поиска производится по присвоенным им рейтингам. Существует огромное число алгоритмов, для определения “важности” ресурса сети. Прорывом в методах ранжирования стал алгоритм PageRank [1] компании Google: превосходя конкурентов более качественным поиском, она быстро стала лидером рынка. На данный момент ни одна крупная ИПС не может обойтись без подобного алгоритма. PageRank в качестве рейтинга страницы использует взвешенное отношение суммы рейтингов ссылающихся на страницу ресурсов к количеству исходящих из них ссылок. Реализация подобного подхода невозможна без использования web-графа. Наряду с web-графом исследуются также такие структуры как:
Хост-граф (Host graph). Орграф вершинами которого являются web узлы. Дуга между вершинами A и B существует, если существует хоть одна web страница узла A имеющая гипертекстовую ссылку на одну из web страниц узла B. Cosine-граф (Cosine graph). Неориентированный граф, вершинами которого являются web узлы. А дуги имеют вес равный cosine дистанции между векторами терминов соответствующих страниц Граф цитирования (Co-citation graph). Неориентированный граф вершинами которого являются web узлы. Весом дуги E(x,y) между вершинами x и y является число страниц ссылающихся и на страницу x и на страницу y. Пиринговый граф (Gnutella graph). Орграф, вершинами которого являются хосты пиринговых программ, таких как Gnutella, Napster, Morpheus и т.п. А дугами – соединения между ними. Интернет-граф (Internet graph). Неориентированный граф, представляющий физическое соединение компьютеров в Интернет. Коммуникационный граф (Communication graph). Взвешенный неориентированный граф, вершинами которого являются хосты, а дугами – соединения между ними. Весом дуги является количество информации
- 1
- 2
- 3
- . . .
- последняя »
Похожие работы
Интересная статья: Быстрое написание курсовой работы