Читать курсовая по информационным технологиям: "Моделирование Web-графа" Страница 1

назад (Назад)скачать (Cкачать работу)

Функция "чтения" служит для ознакомления с работой. Разметка, таблицы и картинки документа могут отображаться неверно или не в полном объёме!

ФЕДЕРАЛЬНОЕ АГЕНСТВО ПО ОБРАЗОВАНИЮ

Государственное образовательное учреждение

высшего профессионального образования

“САМАРСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ”

Механико-математический факультет Кафедра информатики и вычислительной математики Специальность “прикладная математика”Моделирование Web-графа.

Курсовая работа Выполнил студент

4 курса группы 1241

Труфанов Александр Николаевич _____________________________ Научный руководитель

Борисова С. П. _____________________________ Работа защищена

“______”_________________2006г. Оценка________________________ Зав. кафедрой

д.ф.-м.н., профессор

Степанов А.Н. ______________________________ Самара 2006

Оглавление.Введение. 2 Модель ACL. 8 Модель “Развивающейся” сети. 9 Копирующая модель сети. 11 Модель “Растущей сети”. 12 Многослойная модель. 13Заключение. 15Библиография. 16

Введение.

Web-граф. Применение и ценность исследования.

Под Web-графом понимается орграф, вершинами которого являются документы (в основном статические html страницы) сети Интернет, а дугами – гипертекстовые ссылки между ними. Изучение его свойств представляет большой научный интерес и имеет огромную практическую ценность. Основная область применения накопленных о Web-графе данных – информационно поисковые системы (ИПС), такие как Google, MSN, Altavista.

Подавляющее большинство запросов пользователей содержат не более 3-5 слов, и число релевантных им документов измеряется десятками тысяч. Естественно, пользователю предоставляются ссылки на первые 10-15 самых “лучших” страниц. Ранжирование результатов поиска производится по присвоенным им рейтингам. Существует огромное число алгоритмов, для определения “важности” ресурса сети. Прорывом в методах ранжирования стал алгоритм PageRank [1] компании Google: превосходя конкурентов более качественным поиском, она быстро стала лидером рынка. На данный момент ни одна крупная ИПС не может обойтись без подобного алгоритма. PageRank в качестве рейтинга страницы использует взвешенное отношение суммы рейтингов ссылающихся на страницу ресурсов к количеству исходящих из них ссылок. Реализация подобного подхода невозможна без использования web-графа. Наряду с web-графом исследуются также такие структуры как:

    Хост-граф (Host graph). Орграф вершинами которого являются web узлы. Дуга между вершинами A и B существует, если существует хоть одна web страница узла A имеющая гипертекстовую ссылку на одну из web страниц узла B. Cosine-граф (Cosine graph). Неориентированный граф, вершинами которого являются web узлы. А дуги имеют вес равный cosine дистанции между векторами терминов соответствующих страниц Граф цитирования (Co-citation graph). Неориентированный граф вершинами которого являются web узлы. Весом дуги E(x,y) между вершинами x и y является число страниц ссылающихся и на страницу x и на страницу y. Пиринговый граф (Gnutella graph). Орграф, вершинами которого являются хосты пиринговых программ, таких как Gnutella, Napster, Morpheus и т.п. А дугами – соединения между ними. Интернет-граф (Internet graph). Неориентированный граф, представляющий физическое соединение компьютеров в Интернет. Коммуникационный граф (Communication graph). Взвешенный неориентированный граф, вершинами которого являются хосты, а дугами – соединения между ними. Весом дуги является количество информации


Интересная статья: Быстрое написание курсовой работы