Читать курсовая по информационному обеспечению, программированию: "Анализ данных дистанционного практикума по программирования с помощью методов Data Mining" Страница 1

назад (Назад)скачать (Cкачать работу)

Функция "чтения" служит для ознакомления с работой. Разметка, таблицы и картинки документа могут отображаться неверно или не в полном объёме!

ОГЛАВЛЕНИЕ ВВЕДЕНИЕ

. АНАЛИТИЧЕСКАЯ ОБЗОР

.1 Data Mining - способ «обнаружения знаний в базах данных»

.2 Кластеризация как одна из задач Data Mining

.3 Возможности анализа данных дистанционного практикума на основе задачи кластеризации

. ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ДЛЯ ПРОВЕДЕНИЯ КЛАСТЕРИЗАЦИИ

.1 Выбор и описание алгоритмов кластеризации

.2 Выбор программного пакета для проведения эксперимента

.3 Выбор объектов для кластеризации данных дистанционного практикума и определение их признаков

. ХОД И РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТА

.1 Получение данных из хранилища базы данных дистанционного практикума

.2 Загрузка данных в программный пакет WEKA

.3 Кластеризация студентов

.4 Кластеризация задач

.5 Кластеризация пар «студент - задача»

ЗАКЛЮЧЕНИЕ

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

ПРИЛОЖЕНИЕ 1. Реализация функций в модуле подготовки данных

ВВЕДЕНИЕ

век справедливо назван веком информатизации. Происходит информатизация всех сфер деятельности человека. И, естественно, образование не является исключением. Все большее распространение получает дистанционная форма обучения, которая позволяет значительно сокращать время живого общения преподавателя и студента.

В процессе работы студентов с системой дистанционного обучения (СДО) в её базе данных, как правило, сохраняется вся детальная информация о процессе обучения. Таким образом, накапливаются большие информационные массивы, которые, как правило, удаляются после того, как студент окончил курс (окончил вуз), поскольку эти данные уже не нужны для решения тактических задач обучения. Тем не менее, накопленные в СДО информационные массивы могут стать источником новых, полезных для учебного процесса знаний в результате их аналитической обработки с применением методов искусственного интеллекта[1].

В системах аналитической обработки данных различных предметных областей хорошо себя зарекомендовали методы Data Mining. В данной работе представлен опыт по применению методов Data Mining к данным дистанционного практикума по программированию, технологиям баз данных и смежным дисциплинам, разработанного в Вологодском государственном университете (), который активно используется при обучении специалистов в области ИКТ на протяжении десяти лет. Информационной основой практикума является база данных. За многие годы ее эксплуатации были накоплены большие объемы данных. На данный момент в базе данных хранится свыше 168 000 строк, содержащих информацию обо всех успешных и неуспешных попытках решения задач студентами. Основными сущностями для дальнейшего анализа данных нашей БД являются задачи и студенты, решающие эти задачи.Mining - это процесс обнаружения в сырых данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности.

Основу методов Data Mining составляют всевозможные методы моделирования и прогнозирования, классификации, основанные на применении деревьев решений, искусственных нейронных сетей, генетических алгоритмов, эволюционного программирования, ассоциативной памяти, нечёткой логики[2].

С помощью интеллектуального анализа данных решаются многие важные задачи, например, группировка объектов по множеству их


Интересная статья: Быстрое написание курсовой работы