Экзамен сдан

Система анализа данных как индуктивный метод машинного обучения выявляет шаблоны данных среди имеющихся данных. Под термином «анализ данных» понимается исследование данных с целью получения необходимых знаний или информации. 

Анализ данных базируется на использовании различных наук:

- статистика представляет методы для применения, выборки и трансформации данных, а также для выявления «шаблонов данных». 

- Исследование баз данных обеспечивает методы для эффективного хранения, проверки данных.

- Искусственный интеллект обеспечивает технологии для сбора информации (нейронная сеть, генетические алгоритмы).

Методы анализа данных:

Визуализация: гистограммы, диаграмма дисперсий

Классификация: распределение объектов по классам 

Сегментация: объединение объектов в группы, которые до этого не были известны

Прогноз: прогнозирование неизвестных признаков на основе других признаков

Анализ зависимости: связь между признаками объекта

Анализ различий: идентификация объектов, которые не следуют закономерностям других объектов, выяснение причин

Эта схема дает представление о методах анализа данных.

Обзор методов анализа данных 

Кластерный анализ:

Кластер(определенная группа), члены которой внутренне однородны и внешне разнородны

Decision tree

Выводит алгоритмы из данных имеющихся классов для классификации неизвестных объектов 

Регрессионный анализ: 

Выявление функциональных зависимостей между переменными

Поделись материалом