Литвин В. В. Аналіз даних та знань : навч. посіб. / В. В. Литвин, В. В. Пасічник, Ю. В. Нікольський. — Львів : Магнолія 2006, 2017. — 276 с. - Комп'ютинг.

ЗМІСТ

Передмова наукового редактора......7

РОЗДІЛ 1. Інформація. Дані. Знання.....10

1. Поняття про інформацію......10

2. Інформаційні сигнали матеріального світу.......13

3. Знакове середовище існування інформації......13

4. Поняття про знакові системи............15

5. Форми знакового подання інформації....16

6. Інформація як результат взаємодії даних і методів.......17

7. Властивості взаємозв'язку інформації, даних і методів....19

8. Синтаксичні міри інформації.........20

9. Семантичні міри інформації....23

10. Прагматичні міри інформації......23

Контрольні запитання.........24

Розділ 2. Факторний аналіз.....25

2.1. Концепція факторного аналізу.......25

2.2. Основи факторного аналізу......26

2.3. Основні алгоритми та методи.....27

2.4. Методи виділення первинних факторів.....28

2.5. Головні компоненти, власні значення та вектори.......29

2.6. Методи факторного аналізу.......33

2.6.1. Метод найменших квадратів......34

2.6.2. Метод максимальної правдоподібності....35

2.6.3. Альфа-факторний аналіз......37

2.6.4. Аналіз образів.......38

2.7. Методи обертання.....40

2.7.1. Геометричний метод обертання......40

2.7.2. Метод ортогонального обертання......43

2.7.3. Методи косокутного обертання.....45

2.7.4. Обертання з використанням цільової матриці.....47

Контрольні запитання.....48

РОЗДІЛ 3. Дискримінантний аналіз....49

3.1. Суть дискримінантного аналізу......49

3.2. Канонічні дискримінантні функції......52

3.2.1. Геометрична інтерпретація......53

3.2.2. Кількість канонічних дискримінантних функцій.....53

3.2.3. Одержання коефіцієнтів канонічної дискримінантної функції......54

3.2.4. Коефіцієнти.....56

3.2.5. Нестандартизовані коефіціїнти....57

3.3. Процедура класифікації.......57

3.3.1. Класифікаційні функції.......58

3.3.2. Врахування апріорних ймовірностей.......60

3.3.3. Класифікація за допомогою канонічних дискримінантних функцій......61

3.3.4. Графічне зображення областей .......62

3.3.5. Класифікаційна матриця......62

3.3.6. Обгрунтування за допомогою розбиття вибірки....64

Контрольні запитання.....65

РОЗДІЛ 4. Кластерний аналіз....65

4.1. Сутність кластерного аналізу.......65

4.1.1. Застереження стосовно використання кластерного аналізу....67

4.1.2. Поняття подібності......67

4.1.3. Вибір змінних......70

4.2. Міри подібності.....70

4.2.1. Коефіцієнти кореляції.....70

4.2.2. Міри відстані....71

4.2.3. Коефіцієнти асоціативності....72

4.2.4. Імовірнісні коефіцієнти подібності....73

4.3. Методи кластерного аналізу.....74

4.3.1. Ієрархічні методи групування....78

4.3.2. Інтеративні методи групування.....81

4.3.3. Інші методи .....81

Контрольні запитання....83

Розділ 5. Інтелектуальний аналіз даних....84

5.1. Що таке інтелектуальний аналіз даних......84

5.2. Типи закономірностей.....88

5.2.1. Класи систем Data Mining......89

5.2.2. Предметно-орієнтовані аналітичні системи......89

Контрольні запитання....93

РОЗДІЛ 6. Машинне навчання.....96

6.1. Інтуїтивне розуміння навчання.......96

6.2. Означення навчання.......97

6.3. Програми, що навчаються.....98

6.4. Мотивація до навчання.....101

6.5. Таксономія машинного навчання.....102

6.6. Споріднені галузі.....104

6.7. Навчання як розділ штучного інтелекту.....106

6.8. Загальне формулювання задачі навчання за прецендентами.....107

6.9. Основні поняття та означення....107

6.10 Типологія задач навчання за прецендентами.....108

6.11. Задачі з описом об'єктів на основі ознак....111

6.12. Приклади задач машинного навчання....111

6.12.1. Задачі класифікації.....111

6.12.2. Задача відновлення регресії.....116

6.12.3. Задачі прогнозування та прийняття рішень......117

6.12.5. Задачі аналізу клієнтських середовищ........120

6.13. Навчання понять в штучному інтелекті....121

6.13.1. Задача навчання понять - пошук у просторі гіпотез.....122

6.13.2. Упорядкування гіпотез "від загальної до конкретної"........124

6.13.3. Алгоритм Find-S пошуку максимально конкретної гіпотези.....126

6.13.4. Алгоритм "вилучення кандидата".......129

Контрольні запитання......144

Задачі для самостійного розв'язування.....145

РОЗДІЛ 8. Нейронні мережі.....169

8.1. Навчання на основі зв'язків.....169

8.1.2. Модель штучного нейрона...........171

8.1.3. Подання нейромереж та їхньої архітектури.......175

8.1.4. Сучасні архітектури нейромереж....177

8.1.5. Навчання одношарових нейромереж прямого поширення .......182

8.1.6. Навчання багатошарових нейронних мереж прямого поширення......189

8.2. Метод опорних векторів......194

8.3. Мережі, що самоорганізовуються.....210

8.3.1. Опис мереж, що самоорганізуються......210

8.3.2. Міри відстані між векторами.......212

8.3.3. Проблема нормалізації векторів......212

8.3.4. Міра організації мережі......213

8.3.5. Механізм стомлення нейронів.....214

8.3.6. Методи навчання мереж, що самоорганізовуються.....215

Задачі для самостійного розв'язування......219

РОЗДІЛ 9. Онтології й онтологічні системи........222

9.1. Поняття онтології.....222

9.2. Моделі онтології й онтологічні системи.....229

9.3. Методології створення і "життєвий цикл" онтологіїї.....233

9.4. Мови опису онтологій........234

Контрольні запитання......238

РОЗДІЛ 10. Програмні засоби побудови онтологій.......239

10.1. Онтологія як засіб формалізації знань......239

10.1.2. Загальні принципи проектування онтологій......242

10.1.3. Формати та стандарти подання інформації.......243

10.1.4. Засоби для створення онтології....246

10.2. Технологія розроблення онтологій в редакторі Protege......247

10.2.1. Еволюція Protege....247

10.2.2. Protege-OWL. Мова Web онтологій OWL .......249

10.2.3. Основні терміни та поняття у Protege - OWL....249

10.2.4. Методика розроблення онтології засобами Protege......253

10.2.5. Створення онтології......255

Контрольні запитання ......268

Використана література......269




Анотація:
Викладено основні методи аналізу даних та знань, особливу увагу звернуто на багатовимірний та інтелектуальний аналіз даних. Висвітлено особливості технологій Data Mining, їх теоритичні та прикладні аспекти. Розглянуто методи машинного читання, які використовуються під час аналізу даних та знань. Навчальний посібник призначений для студентів, що навчаються за напрямами підготовки "Комп'ютерні науки", "Системний аналіз", для магістрів спеціальностей "Управління проектами" та "Консолідована інформація".



004 Комп'ютерна наука і технологія. Застосування комп'ютера. Оброблення даних

004.8(075.8)