Від статистики − до
аналізу,
від аналізу − до
прогнозування,
від прогнозування − до планування.
Народна мудрість.
![]()
Процеси створення, функціонування та розвитку складних
природних і штучних систем супроводжуються невизначеністю, яка є наслідком
розмитості цілей, неповноти вихідної інформації, суб’єктивності уявлень про
майбутні процеси та критерії їх оцінки. Зменшення невизначеності досягається
шляхом передбачення та прогнозування і, як наслідок, об’єктивізацією
суб’єктивних рішень. У відомій монографії Фогеля Л., Оуенса А., Уолша М.
“Штучний інтелект та еволюційне моделювання” вказано на те, що розумну
поведінку можна розглядати як поєднання можливості передбачувати стани
зовнішнього середовища з перетворенням кожного передбачення в адекватну
реакцію у відповідності до заданої цілі. Такий висновок визначає роль прогнозування
як необхідної умови цілеспрямованої діяльності людини при розв’язанні задач
аналізу та синтезу, а також вибору оптимальних альтернатив.
Концепції та парадигми, елементи яких представлено у
посібнику, базуються на певних логіко-філософських категоріях, зокрема на
дедукції та індукції. Поняття дедукції зустрічаємо ще у Аристотеля і у
широкому сенсі воно означає сукупність процесів наукового мислення, що
включають в себе поділ та визначення понять, доведення положень. Термін
індукція вперше зустрічається у Сократа, де вона інтерпретується як знаходження
загального визначення шляхом порівняння частинних випадків та виключення хибних
визначень. Аристотель розрізняв повну та неповну індукцію. Родоначальником
сучасного поняття індукції вважають Ф.
Бекона, який вказував на те, що при
узагальненні необхідно дотримуватись такого правила: зробити три огляди всіх відомих
випадків прояву відомої властивості у різних предметів − огляд позитивних
та негативних випадків; огляд випадків, у яких властивість проявляється різною
мірою, і лише тоді робити узагальнення. Подальший розвиток поняття індукції
дістало у роботах Дж.Ст. Мілля.
Дедукція
та індукція інцидентні поняттям аналізу та синтезу. Подібність дедукції та
аналізу є очевидною, оскільки аналіз − прийом мислення, через який
відбувається розклад на складові частини того, що є цілим. У склад процесу дедукції
входять такі елементи: положення, з якого робиться висновок; власне процес
виведення із вказаного положення; висновок чи положення, одержане із вихідного
положення. Положення, з яких роблять висновки, зводяться до двох типів:
очевидні істини та узагальнення, одержані шляхом дослідів.
Елементи
обох розглянутих категорій присутні у методах обробки інформації та
прогнозування, які розглянуто у посібнику. Зокрема, більшість наведених задач
розв’язується за допомогою дедуктивних схем, пріоритетним в яких є вивчення
сутності відношень “причина-наслідок”. Репрезентують такий підхід
методи попередньої обробки даних, ідентифікація залежності результуючої характеристики
від вхідних факторів, якщо є заданими її структура та апріорна інформація.
Індуктивний підхід реалізовано у методі групового врахування аргументів та
методі Брандона побудови рівняння нелінійної множинної регресії. Застосування
індуктивної та дедуктивної парадигм наштовхується на певні проблеми, основні з
яких визначені нижче. Зокрема, дедуктивний підхід часто “корелює” з
“прокляттям багатомірності”.
У
навчальному посібнику розглянуто теоретичні та прикладні аспекти технологій
прогнозування, в основі яких лежать класичні та сучасні парадигми. Зауважимо,
що вивчення задач прогнозування, моделей, методів і засобів їх розв’язання
складають частину навчального курсу “Інформаційні інтелектуальні системи”. Зокрема,
це моделі, методи і алгоритми, що базуються на використанні статистичного
аналізу і методу найменших квадратів, нейромережні технології, методи теорії
нечітких множин, еволюційне та гібридне моделювання.
У
першому розділі представлено метод найменших квадратів, який широко
використовується у переважній більшості методів прогнозування. Викладено
проблеми, що супроводжують його застосування при побудові рівнянь парної та
множинної лінійної регресії, алгоритми тестування таких явищ як
мультиколінеарність, гетероскедастичність та автокореляція. Для побудови
множинної нелінійної регресії розглянуто аспекти застосування методу Брандона.
Основні
нейромережні парадигми представлено у наступному розділі. Головна їх
особливість − мінімальні вимоги до складу та структури вихідної
інформації. Розглянуто квінтесенцію нейромережних технологій − метод
зворотного поширення помилки, а також мережі зустрічного поширення та мережі із
радіально-базисними функціями активації.
Третій
розділ містить опис технологій, які базуються на ідеях та принципах
функціонування природних систем − природного відбору, селекції та
самоорганізації. Зокрема, це метод групового врахування аргументів, за
допомогою якого одержують як завгодно складні залежності при мінімальному
апріорному інформаційному забезпеченні. Іншу групу складають еволюційні моделі
та методи. Визначено аспекти застосування генетичного алгоритму при розв’язанні
задач оптимізації складних залежностей.
Третьою
складовою − представником концепції “м’яких обчислень” за визначенням професора
Л. Заде є числення суб’єктивних суджень за допомогою методів теорії нечітких
множин. У четвертому розділі представлено основні поняття, алгоритми нечіткого
логічного виведення та аналізу нечітких експертних висновків.
У
п’ятому розділі наведено методи та алгоритми препроцесінгу даних, використання
яких дозволить підвищити точність та швидкість прогнозування. Складовими попередньої
обробки даних є стандартизація та нормалізація значень факторів, визначення
найбільш інформативних та значущих факторів. На зменшення інформаційної
ентропії спрямовані методи головних компонент, “вибілювання” входів та
розрахунку крос-ентропії.
Ефективність
ідентифікації невідомих залежностей залежить від розв’язання задачі
кластеризації. У шостому розділі представлено такі групи методів кластеризації:
класичні, що базуються на методі парних порівнянь; методи, що базуються на
гіпотезі компактності; еволюційні методи.
Ще
однією із задач прогнозування є відновлення пропущених значень. Її особливістю
є інтерполяційний характер, оскільки, найчастіше, пропущені значення
знаходяться всередині області дослідження. У сьомому розділі наведено емпіричні
та локальні методи відновлення пропусків; ймовірнісно-статистичні методи та методи,
в основі яких лежить побудова рівнянь лінійної регресії, зокрема, метод Бартлетта
та resampling-методи;
методи, розроблені Новосибірською школою аналізу даних під керівництвом
професора М.Г. Загоруйка, а також еволюційний метод.
У
восьмому розділі викладено основи розробки та застосування гібридних моделей і
методів. Композиція нейромережних парадигм, методів еволюційного моделювання та
нечіткого виведення визначає формування нових напрямків дослідження, що
дозволить збільшити точність прогнозування, підвищити інтерпретованість його
результатів, оптимізувати процеси прийняття рішень.
Дев'ятий
розділ містить адаптовані авторські переклади статей авторів відомих сучасних
методів Soft Computing. Зокрема представлені мурашині алгоритми як
метаевристики, які призначені для
розв'язання задач дискретної оптимізації. Іншу технологію репрезентує
програмування генетичних виразів, що є подальшим розвитком і певною комбінацією
генетичних алгоритмів та генетичного програмування. Зазначені його переваги при
розв'язанні задач класифікації та апроксимації невідомих залежностей. Далі
наведено класичну теорему нечіткої апроксимації, на якій базується переважна
більшість тверджень про можливість апроксимації
функцій за допомогою нечітких експертних висновків.
Посібник
містить практичні завдання до кожної теми, контрольні питання і завдання для
самоперевірки, теми рефератів та розрахунково-графічних робіт, а також теми
для самостійного опрацювання. Він буде корисним для студентів, які навчаються
за напрямками “Комп’ютерні науки”, “Комп’ютерна інженерія”, “Прикладна
математика”, економістів, соціологів, інших спеціалістів в області аналізу інформації,
а також аспірантів та фахівців у напрямку штучного інтелекту, теорії та
практики прогнозування.
У
посібнику, крім відомих методів прогнозування, використано оригінальні
розробки автора з оптимізації нейромережних технологій, еволюційного
моделювання та їх прикладного застосування.
Автор
вдячний рецензентам: академіку НАН України О.Г. Івахненку, професорам Зайченку
Ю.П. та Куссуль Н.М. за вказані побажання та зауваження, переважна більшість
яких у даному виданні посібника враховано.
Висловлюю
подяку Говорухіну С. та Атамасю О. за допомогу у
підготовці електронного варіанту посібника.