Від статистики − до аналізу,   

                                                                                                                                                                                                                                                  від аналізу − до прогнозування,    

                                                                                                                                                                                                                                                 від прогнозування − до планування.

Народна мудрість.

 

Передмова

Процеси створення, функціонування та розвитку склад­них природних і штучних систем супроводжуються неви­значеністю, яка є наслідком розмитості цілей, неповноти вихідної інформації, суб’єктивності уявлень про майбутні процеси та критерії їх оцінки. Зменшення невизначеності досягається шляхом передбачення та прогнозування і, як наслідок, об’єктивізацією суб’єктивних рішень. У відомій монографії Фогеля Л., Оуенса А., Уолша М. “Штучний інте­лект та еволюційне моделювання” вказано на те, що розу­мну поведінку можна розглядати як поєднання можливості передбачувати стани зовнішнього середовища з перетво­ренням кожного передбачення в адекватну реакцію у відпо­відності до заданої цілі. Такий висновок визначає роль про­гнозування як необхідної умови цілеспрямованої діяльності людини при розв’язанні задач аналізу та синтезу, а також вибору оптимальних альтернатив.

Концепції та парадигми, елементи яких представлено у посібнику, базуються на певних логіко-філософських кате­горіях, зокрема на дедукції та індукції. Поняття дедукції зу­стрічаємо ще у Аристотеля і у широкому сенсі воно означає сукупність процесів наукового мислення, що включають в себе поділ та визначення понять, доведення положень. Тер­мін індукція вперше зустрічається у Сократа, де вона інтер­претується як знаходження загального визначення шляхом порівняння частинних випадків та виключення хибних ви­значень. Аристотель розрізняв повну та неповну індукцію. Родоначальником сучасного поняття індукції вважають     Ф. Бекона, який вказував на те, що  при узагальненні необ­хідно дотримуватись такого правила: зробити три огляди всіх відомих випадків прояву відомої властивості у різних предметів − огляд позитивних та негативних випадків; огляд випадків, у яких властивість проявляється різною мі­рою, і лише тоді робити узагальнення. Подальший розвиток поняття індукції дістало у роботах Дж.Ст. Мілля.

Дедукція та індукція інцидентні поняттям аналізу та си­нтезу. Подібність дедукції та аналізу є очевидною, оскільки аналіз − прийом мислення, через який відбувається розклад на складові частини того, що є цілим. У склад процесу деду­кції входять такі елементи: положення, з якого робиться ви­сновок; власне процес виведення із вказаного положення; висновок чи положення, одержане із вихідного положення. Положення, з яких роблять висновки, зводяться до двох ти­пів: очевидні істини та узагальнення, одержані шляхом до­слідів.

Елементи обох розглянутих категорій присутні у мето­дах обробки інформації та прогнозування, які розглянуто у посібнику. Зокрема, більшість наведених задач розв’язується за допомогою дедуктивних схем, пріоритетним в яких є ви­вчення сутності відношень причина-наслідок. Репрезен­тують такий підхід методи попередньої обробки даних, іде­нтифікація залежності результуючої характеристики від вхідних факторів, якщо є заданими її структура та апріорна інформація. Індуктивний підхід реалізовано у методі групо­вого врахування аргументів та методі Брандона побудови рівняння нелінійної множинної регресії. Застосування інду­ктивної та дедуктивної парадигм наштовхується на певні проблеми, основні з яких визначені нижче. Зокрема, дедук­тивний підхід часто “корелює” з “прокляттям багатомірно­сті”.  

У навчальному посібнику розглянуто теоретичні та при­кладні аспекти технологій прогнозування, в основі яких лежать класичні та сучасні парадигми. Зауважимо, що вивчення за­дач прогнозування, моделей, методів і засобів їх розв’язання складають частину навчального курсу “Інформаційні інте­лектуальні системи”. Зокрема, це моделі, методи і алгори­тми, що базуються на використанні статистичного аналізу і методу найменших квадратів, нейромережні технології, ме­тоди теорії нечітких множин, еволюційне та гібридне моде­лювання.           

У першому розділі представлено метод найменших квадратів, який широко використовується у переважній більшості методів прогнозування. Викладено проблеми, що супроводжують його застосування при побудові рівнянь парної та множинної лінійної регресії, алгоритми тестування таких явищ як мультиколінеарність, гетероскедастичність та автокореляція. Для побудови множинної нелінійної регресії розглянуто аспекти застосування методу Брандона.

Основні нейромережні парадигми представлено у наступному розділі. Головна їх особливість − мінімальні вимоги до складу та структури вихідної інформації. Розглянуто квінтесенцію нейромережних технологій − метод зворотного поширення помилки, а також мережі зустрічного поширення та мережі із радіально-базисними функціями активації.

Третій розділ містить опис технологій, які базуються на ідеях та принципах функціонування природних систем − природного відбору, селекції та самоорганізації. Зокрема, це метод групового врахування аргументів, за допомогою якого одержують як завгодно складні залежності при мінімальному апріорному інформаційному забезпеченні. Іншу групу складають еволюційні моделі та методи. Визначено аспекти застосування генетичного алгоритму при розв’язанні задач оптимізації складних залежностей.

Третьою складовою − представником концепції м’яких обчислень за визначенням професора Л. Заде є числення суб’єктивних суджень за допомогою методів теорії нечітких множин. У четвертому розділі представлено основні поняття, алгоритми нечіткого логічного виведення та аналізу нечітких експертних висновків.

У п’ятому розділі наведено методи та алгоритми препроцесінгу даних, використання яких дозволить підвищити точність та швидкість прогнозування. Складовими попередньої обробки даних є стандартизація та нормалізація значень факторів, визначення найбільш інформативних та значущих факторів. На зменшення інформаційної ентропії спрямовані методи головних компонент, “вибілювання” входів та розрахунку крос-ентропії.   

Ефективність ідентифікації невідомих залежностей залежить від розв’язання задачі кластеризації. У шостому розділі представлено такі групи методів кластеризації: класичні, що базуються на методі парних порівнянь; методи, що базуються на гіпотезі компактності; еволюційні методи.

Ще однією із задач прогнозування є відновлення пропущених значень. Її особливістю є інтерполяційний характер, оскільки, найчастіше, пропущені значення знаходяться всередині області дослідження. У сьомому розділі наведено емпіричні та локальні методи відновлення пропусків; ймовірнісно-статистичні методи та методи, в основі яких лежить побудова рівнянь лінійної регресії, зокрема, метод Бартлетта та resampling-методи; методи, розроблені Новосибірською школою аналізу даних під керівництвом професора М.Г. Загоруйка, а також еволюційний метод.

У восьмому розділі викладено основи розробки та застосування гібридних моделей і методів. Композиція нейромережних парадигм, методів еволюційного моделювання та нечіткого виведення визначає формування нових напрямків дослідження, що дозволить збільшити точність прогнозування, підвищити інтерпретованість його результатів, оптимізувати процеси прийняття рішень. 

Дев'ятий розділ містить адаптовані авторські переклади статей авторів відомих сучасних методів Soft Computing. Зокрема представлені мурашині алгоритми як метаевристики, які  призначені для розв'язання задач дискретної оптимізації. Іншу технологію репрезентує програмування генетичних виразів, що є подальшим розвитком і певною комбінацією генетичних алгоритмів та генетичного програмування. Зазначені його переваги при розв'язанні задач класифікації та апроксимації невідомих залежностей. Далі наведено класичну теорему нечіткої апроксимації, на якій базується переважна більшість тверджень про можливість апроксимації  функцій за допомогою нечітких експертних висновків.    

Посібник містить практичні завдання до кожної теми, контрольні пи­тання і завдання для самоперевірки, теми рефератів та розрахунково-графіч­них робіт, а також теми для самостійного опрацювання. Він буде корисним для студентів, які навчаються за напрямками “Комп’ютерні науки”, “Комп’ю­­терна інженерія”, “Прикладна математика”, економістів, соціологів, інших спеціалістів в області аналізу інформації, а також аспірантів та фахів­ців у напрямку штучного інтелекту, теорії та практики прогнозування.

У посібнику, крім відомих методів прогнозування, вико­ристано оригінальні розробки автора з оптимізації нейромережних технологій, еволюційного моделювання та їх прикладного застосування.

Автор вдячний рецензентам: академіку НАН України О.Г. Івахненку, професорам Зайченку Ю.П. та Куссуль Н.М. за вказані побажання та зауваження, переважна більшість яких у даному виданні посібника враховано.

Висловлюю подяку Говорухіну С. та Атамасю О. за допомогу у підготовці електронного варіанту посібника.