Розділ 1. Основні положення теорії штучних нейронних мереж Типи і формалізація задач, які розв'язуються нейронними мережами.

Типи і формалізація задач, які розв'язуються нейронними мережами.

Клас задач, які можна вирішити за допомогою нейронної мережі, визначається тим, як мережа працює і як вона навчається. Таким чином, мережі можна застосовувати в ситуації, коли є визначеною відома інформація, і ви намагаєтесь з неї одержати якусь поки що не відому інформацію. Ось деякі важливі приклади задач, у яких були успішно реалізовані нейромережеві методи.

Розпізнавання стану хворого.

Застосування класичних статистичних методів для рішення цієї задачі було описане ще в роботах Неймана. За допомогою медичної апаратури можна спостерігати за різними показниками стану здоров'я людини (наприклад, частотою пульсу, змістом різних речовин у крові, частотою подиху). Стадії виникнення деякої хвороби може відповідати визначена і досить складна (наприклад, нелінійна і взаємозалежна) комбінація змінювання змінних, що спостерігаються, котра може бути виявлена за допомогою нейромережевої моделі.

Прогнозування на фондовому ринку.

Коливання цін на акції і фондових індексах - ще один приклад складного, багатовимірного, але, у визначених ситуаціях, частково прогнозованого явища. Велика кількість фінансових аналітиків використовують нейронні мережі для прогнозування цін акцій на основі численних факторів, наприклад, минулого поводження цін цих і інших акцій у сукупності з різними іншими економічними показниками. Як альтернативні варіанти, застосовуються моделі авторегресії і технічний аналіз.

Надання кредиту.

Як правило, у банку мається великий набір зведень про людину, що звернулася з проханням про надання кредиту. Це можуть бути його вік, освіта, рід занять і багато інших даних. Навчивши нейронну мережу на вже відомих даних, аналітик може визначити найбільш істотні характеристики, і на їхній основі віднести даного клієнта до категорії з високим або низьким кредитним ризиком. Помітимо, що для рішення подібних задач можна паралельно використовувати і класичні статистичні методи, такі як дискримінантний аналіз і дерева класифікації.

Системи спостереження за станом устаткування.

Нейронні мережі виявилися корисними як засіб контролю стану механізмів. Нейронна мережа може бути навчена так, щоб відрізняти звук, що видає машина при нормальній роботі («помилкова тривога») від того, котрий є провісником неполадок. Після такого навчання нейронна мережа може попереджати інженерів про погрозу поломки до того, як вона відбудеться, і тим самим виключати несподівані і дорогі простої.

Керування роботою двигуна.

     Нейронні мережі використовуються для аналізу сигналів від датчиків, встановлених на двигунах. За допомогою нейронної мережі можна керувати різними параметрами роботи двигуна, щоб досягти визначеної мети, наприклад, зменшити споживання пального.
     Зрозуміло, зовсім не будь-яку задачу можна вирішити за допомогою нейронної мережі. Якщо ви бажаєте визначити результати лотереї, тираж якої відбудеться через тиждень, знаючи свій розмір взуття, то навряд чи це вийде, оскільки ці показники ніяк не пов'язані один з одним. Насправді, якщо тираж проводиться чесно, то не існує такої інформації, на підставі якої можна було б пророчити результат. Багато фінансових структур уже використовують нейронні мережі або експериментують з ними з метою прогнозування ситуації на фондовому ринку, і схоже, що будь-який тренд, прогнозований за допомогою нейронних методів, усякий раз уже буває «дисконтований» ринком, і тому (на жаль) цю задачу нам теж навряд чи вдасться вирішити.
     Отже, ми приходимо до другої важливої умови застосування нейронних мереж: ви повинні знати (або хоча б мати серйозні підозри), що між відомими вхідними значеннями і невідомими виходами мається зв'язок. Цей зв'язок може бути перекручений шумом, але він повинен існувати (так, навряд чи очікується, що за даними з приклада з прогнозуванням цін акцій можна побудувати абсолютно точний прогноз, оскільки на ціну впливають і інші фактори, не представлені у вхідному наборі даних, і, крім того, у задачі присутній елемент випадковості).
     Як правило, нейронна мережа використовується тоді, коли невідомий точний вид зв'язків між входами і виходами, - якби він був відомий, то зв'язок можна було б моделювати безпосередньо. Інша істотна особливість нейронних мереж полягає в тому, що залежність між входом і виходом знаходиться в процесі навчання мережі. Для навчання нейронних мереж застосовуються алгоритми двох типів (різні типи мереж використовують різні типи навчання): кероване («навчання з учителем») і некероване («без учителя»). Найчастіше застосовується навчання з учителем, і саме цей метод ми зараз розглянемо (про некероване навчання буде розглянуто пізніше).
     Для керованого навчання мережі користувач повинний підготувати набір навчальних даних. Ці дані являють собою приклади вхідних даних і відповідних їм виходів. Мережа навчається встановлювати зв'язок між першими і другими. Звичайно навчальні дані беруться з історичних зведень. У розглянутих вище прикладах це можуть бути попередні значення цін акцій і індексу FTSE, зведення про минулих позичальників - їхні анкетні дані і те, чи успішно вони виконали свої зобов'язання, приклади положень робота і його правильної реакції. Потім нейронна мережа навчається за допомогою того чи іншого алгоритму керованого навчання (найбільш відомим з них є метод зворотного поширення, запропонований у роботі Rumelhart, 1986), при якому наявні дані використовуються для коректування ваг і їхніх граничних значень мережі таким чином, щоб мінімізувати помилку прогнозу на навчальній безлічі. Якщо мережа навчена добре, вона здобуває здатність моделювати (невідому) функцію, що зв'язує значення вхідних і вихідних змінних, і згодом таку інформацію можна використовувати для прогнозування в ситуації, коли вихідні значення невідомі.

© 2010 ХНУРЕ, ПЗЕОМ, Шатовська Т. Б., shatovska@gmail.com;ХНУРЕ, ПЗЕОМ, Рєпка В. Б., victoria_repka@kture.kharkov.ua
Розроблено за допомогою LERSUS