Nəzarətli maşın öyrənməsi: Regressiya və Klassifikasiya
-
Maşın öyrənməsi (Machine Learning) süni intellektin ən vacib sahələrindən biridir və müxtəlif növ öyrənmə metodlarını əhatə edir. Nəzarətli maşın öyrənməsi (Supervised Learning) bu sahənin ən geniş yayılmış növüdür və real dünyada bir çox tətbiq sahəsinə malikdir. Bu yazıda nəzarətli öyrənmə, onun əsas növləri olan regressiya və klassifikasiya haqqında danışacağıq.
Nəzarətli maşın öyrənməsi nədir?
Nəzarətli maşın öyrənməsində model etiketlənmiş verilənlər üzərində öyrədilir. Yəni, hər giriş (Input) veriləninə uyğun bir çıxış (Output) dəyəri (etiket) mövcuddur. Modelin məqsədi bu verilənlərdən qaydaları öyrənərək gələcəkdə yeni verilənlər üçün düzgün proqnozlar verməkdir.
Məsələn, sizdə avtomobillərin ilinə və gündəlik istifadəsinə əsasən onların satış qiymətini göstərən verilənlər bazası varsa, nəzarətli maşın öyrənməsi modeli bu məlumatlardan istifadə edərək yeni avtomobillərin satış qiymətini proqnozlaşdıra bilər.
Nəzarətli öyrənmənin iki əsas növü
Nəzarətli öyrənmənin iki əsas növü var:
- Regressiya (Regression) – Kəmiyyət (rəqəmsal) dəyərləri proqnozlaşdırmaq üçün istifadə olunur.
- Klassifikasiya (Classification) – Məlumatları müəyyən kateqoriyalara ayırmaq üçün istifadə olunur.
Hər iki metod fərqli növ problemlərin həlli üçün istifadə olunur. İndi onların hər birini daha ətraflı araşdıraq.
Regressiya (Regression)
Regressiya modeli kəmiyyət (rəqəmsal) nəticələri proqnozlaşdırmaq üçün istifadə olunur. Başqa sözlə, bir və ya bir neçə dəyişənin təsiri ilə davamlı (continuous) bir dəyəri təxmin edirik.
Regressiyaya aid misallar:
- Ev qiymətlərinin proqnozlaşdırılması
- Hava temperaturunun proqnozlaşdırılması
- Müəssisənin gəlirinin təxmin edilməsi
- Avtomobilin yanacaq sərfiyyatının hesablanması
Regressiya modelləri arasında ən məşhurları:
- Xətti Regressiya (Linear Regression)
- Çoxlu Xətti Regressiya (Multiple Linear Regression)
- Lojistik Regressiya (Logistic Regression) - Klassifikasiya üçün də istifadə olunur
Xətti Regressiya (Linear Regression)
Xətti regressiya sadə və effektiv bir yanaşmadır. Burada model verilənlər arasındakı xətti münasibəti müəyyən edir. Məsələn, avtomobilin ili artdıqca onun qiymətinin azalması xətti bir münasibətdir.
Xətti regresiyanın ümumi tənliyi:
[y = mx + b]
Burada:
- ( y ) – proqnozlaşdırılan dəyərdir,
- ( m ) – dəyişənin təsir əmsalıdır,
- ( x ) – giriş dəyişənidir,
- ( b ) – sabit dəyərdir.
Məsələn, bir şirkət reklama xərclədiyi məbləğə əsasən satışlarını proqnozlaşdırmaq istəyirsə, xətti regresiya modelindən istifadə edə bilər.
Klassifikasiya (Classification)
Klassifikasiya modeli məlumatları fərqli kateqoriyalara ayırmaq üçün istifadə olunur. Yəni, nəticə diskret (categorical) dəyərdir.
Klassifikasiyaya aid misallar:
- Email-lərin “spam” və ya “normal” olaraq ayrılması
- Xəstənin müəyyən bir xəstəliyə malik olub-olmamasının təxmin edilməsi
- Şəkildə obyektin “pişik” və ya “it” olduğunu müəyyən etmək
- Müştərinin kredit ala bilib-bilməməsi haqqında qərar vermək
Lojistik Regressiya (Logistic Regression)
Adı regressiya olsa da, lojistik regressiya əslində klassifikasiya üçün istifadə olunur. Model, nəticəni 0 və 1 arasında ehtimalla proqnozlaşdırır və nəticəni müəyyən bir həddən (threshold) yuxarı və ya aşağı olaraq iki qrupa ayırır.
Lojistik funksiyanın tənliyi belədir:
[P(y) = \frac{1}{1 + e^{-z}}]
Burada:
- ( P(y) ) – bir hadisənin baş vermə ehtimalıdır,
- ( e ) – Eyler sabitidir (~2.718),
- ( z ) – giriş dəyişənlərinin xətti kombinasiyasıdır.
Əgər modelin proqnozlaşdırdığı ehtimal 0.5-dən böyükdürsə, model “1” (Məsələn, “spam”) nəticəsini verir, əks halda “0” (Məsələn, “normal email”) nəticəsi alınır.
Regressiya və Klassifikasiya Arasındakı Fərqlər
Xüsusiyyət Regressiya Klassifikasiya Nəticə tipi Rəqəmsal (continuous) Kateqorial (categorical) Misal Ev qiymətinin proqnozlaşdırılması Email-in spam olub-olmaması Əsas model Xətti Regressiya Lojistik Regressiya Məlumat tipi Dəyişənlər arasında rəqəmsal əlaqə var Məlumat siniflərə bölünür
Nəticə
Nəzarətli maşın öyrənməsi süni intellektin ən fundamental sahələrindən biridir və iki əsas istiqaməti vardır: regressiya və klassifikasiya.
- Regressiya rəqəmsal qiymətləri proqnozlaşdırmaq üçün istifadə olunur.
- Klassifikasiya isə verilənləri müxtəlif kateqoriyalara ayırmaq üçün tətbiq edilir.
Bu metodlar maliyyə, səhiyyə, marketinq, mühəndislik və bir çox sahədə istifadə olunur və süni intellektin inkişafında böyük rol oynayır.
Bilik paylaşdıqca artan bir sərvətdir