Uploaded by urol ostonoqulov

suniy 01

advertisement
MIRZO ULUG’BEK NOMIDAGI
O’ZBEKISTON MILLIY UNIVERSITETI
JIZZAX FILIALI
SIRTQI BO`LIMI “AXBOROT TIZIMLARI VA TEXNOLOGIYALARI”
YO’NALISHI 4-BOSQICH 911-20 GURUH TALABASI
OSTONOQULOV O`ROLNING
Sun'iy intellekt va neyronto'rli texnologiyalar FANIDAN
MUSTAQIL ISHI
Mavzu: Yarim nazorat ostida o'rganish.
2023-yil
MAVZU: Yarim nazorat ostida o'rganish
REJA:
1. Mashinali o`qitish nima?
2. Semi-supervised learning algoritmlari ishlash tamoyili
3. Unsupervised learning va uning algoritimlari
1.
Mashinali o’qitish nima?
Mashinali o’qitish (Machine Learning) – bu kompyuterni dasturlashning yangi
yo’nalishi bo’lib, dasturning ma’lumotlarni o’qib olish va shu ma’lumotlar asosida
o’rganish xususiyatiga ega bo’lishidir. Mashinani o’qitish jarayoni chiziqli yoki
nochiziqli qaramasdan quyidagi bosqichlarda amalga oshiriladi:
◦ Muammoni aniqlash.
◦ Ma’lumotlarni tayyorlash.
◦ Algoritmni ishlab chiqish va baholash (testlash).
◦ Natijaviy ma’lumotlar aniqligini oshirish.bo’lishiga
◦ Yakuniy natijani (ishlab chiqilgan model) taqdim qilish.
Mashinani o'rganishning 3 turi
Mashinani o'rganish mashinaga katta hajmdagi ma'lumotlarni ko'rsatishni o'z ichiga
oladi, shunda u o'rganishi va bashorat qilishi, naqshlarni topishi yoki ma'lumotlarni
tasniflashi mumkin. Mashinani o'rganishning uchta turi nazoratsiz, nazoratsiz va
mustahkamlovchi o'rganishdir.
2.
Mashinali o’qitishda Vizualizatsiyaning o’rni va grafik turlari.
Biz modellar qurishda va ularni taxlil qilishda ma'lumotlarni grafik ko'rinishida taqdim qila bilish
muhim ko'nikmalardan biri hisoblanadi. Ayniqsa, oddiy odamlar (buyurtmachi, rahbar, hamkasblar)
uchun sonlar va jadvallardan ko'ra grafiklarni tushunish osonroq kechadi.
Muhandis sifatida, ba'zida o'zimiz uchun ham grafiklardan qo'shimcha ma'lumotlar olishimiz
mumkin. Grafiklar nafaqat ma'lumotlarga ishlov berish balki yakuniy natijalarni taqdim qilishda ham
faol ishlatiladi. Pythonda grafiklar bilan ishlash uchun eng mashhur kutubxonalar bu matplotlib va u
asosida qurilgan seaborn kutubxonalaridir.
matplotlib kutubxonasi:
CHIZIQLI GRAFIKLAR(LINE PLOTS)
Biz chiziqli grafiklar yordamida Tendensiyalarni kuzatamiz yani vaqt o'tishi bilan bizdagi malumotlar
qanday o'zgarishini ko'rib borish mumkun.
USTUNLI GRAFIKLAR(BAR GRAPHS)
Ustunli grafiklar yordamida biz alohida ustunlarni va o'zgaruvchilarni solishtirishimiz mumkun.
TARQOQLIK GRAFIGI (SCATTER PLOT)
Scatter plot yordamida ma'lumotlar qanchalik tarqoq ekanin kuzatishimiz mumkin. Bu grafik ham bir
nechta ustunlar orasidagi
bog'liqlikni (korrelyasiyani) ko'rishga xizmat qiladi.
TAQSIMOT GRAFIGI (DISTRIBUTION)
Taqsimot grafik - o'zgaruvchi (ustun)da qanday qiymatlar mavjudligi va ularning ehtimolligini
ko'rsatuvchi grafik.
3.
Unsupervised learning va uning algoritimlari?
O’qituvchisiz o’qitish (unsupervised learning) – bu mashinani o’qitish usulidan biri bo’lib, bunda
modelni oldindan aniq bo’lgan ma’lumotlar bilan o’qitish amalga oshirilmaydi, aksincha obyekt
parametrlarini (ma'lumotlarni) topish uchun modelga o'z ustida ishlashga imkon yaratib beriladi.
Supervised learning usuliga qaraganda murakkab usul hisoblanadi va bashoratlash jarayoni avtomatik
lekin noaniqroq bo’lishi mumkin. Unsupervised learning usulida asosan “klasterlash” masalasi
yechiladi.
Unsupervised learning turlari
Clustering
◦ Hierarchical clustering
◦ K-means clustering
◦ K-NN (k nearest neighbors)
◦ Principal Component Analysis
◦ Singular Value Decomposition
◦ Independent Component Analysis
4.
SLR va MLR modellarining baxolash mezonlari?
SLR (Oddiy chiziqli regressiya) - bu to'g'ri chiziq yordamida bitta mustaqil o'zgaruvchi va bitta qaram
o'zgaruvchi o'rtasidagi munosabatni baholaydigan regressiya modeli. Ikkala o'zgaruvchi ham
miqdoriy bo'lishi kerak.
Masalan, harorat va simobning termometrdagi kengayishi o'rtasidagi bog'liqlikni to'g'ri chiziq
yordamida modellashtirish mumkin: harorat oshishi bilan simob kengayadi.
MLR (Ko'p chiziqli regressiya) nima?
Ko'p chiziqli regressiya - bu to'g'ri chiziq yordamida miqdoriy bog'liq o'zgaruvchi va ikki yoki undan
ortiq mustaqil o'zgaruvchilar o'rtasidagi munosabatni baholaydigan regressiya modeli.
Axborot mezonlari turli regressiya modellariga ballarni belgilash uchun ishlatiladi.
Darajasi:
model mosligini pasaytirish (model ma'lumotlarga qanchalik yaxshi mos tushsa, ball shunchalik past
bo'ladi);
modelning murakkabligini oshirish (qanchalik ko'p regressorlar va parametrlar bo'lsa, ball shunchalik
yuqori bo'ladi).
Eng yaxshi model eng past ballga ega bo'lgan modeldir.
SLR va MLR modellari uchun baxolash vositasi ko'p mavjud. Ular ko'pincha Python dasturlash tili
va kutubxonalari yordamida yaratiladi. Ba'zi baxolash modellari esa Excel kabi dasturlardan
foydalanishni amalga oshiradi. Baxolash natijalari yig'iladigan ma'lumotlar odatda statistika va
matematik asosidagi kutubxonalarda ajratiladi.
5.
Supervised learning va uning algoritmlari?
Supervised learning
O’qituvchili o’qitish (Supervised learning) – bu modelni xususiyatlari aniq bo’lgan ma’lumotlar bilan
o’qitish. Bunday turdagi o’qitish usullariga Regressiya va Sinflashtirish masalalarini misol keltirish
mumkin. Bunda xususiyatlari aniq deganda kiruvchi va chiquvchi parametrlar mavjud
bo’lishi nazarda tutiladi.
Modelni o’qitishda foydalaniladigan ma’lumotlar odatda ikkita qismga ajratiladi va ular 80:20
nisbatda olinadi. Ya’ni ma’lumotlarning 80% o’qitiluvchi ma’lumot va qolgan 20% esa modelni
testlovchi ma’lumot bo’lib xizmat qiladi. O’qitish jarayonida model kiruvchi va chiquvchi
ma’lumotlarning 80% dan foydalanadi va modelni o’qitish faqat ushbu ma’lumot orqali amalga
oshiriladi.
Support-vector machines (Yordamchi vektorli mashinalar)
Linear regression (Chiziqli regressiya)
Logistic regression (Logistik regressiya)
Naive Bayes
Linear discriminant analysis (Chiziqli diskriminant tahlili)
Decision trees (Qaror daraxtlari)
K-nearest neighbor algorithm (K-eng yaqin qo'shni algoritmi)
Neyron tarmoqlar
Similarity learning (O'xshashlikni o'rganish)
6.
Modelni sinash va natijalarni tasdiqlash va uning usullari.
Mashinali o'qitishda modelni sinash va natijalarni tasdiqlashning turli usullari mavjud. Bu usullar
quyidagilardan iborat bo'lishi mumkin:
1. Keltirilgan ma'lumotlarni ushbu model bilan amalga oshirish: Bu, modelni sinashning eng oddiy
va amaliy usuli. Bu, modelga keltirilgan test ma'lumotlar orqali modelelarning ishini tekshirishdir.
Bu usul avvalgi ma'lumotlarni sinash orqali yangi ma'lumotlarni boshqarishni qulaylashtirishga ta'sir
etadi.
2. K-perkritiya metodi: Bu usulda ma'lumotlar bir nechta sinfda ajratiladi va model uning o'ziga xos
va kundalik yechimlarini topadi. Bu usulda, optimal sinf sonini aniqlash uchun bir nechta sinflar
alohida o'qitilganligi uchun qo'llaniladi.
3. Cross-validation usuli: Bu usulda keltirilgan ma'lumotlar qisqa sinflarga ajratiladi va har bir
sinfdagi yechimlar soddalashtiriladi. Keza, sinflarning natijalari statistik xarakteristika bilan
ta'minlangan holda yechish uchun qo'llaniladi.
4. Hold-out metod: Bu metoddagi datalar biron-biriga ixtiyoriy aj
7.
Regressya modellari Simple Linear Regression. Va uning ishlashi.
Regressiya bu – ma’lumotlarni intellektual tahlil qilish usullaridan
biri bo’lib, obyekt yoki jarayonga tegishli o'zgaruvchilar o'rtasidagi
o'zaro bog'liqlikni baholash uchun statistik jarayonlar to'plami
hisoblanadi.
Regressiya va uning turlari. Regressiya asosida yaratiladigan model ma'lumotlarni berilgan
nuqtalardan o'tgan eng yaxshi giper tekislikka (nuqtalar o’rtasidan o’tishiga) moslashtirishga harakat
qiladi. Regression tahlilda turli xil modellardan foydalanish mumkin, eng sodda model chiziqli
regressiya asosida quriladi.
Oddiy chiziqli regressiya ikki miqdoriy o'zgaruvchi o'rtasidagi munosabatni baholash uchun
ishlatiladi . Siz bilishni xohlaganingizda oddiy chiziqli regressiyadan foydalanishingiz mumkin:
1.
Ikki oʻzgaruvchi oʻrtasidagi bogʻliqlik qanchalik kuchli (masalan, yogʻingarchilik va tuproq
eroziyasi oʻrtasidagi bogʻliqlik).
2.
Mustaqil o'zgaruvchining ma'lum bir qiymatidagi bog'liq o'zgaruvchining qiymati (masalan,
yog'ingarchilikning ma'lum darajasidagi tuproq eroziyasining miqdori).
Regressiya modellari kuzatilgan ma'lumotlarga chiziq qo'yish orqali o'zgaruvchilar o'rtasidagi
munosabatni tavsiflaydi. Chiziqli regressiya modellari to'g'ri chiziqdan, logistik va chiziqli
bo'lmagan regressiya modellarida esa egri chiziqdan foydalaniladi. Regressiya mustaqil
o'zgaruvchi(lar)ning o'zgarishi bilan bog'liq o'zgaruvchining qanday o'zgarishini taxmin qilish
imkonini beradi.
8.
Semi-supervised learning algoritmlari ishlash tamoyili?
Yarim nazorat ostida o'qitish nima?
Yarim nazorat ostida o'qitish - bu yorliqli va yorliqsiz ma'lumotlardan foydalanadigan
mashinani o'rganish usullarining keng toifasi; shu tarzda, nomidan ko'rinib turibdiki, bu
nazorat ostida va nazoratsiz o'rganish o'rtasidagi gibrid texnikadir.
Umuman olganda, yarim nazoratning asosiy g'oyasi ma'lumotlar nuqtasiga uning yorlig'i
bor yoki yo'qligiga qarab boshqacha munosabatda bo'lishdir: etiketli nuqtalar uchun
algoritm model og'irliklarini yangilash uchun an'anaviy nazoratdan foydalanadi; va
etiketlanmagan nuqtalar uchun algoritm boshqa shunga o'xshash ta'lim misollari orasidagi
bashoratlardagi farqni minimallashtiradi.
Nazorat ostidagi treninglar bashorat va teglar oʻrtasidagi oʻrtacha farqni minimallashtirish
uchun model ogʻirliklarini yangilaydi. Biroq, cheklangan yorliqli ma'lumotlar bilan, bu
belgilangan nuqtalar uchun amal qiladigan qaror chegarasini topishi mumkin, ammo
butun taqsimot uchun umumlashtirilmaydi (quyidagi
Boshqa tomondan, nazoratsiz o'rganish, ba'zi bir xususiyat-makondagi o'xshashliklarga
asoslanib, nuqtalarni birlashtirishga harakat qiladi. Ammo, ta'limga yo'naltirish uchun
teglarsiz, nazoratsiz algoritm sub-optimal klasterlarni topishi mumkin. Masalan, 2b-rasmda
topilgan klasterlar haqiqiy sinf taqsimotiga noto'g'ri mos keladi.
Belgilanmagan ma'lumotlar nuqtalari kontekstni ta'minlaydi; modelimizni iloji boricha
ko'proq ma'lumotlarga ochib berish orqali biz butun taqsimotning shaklini aniq
baholashimiz mumkin.
Ikkala qism - etiketli va yorliqsiz ma'lumotlar bilan biz aniqroq va bardoshli modellarni
o'rgatishimiz mumkin. Bizning oylar ma'lumotlar to'plamida yarim nazorat ostidagi
mashg'ulotlar
Yarim nazorat ostida o'qitishning afzalliklari va cheklovlari
Belgilanmagan ma'lumotlardan foydalanadigan texnikalar ma'lumotlarni to'plash bilan
bog'liq haqiqiy muammolardan kelib chiqadi.
Har yili kompaniyalar va amaliyotchilar mashinani o'rganish uchun ma'lumotlar to'plamini
etiketlash uchun juda ko'p vaqt va pul sarflashadi. Shu bilan birga, etiketlanmagan
ma'lumotlar bo'sh qoladi; va odatda arzon va yig'ish oson bo'lsa-da, natijalarni teglarsiz
etkazib berish qiyin. Kuchli natijalarga erishishda maʼlumotlarni qoʻlda yorliqlashdan
qochishning iloji boʻlsa, mashinani oʻrganish amaliyotchilari qimmatbaho, aks holda
behuda sarflangan resurslarni tejashlari mumkin.
Ikkita bir xil ma'lumotlar to'plamini hisobga olgan holda, to'liq etiketlangan ma'lumotlar
to'plamiga ega bo'lgan nazorat ostidagi o'quv vazifasi, albatta, yorliqsiz nuqtalarning bir
qismi bo'lgan to'plamga qaraganda yaxshiroq modelni o'rgatadi. Biroq, yorliqlar
cheklangan va yorliqsiz ma'lumotlar ko'p bo'lsa, yarim nazorat ostida o'rganish
kuchli. Bunday holda, bizning modelimiz minglab qo'shimcha tasvirlarga vaqt va pul
sarflamasdan, joylashtirishda duch kelishi mumkin bo'lgan holatlarga ta'sir qiladi.
Ma'lumotlar to'plamiga oson kirish imkoniga ega bo'lganingizda, yorliqsiz va etiketli
ma'lumotlar to'plamini aralashtirish, albatta, modelning ishlashini oshiradi.chiqing
Yarim nazorat ostida o'qitish: asosiy yo'nalishlar
Mana jist.
Umumiy yarim nazoratli algoritmda etiketli va yorliqsiz maʼlumotlar toʻplami berilgan
holda misollar ikki xil usuldan biri bilan ishlanadi:
1.
Belgilangan ma'lumotlar nuqtalari an'anaviy nazorat ostidagi ta'limdagi kabi
ishlanadi; bashorat qilinadi, yo'qotish hisoblab chiqiladi va tarmoq og'irliklari gradient
tushishi bo'yicha yangilanadi.
2.
Belgilanmagan ma'lumotlar nuqtalari modelga yanada izchil va ishonchli bashorat
qilishda yordam berish uchun ishlatiladi. Qo'shimcha nazoratsiz yo'qotish atamasi yoki
psevdo-yorliqlar bo'lishidan qat'i nazar, etiketlanmagan misollar etiketlangan misollarning
rivojlanishiga asoslanish uchun ishlatiladi.
Eng yaxshi natijalarga ega bo'lgan ba'zi maqolalar va ilovalar bitta algoritmda ko'plab
usullardan foydalangan holda yaxlit yondashuvlarni oldi.
9.
Ma’lumotlarni o’rganish Korrelyatsya?
Korrelyatsiya
Korrelyatsiya ikki o'zgaruvchi o'rtasidagi munosabatni o'lchaydi.
Biz funktsiya kirish (x) ni chiqish (f(x)) ga aylantirish orqali qiymatni bashorat qilish
maqsadiga ega ekanligini aytib o'tdik. Aytishimiz mumkinki, funktsiya ikki
o'zgaruvchi o'rtasidagi munosabatni bashorat qilish uchun ishlatadi.
Korrelyatsiya koeffitsienti
Korrelyatsiya koeffitsienti ikki o'zgaruvchi o'rtasidagi munosabatni o'lchaydi.
Korrelyatsiya koeffitsienti hech qachon -1 dan kam yoki 1 dan yuqori bo'lishi mumkin
emas.

1 = o'zgaruvchilar o'rtasida mukammal chiziqli munosabatlar mavjud (masalan,
Kaloriya_burnagega qarshi o'rtacha_puls)

0 = o'zgaruvchilar o'rtasida chiziqli bog'liqlik yo'q

-1 = o'zgaruvchilar o'rtasida mukammal salbiy chiziqli bog'liqlik mavjud
(masalan, kamroq ishlagan soatlar, mashg'ulot paytida kaloriyalarning ko'payishiga
olib keladi)
Mukammal chiziqli munosabatlarga misol (korrelyatsiya koeffitsienti = 1)
Average_Pulse va Calorie_burnage o'rtasidagi munosabatni tasavvur qilish uchun biz
scatterplotdan foydalanamiz (biz 10 ta kuzatuv bilan sport soatlarining kichik
ma'lumotlar to'plamidan foydalandik).
Bu safar biz tarqalish chizmalarini xohlaymiz, shuning uchun biz "tarqalish" ga
o'zgartiramiz:
Misol
import matplotlib.pyplot as plt
health_data.plot(x ='Average_Pulse', y='Calorie_Burnage', kind='scatter')
plt.show()
10. Reinforcement learning algoritmlari va ishlash tamoyili
Mustahkamlashni o'rganish nima?
Kuchaytiruvchi oʻrganish (RL) mashinani oʻrganishning kichik sohasini nazarda
tutadi, bu AIga asoslangan tizimlarga individual faoliyat uchun yaratilgan fikrmulohazalarga asoslangan jamoaviy mukofotlarni maksimal darajada oshirish
uchun sinov va xato orqali dinamik muhitda harakatlarni amalga oshirishga
imkon beradi. RL kontekstida fikr-mulohaza mukofotlar yoki jazolar orqali aks
ettirilgan ijobiy yoki salbiy tushunchaga ishora qiladi.
RL inson idrokiga taqlid qiluvchi tabiiy intellektga taqlid qilish orqali AI tomonidan
boshqariladigan tizimlarni optimallashtiradi. Bunday o'rganish yondashuvi kompyuter
agentlariga inson ishtirokisiz yoki AI tizimlarini aniq dasturlash zaruratisiz
mo'ljallangan vazifalarda hayratlanarli natijalarga erishadigan muhim qarorlar qabul
qilishga yordam beradi.
An'anaviy ML usullariga nozik dinamik element qo'shgan ba'zi ma'lum RL usullari
orasida Monte Karlo, davlat-harakat-mukofot-davlat-harakat (SARSA) va Q-o'rganish
kiradi . Kuchli o'rganish algoritmlari bo'yicha o'qitilgan AI modellari bir nechta video
o'yinlar va stol o'yinlarida, jumladan shaxmat va Go o'yinlarida hamkasblarini mag'lub
etdi.
Texnik jihatdan, RL ilovalarini uch turga bo'lish mumkin:

Siyosatga asoslangan : Ushbu RL yondashuvi deterministik siyosatlar,
strategiyalar va usullardan foydalangan holda tizim mukofotini maksimal darajada
oshirishga qaratilgan.

Qiymatga asoslangan : Qiymatga asoslangan RL ilovasi o'rganishda ishtirok
etadigan ixtiyoriy qiymat funktsiyasini optimallashtirishni maqsad qiladi.

Modelga asoslangan : Modelga asoslangan yondashuv ma'lum bir muhit uchun
virtual sozlamalarni yaratishga imkon beradi. Bundan tashqari, ishtirokchi tizim
agentlari o'z vazifalarini ushbu virtual spetsifikatsiyalar doirasida bajaradilar.
11.
Simple Linear Regression modelining vazifasi va uning ishlashi
Oddiy linearniy regressiya modelini ishlab chiqish vazifasi ma'lum ma'lumotlarning to'plamidan
ijobiy va manfiy o'zgaruvchilarning bir-biriga bo'lgan munosabatini aniqlashdir.
Bu vazifani bajargan paytda ko'rsatiladigan ma'lumotlar tahlil qilinadi, va ularning ma'lum qiymatlari
yuqori va pasti bo'lmaganlari, uzluksizligi o'rtasida bir ko'rsatkichning o'zgarishi bilan bog'liq
emasligi kerak.
Regressiya modeli, ma'lumotlarning kiritilishidan keyin murojaat etiladigan nihoyatda mos keladigan
o'zgaruvchilarning post faktum qiymatlarini hosil qilishga yordam beradi. Model kiritilgan
ma'lumotlarning to'plamidan kelib chiqgan statistik analiz natijasiga asoslanadi va yozilgan shartli
funksiya orqali aniqlangan optimal ko'rsatkichlar yordamida kiritilishi mumkin.
12.
Klassifikatsiya algoritimlari va ularning tarfi.?
Mashina o'rganishda tasniflash algoritmlari
Mashinani o'rganishda tasniflash algoritmlarining har xil turlari quyidagilarni o'z ichiga
oladi:
1.
Logistik regressiya
2.
Naive Bayes klassifikatori
3.
Vektorli mashinalarni qo'llab-quvvatlash (SVM)
4.
Qaror daraxtlari
5.
Ko'tarilgan daraxtlar
6.
Tasodifiy o'rmon
7.
Neyron tarmoqlari
8.
Eng yaqin qo'shni
Ba'zi tasniflash algoritmlarining afzalliklarini tushunish

Logistik regressiya:
Logistik regressiya bilan siz modelingizni qanday qilib tartibga solishning turli usullarini topishingiz
mumkin, bu xususiyatlar o'zaro bog'liq yoki yo'qligi haqida tashvishlanmasdan - bu Naive Bayes
bilan bog'liq muammo bo'lishi mumkin.
Bundan tashqari, u yaxshi ehtimollik talqiniga ega va SVM yoki qaror daraxtlari bilan duch
kelmasligingiz mumkin bo'lgan yangi ma'lumotlar to'plamini olish uchun modelingizni osongina
yangilash imkonini beradi.
Logitsic regressiya, agar sizga ehtimollik doirasi kerak bo'lsa, ideal tarzda qo'llaniladi - masalan,
ishonch oraliqlarini olishingiz, tasniflash chegaralarini sozlashingiz yoki ishonchingiz komil
bo'lmaganda aytishingiz kerak bo'lsa. Bundan tashqari, kelajakda ko'proq o'quv ma'lumotlarini
olishni kutayotgan va ularni osongina va tezda modelingizga qo'shishni xohlagan holatlarda ham
foydalidir.

Naive Bayes:
Naive Bayes klassifikatorini qurish va ishlatish juda oson, chunki u odatda hech qanday talablarga
ega emas. Bu, ayniqsa, katta ma'lumotlar to'plamlari va o'zgaruvchilarning bir nechta toifalari bilan
foydalidir.. Oddiylikdan tashqari, NB hatto juda murakkab tasniflash usullaridan ham ustun turishga
qodir.

Vektorli mashinalarni (SVM) qo'llab-quvvatlash:
SVM larning afzalligi uning yuqori aniqlik va yuqori unumdorlik xususiyatidir. U haddan tashqari
moslashish bo'yicha mukammal nazariy kafolatlar beradi va chiziqli ravishda ajratilmaydigan
ma'lumotlar uchun yadrolarning moslashuvchan tanloviga ega.
Bu, ayniqsa, matnni tasniflash muammolarida, ayniqsa, juda katta o'lchamli bo'shliqlar mavjud
bo'lganda mashhurdir.

Qaror daraxtlari:
Qaror daraxtlarini sharhlash va tushuntirish juda oddiy. Bundan tashqari, u parametrik emas va hech
qanday tarqatishni talab qilmaydi. Buni aytganingizdan so'ng, siz qarorlar daraxtlaridan
foydalanganda, siz tashqi ko'rsatkichlar yoki ma'lumotlar to'plamini chiziqli ravishda ajratish
mumkinmi yoki yo'qmi haqida tashvishlanishingiz shart emas.
Evristik algoritm hisoblanganda, qaror daraxtlari multikollinearlikdan aziyat chekmaydi va bir nechta
toifadagi o'zgaruvchilar uchun mos keladi.

Daraxtlar ansambllari:
Daraxtlar ansambllari algoritmlar oilasi bo'lib, ikkita alohida algoritmni, ya'ni Boost Trees va
Random Forestsni qamrab oladi. Ularning asosiy afzalliklaridan biri shundaki, ular chiziqli
xususiyatlarni, shuningdek, chiziqli o'zaro ta'sir qiluvchi xususiyatlarni kutmaydilar. Ko'p qaror
daraxtlarining kombinatsiyasi sifatida yaratilgan Daraxtlar ansambllari kategorik (ikkilik)
xususiyatlarni osongina boshqarishi mumkin.
Bundan tashqari, ularning umumiy konstruktsiyasi (ko'tarish va to'plash yordamida) tufayli ular
o'lchovli bo'shliqni va ko'p sonli o'quv misollarini juda yaxshi boshqarishi mumkin.
13. Multiple Linear Regression va SLR ning farqi va ishlashi.
Multiple linear regression (MLR) va shaxsiy linear regressiya (SLR) statistikani
o'rganishda ko'p paytada foydalanadigan ikki turdagi regressiya modellari hisoblanadi.
MLR, bir nechta xususiyatlardan foydalanilgan regressiya usulidir. Bu usulda, ba'zi
kriteriyalar birlashtirilib, ularga binoan qaror qabul qilinadi. Bu esa odatda, kuchli
regressiya modellari yaratish imkonini beradi. Boshqa yo'nalishlarda, regressiya
modellari tahlili uchun keyingi bosqichdagi asosiy tamoyillar ko'proq xususiyatlarni
qabul qilmasdan, birinchi bosqichdagi kriteriya asosida regressiya yaratiladi. Bu esa
shaxsiy linear regressiya (SLR) hisoblanadi. Shaxsiy linear regressiya bitta xususiyat
asosida ishlaydi va uni tahlil qilish uchun odatda minimal sanoq bo'limida ishlatiladi.
SLR (Oddiy chiziqli regressiya) - bu to'g'ri chiziq yordamida bitta mustaqil o'zgaruvchi
va bitta qaram o'zgaruvchi o'rtasidagi munosabatni baholaydigan regressiya modeli.
Ikkala o'zgaruvchi ham miqdoriy bo'lishi kerak.
Masalan, harorat va simobning termometrdagi kengayishi o'rtasidagi bog'liqlikni to'g'ri
chiziq yordamida modellashtirish mumkin: harorat oshishi bilan simob kengayadi.
MLR (Ko'p chiziqli regressiya) nima? Ko'p chiziqli regressiya - bu to'g'ri chiziq
yordamida miqdoriy bog'liq o'zgaruvchi va ikki yoki undan ortiq mustaqil
o'zgaruvchilar o'rtasidagi munosabatni baholaydigan regressiya modeli.
Axborot mezonlari turli regressiya modellariga ballarni belgilash uchun ishlatiladi.
Darajasi:
model mosligini pasaytirish (model ma'lumotlarga qanchalik yaxshi mos tushsa, ball
shunchalik past bo'ladi);
modelning murakkabligini oshirish (qanchalik ko'p regressorlar va parametrlar bo'lsa,
ball shunchalik yuqori bo'ladi).
14.
Modelni baholash Cross-Validation?
15.
Mashinali o’qitish nima?
Mashinali o’qitish (Machine Learning) – bu kompyuterni dasturlashning yangi
yo’nalishi bo’lib, dasturning ma’lumotlarni o’qib olish va shu ma’lumotlar asosida
o’rganish xususiyatiga ega bo’lishidir. Mashinani o’qitish jarayoni chiziqli yoki
nochiziqli qaramasdan quyidagi bosqichlarda amalga oshiriladi:
◦ Muammoni aniqlash.
◦ Ma’lumotlarni tayyorlash.
◦ Algoritmni ishlab chiqish va baholash (testlash).
◦ Natijaviy ma’lumotlar aniqligini oshirish.bo’lishiga
◦ Yakuniy natijani (ishlab chiqilgan model) taqdim qilish.
Mashinani o'rganishning 3 turi
Mashinani o'rganish mashinaga katta hajmdagi ma'lumotlarni ko'rsatishni o'z ichiga
oladi, shunda u o'rganishi va bashorat qilishi, naqshlarni topishi yoki ma'lumotlarni
tasniflashi mumkin. Mashinani o'rganishning uchta turi nazoratsiz, nazoratsiz va
mustahkamlovchi o'rganishdir.
Download