MIRZO ULUG’BEK NOMIDAGI O’ZBEKISTON MILLIY UNIVERSITETI JIZZAX FILIALI SIRTQI BO`LIMI “AXBOROT TIZIMLARI VA TEXNOLOGIYALARI” YO’NALISHI 4-BOSQICH 911-20 GURUH TALABASI OSTONOQULOV O`ROLNING Sun'iy intellekt va neyronto'rli texnologiyalar FANIDAN MUSTAQIL ISHI Mavzu: Yarim nazorat ostida o'rganish. 2023-yil MAVZU: Yarim nazorat ostida o'rganish REJA: 1. Mashinali o`qitish nima? 2. Semi-supervised learning algoritmlari ishlash tamoyili 3. Unsupervised learning va uning algoritimlari 1. Mashinali o’qitish nima? Mashinali o’qitish (Machine Learning) – bu kompyuterni dasturlashning yangi yo’nalishi bo’lib, dasturning ma’lumotlarni o’qib olish va shu ma’lumotlar asosida o’rganish xususiyatiga ega bo’lishidir. Mashinani o’qitish jarayoni chiziqli yoki nochiziqli qaramasdan quyidagi bosqichlarda amalga oshiriladi: ◦ Muammoni aniqlash. ◦ Ma’lumotlarni tayyorlash. ◦ Algoritmni ishlab chiqish va baholash (testlash). ◦ Natijaviy ma’lumotlar aniqligini oshirish.bo’lishiga ◦ Yakuniy natijani (ishlab chiqilgan model) taqdim qilish. Mashinani o'rganishning 3 turi Mashinani o'rganish mashinaga katta hajmdagi ma'lumotlarni ko'rsatishni o'z ichiga oladi, shunda u o'rganishi va bashorat qilishi, naqshlarni topishi yoki ma'lumotlarni tasniflashi mumkin. Mashinani o'rganishning uchta turi nazoratsiz, nazoratsiz va mustahkamlovchi o'rganishdir. 2. Mashinali o’qitishda Vizualizatsiyaning o’rni va grafik turlari. Biz modellar qurishda va ularni taxlil qilishda ma'lumotlarni grafik ko'rinishida taqdim qila bilish muhim ko'nikmalardan biri hisoblanadi. Ayniqsa, oddiy odamlar (buyurtmachi, rahbar, hamkasblar) uchun sonlar va jadvallardan ko'ra grafiklarni tushunish osonroq kechadi. Muhandis sifatida, ba'zida o'zimiz uchun ham grafiklardan qo'shimcha ma'lumotlar olishimiz mumkin. Grafiklar nafaqat ma'lumotlarga ishlov berish balki yakuniy natijalarni taqdim qilishda ham faol ishlatiladi. Pythonda grafiklar bilan ishlash uchun eng mashhur kutubxonalar bu matplotlib va u asosida qurilgan seaborn kutubxonalaridir. matplotlib kutubxonasi: CHIZIQLI GRAFIKLAR(LINE PLOTS) Biz chiziqli grafiklar yordamida Tendensiyalarni kuzatamiz yani vaqt o'tishi bilan bizdagi malumotlar qanday o'zgarishini ko'rib borish mumkun. USTUNLI GRAFIKLAR(BAR GRAPHS) Ustunli grafiklar yordamida biz alohida ustunlarni va o'zgaruvchilarni solishtirishimiz mumkun. TARQOQLIK GRAFIGI (SCATTER PLOT) Scatter plot yordamida ma'lumotlar qanchalik tarqoq ekanin kuzatishimiz mumkin. Bu grafik ham bir nechta ustunlar orasidagi bog'liqlikni (korrelyasiyani) ko'rishga xizmat qiladi. TAQSIMOT GRAFIGI (DISTRIBUTION) Taqsimot grafik - o'zgaruvchi (ustun)da qanday qiymatlar mavjudligi va ularning ehtimolligini ko'rsatuvchi grafik. 3. Unsupervised learning va uning algoritimlari? O’qituvchisiz o’qitish (unsupervised learning) – bu mashinani o’qitish usulidan biri bo’lib, bunda modelni oldindan aniq bo’lgan ma’lumotlar bilan o’qitish amalga oshirilmaydi, aksincha obyekt parametrlarini (ma'lumotlarni) topish uchun modelga o'z ustida ishlashga imkon yaratib beriladi. Supervised learning usuliga qaraganda murakkab usul hisoblanadi va bashoratlash jarayoni avtomatik lekin noaniqroq bo’lishi mumkin. Unsupervised learning usulida asosan “klasterlash” masalasi yechiladi. Unsupervised learning turlari Clustering ◦ Hierarchical clustering ◦ K-means clustering ◦ K-NN (k nearest neighbors) ◦ Principal Component Analysis ◦ Singular Value Decomposition ◦ Independent Component Analysis 4. SLR va MLR modellarining baxolash mezonlari? SLR (Oddiy chiziqli regressiya) - bu to'g'ri chiziq yordamida bitta mustaqil o'zgaruvchi va bitta qaram o'zgaruvchi o'rtasidagi munosabatni baholaydigan regressiya modeli. Ikkala o'zgaruvchi ham miqdoriy bo'lishi kerak. Masalan, harorat va simobning termometrdagi kengayishi o'rtasidagi bog'liqlikni to'g'ri chiziq yordamida modellashtirish mumkin: harorat oshishi bilan simob kengayadi. MLR (Ko'p chiziqli regressiya) nima? Ko'p chiziqli regressiya - bu to'g'ri chiziq yordamida miqdoriy bog'liq o'zgaruvchi va ikki yoki undan ortiq mustaqil o'zgaruvchilar o'rtasidagi munosabatni baholaydigan regressiya modeli. Axborot mezonlari turli regressiya modellariga ballarni belgilash uchun ishlatiladi. Darajasi: model mosligini pasaytirish (model ma'lumotlarga qanchalik yaxshi mos tushsa, ball shunchalik past bo'ladi); modelning murakkabligini oshirish (qanchalik ko'p regressorlar va parametrlar bo'lsa, ball shunchalik yuqori bo'ladi). Eng yaxshi model eng past ballga ega bo'lgan modeldir. SLR va MLR modellari uchun baxolash vositasi ko'p mavjud. Ular ko'pincha Python dasturlash tili va kutubxonalari yordamida yaratiladi. Ba'zi baxolash modellari esa Excel kabi dasturlardan foydalanishni amalga oshiradi. Baxolash natijalari yig'iladigan ma'lumotlar odatda statistika va matematik asosidagi kutubxonalarda ajratiladi. 5. Supervised learning va uning algoritmlari? Supervised learning O’qituvchili o’qitish (Supervised learning) – bu modelni xususiyatlari aniq bo’lgan ma’lumotlar bilan o’qitish. Bunday turdagi o’qitish usullariga Regressiya va Sinflashtirish masalalarini misol keltirish mumkin. Bunda xususiyatlari aniq deganda kiruvchi va chiquvchi parametrlar mavjud bo’lishi nazarda tutiladi. Modelni o’qitishda foydalaniladigan ma’lumotlar odatda ikkita qismga ajratiladi va ular 80:20 nisbatda olinadi. Ya’ni ma’lumotlarning 80% o’qitiluvchi ma’lumot va qolgan 20% esa modelni testlovchi ma’lumot bo’lib xizmat qiladi. O’qitish jarayonida model kiruvchi va chiquvchi ma’lumotlarning 80% dan foydalanadi va modelni o’qitish faqat ushbu ma’lumot orqali amalga oshiriladi. Support-vector machines (Yordamchi vektorli mashinalar) Linear regression (Chiziqli regressiya) Logistic regression (Logistik regressiya) Naive Bayes Linear discriminant analysis (Chiziqli diskriminant tahlili) Decision trees (Qaror daraxtlari) K-nearest neighbor algorithm (K-eng yaqin qo'shni algoritmi) Neyron tarmoqlar Similarity learning (O'xshashlikni o'rganish) 6. Modelni sinash va natijalarni tasdiqlash va uning usullari. Mashinali o'qitishda modelni sinash va natijalarni tasdiqlashning turli usullari mavjud. Bu usullar quyidagilardan iborat bo'lishi mumkin: 1. Keltirilgan ma'lumotlarni ushbu model bilan amalga oshirish: Bu, modelni sinashning eng oddiy va amaliy usuli. Bu, modelga keltirilgan test ma'lumotlar orqali modelelarning ishini tekshirishdir. Bu usul avvalgi ma'lumotlarni sinash orqali yangi ma'lumotlarni boshqarishni qulaylashtirishga ta'sir etadi. 2. K-perkritiya metodi: Bu usulda ma'lumotlar bir nechta sinfda ajratiladi va model uning o'ziga xos va kundalik yechimlarini topadi. Bu usulda, optimal sinf sonini aniqlash uchun bir nechta sinflar alohida o'qitilganligi uchun qo'llaniladi. 3. Cross-validation usuli: Bu usulda keltirilgan ma'lumotlar qisqa sinflarga ajratiladi va har bir sinfdagi yechimlar soddalashtiriladi. Keza, sinflarning natijalari statistik xarakteristika bilan ta'minlangan holda yechish uchun qo'llaniladi. 4. Hold-out metod: Bu metoddagi datalar biron-biriga ixtiyoriy aj 7. Regressya modellari Simple Linear Regression. Va uning ishlashi. Regressiya bu – ma’lumotlarni intellektual tahlil qilish usullaridan biri bo’lib, obyekt yoki jarayonga tegishli o'zgaruvchilar o'rtasidagi o'zaro bog'liqlikni baholash uchun statistik jarayonlar to'plami hisoblanadi. Regressiya va uning turlari. Regressiya asosida yaratiladigan model ma'lumotlarni berilgan nuqtalardan o'tgan eng yaxshi giper tekislikka (nuqtalar o’rtasidan o’tishiga) moslashtirishga harakat qiladi. Regression tahlilda turli xil modellardan foydalanish mumkin, eng sodda model chiziqli regressiya asosida quriladi. Oddiy chiziqli regressiya ikki miqdoriy o'zgaruvchi o'rtasidagi munosabatni baholash uchun ishlatiladi . Siz bilishni xohlaganingizda oddiy chiziqli regressiyadan foydalanishingiz mumkin: 1. Ikki oʻzgaruvchi oʻrtasidagi bogʻliqlik qanchalik kuchli (masalan, yogʻingarchilik va tuproq eroziyasi oʻrtasidagi bogʻliqlik). 2. Mustaqil o'zgaruvchining ma'lum bir qiymatidagi bog'liq o'zgaruvchining qiymati (masalan, yog'ingarchilikning ma'lum darajasidagi tuproq eroziyasining miqdori). Regressiya modellari kuzatilgan ma'lumotlarga chiziq qo'yish orqali o'zgaruvchilar o'rtasidagi munosabatni tavsiflaydi. Chiziqli regressiya modellari to'g'ri chiziqdan, logistik va chiziqli bo'lmagan regressiya modellarida esa egri chiziqdan foydalaniladi. Regressiya mustaqil o'zgaruvchi(lar)ning o'zgarishi bilan bog'liq o'zgaruvchining qanday o'zgarishini taxmin qilish imkonini beradi. 8. Semi-supervised learning algoritmlari ishlash tamoyili? Yarim nazorat ostida o'qitish nima? Yarim nazorat ostida o'qitish - bu yorliqli va yorliqsiz ma'lumotlardan foydalanadigan mashinani o'rganish usullarining keng toifasi; shu tarzda, nomidan ko'rinib turibdiki, bu nazorat ostida va nazoratsiz o'rganish o'rtasidagi gibrid texnikadir. Umuman olganda, yarim nazoratning asosiy g'oyasi ma'lumotlar nuqtasiga uning yorlig'i bor yoki yo'qligiga qarab boshqacha munosabatda bo'lishdir: etiketli nuqtalar uchun algoritm model og'irliklarini yangilash uchun an'anaviy nazoratdan foydalanadi; va etiketlanmagan nuqtalar uchun algoritm boshqa shunga o'xshash ta'lim misollari orasidagi bashoratlardagi farqni minimallashtiradi. Nazorat ostidagi treninglar bashorat va teglar oʻrtasidagi oʻrtacha farqni minimallashtirish uchun model ogʻirliklarini yangilaydi. Biroq, cheklangan yorliqli ma'lumotlar bilan, bu belgilangan nuqtalar uchun amal qiladigan qaror chegarasini topishi mumkin, ammo butun taqsimot uchun umumlashtirilmaydi (quyidagi Boshqa tomondan, nazoratsiz o'rganish, ba'zi bir xususiyat-makondagi o'xshashliklarga asoslanib, nuqtalarni birlashtirishga harakat qiladi. Ammo, ta'limga yo'naltirish uchun teglarsiz, nazoratsiz algoritm sub-optimal klasterlarni topishi mumkin. Masalan, 2b-rasmda topilgan klasterlar haqiqiy sinf taqsimotiga noto'g'ri mos keladi. Belgilanmagan ma'lumotlar nuqtalari kontekstni ta'minlaydi; modelimizni iloji boricha ko'proq ma'lumotlarga ochib berish orqali biz butun taqsimotning shaklini aniq baholashimiz mumkin. Ikkala qism - etiketli va yorliqsiz ma'lumotlar bilan biz aniqroq va bardoshli modellarni o'rgatishimiz mumkin. Bizning oylar ma'lumotlar to'plamida yarim nazorat ostidagi mashg'ulotlar Yarim nazorat ostida o'qitishning afzalliklari va cheklovlari Belgilanmagan ma'lumotlardan foydalanadigan texnikalar ma'lumotlarni to'plash bilan bog'liq haqiqiy muammolardan kelib chiqadi. Har yili kompaniyalar va amaliyotchilar mashinani o'rganish uchun ma'lumotlar to'plamini etiketlash uchun juda ko'p vaqt va pul sarflashadi. Shu bilan birga, etiketlanmagan ma'lumotlar bo'sh qoladi; va odatda arzon va yig'ish oson bo'lsa-da, natijalarni teglarsiz etkazib berish qiyin. Kuchli natijalarga erishishda maʼlumotlarni qoʻlda yorliqlashdan qochishning iloji boʻlsa, mashinani oʻrganish amaliyotchilari qimmatbaho, aks holda behuda sarflangan resurslarni tejashlari mumkin. Ikkita bir xil ma'lumotlar to'plamini hisobga olgan holda, to'liq etiketlangan ma'lumotlar to'plamiga ega bo'lgan nazorat ostidagi o'quv vazifasi, albatta, yorliqsiz nuqtalarning bir qismi bo'lgan to'plamga qaraganda yaxshiroq modelni o'rgatadi. Biroq, yorliqlar cheklangan va yorliqsiz ma'lumotlar ko'p bo'lsa, yarim nazorat ostida o'rganish kuchli. Bunday holda, bizning modelimiz minglab qo'shimcha tasvirlarga vaqt va pul sarflamasdan, joylashtirishda duch kelishi mumkin bo'lgan holatlarga ta'sir qiladi. Ma'lumotlar to'plamiga oson kirish imkoniga ega bo'lganingizda, yorliqsiz va etiketli ma'lumotlar to'plamini aralashtirish, albatta, modelning ishlashini oshiradi.chiqing Yarim nazorat ostida o'qitish: asosiy yo'nalishlar Mana jist. Umumiy yarim nazoratli algoritmda etiketli va yorliqsiz maʼlumotlar toʻplami berilgan holda misollar ikki xil usuldan biri bilan ishlanadi: 1. Belgilangan ma'lumotlar nuqtalari an'anaviy nazorat ostidagi ta'limdagi kabi ishlanadi; bashorat qilinadi, yo'qotish hisoblab chiqiladi va tarmoq og'irliklari gradient tushishi bo'yicha yangilanadi. 2. Belgilanmagan ma'lumotlar nuqtalari modelga yanada izchil va ishonchli bashorat qilishda yordam berish uchun ishlatiladi. Qo'shimcha nazoratsiz yo'qotish atamasi yoki psevdo-yorliqlar bo'lishidan qat'i nazar, etiketlanmagan misollar etiketlangan misollarning rivojlanishiga asoslanish uchun ishlatiladi. Eng yaxshi natijalarga ega bo'lgan ba'zi maqolalar va ilovalar bitta algoritmda ko'plab usullardan foydalangan holda yaxlit yondashuvlarni oldi. 9. Ma’lumotlarni o’rganish Korrelyatsya? Korrelyatsiya Korrelyatsiya ikki o'zgaruvchi o'rtasidagi munosabatni o'lchaydi. Biz funktsiya kirish (x) ni chiqish (f(x)) ga aylantirish orqali qiymatni bashorat qilish maqsadiga ega ekanligini aytib o'tdik. Aytishimiz mumkinki, funktsiya ikki o'zgaruvchi o'rtasidagi munosabatni bashorat qilish uchun ishlatadi. Korrelyatsiya koeffitsienti Korrelyatsiya koeffitsienti ikki o'zgaruvchi o'rtasidagi munosabatni o'lchaydi. Korrelyatsiya koeffitsienti hech qachon -1 dan kam yoki 1 dan yuqori bo'lishi mumkin emas. 1 = o'zgaruvchilar o'rtasida mukammal chiziqli munosabatlar mavjud (masalan, Kaloriya_burnagega qarshi o'rtacha_puls) 0 = o'zgaruvchilar o'rtasida chiziqli bog'liqlik yo'q -1 = o'zgaruvchilar o'rtasida mukammal salbiy chiziqli bog'liqlik mavjud (masalan, kamroq ishlagan soatlar, mashg'ulot paytida kaloriyalarning ko'payishiga olib keladi) Mukammal chiziqli munosabatlarga misol (korrelyatsiya koeffitsienti = 1) Average_Pulse va Calorie_burnage o'rtasidagi munosabatni tasavvur qilish uchun biz scatterplotdan foydalanamiz (biz 10 ta kuzatuv bilan sport soatlarining kichik ma'lumotlar to'plamidan foydalandik). Bu safar biz tarqalish chizmalarini xohlaymiz, shuning uchun biz "tarqalish" ga o'zgartiramiz: Misol import matplotlib.pyplot as plt health_data.plot(x ='Average_Pulse', y='Calorie_Burnage', kind='scatter') plt.show() 10. Reinforcement learning algoritmlari va ishlash tamoyili Mustahkamlashni o'rganish nima? Kuchaytiruvchi oʻrganish (RL) mashinani oʻrganishning kichik sohasini nazarda tutadi, bu AIga asoslangan tizimlarga individual faoliyat uchun yaratilgan fikrmulohazalarga asoslangan jamoaviy mukofotlarni maksimal darajada oshirish uchun sinov va xato orqali dinamik muhitda harakatlarni amalga oshirishga imkon beradi. RL kontekstida fikr-mulohaza mukofotlar yoki jazolar orqali aks ettirilgan ijobiy yoki salbiy tushunchaga ishora qiladi. RL inson idrokiga taqlid qiluvchi tabiiy intellektga taqlid qilish orqali AI tomonidan boshqariladigan tizimlarni optimallashtiradi. Bunday o'rganish yondashuvi kompyuter agentlariga inson ishtirokisiz yoki AI tizimlarini aniq dasturlash zaruratisiz mo'ljallangan vazifalarda hayratlanarli natijalarga erishadigan muhim qarorlar qabul qilishga yordam beradi. An'anaviy ML usullariga nozik dinamik element qo'shgan ba'zi ma'lum RL usullari orasida Monte Karlo, davlat-harakat-mukofot-davlat-harakat (SARSA) va Q-o'rganish kiradi . Kuchli o'rganish algoritmlari bo'yicha o'qitilgan AI modellari bir nechta video o'yinlar va stol o'yinlarida, jumladan shaxmat va Go o'yinlarida hamkasblarini mag'lub etdi. Texnik jihatdan, RL ilovalarini uch turga bo'lish mumkin: Siyosatga asoslangan : Ushbu RL yondashuvi deterministik siyosatlar, strategiyalar va usullardan foydalangan holda tizim mukofotini maksimal darajada oshirishga qaratilgan. Qiymatga asoslangan : Qiymatga asoslangan RL ilovasi o'rganishda ishtirok etadigan ixtiyoriy qiymat funktsiyasini optimallashtirishni maqsad qiladi. Modelga asoslangan : Modelga asoslangan yondashuv ma'lum bir muhit uchun virtual sozlamalarni yaratishga imkon beradi. Bundan tashqari, ishtirokchi tizim agentlari o'z vazifalarini ushbu virtual spetsifikatsiyalar doirasida bajaradilar. 11. Simple Linear Regression modelining vazifasi va uning ishlashi Oddiy linearniy regressiya modelini ishlab chiqish vazifasi ma'lum ma'lumotlarning to'plamidan ijobiy va manfiy o'zgaruvchilarning bir-biriga bo'lgan munosabatini aniqlashdir. Bu vazifani bajargan paytda ko'rsatiladigan ma'lumotlar tahlil qilinadi, va ularning ma'lum qiymatlari yuqori va pasti bo'lmaganlari, uzluksizligi o'rtasida bir ko'rsatkichning o'zgarishi bilan bog'liq emasligi kerak. Regressiya modeli, ma'lumotlarning kiritilishidan keyin murojaat etiladigan nihoyatda mos keladigan o'zgaruvchilarning post faktum qiymatlarini hosil qilishga yordam beradi. Model kiritilgan ma'lumotlarning to'plamidan kelib chiqgan statistik analiz natijasiga asoslanadi va yozilgan shartli funksiya orqali aniqlangan optimal ko'rsatkichlar yordamida kiritilishi mumkin. 12. Klassifikatsiya algoritimlari va ularning tarfi.? Mashina o'rganishda tasniflash algoritmlari Mashinani o'rganishda tasniflash algoritmlarining har xil turlari quyidagilarni o'z ichiga oladi: 1. Logistik regressiya 2. Naive Bayes klassifikatori 3. Vektorli mashinalarni qo'llab-quvvatlash (SVM) 4. Qaror daraxtlari 5. Ko'tarilgan daraxtlar 6. Tasodifiy o'rmon 7. Neyron tarmoqlari 8. Eng yaqin qo'shni Ba'zi tasniflash algoritmlarining afzalliklarini tushunish Logistik regressiya: Logistik regressiya bilan siz modelingizni qanday qilib tartibga solishning turli usullarini topishingiz mumkin, bu xususiyatlar o'zaro bog'liq yoki yo'qligi haqida tashvishlanmasdan - bu Naive Bayes bilan bog'liq muammo bo'lishi mumkin. Bundan tashqari, u yaxshi ehtimollik talqiniga ega va SVM yoki qaror daraxtlari bilan duch kelmasligingiz mumkin bo'lgan yangi ma'lumotlar to'plamini olish uchun modelingizni osongina yangilash imkonini beradi. Logitsic regressiya, agar sizga ehtimollik doirasi kerak bo'lsa, ideal tarzda qo'llaniladi - masalan, ishonch oraliqlarini olishingiz, tasniflash chegaralarini sozlashingiz yoki ishonchingiz komil bo'lmaganda aytishingiz kerak bo'lsa. Bundan tashqari, kelajakda ko'proq o'quv ma'lumotlarini olishni kutayotgan va ularni osongina va tezda modelingizga qo'shishni xohlagan holatlarda ham foydalidir. Naive Bayes: Naive Bayes klassifikatorini qurish va ishlatish juda oson, chunki u odatda hech qanday talablarga ega emas. Bu, ayniqsa, katta ma'lumotlar to'plamlari va o'zgaruvchilarning bir nechta toifalari bilan foydalidir.. Oddiylikdan tashqari, NB hatto juda murakkab tasniflash usullaridan ham ustun turishga qodir. Vektorli mashinalarni (SVM) qo'llab-quvvatlash: SVM larning afzalligi uning yuqori aniqlik va yuqori unumdorlik xususiyatidir. U haddan tashqari moslashish bo'yicha mukammal nazariy kafolatlar beradi va chiziqli ravishda ajratilmaydigan ma'lumotlar uchun yadrolarning moslashuvchan tanloviga ega. Bu, ayniqsa, matnni tasniflash muammolarida, ayniqsa, juda katta o'lchamli bo'shliqlar mavjud bo'lganda mashhurdir. Qaror daraxtlari: Qaror daraxtlarini sharhlash va tushuntirish juda oddiy. Bundan tashqari, u parametrik emas va hech qanday tarqatishni talab qilmaydi. Buni aytganingizdan so'ng, siz qarorlar daraxtlaridan foydalanganda, siz tashqi ko'rsatkichlar yoki ma'lumotlar to'plamini chiziqli ravishda ajratish mumkinmi yoki yo'qmi haqida tashvishlanishingiz shart emas. Evristik algoritm hisoblanganda, qaror daraxtlari multikollinearlikdan aziyat chekmaydi va bir nechta toifadagi o'zgaruvchilar uchun mos keladi. Daraxtlar ansambllari: Daraxtlar ansambllari algoritmlar oilasi bo'lib, ikkita alohida algoritmni, ya'ni Boost Trees va Random Forestsni qamrab oladi. Ularning asosiy afzalliklaridan biri shundaki, ular chiziqli xususiyatlarni, shuningdek, chiziqli o'zaro ta'sir qiluvchi xususiyatlarni kutmaydilar. Ko'p qaror daraxtlarining kombinatsiyasi sifatida yaratilgan Daraxtlar ansambllari kategorik (ikkilik) xususiyatlarni osongina boshqarishi mumkin. Bundan tashqari, ularning umumiy konstruktsiyasi (ko'tarish va to'plash yordamida) tufayli ular o'lchovli bo'shliqni va ko'p sonli o'quv misollarini juda yaxshi boshqarishi mumkin. 13. Multiple Linear Regression va SLR ning farqi va ishlashi. Multiple linear regression (MLR) va shaxsiy linear regressiya (SLR) statistikani o'rganishda ko'p paytada foydalanadigan ikki turdagi regressiya modellari hisoblanadi. MLR, bir nechta xususiyatlardan foydalanilgan regressiya usulidir. Bu usulda, ba'zi kriteriyalar birlashtirilib, ularga binoan qaror qabul qilinadi. Bu esa odatda, kuchli regressiya modellari yaratish imkonini beradi. Boshqa yo'nalishlarda, regressiya modellari tahlili uchun keyingi bosqichdagi asosiy tamoyillar ko'proq xususiyatlarni qabul qilmasdan, birinchi bosqichdagi kriteriya asosida regressiya yaratiladi. Bu esa shaxsiy linear regressiya (SLR) hisoblanadi. Shaxsiy linear regressiya bitta xususiyat asosida ishlaydi va uni tahlil qilish uchun odatda minimal sanoq bo'limida ishlatiladi. SLR (Oddiy chiziqli regressiya) - bu to'g'ri chiziq yordamida bitta mustaqil o'zgaruvchi va bitta qaram o'zgaruvchi o'rtasidagi munosabatni baholaydigan regressiya modeli. Ikkala o'zgaruvchi ham miqdoriy bo'lishi kerak. Masalan, harorat va simobning termometrdagi kengayishi o'rtasidagi bog'liqlikni to'g'ri chiziq yordamida modellashtirish mumkin: harorat oshishi bilan simob kengayadi. MLR (Ko'p chiziqli regressiya) nima? Ko'p chiziqli regressiya - bu to'g'ri chiziq yordamida miqdoriy bog'liq o'zgaruvchi va ikki yoki undan ortiq mustaqil o'zgaruvchilar o'rtasidagi munosabatni baholaydigan regressiya modeli. Axborot mezonlari turli regressiya modellariga ballarni belgilash uchun ishlatiladi. Darajasi: model mosligini pasaytirish (model ma'lumotlarga qanchalik yaxshi mos tushsa, ball shunchalik past bo'ladi); modelning murakkabligini oshirish (qanchalik ko'p regressorlar va parametrlar bo'lsa, ball shunchalik yuqori bo'ladi). 14. Modelni baholash Cross-Validation? 15. Mashinali o’qitish nima? Mashinali o’qitish (Machine Learning) – bu kompyuterni dasturlashning yangi yo’nalishi bo’lib, dasturning ma’lumotlarni o’qib olish va shu ma’lumotlar asosida o’rganish xususiyatiga ega bo’lishidir. Mashinani o’qitish jarayoni chiziqli yoki nochiziqli qaramasdan quyidagi bosqichlarda amalga oshiriladi: ◦ Muammoni aniqlash. ◦ Ma’lumotlarni tayyorlash. ◦ Algoritmni ishlab chiqish va baholash (testlash). ◦ Natijaviy ma’lumotlar aniqligini oshirish.bo’lishiga ◦ Yakuniy natijani (ishlab chiqilgan model) taqdim qilish. Mashinani o'rganishning 3 turi Mashinani o'rganish mashinaga katta hajmdagi ma'lumotlarni ko'rsatishni o'z ichiga oladi, shunda u o'rganishi va bashorat qilishi, naqshlarni topishi yoki ma'lumotlarni tasniflashi mumkin. Mashinani o'rganishning uchta turi nazoratsiz, nazoratsiz va mustahkamlovchi o'rganishdir.