Mashina o'rganishga kirish Mashinani o'rganish bilan dasturchi barcha mumkin bo'lgan muammolarni hisobga oladigan va barcha yechimlarni o'z ichiga olgan ko'rsatmalar yozishi shart emas. Buning o'rniga, kompyuter (yoki alohida dastur) statistik ma'lumotlardan kompleks foydalanish orqali mustaqil ravishda yechimlarni topish algoritmi bilan dasturlashtiriladi, undan qonuniyatlar olinadi va ular asosida prognozlar tuziladi. Ma'lumotlar tahliliga asoslangan mashinani o'rganish texnologiyasi 1950 yilda, shashka o'ynash uchun birinchi dasturlar ishlab chiqila boshlangan. So'nggi o'n yilliklar davomida umumiy tamoyil o'zgarmadi. Ammo kompyuterlarning hisoblash quvvatining keskin o'sishi tufayli ular tomonidan yaratilgan qonuniyatlar va bashoratlar ancha murakkablashdi va mashinani o'rganish yordamida hal qilinishi mumkin bo'lgan muammolar va vazifalar doirasi kengaydi. Mashinani o'rganish jarayonini boshlash uchun avval siz algoritm so'rovlarni qayta ishlashni o'rganadigan Ma'lumotlar to'plamini (boshlang'ich ma'lumotlarning ma'lum miqdorini) kompyuterga yuklab olishingiz kerak. Misol uchun, itlar va mushuklarning fotosuratlari bo'lishi mumkin, ularda kimga tegishli ekanligini ko'rsatadigan teglar mavjud. O'quv jarayonidan so'ng dasturning o'zi it va mushuklarni yorliqsiz yangi tasvirlarda taniy oladi. O'quv jarayoni prognozlar qilinganidan keyin ham davom etadi, biz dastur tomonidan qancha ko'p ma'lumotlarni tahlil qilsak, kerakli tasvirlarni aniqroq taniydi. Mashinani o'rganish tufayli kompyuterlar nafaqat fotosuratlar va chizmalardagi yuzlarni, balki landshaftlar, ob'ektlar, matn va raqamlarni ham tan olishni o'rganadilar. Matnga kelsak, bu erda mashinani o'rganish ham ajralmas: grammatika tekshiruvi funksiyasi endi har qanday matn muharririda va hatto telefonlarda ham mavjud. Bundan tashqari, nafaqat so'zlarning imlosi, balki kontekst, ma'no soyalari va boshqa nozik lingvistik jihatlar ham hisobga olinadi. Bundan tashqari, inson aralashuvisiz yangiliklar maqolalarini (iqtisod va, masalan, sport mavzusida) yozish mumkin bo'lgan dasturiy ta'minot allaqachon mavjud. Mashinani o'rganish muammolarining turlari Mashinani o'rganish bilan hal qilingan barcha muammolar quyidagi toifalardan biriga kiradi: 1) Regressiya vazifasi – turli xil xususiyatlarga ega bo'lgan ob'ektlarning namunasi asosidagi prognozlashdir. Chiqish natijasi haqiqiy raqam bo'lishi kerak (2, 35, 76, 454 va boshqalar), masalan, kvartiraning narxi, olti oydan keyin qimmatli qog'ozning qiymati, kelgusi oy uchun do'konning kutilayotgan daromadi va hakazo. 2) Tasniflashning vazifasi – belgilar majmui asosida kategoriyali javob olishdan iborat. Cheklangan miqdordagi javoblarga ega (odatda "ha" yoki "yo'q" formatida): fotosuratda mushuk bormi, odam yuzi tasviri, saraton bilan kasallangan bemormi?. 3) Klasterlash vazifasi – ma'lumotlarni guruhlarga taqsimlash: uyali aloqa operatorining barcha mijozlarini to'lov qobiliyati darajasiga bo'lish, kosmik ob'ektlarni u yoki bu toifaga (sayyora, yulduz, qora tuynuk va boshqalar) ajratish. 4)O'lchovni qisqartirish vazifasi – ko'p sonli xususiyatlarni keyinchalik vizualizatsiya qilish qulayligi uchun (masalan, ma'lumotlarni siqish) kichikroq (odatda 2-3) ga qisqartirishdir. 5) Anomaliyalarni aniqlash vazifasi – anomaliyalarni standart holatlardan ajratishdir. Bir qarashda, bu tasniflash vazifasiga to'g'ri keladi, ammo bitta muhim farq bor: anomaliyalar kamdan-kam uchraydigan hodisa va bunday ob'ektlarni aniqlash uchun mashinani o'rganish modeli o'rgatish mumkin bo'lgan o'qitish misollari juda kam yoki shunchaki yo'q, shuning uchun tasniflash usullari bu yerda ishlamaydi. Amalda, bunday vazifa, masalan, bank kartalari bilan firibgarlik harakatlarini aniqlashdir. Mashinani o'rganishning asosiy turlari Mashinani o'rganish usullari yordamida hal qilinadigan vazifalarning asosiy qismi ikki xil turga tegishli: 1.o'qituvchi bilan o'rganish (nazorat ostida o'rganish) 2.o'qituvchisiz o’rganish (nazoratsiz o'rganish). Biroq, bu o'qituvchi kompyuter ustida turib, dasturdagi har bir harakatni boshqaradigan dasturchining o'zi bo'lishi shart emas. Mashinani o'rganish nuqtai nazaridan "o'qituvchi" - bu ma'lumotni qayta ishlash jarayoniga shaxsning aralashuvi. O'rganishning ikkala turida ham mashina tahlil qilish va qonuniyatlarni topishi kerak bo'lgan dastlabki ma'lumotlar bilan ta'minlangan. Klaster algoritmlari Klasterlash ob'ektlar to'plamini toifalarga taqsimlashdan iborat bo'lib, har bir toifada - klasterda bir-biriga eng o'xshash elementlar mavjud. Siz turli xil algoritmlardan foydalangan holda ob'ektlarni klasterlashingiz mumkin. Quyidagilar eng ko'p qo'llaniladi: uchburchakning og'irlik markaziga asoslangan; ulanishga asoslangan; o'lchamlarni kamaytirish; zichlik (fazoviy klasterlash asosida); ehtimollik; mashinani o'rganish, shu jumladan neyron tarmoqlar. Mashinani o'rganish modellarining asosiy algoritmlari qarorlar daraxti Naive Bayes tasnifi Eng kichik kvadrat usuli Logistik regressiya Vektor mashinasini qo'llab-quvvatlash (SVM) ansambl usuli Klaster algoritmlari Asosiy komponentlar tahlili (PCA) yagona qiymatning parchalanishi Mustaqil komponentlar tahlili (ICA) Naive Bayes tasnifi Naive Bayes klassifikatorlari oddiy ehtimolli klassifikatorlar oilasiga kiradi va Bayes teoremasidan kelib chiqadi, bu holda funksiyalarni mustaqil deb hisoblaydi (bu qat'iy yoki sodda taxmin deb ataladi). Amalda u mashinani o'rganishning quyidagi sohalarida qo'llaniladi: elektron pochtaga keladigan spamning ta'rifi; yangiliklar maqolalarini tematik sarlavhalarga avtomatik bog'lash; matnning hissiy rangini ochib berish; tasvirlardagi yuzlar va boshqa naqshlarni tanib olish. Eng kichik kvadrat usuli Statistikani ozgina o'rgangan har bir kishi chiziqli regressiya tushunchasi bilan tanish. Uni amalga oshirish variantlari eng kichik kvadratlarni o'z ichiga oladi. Odatda, chiziqli regressiyadan foydalanib, muammolar nuqtalar to'plamidan o'tadigan to'g'ri chiziqni o'rnatish orqali hal qilinadi. Bu eng kichik kvadratlar usuli yordamida shunday amalga oshiriladi: to'g'ri chiziq chizish, undan har bir nuqtagacha bo'lgan masofani o'lchash (nuqtalar va chiziq vertikal segmentlar bilan bog'langan), natijada olingan miqdorni yuqoriga o'tkazing. Natijada, masofalar yig'indisi eng kichik bo'lgan egri chiziq kerakli bo'ladi (bu chiziq haqiqiy qiymatdan normal taqsimlangan og'ish bilan nuqtalardan o'tadi). Chiziqli funktsiya odatda mashinani o'rganish uchun ma'lumotlarni o'rnatishda ishlatiladi va xato ko'rsatkichini yaratish orqali xatolarni minimallashtirish uchun eng kichik kvadratlar usuli qo'llaniladi. Logistik regressiya Logistik regressiya - bu o'zgaruvchilar o'rtasidagi munosabatlarni aniqlash usuli bo'lib, ulardan biri qat'iy ravishda bog'liq, boshqalari esa mustaqildir. Buning uchun logistik funktsiya (akkumulyator logistik taqsimot) qo'llaniladi. Logistik regressiyaning amaliy ahamiyati shundaki, u bir yoki bir nechta mustaqil o'zgaruvchilarni o'z ichiga olgan hodisalarni bashorat qilishning kuchli statistik usuli hisoblanadi. Bu quyidagi holatlarda talab qilinadi: kredit reytingi; davom etayotgan reklama kompaniyalarining muvaffaqiyatini o'lchash; ma'lum bir mahsulotdan foyda prognozi; ma'lum bir sanada zilzila ehtimolini taxmin qilish. Faktor tahlili haqida. Faktorli tahlilning asosiy maqsadlari quyidagilardan iborat: 1.o'zgaruvchilar sonini kamaytirish (ma'lumotlarni qisqartirish) 2.o'zgaruvchilar o'rtasidagi munosabatlar tuzilishini aniqlash (o'zgaruvchilar tasnifi) Shuning uchun faktorli tahlil ma'lumotlarni qisqartirish usuli yoki tasniflash usuli sifatida ishlatiladi. Tasdiqlovchi factor(omil)lar tahlili. Strukturaviy tenglamani modellashtirish (SEPATH) bir yoki bir nechta namunalarda bir nechta o'zgaruvchilar (tasdiqlovchi omillar tahlili) uchun omil tuzilishi haqidagi qisman gipotezalarni sinab ko'rish imkonini beradi (masalan, siz turli xil namunalarning (tajribalarning) omil tuzilmalarini solishtirishingiz mumkin). Xat yozish tahlili. Korrespondentlik tahlili satrlar va ustunlar orasidagi ba'zi munosabatlarni o'z ichiga olgan ikki va ko'p yozuvli jadvallarni tahlil qilish uchun mo'ljallangan tavsiflovchi/tadqiqot usullaridir. Ushbu tahlil natijalari faktorli tahlilda berilgan ma'lumotlarga o'xshash ma'lumotlarni beradi va jadvalga kiritilgan kategorik o'zgaruvchilarning tuzilishini o'rganish imkonini beradi. Faktorli tahlil ma'lumotlarni qisqartirish usuli sifatida Aytaylik, siz tadqiqot o'tkazyapsiz, unda siz yuz kishining bo'yini dyum va santimetrda o'lchaysiz. Shunday qilib, sizda ikkita o'zgaruvchi mavjud. Agar siz, masalan, turli xil ozuqaviy qo'shimchalarning balandlikka ta'sirini qo'shimcha tekshirishni istasangiz, ikkala o'zgaruvchidan ham foydalanishni davom ettirasizmi? Ehtimol, yo'q, chunki balandlik - bu qanday birliklarda o'lchanganidan qat'i nazar, insonning xususiyatlaridan biridir. Aytaylik, siz odamlarning hayotdan qoniqishini o'lchashni xohlaysiz, buning uchun siz turli xil narsalardan iborat so'rovnoma tuzasiz. Boshqa savollar qatorida siz quyidagilarni so'raysiz: odamlar o'zlarining sevimli mashg'ulotlaridan mamnunmi? (1-band) va ular u bilan qanchalik intensiv shug'ullanishadi? (2-band). Natijalar o'rtacha javoblar (masalan, qoniqish uchun) 100 qiymatiga to'g'ri kelishi uchun o'zgartiriladi, past va yuqori qiymatlar mos ravishda o'rtacha javoblardan pastda va yuqorida joylashgan. Ikki o'zgaruvchi (ikki xil elementga javoblar) bir-biri bilan korrelyatsiya qilinadi. Ushbu ikki o'zgaruvchining yuqori korrelyatsiyasidan xulosa qilishimiz mumkinki, so'rovnomaning ikkita elementi ortiqcha. Ikki o'zgaruvchini bitta omilga birlashtirish. O'zgaruvchilar o'rtasidagi munosabatni scatterplot yordamida aniqlash mumkin. Fitting orqali olingan regressiya chizig'i munosabatlarning grafik tasvirini beradi. Agar ushbu diagrammada tasvirlangan regressiya chizig'i asosida yangi o'zgaruvchi aniqlansa, bunday o'zgaruvchi ikkala o'zgaruvchining eng muhim xususiyatlarini o'z ichiga oladi. Shunday qilib, aslida siz o'zgaruvchilar sonini kamaytirdingiz va ikkitasini bitta bilan almashtirdingiz. E'tibor bering, yangi omil (o'zgaruvchi) aslida ikkita asl o'zgaruvchining chiziqli birikmasidir. Asosiy komponentlarni tahlil qilish. Ikki korrelyatsion o'zgaruvchining bitta omilga birlashtirilgan misoli omil tahlilining asosiy g'oyasini yoki aniqrog'i asosiy komponent tahlilini ko'rsatadi (bu farq keyinroq muhokama qilinadi). Ikki o'zgaruvchili misol ko'proq o'zgaruvchilarni o'z ichiga olgan holda kengaytirilsa, hisobkitoblar murakkablashadi, lekin ikki yoki undan ortiq bog’langan o'zgaruvchilarni bitta omil bilan ifodalashning asosiy printsipi o'z kuchida qoladi. Asosiy komponentlarni tanlash. Asosan, asosiy komponentlarni ajratib olish tartibi dastlabki o'zgaruvchan fazoning dispersiyasini (varimax) maksimal darajaga keltiradigan aylanishga o'xshaydi. Misol uchun, tarqalish chizmasida regressiya chizig'ini x - o'qi sifatida ko'rishingiz mumkin , shunda uni regressiya chizig'i bilan bir qatorda aylantiriladi. Aylanishning bu turi dispersiyani maksimallashtiruvchi aylanish deb ataladi, chunki aylanish mezoni (maqsad) "yangi" o'zgaruvchining (omil) dispersiyasini (o'zgaruvchanligini) maksimal darajada oshirish va uning atrofidagi tarqalishni minimallashtirishdir. Bir nechta ortogonal omillar. Dispersiya maksimal bo'lgan chiziqni topganingizdan so'ng, uning atrofida ma'lumotlarning bir nechta tarqalishi mavjud. Va tabiiy ravishda protsedurani takrorlang. Asosiy komponentlar tahlilida aynan shunday amalga oshiriladi: birinchi omil tanlangandan so'ng, ya'ni birinchi chiziq chizilgandan so'ng, qoldiq o'zgarishlarni maksimal darajada oshiradigan keyingi qator aniqlanadi (birinchi qator atrofida ma'lumotlarning tarqalishi), va hokazo. Shunday qilib, omillar ketma-ket taqsimlanadi. Har bir keyingi omil avvalgilaridan qolgan o'zgaruvchanlikni maksimal darajaga ko'taradigan tarzda aniqlanganligi sababli, omillar bir-biridan mustaqil bo'lib chiqadi. Boshqacha qilib aytganda, korrelyatsiyasiz yoki ortogonal. Qancha faktorlarni ajratib ko'rsatish kerak? Eslatib o'tamiz, asosiy komponent tahlili ma'lumotlarni kamaytirish yoki kamaytirish usuli hisoblanadi, ya'ni. o'zgaruvchilar sonini kamaytirish usuli. Tabiiy savol tug'iladi: qancha omillarni ajratib ko'rsatish kerak? E'tibor bering, omillarni ketma-ket tanlash jarayonida ular kamroq o'zgaruvchanlikni o'z ichiga oladi. Faktorlarni ajratib olish protsedurasini qachon to'xtatish to'g'risidagi qaror, asosan, kichik "tasodifiy" o'zgaruvchanlik nuqtai nazariga bog'liq. Asosiy komponentlar tahlili natijalari. Endi asosiy komponentlar tahlilining standart natijalarini ko'rib chiqamiz. Takroriy takrorlash bilan siz kamroq tafovutlar bilan omillarni chiqarasiz. Oddiylik uchun biz ish odatda barcha o'zgaruvchilarning dispersiyalari 1,0 ga teng bo'lgan matritsadan boshlanadi deb faraz qilamiz. Shuning uchun umumiy dispersiya o'zgaruvchilar soniga teng. Misol uchun, agar sizda 10 ta o'zgaruvchi bo'lsa, ularning har biri 1 ga teng, keyin potentsial izolyatsiya qilinishi mumkin bo'lgan eng katta tafovut 10 marta ko’p. Faraz qiling, siz hayotdan qoniqish so'rovingizga uy va ishdan qoniqishning turli jihatlarini o'lchash uchun 10 ta elementni kiritdingiz. Ketma-ket omillar bilan izohlangan dispersiya quyidagi jadvalda keltirilgan: Xususiy qiymatlar va omillar soni muammosi Har bir omil qancha tafovut chiqarganini bilganingizdan so'ng, qancha omillarni saqlash kerakligi haqidagi savolga qaytishingiz mumkin. Yuqorida aytib o'tilganidek, o'z tabiatiga ko'ra, bu qaror xususiydir. Biroq, ba'zi umumiy ko'rsatmalar mavjud va amalda ularga rioya qilish eng yaxshi natijalarni beradi. Kayzer mezoni. Avvaliga siz faqat o'z qiymatlari 1 dan katta bo'lgan omillarni tanlashingiz mumkin. Asosan, bu shuni anglatadiki, agar biror omil hech bo'lmaganda bitta o'zgaruvchiga ekvivalent bo'lgan dispersiyani chiqarmasa, u o'tkazib yuboriladi. Ushbu mezon Kaiser (Kaiser, 1960) tomonidan taklif qilingan va, ehtimol, eng keng tarqalgan. Yuqoridagi misolda, ushbu mezonga asoslanib, siz faqat 2 omilni (ikkita asosiy komponentni) saqlashingiz kerak. Skrining mezoni. Scree mezoni birinchi marta Cattell (1966) tomonidan taklif qilingan grafik usuldir. Yuqoridagi jadvalda keltirilgan xos qiymatlarni oddiy grafik sifatida chizishingiz mumkin. Asosiy faktorlar tahlili Asosiy komponentlar tahlilini chiqarishning turli jihatlarini davom ettirishdan oldin, keling, asosiy omillar tahlili bilan tanishamiz. Yana bir "o'ylash mumkin bo'lgan model"ni shakllantirish uchun hayotdan qoniqish anketasi misoliga qaytaylik. Tasavvur qilishingiz mumkinki, sub'ektlarning javoblari ikkita komponentga bog'liq. Birinchidan, biz ba'zi tegishli umumiy omillarni tanlaymiz, masalan, yuqorida muhokama qilingan "o'z sevimli mashg'ulotlaridan qoniqish". Har bir element qoniqishning ushbu umumiy jihatining bir qismini o'lchaydi. Bundan tashqari, har bir element boshqa hech qanday element tomonidan baham ko'rilmagan qoniqishning o'ziga xos jihatini o'z ichiga oladi. Asosiy omillar va asosiy komponentlar. Asosiy omillar va asosiy komponentlar. Ikki omilli tahlil modellari orasidagi asosiy farq shundan iboratki, Asosiy komponentlar tahlili oʻzgaruvchilarning barcha oʻzgaruvchanligidan foydalanish kerakligini nazarda tutadi, asosiy omil tahlilida esa faqat boshqa oʻzgaruvchilar uchun umumiy boʻlgan oʻzgaruvchining dispersiyasidan foydalanasiz. Har bir yondashuvning ijobiy va salbiy tomonlarini batafsil muhokama qilish ushbu kirish doirasidan tashqarida. Ko'pgina hollarda, bu ikki usul juda yaqin natijalarga olib keladi. Biroq, asosiy komponentlar tahlili ko'pincha ma'lumotlarni qisqartirish usuli sifatida tanlanadi, asosiy omillar tahlili esa ma'lumotlar strukturasini aniqlash uchun eng yaxshi qo'llaniladi. Ma'lumotlarni intelektual tahlili Ma'lumotlarni intelektual tahlili(ing., Data Mining) - bu ma'lumotlar to'plamidagi ma'lumotlarni topish jarayoni, shuningdek, ma'lumotlar bazalarida bilimlarni kashf qilishdir(Knowledge Discovery in Databases, KDD). Ma'lumotlarni intelektual tahlili bilan siz ikkita natijaga erishishingiz mumkin: 1. mavjud ma'lumotlarni tasvirlash 2. kelajak uchun bashorat qilish. Ma'lumotlarni intelektual tahlilining birinchi va, ehtimol, eng qiyin bosqichi bu biznes maqsadini belgilashdir. Bu eng muhim qadamdir. Agar siz nima qidirayotganingizni bilmasangiz, kerakli ma'lumotlarni olish uchun mashinani o'rganish (ML) turlari, algoritmlari va modellarini tanlash qiyin bo'ladi. Ma'lumotlarni qidirish kompaniyaga o'z mijozlari va bozorini yaxshiroq tushunishga yordam beradi va shu bilan yanada samarali savdo va marketing strategiyalarini yaratadi. Maktablar va universitetlarda esa: o‘z talabalarini virtual sinfda o‘tkazgan vaqtlari, tugmalar bosishlar soni, o‘quvchilar bir vaqtning o‘zida qatnashgan darslari qaysi sinflar testlarda yaxshiroq natija ko‘rsatishi kabi ma’lumotlarni tahlil qilish orqali yaxshiroq tushuna oladi. Shuningdek, korxonalar ishlab chiqarish, yig‘ish, nosozliklar aniqlash va boshqalarni tushunish orqali biznes jarayonlarini optimallashtirish uchun ma’lumotlarni tahlil qilishdan foydalanishlari mumkin. Shuningdek, ma’lumotlarni tahlil qilish firibgarlikni aniqlash uchun ham foydalidir. Bank sohasida firibgarlik yoki xakerlik sxemalarini aniqlash uchun ma'lumotlarni qidirishdan foydalanish mumkin. Ikkinchi bosqich - ma'lumotlarni tayyorlash. Tahlil maqsadini aniqlaganingizdan so'ng, ma'lumotlar bo'yicha olimlar sizning biznesingiz uchun foydali bo'lishi uchun tegishli ma'lumotlar to'plamini tanlashlari mumkin. Ma'lumotlar bo'yicha olimlar ma'lumotlarni tozalashlari kerak: takroriy va noto'g'ri ma'lumotlarni yo'q qilish, etishmayotgan qiymatlarni to'ldirish; Chunki bularning barchasi algoritmlar va ma'lumotlarni qidirish vositalari sizga kerakli natijalarni berishiga to'sqinlik qilishi mumkin. Uchinchi bosqich - model yaratish va naqshlarni aniqlash. Quyida keltirilgan usullar va vositalar aynan shu narsa ustida ishlaydi. Ma'lumotlarni tahlil qilishni chuqur o'rganish algoritmlarini nazorat ostida yoki nazoratsiz o'rganish usullari bilan ishlatishi mumkin. To'rtinchi va oxirgi bosqich - bu jarayonlarga o'zgartirishlar kiritish yoki biznesga foyda keltiradigan harakatlarni amalga oshirish uchun ma'lumotlarni qidirish natijalarini baholash. Ma'lumotlarni tahlil qilish usullari Ma'lumotni tahlil qilish texnikasi ma'lumotlar olimlari va korxonalarga katta hajmdagi ma'lumotlardan yaxshiroq foydalanish imkonini beradi. Usullar orasida quyidagilar mavjud: Naqshlarni kuzatish – naqshlarni aniqlashning asosiy usuli hisoblanadi, masalan, qor yog'ishi paytida qor kuraklarini sotishning ko'payishi. Lekin faqat sizga kerak bo'lgan naqshlar unchalik aniq emas. Tasniflash – ma’lumotlarni turkumlash va unga sinf belgilash imkonini beruvchi yana bir usuldir. Masalan, bank mijozlarining moliyaviy tarixidan kelib chiqib, to‘lov qobiliyati past, o‘rta va yuqori darajadagi mijozlarga bo‘linadi. Assotsiatsiya – naqshni kuzatish bilan bog'liq yana bir usuldir. U ma'lum vaqtlarda bir-biri bilan bog'liq bo'lgan o'zgaruvchilarni qidiradi. Anomaliyalarni aniqlash – bu ma'lumotlar to'plamidagi istisnolarni qidiradigan yana bir ma'lumot tahlil qilish usuli. Klasterlash – Bu usul tabiatan tasniflash usuliga o'xshaydi. Ma'lumotlar o'xshashligi bo'yicha guruhlangan. Masalan, xaridorlar sotib olish chastotasi yoki bir martalik daromadga qarab guruhlangan (klasterlar). Regressiya - bu o'tgan qiymatlarga asoslangan qiymatni bashorat qilish qobiliyati. Regressiya vaqt o'tishi bilan o'rtacha qiymatni aniqlaydi, chunki uy narxlari kabi narsalar vaqt o'tishi bilan joriy o'rtacha narxdan biroz yuqori yoki pastroq o'zgaradi. Prognozlash - bu korxonalarga kelajakda tovarlar va xizmatlar narxini bashorat qilish imkonini beruvchi ma'lumotlarni yig'ish usuli. Ma'lumotlarni tahlil qilish vositalari Ma'lumotni tahlil qilish vositalari sizga ma'lumotlarni qidirishning kompaniya faoliyatiga ta'sirini oshirishga imkon beradi. Bugungi kunda eng yaxshi vositalardan ba'zilari: • MonkeyLearn • RapidMiner Studio • Sisense for Cloud Data Teams • Alteryx Designer • Qlik Sense • Orange MonkeyLearn - bu matnni tahlil qilish vositasidir. Siz undan salbiy onlayn sharhlar kabi fikrlarni aniqlash yoki chiptalarga teg qo'shish va xodimlarga chiptalar tayinlash jarayonini avtomatlashtirish uchun foydalanishingiz mumkin. RapidMiner Studio – ochiq kodli platforma bo'lib, dasturchi bo'lmaganlar o'z holatlarini sozlashlari uchun ma'lumotlarni tahlil qilish uchun sudrab olib tashlash interfeysini taklif qiladi. U firibgarlikni aniqlash yoki mijozlar aylanmasini aniqlash uchun ishlatilishi mumkin. Dasturchilar uchun R va Python uchun kengaytmalar mavjud bo'lib, ular sizga ma'lumotlar tahlil qilishni sozlash imkonini beradi. Bundan tashqari, allaqachon qurilgan ajoyib qo'llab-quvvatlash hamjamiyati mavjud. Sisense for Cloud Data Teams – jamoa aʼzolarining texnik darajasidan qatʼi nazar, jamoalarga oʻz maʼlumotlaridan tushunchalar olish boʻyicha hamkorlik qilish imkonini beradi. Sisense for Cloud Data Teams – jamoa aʼzolarining texnik darajasidan qatʼi nazar, jamoalarga oʻz maʼlumotlaridan tushunchalar olish boʻyicha hamkorlik qilish imkonini beradi. Qlik Sense – bu "ajoyib diagrammalar va grafiklar"ga ega vizualizatsiya dasturi. Bu sudrab olib tashlash yordamida bir nechta ma'lumotlar manbalarini tahlil qilish imkonini beradi.