Uploaded by Kamoliddin Yangiboyev

Qolganlari

advertisement
Mashina o'rganishga kirish
Mashinani o'rganish bilan dasturchi barcha mumkin bo'lgan muammolarni
hisobga oladigan va barcha yechimlarni o'z ichiga olgan ko'rsatmalar yozishi
shart emas. Buning o'rniga, kompyuter (yoki alohida dastur) statistik
ma'lumotlardan kompleks foydalanish orqali mustaqil ravishda yechimlarni
topish algoritmi bilan dasturlashtiriladi, undan qonuniyatlar olinadi va ular
asosida prognozlar tuziladi.
Ma'lumotlar tahliliga asoslangan mashinani o'rganish texnologiyasi 1950
yilda, shashka o'ynash uchun birinchi dasturlar ishlab chiqila boshlangan.
So'nggi o'n yilliklar davomida umumiy tamoyil o'zgarmadi. Ammo
kompyuterlarning hisoblash quvvatining keskin o'sishi tufayli ular tomonidan
yaratilgan qonuniyatlar va bashoratlar ancha murakkablashdi va mashinani
o'rganish yordamida hal qilinishi mumkin bo'lgan muammolar va vazifalar
doirasi kengaydi.
Mashinani o'rganish jarayonini boshlash uchun avval siz algoritm so'rovlarni
qayta ishlashni o'rganadigan Ma'lumotlar to'plamini (boshlang'ich
ma'lumotlarning ma'lum miqdorini) kompyuterga yuklab olishingiz kerak.
Misol uchun, itlar va mushuklarning fotosuratlari bo'lishi
mumkin, ularda kimga tegishli ekanligini ko'rsatadigan teglar mavjud. O'quv
jarayonidan so'ng dasturning o'zi it va mushuklarni yorliqsiz yangi tasvirlarda
taniy oladi. O'quv jarayoni prognozlar qilinganidan keyin ham davom etadi,
biz dastur tomonidan qancha ko'p ma'lumotlarni tahlil qilsak, kerakli
tasvirlarni aniqroq taniydi. Mashinani o'rganish tufayli kompyuterlar nafaqat
fotosuratlar va chizmalardagi yuzlarni, balki landshaftlar, ob'ektlar, matn va
raqamlarni ham tan olishni o'rganadilar. Matnga kelsak, bu erda mashinani
o'rganish ham ajralmas: grammatika tekshiruvi funksiyasi endi har qanday
matn muharririda va hatto telefonlarda ham mavjud. Bundan tashqari,
nafaqat so'zlarning imlosi, balki kontekst, ma'no soyalari va boshqa nozik
lingvistik jihatlar ham hisobga olinadi. Bundan tashqari, inson aralashuvisiz
yangiliklar maqolalarini (iqtisod va, masalan, sport mavzusida) yozish
mumkin bo'lgan dasturiy ta'minot allaqachon mavjud.
Mashinani o'rganish muammolarining turlari
Mashinani o'rganish bilan hal qilingan barcha muammolar quyidagi
toifalardan biriga kiradi:
1) Regressiya vazifasi – turli xil xususiyatlarga ega bo'lgan ob'ektlarning
namunasi asosidagi prognozlashdir. Chiqish natijasi haqiqiy raqam bo'lishi
kerak (2, 35, 76, 454 va boshqalar), masalan, kvartiraning narxi, olti oydan
keyin qimmatli qog'ozning qiymati, kelgusi oy uchun do'konning
kutilayotgan daromadi va hakazo.
2) Tasniflashning vazifasi – belgilar majmui asosida kategoriyali javob
olishdan iborat. Cheklangan miqdordagi javoblarga ega (odatda "ha" yoki
"yo'q" formatida): fotosuratda mushuk bormi, odam yuzi tasviri, saraton
bilan kasallangan bemormi?.
3) Klasterlash vazifasi – ma'lumotlarni guruhlarga taqsimlash: uyali aloqa
operatorining barcha mijozlarini to'lov qobiliyati darajasiga bo'lish, kosmik
ob'ektlarni u yoki bu toifaga (sayyora, yulduz, qora tuynuk va boshqalar)
ajratish.
4)O'lchovni qisqartirish vazifasi – ko'p sonli xususiyatlarni keyinchalik
vizualizatsiya qilish qulayligi uchun (masalan, ma'lumotlarni siqish) kichikroq
(odatda 2-3) ga qisqartirishdir.
5) Anomaliyalarni aniqlash vazifasi – anomaliyalarni standart holatlardan
ajratishdir. Bir qarashda, bu tasniflash vazifasiga to'g'ri keladi, ammo bitta
muhim farq bor: anomaliyalar kamdan-kam uchraydigan hodisa va bunday
ob'ektlarni aniqlash uchun mashinani o'rganish modeli o'rgatish mumkin
bo'lgan o'qitish misollari juda kam yoki shunchaki yo'q, shuning uchun
tasniflash usullari bu yerda ishlamaydi. Amalda, bunday vazifa, masalan,
bank kartalari bilan firibgarlik harakatlarini aniqlashdir.
Mashinani o'rganishning asosiy turlari
Mashinani o'rganish usullari yordamida hal qilinadigan vazifalarning asosiy
qismi ikki xil turga tegishli:
1.o'qituvchi bilan o'rganish (nazorat ostida o'rganish)
2.o'qituvchisiz o’rganish (nazoratsiz o'rganish).
Biroq, bu o'qituvchi kompyuter ustida turib, dasturdagi har bir
harakatni boshqaradigan dasturchining o'zi bo'lishi shart emas. Mashinani
o'rganish nuqtai nazaridan "o'qituvchi" - bu ma'lumotni qayta ishlash
jarayoniga shaxsning aralashuvi. O'rganishning ikkala turida ham mashina
tahlil qilish va qonuniyatlarni topishi kerak bo'lgan dastlabki ma'lumotlar
bilan ta'minlangan.
Klaster algoritmlari
Klasterlash ob'ektlar to'plamini toifalarga taqsimlashdan iborat
bo'lib, har bir toifada - klasterda bir-biriga eng o'xshash elementlar mavjud.
Siz turli xil algoritmlardan foydalangan holda ob'ektlarni klasterlashingiz
mumkin.
Quyidagilar eng ko'p qo'llaniladi:
 uchburchakning og'irlik markaziga asoslangan;
 ulanishga asoslangan;
 o'lchamlarni kamaytirish;
 zichlik (fazoviy klasterlash asosida);
 ehtimollik;
mashinani o'rganish, shu jumladan neyron tarmoqlar.
Mashinani o'rganish modellarining asosiy algoritmlari
 qarorlar daraxti
 Naive Bayes tasnifi
 Eng kichik kvadrat usuli
 Logistik regressiya
 Vektor mashinasini qo'llab-quvvatlash (SVM)
 ansambl usuli
 Klaster algoritmlari
 Asosiy komponentlar tahlili (PCA)
 yagona qiymatning parchalanishi
Mustaqil komponentlar tahlili (ICA)
Naive Bayes tasnifi
Naive Bayes klassifikatorlari oddiy ehtimolli klassifikatorlar
oilasiga kiradi va Bayes teoremasidan kelib chiqadi, bu holda funksiyalarni
mustaqil deb hisoblaydi (bu qat'iy yoki sodda taxmin deb ataladi). Amalda u
mashinani o'rganishning quyidagi sohalarida qo'llaniladi:
 elektron pochtaga keladigan spamning ta'rifi;
 yangiliklar maqolalarini tematik sarlavhalarga avtomatik
bog'lash;
 matnning hissiy rangini ochib berish;
 tasvirlardagi yuzlar va boshqa naqshlarni tanib olish.
Eng kichik kvadrat usuli
Statistikani ozgina o'rgangan har bir kishi chiziqli regressiya
tushunchasi bilan tanish. Uni amalga oshirish variantlari eng kichik
kvadratlarni o'z ichiga oladi. Odatda, chiziqli regressiyadan foydalanib,
muammolar nuqtalar to'plamidan o'tadigan to'g'ri chiziqni o'rnatish orqali
hal qilinadi.
Bu eng kichik kvadratlar usuli yordamida shunday amalga
oshiriladi: to'g'ri chiziq chizish, undan har bir nuqtagacha bo'lgan masofani
o'lchash (nuqtalar va chiziq vertikal segmentlar bilan bog'langan), natijada
olingan miqdorni yuqoriga o'tkazing.
Natijada, masofalar yig'indisi eng kichik bo'lgan egri chiziq kerakli bo'ladi (bu
chiziq haqiqiy qiymatdan normal taqsimlangan og'ish bilan nuqtalardan
o'tadi).
Chiziqli funktsiya odatda mashinani o'rganish uchun ma'lumotlarni
o'rnatishda ishlatiladi va xato ko'rsatkichini yaratish orqali xatolarni
minimallashtirish uchun eng kichik kvadratlar usuli qo'llaniladi.
Logistik regressiya
Logistik regressiya - bu o'zgaruvchilar o'rtasidagi munosabatlarni aniqlash
usuli bo'lib, ulardan biri qat'iy ravishda bog'liq, boshqalari esa mustaqildir.
Buning uchun logistik funktsiya (akkumulyator logistik taqsimot) qo'llaniladi.
Logistik regressiyaning amaliy ahamiyati shundaki, u bir yoki bir nechta
mustaqil o'zgaruvchilarni o'z ichiga olgan hodisalarni bashorat qilishning
kuchli statistik usuli hisoblanadi. Bu quyidagi holatlarda talab qilinadi:
 kredit reytingi;
 davom etayotgan reklama kompaniyalarining muvaffaqiyatini
o'lchash;
 ma'lum bir mahsulotdan foyda prognozi;
ma'lum bir sanada zilzila ehtimolini taxmin qilish.
Faktor tahlili haqida.
Faktorli tahlilning asosiy maqsadlari quyidagilardan iborat:
1.o'zgaruvchilar sonini kamaytirish (ma'lumotlarni qisqartirish)
2.o'zgaruvchilar o'rtasidagi munosabatlar tuzilishini aniqlash (o'zgaruvchilar
tasnifi)
Shuning uchun faktorli tahlil ma'lumotlarni qisqartirish usuli yoki
tasniflash usuli sifatida ishlatiladi.
Tasdiqlovchi factor(omil)lar tahlili.
Strukturaviy tenglamani modellashtirish (SEPATH) bir yoki bir
nechta namunalarda bir nechta o'zgaruvchilar (tasdiqlovchi omillar tahlili)
uchun omil tuzilishi haqidagi qisman gipotezalarni sinab ko'rish imkonini
beradi (masalan, siz turli xil namunalarning (tajribalarning) omil tuzilmalarini
solishtirishingiz mumkin).
Xat yozish tahlili.
Korrespondentlik tahlili satrlar va ustunlar orasidagi ba'zi
munosabatlarni o'z ichiga olgan ikki va ko'p yozuvli jadvallarni tahlil qilish
uchun mo'ljallangan tavsiflovchi/tadqiqot usullaridir. Ushbu tahlil natijalari
faktorli tahlilda berilgan ma'lumotlarga o'xshash ma'lumotlarni beradi va
jadvalga kiritilgan kategorik o'zgaruvchilarning tuzilishini o'rganish imkonini
beradi.
Faktorli tahlil ma'lumotlarni qisqartirish usuli sifatida
Aytaylik, siz tadqiqot o'tkazyapsiz, unda siz yuz kishining bo'yini dyum va
santimetrda o'lchaysiz. Shunday qilib, sizda ikkita o'zgaruvchi mavjud. Agar
siz, masalan, turli xil ozuqaviy qo'shimchalarning balandlikka ta'sirini
qo'shimcha tekshirishni istasangiz, ikkala o'zgaruvchidan ham foydalanishni
davom ettirasizmi? Ehtimol, yo'q, chunki balandlik - bu qanday birliklarda
o'lchanganidan qat'i nazar, insonning xususiyatlaridan biridir.
Aytaylik, siz odamlarning hayotdan qoniqishini o'lchashni xohlaysiz, buning
uchun siz turli xil narsalardan iborat so'rovnoma tuzasiz.
Boshqa savollar qatorida siz quyidagilarni so'raysiz: odamlar o'zlarining
sevimli mashg'ulotlaridan mamnunmi? (1-band) va ular u bilan qanchalik
intensiv shug'ullanishadi? (2-band). Natijalar o'rtacha javoblar (masalan,
qoniqish uchun) 100 qiymatiga to'g'ri kelishi uchun o'zgartiriladi, past va
yuqori qiymatlar mos ravishda o'rtacha javoblardan pastda va yuqorida
joylashgan. Ikki o'zgaruvchi (ikki xil elementga javoblar) bir-biri bilan
korrelyatsiya qilinadi. Ushbu ikki o'zgaruvchining yuqori korrelyatsiyasidan
xulosa qilishimiz mumkinki, so'rovnomaning ikkita elementi ortiqcha.
Ikki o'zgaruvchini bitta omilga birlashtirish.
O'zgaruvchilar o'rtasidagi munosabatni scatterplot yordamida
aniqlash mumkin. Fitting orqali olingan regressiya chizig'i munosabatlarning
grafik tasvirini beradi. Agar ushbu diagrammada tasvirlangan regressiya
chizig'i asosida yangi o'zgaruvchi aniqlansa, bunday o'zgaruvchi ikkala
o'zgaruvchining eng muhim xususiyatlarini o'z ichiga oladi. Shunday qilib,
aslida siz o'zgaruvchilar sonini kamaytirdingiz va ikkitasini bitta bilan
almashtirdingiz. E'tibor bering, yangi omil (o'zgaruvchi) aslida ikkita asl
o'zgaruvchining chiziqli birikmasidir.
Asosiy komponentlarni tahlil qilish.
Ikki korrelyatsion o'zgaruvchining bitta omilga birlashtirilgan
misoli omil tahlilining asosiy g'oyasini yoki aniqrog'i asosiy komponent
tahlilini ko'rsatadi (bu farq keyinroq muhokama qilinadi). Ikki o'zgaruvchili
misol ko'proq o'zgaruvchilarni o'z ichiga olgan holda kengaytirilsa, hisobkitoblar murakkablashadi, lekin ikki yoki undan ortiq bog’langan
o'zgaruvchilarni bitta omil bilan ifodalashning asosiy printsipi o'z kuchida
qoladi.
Asosiy komponentlarni tanlash.
Asosan, asosiy komponentlarni ajratib olish tartibi dastlabki o'zgaruvchan
fazoning dispersiyasini (varimax) maksimal darajaga keltiradigan aylanishga
o'xshaydi. Misol uchun, tarqalish chizmasida regressiya chizig'ini x - o'qi
sifatida ko'rishingiz mumkin , shunda uni regressiya chizig'i bilan bir qatorda
aylantiriladi. Aylanishning bu turi dispersiyani maksimallashtiruvchi aylanish
deb ataladi, chunki aylanish mezoni (maqsad) "yangi" o'zgaruvchining (omil)
dispersiyasini (o'zgaruvchanligini) maksimal darajada oshirish va uning
atrofidagi tarqalishni minimallashtirishdir.
Bir nechta ortogonal omillar.
Dispersiya maksimal bo'lgan chiziqni topganingizdan so'ng, uning
atrofida ma'lumotlarning bir nechta tarqalishi mavjud. Va tabiiy ravishda
protsedurani takrorlang. Asosiy komponentlar tahlilida aynan shunday
amalga oshiriladi: birinchi omil tanlangandan so'ng, ya'ni birinchi chiziq
chizilgandan so'ng, qoldiq o'zgarishlarni maksimal darajada oshiradigan
keyingi qator aniqlanadi (birinchi qator atrofida ma'lumotlarning tarqalishi),
va hokazo. Shunday qilib, omillar ketma-ket taqsimlanadi. Har bir keyingi
omil avvalgilaridan qolgan o'zgaruvchanlikni maksimal darajaga ko'taradigan
tarzda aniqlanganligi sababli, omillar bir-biridan mustaqil bo'lib chiqadi.
Boshqacha qilib aytganda, korrelyatsiyasiz yoki ortogonal.
Qancha faktorlarni ajratib ko'rsatish kerak? Eslatib o'tamiz, asosiy
komponent tahlili ma'lumotlarni kamaytirish yoki kamaytirish usuli
hisoblanadi, ya'ni. o'zgaruvchilar sonini kamaytirish usuli. Tabiiy savol
tug'iladi: qancha omillarni ajratib ko'rsatish kerak? E'tibor bering, omillarni
ketma-ket tanlash jarayonida ular kamroq o'zgaruvchanlikni o'z ichiga oladi.
Faktorlarni ajratib olish protsedurasini qachon to'xtatish to'g'risidagi qaror,
asosan, kichik "tasodifiy" o'zgaruvchanlik nuqtai nazariga bog'liq.
Asosiy komponentlar tahlili natijalari. Endi asosiy komponentlar tahlilining
standart natijalarini ko'rib chiqamiz. Takroriy takrorlash bilan siz kamroq
tafovutlar bilan omillarni chiqarasiz. Oddiylik uchun biz ish odatda barcha
o'zgaruvchilarning dispersiyalari 1,0 ga teng bo'lgan matritsadan boshlanadi
deb faraz qilamiz. Shuning uchun umumiy dispersiya o'zgaruvchilar soniga
teng. Misol uchun, agar sizda 10 ta o'zgaruvchi bo'lsa, ularning har biri 1 ga
teng, keyin potentsial izolyatsiya qilinishi mumkin bo'lgan eng katta tafovut
10 marta ko’p. Faraz qiling, siz hayotdan qoniqish so'rovingizga uy va ishdan
qoniqishning turli jihatlarini o'lchash uchun 10 ta elementni kiritdingiz.
Ketma-ket omillar bilan izohlangan dispersiya quyidagi jadvalda keltirilgan:
Xususiy qiymatlar va omillar soni muammosi
Har bir omil qancha tafovut chiqarganini bilganingizdan so'ng, qancha
omillarni saqlash kerakligi haqidagi savolga qaytishingiz mumkin. Yuqorida
aytib o'tilganidek, o'z tabiatiga ko'ra, bu qaror xususiydir. Biroq, ba'zi
umumiy ko'rsatmalar mavjud va amalda ularga rioya qilish eng yaxshi
natijalarni beradi.
Kayzer mezoni. Avvaliga siz faqat o'z qiymatlari 1 dan katta bo'lgan omillarni
tanlashingiz mumkin. Asosan, bu shuni anglatadiki, agar biror omil hech
bo'lmaganda bitta o'zgaruvchiga ekvivalent bo'lgan dispersiyani chiqarmasa,
u o'tkazib yuboriladi. Ushbu mezon Kaiser (Kaiser, 1960) tomonidan taklif
qilingan va, ehtimol, eng keng tarqalgan. Yuqoridagi misolda, ushbu
mezonga asoslanib, siz faqat 2 omilni (ikkita asosiy komponentni)
saqlashingiz kerak.
Skrining mezoni. Scree mezoni birinchi marta Cattell (1966) tomonidan taklif
qilingan grafik usuldir. Yuqoridagi jadvalda keltirilgan xos qiymatlarni oddiy
grafik sifatida chizishingiz mumkin.
Asosiy faktorlar tahlili
Asosiy komponentlar tahlilini chiqarishning turli jihatlarini davom ettirishdan
oldin, keling, asosiy omillar tahlili bilan tanishamiz. Yana bir "o'ylash mumkin
bo'lgan model"ni shakllantirish uchun hayotdan qoniqish anketasi misoliga
qaytaylik. Tasavvur qilishingiz mumkinki, sub'ektlarning javoblari ikkita
komponentga bog'liq. Birinchidan, biz ba'zi tegishli umumiy omillarni
tanlaymiz, masalan, yuqorida muhokama qilingan "o'z sevimli
mashg'ulotlaridan qoniqish". Har bir element qoniqishning ushbu umumiy
jihatining bir qismini o'lchaydi. Bundan tashqari, har bir element boshqa
hech qanday element tomonidan baham ko'rilmagan qoniqishning o'ziga xos
jihatini o'z ichiga oladi.
Asosiy omillar va asosiy komponentlar. Asosiy omillar va asosiy
komponentlar. Ikki omilli tahlil modellari orasidagi asosiy farq shundan
iboratki, Asosiy komponentlar tahlili oʻzgaruvchilarning barcha
oʻzgaruvchanligidan foydalanish kerakligini nazarda tutadi, asosiy omil
tahlilida esa faqat boshqa oʻzgaruvchilar uchun umumiy boʻlgan
oʻzgaruvchining dispersiyasidan foydalanasiz. Har bir yondashuvning ijobiy
va salbiy tomonlarini batafsil muhokama qilish ushbu kirish doirasidan
tashqarida. Ko'pgina hollarda, bu ikki usul juda yaqin natijalarga olib keladi.
Biroq, asosiy komponentlar tahlili ko'pincha ma'lumotlarni qisqartirish usuli
sifatida tanlanadi, asosiy omillar tahlili esa ma'lumotlar strukturasini
aniqlash uchun eng yaxshi qo'llaniladi.
Ma'lumotlarni intelektual tahlili
Ma'lumotlarni intelektual tahlili(ing., Data Mining) - bu
ma'lumotlar to'plamidagi ma'lumotlarni topish jarayoni, shuningdek,
ma'lumotlar bazalarida bilimlarni kashf qilishdir(Knowledge Discovery in
Databases, KDD).
Ma'lumotlarni intelektual tahlili bilan siz ikkita natijaga
erishishingiz mumkin:
1.
mavjud ma'lumotlarni tasvirlash
2.
kelajak uchun bashorat qilish.
Ma'lumotlarni intelektual tahlilining birinchi va, ehtimol, eng qiyin bosqichi
bu biznes maqsadini belgilashdir.
Bu eng muhim qadamdir. Agar siz nima qidirayotganingizni
bilmasangiz, kerakli ma'lumotlarni olish uchun mashinani o'rganish (ML)
turlari, algoritmlari va modellarini tanlash qiyin bo'ladi.
Ma'lumotlarni qidirish kompaniyaga o'z mijozlari va bozorini yaxshiroq
tushunishga yordam beradi va shu bilan yanada samarali savdo va marketing
strategiyalarini yaratadi.
Maktablar va universitetlarda esa:
o‘z talabalarini virtual sinfda o‘tkazgan vaqtlari,
tugmalar bosishlar soni,
o‘quvchilar bir vaqtning o‘zida qatnashgan darslari
qaysi sinflar testlarda yaxshiroq natija ko‘rsatishi kabi
ma’lumotlarni tahlil qilish orqali yaxshiroq tushuna oladi.
Shuningdek, korxonalar ishlab chiqarish, yig‘ish, nosozliklar aniqlash va
boshqalarni tushunish orqali biznes jarayonlarini optimallashtirish uchun
ma’lumotlarni tahlil qilishdan foydalanishlari mumkin.
Shuningdek, ma’lumotlarni tahlil qilish firibgarlikni aniqlash
uchun ham foydalidir. Bank sohasida firibgarlik yoki xakerlik sxemalarini
aniqlash uchun ma'lumotlarni qidirishdan foydalanish mumkin.
Ikkinchi bosqich - ma'lumotlarni tayyorlash.
Tahlil maqsadini aniqlaganingizdan so'ng, ma'lumotlar bo'yicha
olimlar sizning biznesingiz uchun foydali bo'lishi uchun tegishli ma'lumotlar
to'plamini tanlashlari mumkin. Ma'lumotlar bo'yicha olimlar ma'lumotlarni
tozalashlari kerak:
takroriy va noto'g'ri ma'lumotlarni yo'q qilish,
etishmayotgan qiymatlarni to'ldirish;
Chunki bularning barchasi algoritmlar va ma'lumotlarni qidirish vositalari
sizga kerakli natijalarni berishiga to'sqinlik qilishi mumkin.
Uchinchi bosqich - model yaratish va naqshlarni aniqlash. Quyida keltirilgan
usullar va vositalar aynan shu narsa ustida ishlaydi. Ma'lumotlarni tahlil
qilishni chuqur o'rganish algoritmlarini nazorat ostida yoki nazoratsiz
o'rganish usullari bilan ishlatishi mumkin.
To'rtinchi va oxirgi bosqich - bu jarayonlarga o'zgartirishlar kiritish yoki
biznesga foyda keltiradigan harakatlarni amalga oshirish uchun
ma'lumotlarni qidirish natijalarini baholash.
Ma'lumotlarni tahlil qilish usullari
Ma'lumotni tahlil qilish texnikasi ma'lumotlar olimlari va korxonalarga katta
hajmdagi ma'lumotlardan yaxshiroq foydalanish imkonini beradi. Usullar
orasida quyidagilar mavjud:
Naqshlarni kuzatish – naqshlarni aniqlashning asosiy usuli hisoblanadi,
masalan, qor yog'ishi paytida qor kuraklarini sotishning ko'payishi. Lekin
faqat sizga kerak bo'lgan naqshlar unchalik aniq emas.
Tasniflash – ma’lumotlarni turkumlash va unga sinf belgilash imkonini
beruvchi yana bir usuldir. Masalan, bank mijozlarining moliyaviy tarixidan
kelib chiqib, to‘lov qobiliyati past, o‘rta va yuqori darajadagi mijozlarga
bo‘linadi.
Assotsiatsiya – naqshni kuzatish bilan bog'liq yana bir usuldir. U ma'lum
vaqtlarda bir-biri bilan bog'liq bo'lgan o'zgaruvchilarni qidiradi.
Anomaliyalarni aniqlash – bu ma'lumotlar to'plamidagi istisnolarni
qidiradigan yana bir ma'lumot tahlil qilish usuli.
Klasterlash – Bu usul tabiatan tasniflash usuliga o'xshaydi. Ma'lumotlar
o'xshashligi bo'yicha guruhlangan. Masalan, xaridorlar sotib olish chastotasi
yoki bir martalik daromadga qarab guruhlangan (klasterlar).
Regressiya - bu o'tgan qiymatlarga asoslangan qiymatni bashorat qilish
qobiliyati. Regressiya vaqt o'tishi bilan o'rtacha qiymatni aniqlaydi, chunki uy
narxlari kabi narsalar vaqt o'tishi bilan joriy o'rtacha narxdan biroz yuqori
yoki pastroq o'zgaradi.
Prognozlash - bu korxonalarga kelajakda tovarlar va xizmatlar narxini
bashorat qilish imkonini beruvchi ma'lumotlarni yig'ish usuli.
Ma'lumotlarni tahlil qilish vositalari
Ma'lumotni tahlil qilish vositalari sizga ma'lumotlarni qidirishning kompaniya
faoliyatiga ta'sirini oshirishga imkon beradi. Bugungi kunda eng yaxshi
vositalardan ba'zilari:
•
MonkeyLearn
•
RapidMiner Studio
•
Sisense for Cloud Data Teams
•
Alteryx Designer
•
Qlik Sense
•
Orange
MonkeyLearn - bu matnni tahlil qilish vositasidir. Siz undan salbiy onlayn
sharhlar kabi fikrlarni aniqlash yoki chiptalarga teg qo'shish va xodimlarga
chiptalar tayinlash jarayonini avtomatlashtirish uchun foydalanishingiz
mumkin.
RapidMiner Studio – ochiq kodli platforma bo'lib, dasturchi bo'lmaganlar o'z
holatlarini sozlashlari uchun ma'lumotlarni tahlil qilish uchun sudrab olib
tashlash interfeysini taklif qiladi.
U firibgarlikni aniqlash yoki mijozlar aylanmasini aniqlash uchun
ishlatilishi mumkin. Dasturchilar uchun R va Python uchun kengaytmalar
mavjud bo'lib, ular sizga ma'lumotlar tahlil qilishni sozlash imkonini beradi.
Bundan tashqari, allaqachon qurilgan ajoyib qo'llab-quvvatlash hamjamiyati
mavjud.
Sisense for Cloud Data Teams – jamoa aʼzolarining texnik darajasidan qatʼi
nazar, jamoalarga oʻz maʼlumotlaridan tushunchalar olish boʻyicha
hamkorlik qilish imkonini beradi.
Sisense for Cloud Data Teams – jamoa aʼzolarining texnik darajasidan qatʼi
nazar, jamoalarga oʻz maʼlumotlaridan tushunchalar olish boʻyicha
hamkorlik qilish imkonini beradi.
Qlik Sense – bu "ajoyib diagrammalar va grafiklar"ga ega vizualizatsiya
dasturi. Bu sudrab olib tashlash yordamida bir nechta ma'lumotlar
manbalarini tahlil qilish imkonini beradi.
Download