Differenta tra: : DVariabile caratteristica è ne a attributo e può assumere in diversi umità statistiche A seconde dei dati d rappresentano le variabili possono rilevato m + essern : di L QUANTITIVE: QUAUTATIVE : Rappresentano dei dati numerici Rappresentano categorie e quantite età di e , = . i di persona peso una un infinito di valori all'int haww . valori specifici ↳ Es : Macchine in in una percleggio un mereri de non : general gerarchico , >R ORDINAU Laco in odice intric selo uno be distante tre le categ separati e di Studenti m di degli occhi . intrinseco (es colore ordine in com categorie . essere solo a DISCRETE possono auticle >R NOMINAH= sono possono essurele caratter descritte a essen oggetto di in intervallo erno parole con . ~ > a CONTINUE in istiche de possono misurate in tezuini graudette essere possono di valori viewe . casse, me = : orie umifozus e no o definite mavericamente (es livello di sodde - : fation del clientel statistica : 2) Umità l'entità e o 3) Dati l'aggetto grezzi dirette osservazioni vergono raccolti i dati . - amalisi Soco o ci su . · info o misurazioni raccolte EABORATE E RACCOLTE NON senza DALLE alcuma elaborazione UNI STATISTICHE IVAMABILE FATTORE VARABILE INDIPENDENTE ↳ lo sue voliazioni influentomo le VAR DIPENDENT = . Amalisi cultivariata I m : · che si concentr sull'ANAUS SMULTAREA campo della al a tistica variabili al five di comprendere le relazioni complesse tra di esse ed identifi are pattern , associazioni a strutture mascoste wei dati - - di + , - GIE : a) ANALISI DELLA DIPENDENZA = è relazioni tra le variabili esacime come relate a ↑ variabili processo de wire multivariato Tale uno spatio . le variabili si influenzamo dipendenti -unite im in tra loro . reciprocamente e a comprenden le tipologia di amalizi come possono essere car DELL'INTERDIPENDENZA= In concentre sull'esplorazione delle rel variabili multivoniate: vole scoprire come aziomi complesse e reciproche tra le le variabili si imfluenza mo reciprocamente in modo dimanico all'interno di in 2) ANAUSI inviewe di dati 3) RIDUZIONE DIMENSIONALE = è una tecuice che mine a rid mo di variabili im um set esse il di dati mentwendo al contempo le maggior parte delle info rilevanti Le 2 tearicle + comuni per lo riduzione delle dimensionalità sono : analisi delle componenti principali Tale tecnica ene a trasformare le variabili diginali in in muoro insient di variabili (componenti principali) d sono lineamente indipendenti e and inate in base alle low importanze welle dell variante mei DELA L · spiegazion dati · amalisi dei di co fattori RIDUZIONE : RABI [ identificate : fattori sottostatide contribuiscono alle colazioni the le variabili 4) CLUSTER ANALYS1S= Metodo suddivider in insieme di dati in gruppi o cluster angerei bacati sulle somigliauta tra le umità ste Istich e le osservation= cerco di identificar gruppi di dati sicili to Ros mecessariamente ridurre la dicensionalità dei dati iniziali Tutterie senze la C A pu esser utilizzate cave parte di un processo aupio di ridutions delle dicensionalità d mine e . . . 3) ANAUSI DISCRIMNANTE=3 serve classificare e separare orie di osservationi basate su voniabili multiple o predileppin categ . Vettori In statistica, un vettore è una sequenza di dati o osservazioni organizzate in una struttura ordinata. I vettori sono utilizzati per rappresentare e manipolare dati multivariati, ovvero dati che coinvolgono più di una variabile. Ogni elemento o componente del vettore rappresenta un'osservazione o un valore associato a una variabile specifica. In statistica, un vettore reale è una sequenza di valori numerici reali organizzati in una struttura ordinata. Questi vettori sono utilizzati per rappresentare dati numerici multivariati, ovvero dati che coinvolgono più di una variabile, e sono spesso usati in diverse analisi statistiche. I vettori reali forniscono una struttura flessibile per rappresentare dati complessi in statistica, consentendo di eseguire una varietà di analisi, tra cui analisi descrittive, analisi multivariate, regressione e molto altro. Sono una parte fondamentale degli strumenti statistici utilizzati per esplorare, analizzare e interpretare dati numerici in diversi contesti. - I = V V 2Vm - In statistica, i "vettori speciali" sono vettori che hanno proprietà specifiche o che svolgono un ruolo particolare in alcune analisi o applicazioni statistiche. Questi vettori speciali sono spesso utilizzati per scopi specifici nelle analisi statistiche e nelle operazioni matematiche. -o O e no tipologia wellme che letti u 0 - - di Louh eve - & = h I - : - - = g e= - Tipologia de contiere tutti 1 - - e - l + : < - i (posizioni) ↳ pu essere maver · : 1 = qualme si ! ..... M - - In statistica, un "vettore colonna" è un tipo specifico di vettore che è rappresentato come una matrice con una sola colonna di dati. Questa matrice unidimensionale è utilizzata per rappresentare un insieme di dati, spesso una serie di osservazioni su una variabile specifica. Un vettore colonna può contenere dati numerici, categorici o qualsiasi tipo di valore che debba essere analizzato o manipolato. * = ( Operaiomi SOMMA (I + 2) i con RI LETTORI : = Vi+ Wi vettori : Ey] Tw) MOLTIPUCAEONE PER UNO SALRE : Jagui comparente I scalore ceRJ sane moltiplicato per il valore scolare (c)i cVi : = PRODOTTO D HADAMARD E effettua tra z matrici o vettori dello stesso vedime (cioè com lo stesso midi si righe colo e o mme -- eleventi) Tale operazione produce mme muove matrice ret il prodotto dei elemento delle muove matic corrispon gui o . tor risultaute im mi ti eleventi delle a natrici originali , (V0w)i (Vow) = = é : kW PRODOTTO SCALARE DI 2 VETTORI ↳ consiste wel combinone due vettori Dati VRW Ut w . = L = kM+ kWzt w = v ( 1) fu) 2(t) = - . atogomali + con le stesse posizioni musero 3 1 . = - 4 + 1 + 3 = 0 e poi ALER DOPO + um Fat Un Wn + ... Hadaward e poi sowwere + produrre per =** = Wil prodotto scalare è u numero ve Bisogue moltiplicate be comparenti ↓ ] * Prodotto sowware FATTO : fax IL BNA SONARE : Due vettori si definiscono ortogonali quando il loro prodotto scalare è uguale a zero. In altre parole, due vettori u e v sono ortogonali se e solo se: U V . = 0 Questo significa che l'angolo tra i due vettori è di 90 gradi o, in generale, che sono perpendicolari tra loro nello spazio. URV= WVt IVII r ⑧ 0 . Mozia di m rettore : IVII = a - Um ne La norma di un vettore è una quantità utilizzata in statistica e in altre discipline per misurare la lunghezza o la magnitudine di un vettore. In statistica, la norma di un vettore può essere utile per diverse ragioni: Rappresentazione dei dati: La norma di un vettore può essere utilizzata per rappresentare le caratteristiche di un insieme di dati multivariati in modo più compatto. Ad esempio, in un'analisi multivariata, è possibile calcolare la norma di un vettore di osservazioni per rappresentare la "dimensione" complessiva dei dati. Misura di distanza: La norma di un vettore può essere utilizzata per calcolare la distanza tra due vettori. Ad esempio, la distanza euclidea tra due punti nello spazio multidimensionale può essere calcolata utilizzando la norma dei vettori che collegano i punti. Normalizzazione dei dati: La normalizzazione dei dati è una pratica comune in statistica per mettere a confronto variabili con diverse unità di misura o range di valori. La norma di un vettore può essere utilizzata come parte di un processo di normalizzazione per standardizzare i dati. Calcolo della similarità: In alcune analisi, la norma di un vettore può essere utilizzata per calcolare la similarità tra vettori. Vettori con norme simili possono essere considerati più simili tra loro rispetto a vettori con norme molto diverse. Selezione delle variabili: In analisi dei dati, è possibile utilizzare la norma dei vettori di coefficienti di regressione o di carico fattoriale per valutare l'importanza delle variabili. Le variabili associate a componenti di vettore con norme più grandi possono essere considerate più influenti nei modelli statistici. Regolarizzazione: In alcune tecniche di modellazione statistica, come la regressione ridge e la regressione lasso, la norma dei coefficienti viene utilizzata come parte di un termine di regolarizzazione per prevenire l'overfitting dei modelli. : Se la norma di un vettore è uguale a 0, significa che il vettore stesso è un vettore nullo o un vettore zero. In altre parole, tutti i suoi componenti sono uguali a zero. Il vettore stesso è il vettore nullo, che ha lunghezza zero, non ha direzione definita e si trova di solito nell'origine del sistema di coordinate. TRASPOSIZIONE : La trasposizione di un vettore è un'operazione matematica che riguarda la modifica della disposizione dei componenti di un vettore, trasformando un vettore colonna in un vettore riga o viceversa. In altre parole, la trasposizione scambia le righe con le colonne di un vettore. Questa operazione è spesso indicata con una "T" sovrapposta o un apice in alto a sinistra del simbolo del vettore, ad esempio, vi + es v=[W) : = = IVerver .... S Proprietà dellevettori operazioni chi A COMMUTATIVA : consiste mel ambier l'ordine erazione Esse vale per ambiere il senza risultato cioi l'esito - : . - le SOMMA : ↓ + k I+ Y = -Le MONIPUCAZIONE ER UNO c = SCARE : V -HADAMARR : NOW W . = -PRODOTTO N * = vk(k - SCURE : + WXX d) = Tolinostrazione de de ci + ved T - denghin] Lvettori mostre risultati e dxe sx dell', sowo uguali TH : ve : * (w d) + = Vkw + Tu d) (w I = / *d (W, +d) + ... + Ver (Water e VWs+Vidr + VWz +kdzt ... UnWm+ Unahm dell'op -> Applico la PROPR CORIUTATIVA . sulle VaW+VWetUnK+VadtVedz + Undm succe : UNIRd = GRAFIA Rappresentazione dei Vettori : L'interpretazione geometrica dei vettori in statistica può fornire una visione intuitiva e utile per comprendere i dati multivariati, le relazioni tra variabili e le operazioni statistiche. In statistica, i vettori possono rappresentare dati multivariati, dove ogni variabile è rappresentata da una dimensione nel vettore. Ad esempio, in un diagramma a dispersione a due dimensioni, i punti possono essere interpretati come vettori in uno spazio bidimensionale, con ogni coordinata che rappresenta il valore di una variabile. sempio ( : 1 = (5) + 1) I e una faccia nel pianoche origine mell'origine del piaco cartesiano le punte delle face sta mel punto del piano (VV) e . w re = ** [ 3) 2 ( . = II - 3 a(-) = - 3) + 3(2) = ⑧ vettori sono ORTOGONAU ~Rappresentazione MONTIPUGELONE PER SCARE (3) 22 1272 =[5] 1 41 - 3] [3] A : v + = - = * ↑ w= corrisponde diagonale alle del parallelogramme sul osservazione L d L I PRODOTTO a seve ueV · Fil · a vettori i spesso indicato è come può e essere al : rettor = = · = & 98 E se Inoltr it valok tra tipologie Kulle DVI more dei rettori Se O D E LETTOR PARALLEH · · , de capite Jacula cos(8) ⑧ SCALARE : angolo formano di to a vettori augolo colato utilizzando tal · , FOR = ORTOGONAU indice prodotto valere del vettori (correlazione) : auch la SIMIARIE ecuto te e angolo prodottoportivo alteriore ame allematic prodotto prodotto mullo-ORTOGONAU Contimazione limeare : Ce attenuto cettore in - moltiplicato cumo ↑ Um vettor y K costanti T =E = x = lä si · * = I in se il cafficiente costante) · Br Bix+ + + = in rece (2) e (2) x dei vettori X .... tali de : ... se esistono Br gewete + grande statistich Es : Stabilite r ..... · an combinazione lineare dice e 7 per combine udo lo sendd altri vittori wias. le di K perchi ⑫ somo le unità variabili e M sono y( e roubicazione lineare dei retton [EF T2) 787 [2] Te 13- [2] 1) Test M I + (+ Br t = => + - sa - - = + E e X : = 1 + !E es : stablic 2 = :7 se Br x'+ BiX se Or e di combinatavaj wacto -F]+[] [B+ B *** <BARRA B: En I NOWE no comb . linece Relazione ta COMB ULEARE SPEGREX UREARE MULEVARIAZ . Le combinazioni lineari e la regressione lineare multivariata sono concetti correlati in statistica, entrambi legati alla rappresentazione e all'analisi di relazioni tra variabili. Ecco come sono collegati: Combinazione Lineare: • Una combinazione lineare è una somma ponderata di variabili o vettori, dove ciascun termine è moltiplicato per un coefficiente e quindi sommato. • Ad esempio, supponiamo di avere due variabili X e Y e di voler creare una nuova variabile Z che sia una combinazione lineare delle due. La combinazione lineare potrebbe essere espressa come Z = aX + bY, dove "a" e "b" sono coefficienti che pesano rispettivamente X e Y. • Le combinazioni lineari sono utilizzate per creare nuove variabili che possano catturare relazioni o pattern specifici tra variabili esistenti. Regressione Lineare Multivariata: • La regressione lineare multivariata è una tecnica statistica che modella la relazione tra una variabile dipendente (o risposta) e due o più variabili indipendenti (o predittive) attraverso una relazione lineare. • In una regressione lineare multivariata, l'obiettivo è trovare i coefficienti che meglio descrivono la relazione lineare tra le variabili indipendenti e la variabile dipendente. • Ad esempio, una regressione lineare multivariata potrebbe essere espressa come Y = aX1 + bX2 + cX3 + ... + e, dove Y è la variabile dipendente, X1, X2, X3, ecc. sono variabili indipendenti e "a," "b," "c," ecc. sono coefficienti da stimare. • La regressione lineare multivariata viene spesso utilizzata per fare previsioni o per capire come le variabili indipendenti influenzano la variabile dipendente. - - In breve, le combinazioni lineari si riferiscono a combinazioni ponderate di variabili utilizzate per creare nuove variabili o catturare relazioni complesse, mentre la regressione lineare multivariata è una tecnica statistica che mira a modellare la relazione tra una variabile dipendente e più variabili indipendenti in modo da fare previsioni o analizzare l'effetto delle variabili indipendenti sulla variabile dipendente. Le combinazioni lineari possono essere utilizzate all'interno di una regressione lineare multivariata quando si costruiscono modelli complessi che coinvolgono varie combinazioni di variabili indipendenti. Consideriamo I = spece u = 1 de I é i faciglia X - = in in x im 1 rotolito acco DIPEMENTE) x I X no famiglione contiene be (VARABILE X* = X I de vettore -d figli carico a osservazioni = Bo ↓ + Cos I é legato a variabile BIX + BeX d la sostenere famiglie FISS1 sempre ammuo · uma LINEARE : COMBINAZIONE I di tutte le altre variabili dipendenti . ere reddito= . Lo spese COMBINAIONE Fidentification problem UREARE II METODO = cio de mi espetto] DETERMINISTICO La combinazione lineare è considerata un metodo deterministico perché il suo risultato è completamente determinato dalla combinazione di coefficienti specifici assegnati a ciascuna variabile. In altre parole, una volta che hai fissato i coefficienti per le variabili coinvolte in una combinazione lineare, il risultato sarà sempre lo stesso quando applicato alle stesse variabili. Ecco perché la combinazione lineare è considerata deterministica: Coefficienti fissi: Nella combinazione lineare, hai coefficienti specifici (pesi) associati a ciascuna variabile. Questi coefficienti sono costanti e non cambiano durante l'applicazione della combinazione lineare. Risultato prevedibile: Poiché i coefficienti sono fissi, puoi calcolare il risultato esatto della combinazione lineare per qualsiasi insieme di valori delle variabili. Non c'è alcuna casualità o incertezza associata alla combinazione lineare. Riproducibilità: Quando applichi la stessa combinazione lineare agli stessi dati o variabili con gli stessi coefficienti, otterrai sempre lo stesso risultato. Non c'è aleatorietà coinvolta. Consistenza: La combinazione lineare è basata su principi matematici solidi e le operazioni di somma e moltiplicazione coinvolte sono ben definite e deterministiche. Ii limeale MULTIVARATA : Regressione ↓ zabili - ↳ sinile alle é CL . con me variabile di l'aggiunto ramdom che dorna uma delle · de ipotesi I verificare = Bu costanti (BorBI) rappresentano deuti en y voriebli indipen BiX Bi + A VARABILI NOTE . OBIETTINO DEL Stinone coefficienti : + . l'effetto delle miminizzate MODELLO : ha degli errori(2) E alwaus Definizione in source Vettore modo de dei voniare dere quedati ERRORE può wo in wedie = essele o : K vettori di dicrensione a si dicou limeaente dipendenti se lono si può scrivere love carbica. alneno umo di come limeare altri Quando resto mou é wai pox degli U di se no de sowe indipenden . - & - Torna - & R rettori IY I..... V di in sou limeoente lunghezza solo se e>Ilequazione vettoriale Be'+ Be It denti se e ha come unice soluzione Aut Bet BK P ... = ... inclipen. Bustk + ESERCEO : 15] =[1] vit] Stabilissi rettori se vor ① Gone to sono lineamente indip dipendente . combinazione limeone : ud B07 RET + calcolar be - sow 5) 0737877752] :T27 + N3 If 3' rettore (V) i quello de pri scritto essere liveau degli combinazion IUBERO M QUALUNOLE VALORE come V V alti IB]]+ IBet 23] Te I - ReteE i I alle -> = B1 2B3 + 0 = B1 B2 3B3 0 B2 2Bs + = 2B1 = + - = 2B3 0 : - E R1 23 33 - B2 21 = + - B3 23 ESEMPIO 0 2 + Ivorugo Rougo = : : si -> - 0 I B1 + B3 0 -> B3 Be B2 2B3 B2 2 B = definisce raugo di un = 2B1 0 raugo -E] nel si M = - 3 N* DRENN dei + 2( B1) - . Il Taugo PERCHE M RO ESSELE - INDIP e lumi sempre e m , il memax winde/ugual seguenti vettori 2 elen rango E =I NON 0 = di Krettri insieme di rettori liwearwente indipendenti del min GK, m Calcolan il - - Br # 23 Re = = & 4 - = = = = vettori liwarweute percle &D indipendenti sono ESPRESSO COME COA COMBINAZ . HAEARE D PRECERia[nou e peico né multiplo vettore) i - ué souve del 2 Per capire se il rango di un insieme di vettori supera o no la dimensione del vettore, puoi considerare la seguente regola: Se il rango dell'insieme di vettori è uguale alla dimensione del vettore, allora gli insiemi di vettori sono linearmente indipendenti e possono generare tutto lo spazio vettoriale corrispondente alla loro dimensione. In altre parole, se hai un insieme di vettori in uno spazio vettoriale di dimensione n e il rango di questi vettori è anche n allora puoi concludere che sono linearmente indipendenti e possono generare tutto lo spazio vettoriale. D'altra parte, se il rango è inferiore a n significa che ci sono delle relazioni lineari tra i vettori, e non possono generare tutto lo spazio vettoriale di dimensione n. In tal caso, gli insiemi di vettori sono linearmente dipendenti e non possono coprire completamente lo spazio vettoriale. Esempio : 28] - 5 veto] dimensione spacio vettoriale neuge · UTOM : 2 3 quindi non possono generone tutto lo spacio UN Di e . tdicensionale ⑱ se il = sabber lina zweute rango fosse 3 allone lo spazio retoriale generere tutto - indipendenti e potrebber dene del vettate auperan la lunghezza reugo a Il VIT Il M = Risolo : IBITB = [8] T+ 2 (RI4= ⑧ Se trovi una soluzione diversa da quella in cui tutti i coefficienti sono zero=0), allora gli insiemi di vettori sono linearmente dipendenti. Altrimenti, se l'unico caso in cui il sistema ha una soluzione è quando tutti i coefficienti sono zero, allora gli insiemi di vettori sono linearmente indipendenti. Il rango degli insiemi di vettori è uguale al numero massimo di vettori linearmente indipendenti in quell'insieme. -> 10 = an I - = 1 1 2 -V ↑ S - -V9 - 1 Combinando i z ultori, aleuge · ⑭ +V tutti i vettori del piano · I cettori - 90 ORTOGONAU sono sempre indipendenti DIRENDENTIPO Proiezione di : - proiezione Analisi dei Dati: In analisi dei dati, la proiezione di un vettore su un sottospazio può essere utilizzata per ridurre la dimensionalità dei dati. Ad esempio, nella riduzione delle dimensioni con l'analisi delle componenti principali (PCA), si calcolano le proiezioni dei dati su nuovi assi principali per ridurre il numero di variabili. Proprietà vettori a : lunghezze m,se di limearente somo (I rettor ha / W4 indipendenti 2 ramgo artogonali somo l'insieme dei e io . & FAIMOSTRAZIONE Ipotesi Tesi &W : = 0 indipendenti REFCA dimostratione parto dav Ie : GK+GW =07) (1 (2 0 cioé A dimostrazione cior : PER ASSU : se de e no l'ipotesi vene e = = AT-> Not ti divostro da e de rene auch la essere vero Esist var e vene le tesi a e s Not supporiaco viano limearmente dipendenti = w = Cipotesi assurole NT) cI X*w = (ipotesi vera) 0 Calcoliamo VW ↓A W VWitkWc+ = fatto de W =C usando il + ... VWm V[cV) k(CV) + w I I clXll 0 = Osservazione : Ie erewo = c (V Ve + + Vn) CIV + ... = cVi cX = cioé vettori qualunque purché atogonali quindi foe . ad in = = = Vm(cVm) allone be conditions WIK=0 Libe cVllio condan assurdo percli se Hull 0 allore V 0 (impossibil W to Se c 0 allone O ... A Wi * + + = W = - = <V = & (impossibile) DUNALE A TES NON SI PE REGARE Dimostronome ORTOGONAUTE : Proiezioni moza Px(w) consideriaco il rettore I di mozua a CAVI =1 ne lettore di auch versote)e in vettore u to si definiscono chiare si : = I proiezione di Zenme (XW) pw) W (vw) proiezione - = di welle spazio artogonale al Dinastiano de Ve PW) saw atoganali Calcolo il prodotto scabare . + 2 P (w) x=(wi)v) P((() = = w - (wik k(w (wi)k) k(wi wt)Ve)+ - - + ... + = Un (Wn (E) (n) - kW-(Vt VeW-(WX)+ WWm-(W) V =s1-NORMA t IVII EV ~ -V Cre NWa+EWe+VWa) (WEr) (Va V-+ V) ~ + = ... - + ... = - - ⑧ & Spazio vettoriale = l'insieme sawna wo : IR = moltiplicatione per u Spazi dal NOTAGON e dei vettori reali var spatio e l'operazion di saler costituisc - _ dimensione essequate toche di vettore vettoriale . di dicrension