Anno accademico: _______ BIOLOGIA MOLECOLARE Dispensa Corso di Biotecnologie Proprietario/a: _____________________________ UNIVERSITÀ DI FERRARA BIOLOGIA MOLECOLARE La struttura degli acidi nucleici In questo capitolo andremo a prendere in considerazione diversi argomenti, quali: ● Struttura chimica degli acidi nucleici ● Struttura fisica del DNA: la doppia elica e i suoi parametri strutturali ● Topologia del DNA e DNA topoisomerasi ● Struttura dell’RNA Struttura chimica degli acidi nucleici GLI ACIDI NUCLEICI ● DNA e RNA sono catene polinucleotidiche (= polimeri lineari di nucleotidi) o Nel caso dell’RNA queste catene possono avere migliaia di nucleotidi o Nel caso del DNA si arriva persino a milioni di nucleotidi ● I nucleotidi sono quindi l’unità fondamentale del DNA e RNA e hanno tre componenti: o Uno zucchero pentoso (cioè a 5 C) ▪ Nel caso del DNA lo zucchero è il deossiribosio ▪ Nel caso dell’RNA lo zucchero è il ribosio o Una base azotata o Uno o più gruppi fosfato Quando lo zucchero si lega alla base azotata, si va a formare quello che si chiama NUCLEOSIDE. Se a questo si associa poi un gruppo fosfato si parla di NUCLEOTIDE. Posso però avere anche più di un gruppo fosfato, questo perché, quando il nucleotide non è incorporato all’interno di un acido nucleico, si trova solitamente nella forma di NUCLEOSIDE TRIFOSFATO (una base, lo zucchero e tre gruppi fosfati). Quando, invece, il nucleotide è incorporato all’interno della catena polinucleotidica, si trova nella forma con un solo gruppo fosfato. STRUTTURE DEI COMPONENTI CHIMICI DEI NUCLEOTIDI Come abbiamo detto, lo zucchero è un pentoso, cioè una molecola con 5 atomi di carbonio numerati da 1 a 5 all’interno del nucleotide. In particolare, per distinguere i carboni dello zucchero da quelli delle basi, vengono indicati con l’apostrofo. I nucleotidi del DNA contengono il deossiribosio, che differisce dal ribosio (presente nell’RNA) per l’assenza del gruppo ossidrilico al carbonio 2’. La seconda porzione del nucleotide è la base azotata, una molecola a struttura ciclica legata al carbonio 1’ dello zucchero (sia che sia ribosio che deossiribosio). In particolare, nel DNA possiamo trovare 4 diverse basi azotate legate allo zucchero à adenina, guanina, citosina e timina. L’adenina e la guanina sono delle PURINE, caratterizzate dalla presenza di un doppio anello nella loro struttura. Citosina e timina sono invece delle PIRIMIDINE e presentano un singolo anello. Ovviamente anche i carboni delle basi vengono numerati, ma senza apostrofo. Tre di queste basi (adenina, guanina e citosina) vengono a trovarsi anche nell’RNA, ma la timina è sostituita da una diversa pirimidina, ovvero l’uracile. Queste basi azotate sono legate allo zucchero attraverso un legame chiamato N-b-glicosidico, questo perché si instaura tra il carbonio 1’ dello zucchero e l’azoto (ecco il perché della N del legame) della base purinica o pirimidinica (nel caso delle purine si intende l’azoto 9, nel caso delle pirimidine l’azoto 1). Il beta indica la posizione del legame glicosidico rispetto all’anello del pentoso. Beta sta a indicare che il legame sta verso l’alto rispetto al piano dell’anello, mentre alfa sta verso il basso. L’ultima porzione del nucleotide è il gruppo fosfato, il quale è legato al C5’ dello zucchero. Questo legame si chiama fosfoesterico. Ricorda: senza gruppo fosfato la molecola si chiama nucleoside. NOMENCLATURA Per quanto riguarda i nomi dei nucleotidi, è difficile trovarli scritti come acido adenilico, etc., più frequentemente li troviamo come la loro abbreviazione (AMP, GMP, etc. per l’RNA, dAMP, dGMP, etc. per il DNA). Le unità strutturali (i nucleotidi), per essere più specifici, sono dette: ● Nel DNA: deossiribonucleotidi (= deossiribonucleosidi 5’ monofosfato) ● Nell’RNA: ribonucleotidi (= ribonucleosidi 5’ monofosfato) NOMENCLATURA DEI GRUPPI FOSFATO NEL NUCLEOSIDE TRIFOSFATO Come già detto, i nucleotidi, quando non sono incorporati nel DNA o RNA, possono essere dei nucleosidi trifosfati. Questi 3 gruppi fosfato vengono indicati rispettivamente con alfa, beta o gamma, a seconda che siano prossimali o distali rispetto al C5’ dello zucchero (quello più vicino sarà quindi l’alfa). Chiaramente, quando il nucleotide è incorporato in una catena polinucleotidica, rimane solo il gruppo fosfato alfa, mentre gli altri due vengono persi. FORMAZIONE DEL NUCLEOTIDE MEDIANTE ELIMINAZIONE DI ACQUA La formazione di un nucleotide e la formazione dei due legami, ovvero il legame N-betaglicosidico e il legame tra zucchero e gruppo fosfato, vengono a crearsi con la perdita di due molecole di H2O. Una base si viene ad unire perciò allo zucchero per formare il legame beta-N-glicosidico con il C1’ dello zucchero perdendo una molecola di acqua (data dall’OH dello zucchero e l’H della base); si crea così il nucleoside. La formazione del nucleotide, poi, prevede anch’essa l’eliminazione di una molecola d’acqua data dall’H del fosfato e l’ossidrile del C5’. BASI MODIFICATE CHE SI POSSONO TROVARE NEL DNA E NELL’RNA Sono delle basi meno frequenti che però possiamo trovare nelle catene polinucleotidiche. Nell’immagine sottostante: ● Nella parte in a) sono tipiche le basi modificate che troviamo a livello del DNA, che hanno soprattutto dei sostituenti metilici legati all’azoto o agli atomi di C oppure possono avere anche dei gruppi ossidrilici ● In b) abbiamo invece le basi modificate che troviamo nell’RNA I LEGAMI FOSFODIESTERICI NEGLI ACIDI NUCLEICI Il passaggio successivo chiaramente è che i singoli nucleotidi devono essere legati per formare il polimero. In particolare, questo polimero viene chiamato polinucleotide (> 50 nucleotidi) o oligonucleotide (fino a 50 nucleotidi). Nell’immagine a lato vediamo una struttura di un trinucleotide a DNA e di una molecola similare a RNA (quindi una piccola molecola con soli 3 nucleotidi, ovvero un polimero di nucleosidi monofosfato). Le due molecole sono analoghe, l’unica cosa che cambia è appunto l’assenza della timina e presenza di uracile nell’RNA. Ma come sono legati questi nucleotidi? I nucleotidi vengono legati gli uni con gli altri mediante un legame fosfodiestere, ossia un legame che si instaura tra il gruppo fosfato legato al C5’ di un nucleotide e il gruppo OH al C3’ del nucleotide “precedente”. Si chiama fosfodiestere per la presenza di un atomo di fosforo e per la presenza dei due legami esteri, il legame C3’-O-P da una parte e il legame C5’-O-P dall’altra. Per essere più precisi, il legame dovrebbe essere chiamato 3’- 5’ fosfodiestere. Naturalmente, un’importante caratteristica di questi polinucleotidi è il fatto che le due estremità della molecola non sono uguali tra di loro. Vediamo infatti come, nell’immagine, la parte in alto termina con un 5’fosfato e viene chiamata estremità 5’ o semplicemente anche estremità 5’-P. All’altra estremità (3’), invece, abbiamo un gruppo OH libero e in questo caso si parla di estremità 3’ oppure estremità 3’-OH. Quindi, la formazione di questi legami fosfodiesterici tra i diversi nucleotidi conferisce a ciascun polinucleotide due estremità diverse. La possibilità di distinguere chimicamente le due estremità fa sì che la molecola possieda una direzionalità, che va dal 5’ al 3’. Quindi, è possibile, avendo estremità diverse, che io possa avere una diversa direzionalità; può essere quindi sia 5’-3’ (dall’alto verso il basso) ma anche 3’-5’ (dal basso verso l’alto). Questo sarà molto importante perché permette di creare quella bidirezionalità tipica della doppia elica. NB: nelle cellule viventi i polinucleotidi vengono allungati sempre nella direzione 5’-3’. Quindi, i nucleotidi vengono aggiunti all’estremità 3’OH libera, questo perché in natura esistono enzimi capaci di catalizzare solo questo tipo di allungamento. Struttura fisica del DNA: la doppia elica e i suoi parametri strutturali La struttura a doppia elica come la conosciamo oggi è stata riportata per la prima volta nel 1953 da Watson e Crick, che la pubblicarono su “Nature”. La loro scoperta originò anche dall’analisi di immagini di diffrazione dei raggi X di fibre di DNA ottenute da Rosalind Franklin e Maurice Wilkins, che lavoravano nello stesso laboratorio. Grazie a questa scoperta, Watson e Crick, insieme a Wilkins, ricevettero il premio Nobel. LA STRUTTURA A DOPPIA ELICA DEL DNA La struttura a doppia elica che noi conosciamo è una struttura costituita da due filamenti, dove i due polinucleotidi sono disposti in modo tale che lo scheletro zuccherofosfato sia rivolto verso l’esterno dell’elica, mentre le basi azotate verso l’interno. Vediamo inoltre che le basi di un filamento si appaiano alle basi dell’altro filamento mediante dei legami idrogeno, a creare una sorta di “scala a pioli”. Le basi si appaiano le une alle altre secondo dei legami specifici, i legami idrogeno appunto, che determinano degli appaiamenti di Watson e Crick, che sono specifici in base alla sequenza; in particolare: ● la guanina si appaia, formando 3 legami idrogeno, con la citosina del filamento adiacente ● l’adenina, invece, si appaia con la timina, mediante due legami idrogeno La doppia elica descritta da Watson e Crick, tra l’altro, prevede caratteristiche strutturali specifiche à ha un diametro di 20 Angstrom (2 nm) e un giro d’elica corrisponde a 34 Angstrom (3,4 nm), pari a 10,5 coppie di basi. Inoltre, la doppia elica si rivolge intorno a un asse centrale secondo un andamento destrorso (normalmente). CIASCUNA BASE SI TROVA NELLA SUA FORMA TAUTOMERICA PREFERITA Gli appaiamenti di basi secondo Watson e Crick richiedono che le basi si trovino nella loro forma tautomerica corretta (quella preferita). Ad esempio, noi sappiamo che la citosina normalmente ha un gruppo amminico, mentre la guanina un gruppo chetonico. Esistono però anche altre forme tautomeriche delle basi à ad esempio la citosina con un gruppo imminico e la guanina con un gruppo enolico (forme tautomeriche più rare ma che possono avvenire e causare errori di sintesi del DNA). Come possiamo vedere dall’immagine, esiste una forma tautomerica preferita (per gli appaiamenti tra basi canonici) ed è indicata dalla freccia più spessa. LA STRUTTURA A DOPPIA ELICA DEL DNA La struttura della nostra doppia elica, oltre ad avere un avvitamento destrorso, non è affatto regolare. Si possono infatti evidenziare due solchi spiraliformi lungo il decorso della doppia elica. Il solco maggiore è più ampio e profondo (larghezza di 22 Angstrom o 2 nm). Invece, l’altro solco è più stretto e viene chiamato solco minore (larghezza di 12 Angstrom o 1,2 nm). Solitamente, le proteine che interagiscono con il DNA, lo fanno proprio a livello del solco maggiore, che è più ampio ed è solito accogliere strutture ad alfa-eliche delle proteine che interagiscono con il DNA stesso. Ritornando alla nostra struttura a doppia elica (struttura secondaria che possiede il DNA) dobbiamo ricordare che i due filamenti hanno due caratteristiche: ● Abbiamo già parlato degli appaiamenti specifici tra le basi secondo Watson e Crick o a causa di questo appaiamento altamente specifico le sequenze dei due filamenti polinucleotidici sono complementari à questo significa che la sequenza di un filamento può essere dedotta dalla sequenza dell’altro. ● I due filamenti della doppia elica hanno un orientamento anti-parallelo, cioè i due polinucleotidi decorrono in senso opposto (uno in direzione 5’-3’ e l’altro in direzione 3’-5’) Bisogna poi aggiungere che la stabilità della doppia elica è assicurata da due tipi di interazioni chimiche: ● L’appaiamento tra basi complementari (con legami idrogeno) ● Oltre a questo, la doppia elica è stabilizzata anche dall’impilamento delle basi, le quali sono impilate le une sulle altre come una sorta di gradini di una “scala a pioli”. Questo impilamento va perciò a stabilizzare la conformazione della doppia elica, in quanto implica la presenza di una serie di forze attrattive tra le varie coppie adiacenti che aumentano la stabilità della doppia elica à queste forze attrattive sono soprattutto delle forze deboli (interazioni di Van der Waals). C’è da dire che queste coppie di basi impilate le une sulle altre non sono sovrapposte perfettamente, ma solo parzialmente perché a causa della rotazione dell’elica, ogni coppia è girata rispetto a quella adiacente. Questa parziale sovrapposizione è però sufficiente alle interazioni di Van der Waals appena descritte. MODELLO DEL DNA IN FORMA B La struttura che abbiamo descritto finora corrisponde al modello del DNA in forma B. Questo modello è quello che è stato descritto da Watson e Crick e che ritroviamo in soluzione acquosa e anche negli esperimenti descritti con immagini da Rosalind Franklin. La struttura a doppia elica in forma B è favorita da condizioni di elevata umidità ed è la più comune in vivo e in soluzione acquosa in vitro, ma non è l’unica possibile à esistono altre forme, tra cui le più note sono: ● La forma A à ha molte differenze rispetto alla forma B; le coppie di basi hanno una maggiore angolatura, le grandezze sono diverse (diametro, passo dell’elica, etc., inoltre le coppie di basi per giro d’elica sono 11 contro le 10,5 della forma B). Il DNA A ha una forma più tarchiata rispetto alla forma B. Una cosa che le accomuna è il senso di avvolgimento dell’elica, entrambe hanno un senso destrorso. Il DNA assume questa forma in condizioni di bassa umidità, questo in vitro. Questa forma è stata però trovata anche in vivo, quindi in soluzione acquosa, in un caso specifico, ovvero in duplex che contengono uno o due filamenti di RNA à quindi duplex formati da due filamenti di RNA oppure un filamento di DNA e uno di RNA vanno ad assumere questa forma A, questo perché la presenza del ribosio nell’RNA, che possiede il gruppo OH in posizione 2’, impedisce alla molecola di RNA stesso di assumere la classica forma B. ● La forma Z (“zig-zag”) à molto diversa rispetto alle precedenti. Ha un senso dell’elica sinistrorso. Ha poi un diametro di 18 Angstrom e un passo dell’elica di 46 Angstrom, il che dimostra che questa doppia elica ha una struttura più magra e allungata. Altro elemento importante è che l’impalcatura ha un andamento insolito a zig-zag (da cui il nome della forma); questa impalcatura è dovuta alla particolare conformazione del legame glicosidico, che risulta essere per le forme B ed A “anti”, mentre per la forma Z abbiamo un’alternanza di anti e di syn. Cosa vuol dire anti e syn? Stanno ad indicare l’orientamento rispetto al legame glicosidico tra, nel caso specifico, la guanina e lo zucchero. Nella conformazione anti, zucchero e base (guanina) si trovano da parti opposte rispetto al legame beta-N-glicosidico. Invece, nel caso della conformazione in syn, si ha che la base e lo zucchero si trovano dallo stesso lato. Quindi: o Il DNA Z è causato dal cambiamento di orientamento del legame glicosidico tra la guanina e il deossiribosio o La forma a zig-zag della forma Z è determinata da un’alternanza di conformazioni syn (tipica della guanina e in generale delle purine) e anti (tipica della citosina e in generale delle pirimidine) di nucleotidi contigui. Perciò, la presenza di citosina e guanina alternate, almeno in vitro, determina questa conformazione a zig zag. o Nelle forme B ed A la conformazione del legame glicosidico è sempre anti Il DNA Z è stato osservato in vitro, studiando dei DNA di sintesi (sintetici), in cui C e G si alternano lungo questa sequenza. Però, è stato osservato che anche nel DNA presente nelle cellule, solitamente in forma B, alcuni tratti possono essere in forma Z. In particolare, nella stessa molecola di DNA possono coesistere tratti di DNA B e tratti di DNA Z. Nell’immagine a lato possiamo anche vedere il punto dove il DNA subisce questo cambiamento di conformazione da Z a B, determinato da questa estrusione a livello della giunzione della timina e adenina rispettivamente. Sono persino state isolate delle proteine che si legano in maniera specifica a questi tratti di DNA Z all’interno del DNA B, anche se non è ancora chiaro il loro ruolo. Questi tratti sono stati rinvenuti sia in cromosomi batterici che eucariotici, ma il ruolo non è stato ancora chiarito, anche se si suppone possano avere importanza nella ricombinazione genetica o nella regolazione dell’espressione genica. DNA INTRINSECAMENTE CURVO (O PIEGATO) Nelle immagini viste finora della doppia elica, essa appare come una struttura regolare. In realtà questo non è il caso, questo perché il DNA può avere delle sue curvature intrinseche. Nell’immagine a lato possiamo vedere, indicate dalle frecce, alcune paia di basi adiacenti (es. A-T/A-T) à la presenza di queste due coppie fa sì che si vengano a creare dei piccoli piegamenti nella nostra doppia elica, che quindi non è più così regolare ma si ripiega un poco. Questo è dovuto al fatto che queste due paia di basi adiacenti A-T hanno un’intrinseca tendenza a piegarsi dalla parte del solco minore, mentre due paia G-C hanno una tendenza inversa (verso il solco maggiore). Ne risulta che la doppia elica non è perfettamente dritta ma presenta dei piccoli piegamenti. Se poi un tratto di DNA contiene, come nel caso C della figura, due o tre paia di basi A-T consecutive con una certa periodicità (per esempio circa 10 paia di basi consecutive ripetute ad ogni giro d’elica), i piccoli angoli di ripiegamento verso il solco minore si sommeranno tra di loro, producendo una curvatura dell’asse della doppia elica piuttosto apprezzabile. Questa curvatura indica un DNA intrinsecamente curvo. Rivedremo questo concetto quando parleremo delle sue funzioni a livello della struttura della cromatina. DNA A TRIPLA ELICA Finora abbiamo parlato solo di acidi nucleici che si trovano in forma di singolo filamento o di duplex (doppio filamento). Poi è stato scoperto che in casi molto particolari si possono formare anche delle regioni a tripla elica. Questo è stato osservato in vitro, non in vivo, però la scoperta ha riscosso un certo interesse perché questo tipo di struttura potrebbe offrire la possibilità di sviluppare degli inibitori specifici per bloccare l’attività di geni bersaglio (quindi con uno scopo potenzialmente terapeutico). Ad ogni modo, questa struttura è stata osservata per DNA duplex di 20-30 coppie di basi aventi un filamento di sole purine accoppiato con un filamento complementare di sole pirimidine. Questo duplex è quindi in grado di interagire, formando una tripla elica, con una terza catena polinucleotidica più corta (che si insinua nel solco maggiore), composta solo da pirimidine, complementare alla sequenza purinica del duplex. I tipi di interazione che si formano tra la terza catena e il duplex sono sempre legami idrogeno, diversi però da quelli di Watson e Crick, che prendono il nome di interazioni o appaiamenti di Hoogsten (indicati con un puntino). Nell’immagine C a lato possiamo vedere come A e T del duplex interagiscano in maniera normale tra di loro; ci sono però poi altri legami idrogeno, diversi da quelli canonici, tra A e T della terza catena. QUARTETTI DI G (TETRAPLEX G) Un altro tipo di interazione insolita sono i quartetti di G o tetraplex G. In questo caso, questa struttura si forma tra 4 tratti di DNA o RNA a singolo filamento che contengono ciascuno 3 o più G consecutive. In questo modo, i 4 tratti di G si trovano sullo stesso piano e formano delle interazioni (proprio una specie di quartetto), anche in questo caso si tratta di legami idrogeno non canonici, ma di Hoogsten. Questo tipo di quartetto è stato osservato in laboratorio studiando i telomeri. I telomeri, che di solito consistono di segmenti ricchi di G, quando saggiati in laboratorio, hanno una certa propensione a formare dei tetraplex. Non è noto se queste strutture abbiano un ruolo nella stabilizzazione e nel riconoscimento dei telomeri in vivo. PALINDROMI E SEQUENZE RIPETUTE E INVERTITE Un’altra possibilità di strutture secondarie riguarda i palindromi e le sequenze ripetute e invertite. In letteratura, un palindromo è una frase che può essere letta in entrambe le direzioni e avere lo stesso significato. Per quanto riguarda la biologia molecolare, abbiamo due sequenze ripetute adiacenti (non interrotte) e abbiamo poi che questa intera sequenza è ripetuta nel filamento sottostante. Se, invece, questa sequenza ripetuta e adiacente viene interrotta da alcune basi si parla di sequenza ripetuta e invertita. Queste sequenze possono essere interessanti per andare a creare delle strutture secondarie. Per esempio, se io riprendo la sequenza ripetuta e invertita di prima, attraverso interazioni intramolecolari tra le basi della mia sequenza ripetuta e invertita, si creano su ciascun filamento delle strutture con stelo e ansa, creando in questo caso una struttura cruciforme. Se questa sequenza invertita e ripetuta, poi, la ritroviamo su un DNA a singolo filamento o un RNA, abbiamo una struttura a forcina o “stem-loop”. Queste strutture a forcina si hanno spesso nell’RNA a singolo filamento. LE PROPRIETÀ TERMICHE DEL DNA: LA DENATURAZIONE REVERSIBILE Le soluzioni di DNA a doppio filamento, o anche di RNA, se si trova a doppia elica, sono molto viscose a pH 7 e temperatura ambiente (25°C). Quando queste soluzioni vengono sottoposte, ad esempio, a temperature superiori agli 80 gradi, osserviamo che la viscosità diminuisce bruscamente, indicando che il DNA ha subito un cambiamento fisico, che non è altro che una denaturazione o “fusione” della nostra doppia elica di DNA o RNA. La denaturazione avviene quindi quando il DNA viene riscaldato a temperature superiori a 80 gradi e questo riscaldamento determina una separazione delle eliche perché vengono distrutti i legami idrogeno tra le basi appaiate e le interazioni deboli (di Van der Waals) che osserviamo nell’impilamento delle basi. In questo modo, i due filamenti della doppia elica vengono separati. Ovviamente, in questo processo, non si vanno a rompere i legami covalenti, ma solo quelli deboli (a idrogeno e di Van der Waals). Quando poi noi portiamo la temperatura di nuovo a valori canonici, a temperatura ambiente, si nota che i due filamenti separati si riannilano/riappaiano; quindi, si parla di Annealing. Quindi, denaturazione e annealing costituiscono un processo reversibile. ASSORBIMENTO DELLA LUCE UV DA PARTE DEL DNA È possibile andare a monitorare la transizione del DNA da doppio a singolo filamento analizzando l’assorbimento della luce UV del nostro campione di DNA man mano che viene riscaldato. Come possiamo vedere dall’immagine a lato, il valore di assorbanza del DNA a temperatura ambiente è di 260 nm, questo perché il DNA ha un massimo di assorbimento dei raggi UV a questo valore, dovuto agli anelli che costituiscono le sue basi. Andando a riscaldare la soluzione e monitorando l’assorbanza, si può notare come a un certo punto l’assorbanza aumenta fino ad arrivare a un plateau. Inoltre, è possibile calcolare il Tm (Temperatura di melting o fusione), che rappresenta la temperatura alla quale metà del DNA nel campione è denaturato. L’assorbanza del doppio filamento è più bassa di quella del singolo filamento perché il DNA assorbe la luce UV attraverso le basi, in particolare attraverso gli anelli aromatici. Quando le basi sono appaiate e impilate le une sulle altre, come nella doppia elica, è ovvio che questo determina una diminuzione della capacità del doppio filamento di assorbire la luce UV à questo è il motivo per la minore assorbanza e questo fatto si chiama effetto ipocromico. Viceversa, man mano che il DNA si denatura, le basi sono libere dall’impilamento e dall’appaiamento e perciò possono assorbire più facilmente la luce UV e quindi l’assorbanza aumenta fino ad arrivare a un picco massimo quando tutto il DNA si è denaturato. L’aumento di assorbimento che osserviamo in questo caso è chiamato effetto ipercromico. NB: Una molecola di DNA ricca in GC ha una temperatura di melting (Tm) maggiore di una molecola di DNA ricca in AT, questo perché nell’accoppiamento GC si hanno 3 legami idrogeno, mentre nell’accoppiamento AT ho solo 2 legami idrogeno; perciò, avrò più legami idrogeno da separare in una sequenza GC rispetto a una sequenza AT e quindi necessito di una Tm maggiore chiaramente. Topologia del DNA e DNA topoisomerasi SUPERAVVOLGIMENTI Il DNA cellulare deve essere estremamente compattato e possedere un livello di organizzazione molto elevato dal punto di vista strutturale. Possiamo fare un paragone dello stato del DNA all’interno delle cellule, almeno come primo livello di organizzazione strutturale, comparando la doppia elica al filo del telefono. Oltre al normale avvolgimento intorno a un asse centrale in senso destrorso, il filo del telefono, come anche il DNA, può ulteriormente attorcigliarsi su sé stesso, ovvero può superavvolgersi (avvolgimento di qualcosa che è già avvolto). Ricapitolando, il DNA a doppia elica ruota attorno al suo asse centrale (avvolgimento). Un’ulteriore torsione o ripiegamento di tale asse su sé stesso determina un superavvolgimento (struttura terziaria) del DNA. DUE FORME DI WRITHE (SUPERAVVOLGIMENTO) In particolare, sono descritte due forme di superavvolgimento (anche chiamate Writhe) del DNA, sia a livello eucariotico che procariotico. Questi superavvolgimenti possono essere di due tipi: ● Interwound o writhe plectonemico à in questo caso l’asse longitudinale della doppia elica è avvolto su sé stesso ● Superavvolgimento toroide o a spirale à qui l’asse longitudinale della doppia elica è avvolto come attorno a un cilindro, da cui il nome toroide. LINKING NUMBER Il superavvolgimento è un aspetto intrinseco alla struttura terziaria del DNA. Per studiare dal punto di vista quantitativo il superavvolgimento ci si è avvalsi di una branca della matematica chiamata topologia. Il Linking number è una misura del superavvolgimento del DNA. ● Il numero di legame (Lk, Linking number) è una proprietà topologica del DNA a doppio filamento, cioè una proprietà che può essere modificata soltanto dalla rottura e riunione (formazione di legami fosfodiesterici) dell’ossatura di uno o entrambi i filamenti del DNA. o Chiaramente questo non avviene da solo, ma solo con l’intervento di un particolare tipo di enzimi, le topoisomerasi. ● Per calcolare l’Lk si usa l’equazione: 𝐿𝑘 = 𝑇𝑤 + 𝑊𝑟 ● Tw = Twist (torsione), ovvero il numero di giri della doppia elica rispetto all’asse centrale (grado di avvitamento (o avvolgimento) della doppia elica) (per sapere il numero di giri devo conoscere il numero di coppie di basi del DNA o di una regione specifica del DNA à per sapere il Twist devo dividere il numero di coppie di basi del DNA di interesse per il numero di coppie di basi per giro, che per il DNA in forma B è di 10,5 coppie di basi per giro). ● Wr = Writhe (contorsione), ovvero il numero di volte che l’asse centrale della doppia elica si ripiega su sé stessa formando superavvolgimenti (numero di superavvolgimento). SUPERAVVOLGIMENTI POSITIVI E NEGATIVI Normalmente, per spiegare la topologia del DNA, si utilizza il caso più semplice, ovvero quello di piccoli DNA circolari come i plasmidi. I DNA circolari chiusi sono normalmente in forma B anch’essi (quindi con 10,5 coppie di basi per giro della doppia elica) Nell’immagine a lato possiamo vedere in alto il DNA senza superavvolgimenti (lungo 260 paia di basi in questo caso), chiamato DNA rilassato. Non avendo superavvolgimenti, il DNA rilassato non avrà il Writhe e !"# perciò 𝐿𝑘 = 𝑇𝑤 = $#,& = 25. Tuttavia, i DNA circolari chiusi raramente sono rilassati à questo vale anche per i DNA eucariotici e quindi i cromosomi lineari eucariotici; in generale possiamo dire che il DNA all’interno delle cellule raramente è rilassato e solitamente sottoposto a una tensione tale da indurre dei superavvolgimenti. In generale, quindi, il DNA in natura è superavvolto e i superavvolgimenti possibili possono essere: ● Negativi à consistono in una rotazione in senso opposto (sinistrorso) a quello di avvolgimento del DNA duplex. o 𝐿𝑘 = 𝑇𝑤 + (−𝑊𝑟) = 25 − 2 (𝑝𝑒𝑟𝑐ℎé 𝑐𝑖 𝑠𝑜𝑛𝑜 2 𝑖𝑛𝑐𝑟𝑜𝑐𝑖 𝑖𝑛 𝑓𝑖𝑔𝑢𝑟𝑎) = 23 ● Positivi à consistono in una rotazione nella stessa direzione (destrorso) dell’avvolgimento del duplex. o 𝐿𝑘 = 𝑇𝑤 + 𝑊𝑟 = 25 + 2 = 27 Per capire graficamente quando ho un superavvolgimento positivo o negativo, bisogna guardare il segmento superiore del DNA ripiegato: ● Nei superavvolgimenti negativi il segmento di DNA che sta davanti incrocia il segmento che sta dietro da destra verso sinistra (partendo dall’alto) ● Viceversa, nel superavvolgimento positivo il segmento davanti incrocia il segmento dietro da sinistra verso destra. ● Il DNA nelle cellule (sia DNA circolari procariotici che DNA dei cromosomi eucariotici) è normalmente superavvolto negativamente. ● Dal punto di vista biologico i superavvolgimenti negativi possono essere considerati come un meccanismo di immagazzinamento dell’energia libera (tensione) che aiuta quei processi che richiedono una separazione dei due filamenti della doppia elica come la replicazione o la trascrizione (proprio grazie a questa tensione immagazzinata, cosa che non si ha nel DNA rilassato). ● Le regioni di DNA superavvolto negativamente hanno la tendenza a disavvolgersi localmente (come quando si avvolge un’altalena e che, appena rilasciata, comincia a srotolarsi in maniera naturale), per cui la separazione dei due filamenti è più favorita nel DNA superavvolto negativamente piuttosto che nel DNA rilassato. I NUCLEOSOMI INTRODUCONO SUPERAVVOLGIMENTI NEGATIVI NEL DNA DEGLI EUCARIOTI Il DNA negli eucarioti è attorcigliato attorno alle proteine istoniche per formare i nucleosomi (di cui parleremo più avanti), così si vengono a presentare dei superavvolgimenti negativi à i nucleosomi, infatti, rappresentano un classico esempio di superavvolgimenti negativi (che sono infatti tipici del DNA nelle cellule). Inoltre, i nucleosomi sono superavvolgimenti di tipo toroide. NB: il superavvolgimento toroidale è tipico del DNA eucariotico, di grandi dimensioni, impacchettato all’interno del nucleo. STRUTTURA DEL CROMOSOMA MITOTICO Andando a vedere la struttura del cromosoma mitotico, il DNA è organizzato in vere e proprie anse di cromatina, le cui estremità sono fissate a una struttura proteica (impalcatura proteica) e in queste anse ci sono i nucleosomi à ogni ansa avrà un certo grado di superavvolgimento (una certa topologia) che possiamo analizzare con il Linking number. DOMINI DEL DNA SUPERAVVOLTO NEL CROMOSOMA DI E. coli Anche il cromosoma circolare di E. coli è organizzato in maniera simile a quello eucariotico à anch’esso non è mai rilassato; il DNA forma delle anse tenute ferme da proteine strutturali e ogni ansa ha una certa topologia (che può essere DNA rilassato ma il più delle volte sarà con superavvolgimenti plectonemici o toroidali, quest’ultimi attorno a delle proteine non indicate in figura). Si presenta anche del DNA curvato (dato da sequenze ripetute regolarmente di coppie di basi uguali). Ricorda: ogni ansa, sia nei procarioti che negli eucarioti, in virtù di questi superavvolgimenti avrà un certo Linking number e quindi un certo grado di superavvolgimento. EFFETTI DELLA REPLICAZIONE E DELLA TRASCRIZIONE SUL SUPERAVVOLGIMENTO DEL DNA Fino ad ora abbiamo parlato di superavvolgimenti negativi come forma naturale in cui si trova il DNA nelle cellule, ma si hanno anche superavvolgimenti positivi che si creano per effetto della replicazione e della trascrizione à per capire questo fenomeno si può immaginare che il DNA sia rappresentato da due nastri avvolti a creare la doppia elica. Le due estremità sono tenute ferme dalle mani. Se tengo un’estremità ferma e l’altra la apro, creando tensione, come avviene durante la replicazione e trascrizione, il DNA subisce questa tensione e, non avendo la possibilità di scaricare l’energia dell’apertura di un’estremità (poiché l’altra estremità è ferma e quindi non si hanno estremità libere à le estremità del DNA sono ancorate a proteine strutturali, sia in E. Coli. che negli eucarioti), si vanno a formare dei superavvolgimenti positivi a valle dell’apertura/bolla di replicazione o trascrizione (e quindi si avrà un ulteriore aggrovigliamento). Quest’ulteriore aggrovigliamento non può però essere risolto da solo proprio perché il DNA in questo caso è maggiormente aggrovigliato e il superavvolgimento positivo non ha la tendenza a separarsi spontaneamente come quello negativo. Questo perché il superavvolgimento positivo è nello stesso senso dell’avvolgimento della doppia elica e quindi è come se il DNA semplicemente si attorcigliasse di più. Per rimuoverlo saranno necessarie le topoisomerasi. SEPARAZIONE DI TOPOISOMERI MEDIANTE ELETTROFORESI SU GEL DI AGAROSIO È possibile studiare questi livelli di superavvolgimenti anche attraverso l’elettroforesi su gel di agarosio. In particolare, attraverso questa tecnica, posso separare i topoisomeri, che sono le molecole di DNA circolari covalentemente chiuse aventi la stessa lunghezza ma Linking number differente (quindi un diverso grado di superavvolgimenti). Ricordiamo che il DNA può essere separato all’interno di un gel di agarosio migrando da un polo negativo a un polo positivo, questo perché il DNA è carico negativamente (a causa delle cariche negative dei gruppi fosfato dello scheletro) e quindi è attratto dal polo positivo. Nell’immagine A vediamo le elettroforesi di 3 campioni diversi e che vengono fatti migrare applicando il campo elettrico. Nell’immagine possiamo vedere che è stata caricata la stessa molecola di DNA plasmidico (identica per tipologia e dimensioni) ma in forme diverse: ● Nella linea 1 viene caricata nella sua forma superavvolta ● Nella linea 2 nella forma circolare rilassata (ad opera di topoisomerasi che rimuovono appunto i superavvolgimenti) ● Nella linea 3 nella forma tagliata per opera di una endonucleasi, la quale ha linearizzato quindi il DNA 1, 2 e 3 sono quindi lo stesso DNA ma trattato in maniera differente e che quindi migra in modo diverso in base allo stato in cui si trova. Il fatto che il DNA superavvolto migri più velocemente è dovuto al fatto che esso è più compatto e quindi riesce a entrare meglio nelle maglie del gel e perciò a migrare più velocemente. Quello rilassato è ovviamente quello più lento e quello linearizzato è una via di mezzo. Nell’immagine B vediamo che in questo caso si ha: ● la preparazione di DNA plasmidico nella forma superavvolta nella linea 1 ma che contiene anche una certa quantità di forma rilassata ● Nelle linee 2 e 3 questa quantità di DNA plasmidico è stata trattata per tempi crescenti con una topoisomerasi à vediamo infatti molte bande intermedie che non rappresentano altro che il DNA che contiene un numero di superavvolgimenti diversi e, in particolare, progressivamente minore. Si vede infatti che via via la banda del rilassato aumenta e questi intermedi si riportano sempre più verso la forma rilassata. Queste bande rappresentano quindi tanti topoisomeri. DNA TOPOISOMERASI ● Lk può essere modificato soltanto dalla rottura e riunione (formazione di legami fosfodiesterici) dell’ossatura di uno o entrambi i filamenti del DNA grazie all’azione delle DNA topoisomerasi. Esistono due classi: ● Topoisomerasi I: permettono di modificare il valore di Lk di una unità alla volta. Esse determinano la rottura temporanea di un singolo filamento del DNA duplex, consentendo così al filamento integro di passare attraverso la rottura dell’altro prima che il nick venga saldato. o Non richiedono ATP. ● Topoisomerasi II: permettono di modificare il Lk di due unità. Esse determinano una rottura temporanea dei due filamenti del DNA attraverso la quale fanno passare il duplex integro, prima che il taglio venga rinsaldato. o Richiedono l’energia di idrolisi dell’ATP (non tanto per tagliare il DNA ma per consentire i cambiamenti conformazionali che si vengono a creare tra la topoisomerasi e il DNA stesso). NB: Le topoisomerasi tagliano il legame fosfodiesterico dello scheletro zucchero-fosfato, senza eliminare i nucleotidi (al contrario delle eso - o endonucleasi). MECCANISMO D’AZIONE DELLA TOPOISOMERASI I Nell’immagine a fianco è riportato il meccanismo d’azione semplificato della topoisomerasi I, indicata con una forbice à la topoisomerasi I taglia uno dei due filamenti, rompendo un legame fosfodiesterico, fa poi passare il filamento integro attraverso la rottura/nick e, una volta passato, la rottura viene rinsaldata sempre dalla topoisomerasi. La topoisomerasi, tra l’altro, funziona attraverso un meccanismo chiamato a ponte, cioè è composta da diverse subunità che, una volta tagliato uno dei due filamenti, vanno ad afferrare le due estremità della rottura, in modo da tenerle vicine e creare uno spazio sufficiente per far passare il filamento integro. L’enzima si mette quindi proprio a ponte sulla struttura, a cavallo delle due estremità (un ponte enzimatico). Una volta che il passaggio è avvenuto l’enzima ponte fa avvicinare di nuovo le due estremità, cambiando la sua conformazione, così poi la topoisomerasi rinsalda il legame fosfodiesterico. MECCANISMO D’AZIONE DELLA TOPOISOMERASI II Anche le topoisomerasi II nell’immagine vengono indicate con una forbice e tagliano due filamenti del DNA circolare in figura. Fa poi passare anch’essa la doppia elica integra attraverso il taglio e poi la rottura viene rinsaldata. Il meccanismo è quindi molto simile a quello precedente, anche se qui vengono tagliati entrambi i filamenti. L’enzima, per fare tutti i suoi cambiamenti conformazionali del complesso topoisomerasi-DNA, che consentono di tenere le due estremità vicine, di far passare la doppia elica integra e far riavvicinare le due estremità e rinsaldarle, viene a utilizzare l’idrolisi dell’ATP, come già detto. Il modello di questo meccanismo d’azione viene chiamato a doppio cancello, questo perché più complesso, con due subunità (una per ciascun filamento di DNA). LE TOPOISOMERASI DECATENANO, DISTRICANO E SNODANO IL DNA Le due classi di topoisomerasi sono comuni sia per i procarioti che per gli eucarioti e sono in grado di rimuovere superavvolgimenti presenti sulle molecole di DNA. Nei procarioti esiste poi una speciale topoisomerasi di classe II che si chiama DNA Girasi e che, anziché rimuovere superavvolgimenti, introduce superavvolgimenti negativi à questo è molto importante perché, come già sappiamo, la presenza di superavvolgimenti nel DNA facilita la denaturazione della doppia elica per replicazione e trascrizione del DNA stesso. Le topoisomerasi svolgono però anche altre funzioni: ● Le topoisomerasi II possono infatti concatenare e decatenare DNA circolari covalentemente chiusi, andando a introdurre una rottura su una delle due molecole, sul doppio filamento di una delle due molecole. ● Stessa cosa la possono fare anche le topoisomerasi I, purché una delle due molecole abbia una regione a singolo filamento ● Le topoisomerasi II possono andare a separare molecole di DNA molto lunghe e attorcigliate, cosa che si verifica spesso durante la replicazione dei cromosomi eucariotici, che devono venir districati dalle topoisomerasi. ● Infine, si possono creare delle situazioni un po' più complesse, in cui i DNA annodati possono essere snodati sempre per mezzo dell’azione delle topoisomerasi II. LE TOPOISOMERASI TAGLIANO IL DNA USANDO COME INTERMEDIO UNA TIROSINA COVALENTEMENTE LEGATA AL DNA Entrambe le classi di topoisomerasi vengono a tagliare il DNA utilizzando un residuo di tirosina presente nel loro sito attivo. Nell’immagine sottostante è riportato l’esempio della topoisomerasi I, ma lo stesso vale anche per la seconda classe (sebbene siano necessarie due subunità in questo caso, una per ogni filamento di DNA da tagliare). Ad ogni modo, che io abbia una subunità come nel caso della topoisomerasi I o due subunità come la classe II, nel sito attivo c’è il residuo di tirosina, grazie al quale la topoisomerasi interviene nel tagliare e creare poi un intermedio covalente con il DNA. In particolare, nell’immagine è rappresentato, per semplicità, un singolo filamento di DNA à la topoisomerasi, con il suo residuo di tirosina, grazie al suo gruppo OH, fa un attacco nucleofilo sul filamento di DNA a livello del legame fosfodiesterico, rompendolo e creando un nuovo intermedio covalente tra la tirosina e il gruppo fosfato del DNA. Nel caso specifico dell’immagine, vediamo come lo scheletro zucchero fosfato è stato interrotto e l’estremità liberata (in questo caso una 5’) viene a formare un legame covalente con la tirosina, chiamato legame fosfotirosinico. La formazione di questo intermedio covalente viene poi dopo ad essere colpito dall’estremità 3’-OH liberata, la quale fa un attacco nucleofilo su questo legame fosfotirosinico; in questo modo libera l’enzima che può andare a colpire un altro filamento e la rottura viene rinsaldata. Ovviamente, questo rinsaldamento avviene solo dopo che attraverso la rottura è stata fatto passare il filamento intatto. Struttura dell’RNA CARATTERISTICHE STRUTTURALI DELL’RNA L’RNA ha diverse caratteristiche: ● Rispetto al DNA è costituito da un singolo filamento ● Anche in questo caso i nucleotidi sono tenuti assieme da legami fosfodiesterici e perciò anche l’RNA avrà una direzionalità ● Lo zucchero è il ribosio (con un OH in posizione C2’), non il deossiribosio ● La timina nell’RNA è sostituita dall’uracile che, però, mantiene la stessa capacità di appaiamento con l’adenina, formando due legami idrogeno o La differenza tra timina e uracile è semplicemente l’assenza del metile in posizione 5 nell’uracile (quindi è praticamente una timina demetilata) CARATTERISTICHE DELL’RNA Ricapitolando le differenze strutturali rispetto al DNA: 1. Ribosio 2. Uracile 3. Singola catena polinucleotidica à grazie a ciò ha la possibilità di formare diversi appaiamenti intramolecolari e assumere diverse strutture secondarie (anche complesse) e questo conferisce all’RNA diversi ruoli Funzioni (ruoli) dell’RNA: 1. Intermediario (mRNA) à consente di copiare l’informazione contenuta nel DNA a RNA, per poi venir tradotta in proteina 2. Adattatore (tRNA o RNA-transfer) à sono RNA di raccordo tra i codoni presenti sull’mRNA e gli amminoacidi (una sorta di ponte per l’amminoacido che deve essere aggiunto alla proteina in base al codone presente sull’mRNA) 3. Strutturale (rRNA) à è uno dei componenti dei ribosomi 4. Regolatore (RNA regolatori) à ne esistono diversi tipi (primo fra tutti i microRNA) e che hanno la funzione di regolare l’espressione genica di geni bersaglio, colpendo ad esempio gli stessi mRNA 5. Enzimatica (ribozimi) TIPI DI RNA LE CARATTERISTICHE DELLA DOPPIA ELICA DI RNA Nonostante l’RNA sia a singolo filamento, è comunque in grado di formare delle strutture a doppia elica, questo perché, essendo a singolo filamento, è una molecola molto flessibile e può creare delle strutture secondarie con regioni anche a doppia elica mediante interazioni intramolecolari à ovviamente queste interazioni non prevedono che io abbia una struttura a doppia elica così regolare come quella del DNA, ma possiamo avere strutture già viste come strutture a forcina o stem-loop, regioni che creano delle biforcazioni, anse interne dove le basi non sono appaiate oppure basi che vengono estruse all’esterno perché non c’è la corrispondente complementare (si parla in questo caso di gemma), o tratti semplicemente a filamento singolo. Le strutture secondarie dell’RNA, quindi, sono piuttosto variegate. APPAIAMENTO DELLE BASI G:U NELL’RNA Nell’RNA possiamo osservare, oltre alle classiche interazioni GC e AU (ovvero secondo Watson e Crick), anche degli appaiamenti insoliti come GU à dove vediamo che si formano due legami idrogeno tra l’O in posizione C6 della guanina e l’H in posizione N3 dell’uracile e tra l’H in posizione N1 della guanina e l’O in posizione C2 dell’uracile. Questo appaiamento insolito non è però così poco frequente per l’RNA à infatti, nell’RNA ribosomiale gli accoppiamenti GA e GU sono i più abbondanti. Quindi, nell’RNA è facile trovare altri appaiamenti più insoliti oltre a quelli canonici di Watson e Crick. PSEUDONODI Avendo la molecola una certa flessibilità, essendo a singolo filamento, possiamo avere regioni, a forcina per esempio come nell’immagine, che hanno nell’ansa delle basi disponibili, possono andare ad appaiarsi con sequenze complementari non contigue, creando strutture più o meno complesse chiamate pseudonodi (sono quindi strutture formate da appaiamento di basi fra sequenze complementari che non sono contigue). LA TRIPLETTA DI BASI U:A:U Inoltre, è possibile addirittura avere delle triplette di basi, sempre tramite legami a idrogeno, che coinvolgono appunto 3 basi à è molto frequente la tripletta UAU, per esempio, nel tRNA. Quindi, si vengono a creare delle vere e proprie strutture terziarie in virtù del fatto che l’RNA, essendo più “flessibile” del DNA, può ripiegarsi e creare delle strutture anche piuttosto complesse, in quanto l’RNA ha proprio la possibilità di ruotare molto facilmente attorno ai legami fosfodiesterici per ripiegarsi. Così ha anche una maggiore capacità rispetto al DNA di formare interazioni intramolecolari. NB: Quando l’RNA forma queste regioni a doppia elica, la conformazione è solitamente di tipo A à infatti, la presenza del ribosio, con il suo OH in più, impedisce a doppie eliche di RNA di assumere la forma B. Struttura del genoma, cromatina e nucleosoma I punti che verranno trattati sono: ● Genomi procariotici ed eucariotici ● Impacchettamento del genoma batterico e del DNA eucariotico ● Nucleosomi e proprietà strutturali e funzionali della cromatina ● Regolazione della cromatina Genomi procariotici ed eucariotici Geni e cromosomi ● I geni sono segmenti di DNA che contengono il codice per una proteina specifica e, quindi, contengono tutte le informazioni per codificare/specificare/produrre una proteina specifica ● I cromosomi sono strutture all’interno delle cellule che contengono i geni di un organismo ● Il cromosoma contiene un numero variabile di geni in base all’organismo ● Il numero di cromosomi può essere differente, ad esempio, ogni cellula umana contiene 23 coppie di cromosomi, per un totale di 46 cromosomi Il cromosoma può essere circolare o lineare Il cromosoma può essere circolare o lineare. Nei procarioti, normalmente, il cromosoma è circolare, anche se vi sono delle eccezioni come l’Agrobacterium, uno dei pochi procarioti che ha anche un cromosoma lineare. Quindi, il cromosoma è circolare ed è presente in numero pari a 1 e a singola copia (anche in questo caso vi sono delle eccezioni, ovvero il numero di cromosomi per alcuni procarioti può essere anche maggiore di 1). In generale, ad esempio in E. coli, uno degli organismi più studiati, il numero di cromosomi è unitario, a singola copia e circolare. Negli eucarioti il numero di cromosomi è variabile, ma sicuramente maggiore di 1 (ad esempio il lievito ne ha 16, mentre nell’uomo vi sono 22 cromosomi + i due cromosomi sessuali X e Y). Normalmente il numero di copie è due, però, come nel lievito, ci sono delle eccezioni. In tutti i casi i cromosomi sono lineari, perciò sono lunghe catene. Confronto fra cellula eucariotica e procariotica La cellula procariotica è una cellula più piccola, con un diametro medio di 1 micrometro. La cellula eucariotica è più grande ed ha un diametro pari a 10-100 micrometri. La cellula procariotica presenta un DNA, non contenuto nel nucleo, ma organizzato in una struttura, chiamata NUCLEOIDE, che è circolare e comprende anche dei plasmidi. I plasmidi sono DNA circolari di piccole dimensioni, indipendenti rispetto al cromosoma batterico, che non sono indispensabili per la crescita della cellula ma sono importanti perché le forniscono delle proprietà aggiuntive, come la resistenza agli antibiotici. Nella cellula batterica vi è un solo cromosoma e si parla, quindi, di cellula aploide. Negli eucarioti, le cellule sono diploidi, quindi si hanno due copie per ogni cromosoma, una che proviene dalla madre e una dal padre e si parla quindi di cromosomi OMOLOGHI. Il DNA è contenuto all’interno del nucleo (= struttura subcellulare, avente una membrana cellulare che lo separa dal resto del citoplasma). Non tutte le cellule eucariotiche sono diploidi ma ci sono delle cellule eucariotiche aploidi, in cui il DNA, quindi i cromosomi, è a singola copia e questo è tipico degli spermatozoi e delle uova, quindi cellule che sono coinvolte nella riproduzione sessuale. Questa tabella mette a confronto diversi esempi di batteri ed eucarioti, focalizzandosi sulla grandezza del genoma, il numero approssimativo dei geni e la densità genica: Quando si parla di grandezza del genoma, si intende la lunghezza del DNA in un assetto cromosomico aploide. Viene misurata in megabasi (1 megabase = 1 milione di paia di basi). La grandezza del genoma, nel caso dei procarioti, intesi come batteri, ha delle dimensioni inferiori alle 10 megabasi. Negli eucarioti, per quanto riguarda quelli unicellulari, il genoma ha una dimensione inferiore alle 50 megabasi mentre gli organismi eucarioti multicellulari hanno delle dimensioni maggiori fino a raggiungere anche dimensioni superiori alle 100.000 megabasi, come per il DNA del tulipano. Quello che sorprende è il fatto che organismi, che dal punto di vista della complessità non sono similari, abbiano una grandezza del genoma simile. Ad esempio, il genoma dell’homo sapiens ha una grandezza del genoma di 3200 megabasi, che è similare a quella del grano turco che è 2200, anche se la complessità dell’organismo è differente. Questo evidenzia come non sia tanto la grandezza del genoma ad essere correlata alla complessità dell’organismo, ma piuttosto che ci sia una correlazione più diretta tra la complessità dell’organismo e il numero di geni, in particolare la densità genica. Se si vede il numero approssimativo di geni nei procarioti, si nota che è minore rispetto agli eucarioti. Organismi più semplici hanno un numero di geni minore rispetto a organismi più complessi. La densità genica rappresenta il numero di geni che sono all’interno di una megabase di DNA e viene ottenuta dividendo la grandezza del genoma di quell’organismo per il numero approssimativo di geni. Si nota come i batteri hanno una densità genica maggiore rispetto agli eucarioti, soprattutto quelli più complessi, perché? La densità genica diminuisce all’aumentare della complessità dell’organismo eucariotico. Questo è dovuto a 2 fattori: 1) I geni negli eucarioti superiori hanno dimensioni maggiori, a causa della presenza di introni. Un gene umano ha solo un 5% di regione che codifica per la proteina, mentre il 95% è costituito da introni, sequenze non codificanti. Nel DNA vi sono regioni codificanti, gli esoni, che vengono separate dagli introni. Quando il DNA viene trascritto a RNA, vengono copiati anche gli introni (trascritto primario) e l’mRNA che viene utilizzato per la traduzione delle proteine è soggetto a splicing, processo di maturazione, dove gli introni vengono rimossi e gli esoni vengono saldati gli uni con gli altri. Nei procarioti, dove vi è una densità genica pari a 950 geni/Mb, il numero medio di introni è pari a 0. Negli eucarioti il numero medio di introni è più alto come in h. sapiens, che ha una densità genica pari a 6,25 e un numero medio di introni pari a 6. 2) Il DNA esistente tra i geni è in quantità elevata. A livello del DNA vi sono diverse sequenze intergeniche che non sono strettamente correlate con i geni stessi. I geni che codificano per RNA funzionale servono per la sintesi delle proteine (rRNa, tRNA, microRNA, ecc.) Gli PSEUDOGENI derivano da un effetto collaterale, in seguito a un'infezione virale; infatti, questi virus per replicarsi utilizzano una trascrittasi inversa, che serve a replicare il loro RNA a cDNA (= copie di DNA a doppio filamento), il quale può reintegrarsi con bassa efficienza nel genoma, in modo casuale. Viene definito pseudogene perché, a differenza del gene funzionale o strutturale, non ha sequenze regolatrici e quindi sono sequenze che non vengono espresse Le sequenze a basso numero di copie sono poco ripetute all’interno del genoma e non si conosce bene la loro funzione. Gli elementi interspersi sono soprattutto trasposoni, ovvero delle sequenze di DNA che da una regione si spostano ad un’altra in maniera casuale, lasciando una copia originaria di sè nel punto da cui si sono spostati. Le ripetizioni in tandem, ovvero DNA satellite (NB: dire DNA satellite o ripetizioni in tandem è la stessa cosa) possono essere suddivisi in: ● Minisatelliti (sequenze di 10-15 pb che sono ripetute fino a 1000 volte all’interno del genoma ● Microsatelliti (segmenti di 2-6 pb presenti fino a 100 volte consecutive) Sono degli elementi altamente ripetuti all’interno del genoma e contribuiscono a far parte delle sequenze intergeniche. La presenza delle sequenze intergeniche va a diminuire la densità genica che si trova a livello del DNA, perché, accanto ai geni che codificano per le proteine, vi è tanta quantità di DNA non codificante, che va a determinare una diminuzione della densità genica. Impacchettamento del genoma batterico e del DNA eucariotico Il nucleoide non è piccolo, ma va a riempire una parte dello spazio intracellulare ed è organizzato in modo tale che il DNA circolare si organizzi in circa un centinaio di anse, le quali hanno una lunghezza di 40 Kbp e che sono ancorate a dei complessi proteici strutturali, che rendono ogni ansa indipendente dal punto di vista topologico, quindi avranno un proprio linking number. Il DNA in ogni ansa può essere rilassato, avere dei superavvolgimenti plectonemici o toroidali. CAMBIAMENTI DELLA STRUTTURA DELLA CROMATINA: Cromatina interfasica e cromosomi mitotici Nel caso delle cellule eucariotiche, dove il DNA è contenuto nel nucleo, il materiale genetico viene a costituire, nei nuclei, la CROMATINA, o massa cromatinica. La cromatina subisce dei cambiamenti molto vistosi durante il ciclo cellulare (la cui fase principale è l’interfase, costituita da fase G1, S e G2, durante le quali il DNA viene trascritto e duplicato e le fibre si trovano in uno stato più rilassato). Durante l’interfase: Le molecole di DNA delle cellule eucariotiche sono organizzate a formare delle anse di 30-100 Kpb, ancorate alla matrice cellulare (grigio più scuro nell’immagine). Ogni ansa ha ulteriori livelli di organizzazione strutturale/compattazione che vanno da una fibra da 10nm a una fibra da 30nm. La fibra di 10 nm è un DNA avvolto attorno a delle proteine istoniche e viene chiamata a COLLANA DI PERLE, poiché ricorda con i nucleosomi una collana di perle. Se poi nella fibra da 10nm è presente una proteina H1, la fibra si può ulteriormente complessare, in quanto l’H1 avvicina i vari nucleosomi. Questa struttura elicoidale, dove i nucleosomi sono più vicini, viene chiamata SOLENOIDE, con 6 nucleosomi per giro, e compatta ulteriormente il DNA. La fibra viene chiamata di 30 nm, poiché ha un diametro di 30 nm. I diversi livelli di organizzazione strutturale sono apprezzabili nelle anse di 30-100 Kpb che si trovano a livello dell’interfase. La matrice nucleare è un reticolo insolubile di varie proteine scheletriche e nel DNA esistono sequenze specifiche che gli consentono di ancorarsi alla matrice nucleare durante l'interfase. Le componenti principali sono proteine scheletriche e fondamentali per andare ad agire sul DNA che si ancora ad essa, in particolare le topoisomerasi II (enzimi che vanno a regolare la topologia, il grado di superavvolgimento del DNA) e le proteine SMC (proteine che aiutano a mantenere la struttura del cromosoma, come le condensine, che vanno a condensare il DNA nelle strutture a livello organizzativo più complesse). Durante la mitosi: I cromosomi si compattano ancora di più in quelli che sono i tipici cromosomi mitotici e anche in questo caso è mantenuta una struttura di anse cromatiniche, con i nucleosomi, di 30-100 Kpb, che sono ancorati però a una vera impalcatura proteica che attraversa l’intero cromosoma e non a una matrice. L’impalcatura proteica contiene le topoisomerasi II e le condensine, che servono a condensare il DNA, e anche in questo caso il DNA contiene le sequenze specifiche per farlo ancorare a questa impalcatura tipica dei cromosomi mitotici. La cromatina interfasica ha gradi diversi di condensazione del materiale genetico In base al fatto che il DNA deve essere replicato o trascritto può essere sotto diverse forme. Nella maggior parte dello spazio nucleare le fibre cromatiche appaiano disperse (spesso si fa l’analogia con un piatto di spaghetti) e questo stato di cromatina prende il nome di EUCROMATINA, sinonimo di un minor livello di organizzazione/compattazione rispetto al cromosoma mitotico e quindi vi sono alti livelli di espressione genica. Il DNA è impegnato ad essere trascritto e replicato e non può essere condensato perché se lo fosse non sarebbe più accessibile agli enzimi che si impegnano a replicare o trascrivere il DNA. In alcune regioni del nucleo si osservano delle fibre cromatiniche più compatte e condensate e la cromatina prende il nome di ETEROCROMATINA, ed è sinonimo di una ridotta espressione genica. In realtà l’eterocromatina interfasica può essere distinta in due tipi: COSTITUTIVA: riguarda regioni del genoma che non sono codificanti e quindi ha un ruolo strutturale à ad esempio i centromeri. FACOLTATIVA: tale solo in certe situazioni, che riguarda regioni del DNA che codificano per proteine, come ad esempio una proteina che può essere espressa in un tessuto muscolare e non in un tessuto adiposo. Se una proteina viene espressa in un tessuto muscolare, il DNA sarà meno condensato, quindi sotto forma di eucromatina, mentre quella stessa regione codificante nel tessuto adiposo, dove la proteina non deve essere espressa, viene condensata. L’eterocromatina facoltativa riguarda particolari situazioni in cui vi sono regioni che devono essere espresse in un certo tipo cellulare e in un altro no. Quando si parla di questo stato, nel nucleo in cui si ha la massa cromatinica, vi sono delle regioni MISTE, regioni nel nucleo dove vi sono fibre della cromatina sotto forma di eucromatina e altre di eterocromatina, facoltativa o costitutiva. Il massimo grado di compattamento sono i cromosomi mitotici Rap. imp.: rapporto di impacchettamento rispetto al DNA non impacchettato nelle proteine istoniche. Quando il DNA è avvolto intorno ai nucleosomi si ha un rapporto di 6 rispetto a una molecola di DNA non avvolta, fino ad arrivare a un rapporto di 10.000, che è il massimo livello di compattamento possibile per il DNA. Cromosoma mitotico Il cromosoma mitotico contiene due filamenti (indicati in grigio), chiamati cromatidi fratelli, che si ottengono dopo che il DNA è stato replicato. Questi due cromatidi fratelli sono tenuti insieme da una regione che si chiama centromero. Ciascun cromatidio contiene due telomeri, un centromero e più origini di replicazione. Le origini di replicazione sono siti sul DNA dove si viene ad assemblare tutto il complesso proteico deputato ad iniziare la replicazione. Solitamente, nei cromosomi eucariotici, queste origini di replicazione sono più di una, infatti sono posizionate ogni 30-40 Kpb e sono molteplici. Nei cromosomi dei procarioti vi è una sola origine di replicazione, quindi, contengono un solo sito di inizio della replicazione. Queste origini di replicazione sono posizionate in regioni del DNA che non sono codificanti. I centromeri sono utili per tenere insieme i due cromatidi fratelli ma anche per consentire una corretta segregazione dei cromosomi omologhi dopo la replicazione. I centromeri vengono ad associarsi con un complesso proteico, chiamato cinetocore. Il cinetocore è un complesso proteico che viene ad unirsi con i microtubuli cellulari, consentendo una corretta separazione dei cromosomi ai due poli della cellula, che si dividerà dando le due cellule figlie. Nella maggior parte degli eucarioti superiori i centromeri hanno dimensioni > 40 Kpb e contengono numerose sequenze ripetute. Negli eucarioti unicellulari, come il lievito, sono più corti, si è intorno alle 200 pb. a) È importante che per ogni cromosoma o cromatidio fratello si abbia un solo centromero, in modo tale che si abbia un solo cromosoma per ciascuna cellula figlia. b) Se i centromeri non ci sono, si avrà che i cromosomi non segregano in maniera corretta e si avrà una segregazione casuale. Una cellula figlia sarà priva di un cromosoma e l’altra invece ne avrà due. c) Se si hanno invece due centromeri, che vengono ad associarsi al cinetocore, si possono avere delle rotture del cromosoma con conseguente perdita del materiale genetico. Telomeri I telomeri vengono riconosciuti da delle proteine, che hanno la funzione di proteggere queste estremità da rotture o danni e oltre a queste proteine, si ha un’altra tipologia di proteina, ovvero le telomerasi (= gli enzimi deputati a replicare le estremità dei cromosomi). La telomerasi è una particolare DNA polimerasi, diversa da quella che replica il resto del DNA e anche il meccanismo con cui replica queste estremità è diverso rispetto a quello utilizzato per il resto del DNA. Quindi, i telomeri vengono ad associarsi a proteine: sia proteine che li proteggono da eventuali rotture, sia proteine coinvolte nella loro replicazione. I telomeri presentano una sequenza ripetuta (quella nel quadrato marroncino). Il telomero non è tutto a doppia elica perché ha una regione terminale al 3’, lunga, che può comprendere anche centinaia di basi a singolo filamento. La barretta sta ad indicare che questa sequenza a singolo filamento è molto lunga, ovvero centinaia di basi e non può essere riportata nel disegno. Questa estremità è ricca di 3 G consecutive e il DNA telomerico, può, avendo 3 G consecutive, organizzarsi in strutture a quartetti di G, ripiegato su sé stesso e le G che si trovano sullo stesso piano vengono a creare degli appaiamenti di Hoogsten e a creare, appunto, questo tipo di interazioni, che pare stabilizzino, anche se non si è certi, la struttura del telomero. Affinché questi cromosomi mitotici vengano a condensarsi durante la mitosi hanno bisogno di una serie di proteine che fanno parte della famiglia indicata con le lettere SMC (= Structural Maintenance of Chromosome). Sono proteine che mantengono la struttura del cromosoma. In particolare, queste proteine servono a mantenere coesi i cromatidi fratelli e a condensare i cromosomi mitotici. L’immagine propone un modello, che spiega come funzionano COESINA e CONDENSINA durante la mitosi (bisogna ricordare che la mitosi consta di diverse fasi, riportate nella parte più a sinistra dell’immagine). Nella profase, la cellula si prepara alla mitosi. La membrana nucleare comincia a scomparire e i due cromatidi fratelli sono tenuti insieme dalla coesina. La coesina è un complesso proteico che lega regioni distanti di due cromatidi. È una specie di anello che si posiziona avvolgendo i due cromatidi fratelli in regioni abbastanza distanti. La coesina non è una singola proteina ma un complesso proteico utile per mantenere, connettere i due cromatidi fratelli al termine della fase S, prima della mitosi. Quando si entra in mitosi i cromatidi fratelli sono già tenuti insieme mediante coesina. Passando da profase a metafase, interviene la condensina. Nella metafase si vede che i cromosomi iniziano a condensarsi e iniziano ad allinearsi a livello della piastra equatoriale, ovvero al centro della cellula. Nella metafase avviene la condensazione cromosomica. Questa compattazione è possibile grazie all’intervento della condensina, la quale è un complesso proteico ad anello che viene a legare regioni differenti dello stesso cromatidio, compattandolo. Nell’anafase i cromatidi fratelli iniziano ad essere separati ai due poli, è necessario, quindi, che la coesina venga tagliata mentre la condensina rimane ancora legata a ciascun cromatidio, mantenendolo condensato durante l’anafase. Nella telofase i cromosomi sono meno condensati, si inizia riformare la membrana nucleare intorno a ciascun pool di cromosomi e successivamente le condensine vengono rilasciate e quando si formano le due cellule figlie, in seguito a citochinesi, la cromatina è in uno stato meno condensato, ovvero nello stato tipico dell’interfase. Nucleosomi e proprietà strutturali e funzionali della cromatina Il DNA ha, come primo livello di compattazione/organizzazione, il NUCLEOSOMA (= unità base di condensazione del DNA, è il mattone della cromatina) Nel nucleosoma, il DNA è avvolto attorno a un disco proteico, che viene chiamato CORE ISTONICO. Il DNA avvolto al core istonico è chiamato DNA CORE o DNA NUCLEOSOMICO ed è lungo 147 pb; Il core istonico è un ottamero istonico, ovvero costituito da otto proteine istoniche, che sono due copie di H2A, H2B, H3, H4, vi sono quindi quattro proteine istoniche presenti in due copie ciascuna. Il DNA core è avvolto 1,65 volte all’ottamero istonico. I nastri in verde e in grigio rappresentano il DNA che è avvolto attorno all’ottamero istonico, dove ogni proteina è indicata con un colore diverso: H2A, H2B, H3, H4. Tra un nucleosoma e l’altro si ha un DNA linker, che ha una lunghezza variabile di 20-60 pb, che dipende dall’organismo: Grazie alla formazione dei nucleosomi si ha un compattamento del DNA di circa 6 volte rispetto alla sua lunghezza. Quando il DNA è avvolto nel nucleosoma, crea una sorta di nucleosomi in serie, che prende il nome di FIBRA da 10nm oppure COLLANA DI PERLE. L’ottamero è costituito dalle 4 proteine istoniche, che hanno un peso in media dalle 11 alle 15 KDalton e sono molto ricche di residui amminoacidici, quali la lisina e l’arginina e si va dal 20 al 24%. Gli istoni sono quindi delle proteine basiche perché grazie alla lisina e arginina contengono degli aa carichi positivamente. Il DNA è carico negativamente, in virtù dei gruppi fosfato che costituiscono lo scheletro zuccherofosfato esterno e viene favorito nell’interagire con queste proteine istoniche, che hanno una carica positiva. Esiste una proteina che è l'istone linker, o H1, più grande delle altre, di quasi 21 KDalton, che ha una componente di lisina e arginina importante, che non fa parte dell’ottamero istonico ma si lega al DNA linker. Bisogna ricordare che la maggior parte del DNA delle cellule eucariotiche è impacchetto nei nucleosomi, però in tutte le cellule vi sono zone che non sono impegnate a legarsi attorno all’ottamero istonico, ma sono le regioni coinvolte nel processo di replicazione o ricombinazione. Anche in questo caso si tratta di DNA, non nudo, ma associato a complessi proteici ed enzimi che sono parte attiva di eventi di trascrizione o replicazione. I componenti del core istonico Tutte le 4 proteine hanno: una coda N terminale, un’estremità carbossiterminale e una componente centrale comune, che viene denominata dominio histone-fold, ovvero dominio di ripiegamento degli istoni. Questo dominio è una regione conservata in tutti i 4 istoni ed è importante per la formazione di complessi intermedi. Quando non vi è l’acido nucleico (il DNA), gli istoni formano dei complessi intermedi in soluzione, che sono riportati nell’immagine b): ● Gli istoni H3 e H4 si organizzano per formare tetrameri ● Gli istoni H2A e H2B si organizzano per formare un dimero Il core proteico si assembla solo in presenza di DNA. Da queste rappresentazioni si può osservare che le molecole di ciascun istone interagiscono tra loro sovrapponendosi le une sulle altre e in particolare incrociando le due alfa-eliche centrali di ogni dominio histone-fold (il quale è formato da 3 strutture ad alfa elica), quindi la seconda si incrocia l’una con l’altra, creando un particolare tipo di organizzazione chiamata STRETTA di MANO, creando questi complessi intermedi. In presenza di DNA, questi complessi intermedi si vanno ad organizzare in quello che viene detto nucleosoma, in particolare: Si formano in maniera indipendente due dimeri H2A e H2B e un tetramero H3 e H4, poi in presenza di DNA il primo a legarsi è il tetramero e in un secondo momento si assemblano i due dimeri fino a formare il nucleosoma. Questo processo di assemblaggio non avviene in maniera autonoma, ma richiede delle proteine che sono dette CHAPERONINE, ovvero proteine che controllano questo processo di assemblaggio proteico tra i diversi intermedi con il DNA. Il nucleosoma Se si guarda il nucleosoma dall’alto, si nota che fuoriescono da esso le code N terminali degli istoni, che sporgono verso l’esterno, andando a formare delle specie di “tentacoli”. Queste code N terminali vengono ad essere molto importanti perché subiscono delle possibili modifiche chimiche, ovvero residui di queste code come la serina, la lisina e l’arginina, che vengono ad essere modificate chimicamente aggiungendo un gruppo fosfato o metile, o un acetile, e subiscono quindi fosforilazione, metilazione o acetilazione a livello di specifici residui amminoacidici. Queste modifiche sono importanti perché hanno un effetto sulla cromatina, rendendola più o meno rilassata. Le code non contribuiscono al legame con il DNA, ma sono importanti perché modificate chimicamente vengono ad alterare lo stato della cromatina. Se i nucleosomi vengono trattati con una proteasi, enzima che taglia i legami peptidici a livello di aa basici ed è in grado di rimuovere le code amminoterminali dal nucleosoma: Tagliando le code l’ottamero istonico è ancora assemblato attorno al DNA e anche questo dimostra come le code non siano fondamentali per il legame con il DNA. Le code istoniche sporgono dal core nucleosomico in specifiche posizioni: (L’immagine propone una visione del nucleosoma laterale) ● Le code degli istoni H2B e H3 sporgono in mezzo alle due eliche di DNA ● Le code degli istoni H2A e H4 emergono sulla parte superiore o inferiore di entrambe le due eliche di DNA L’associazione tra il DNA e le proteine istoniche è mediata da tantissimi contatti, in particolare da legami H, che vengono ad essere in numero molto elevato, fornendo la necessaria energia per aiutare la curvatura del DNA. Il numero elevato di legami H è riportato a circa 140 dagli studi sviluppati più recentemente. Le interazioni sono indipendenti dalla sequenza, non vi è il riconoscimento di una sequenza specifica conservata, quindi, l'interazione fra il core istonico e DNA avviene in maniera indipendente dalla sequenza. Non sono necessarie delle sequenze specifiche che devono essere conservate. I nucleosomi, dal momento che il DNA deve curvare attorno all’ottamero istonico, si devono formare di preferenza sul DNA che si presenta intrinsecamente curvo. Il DNA può avere naturalmente una certa curvatura ed è ricco di brevi ripetizioni di sequenze AT con una tendenza intrinseca a curvarsi in direzione del solco minore; quindi, i tratti di DNA che contengono i nucleotidi AA TT e TA vengono a ripiegarsi verso il solco minore e pertanto un DNA ricco di questi tratti favorisce la formazione del nucleosoma esponendo verso gli istoni il solco minore. Il solco minore è rivolto all’interno, verso l’ottamero istonico. Il DNA ricco in GC ha la tendenza opposta, quindi forma nucleosomi mantenendo il solco minore rivolto verso l’esterno. Tratti che contengono AT vengono a favorire la formazione di un nucleosoma esponendo il solco minore all’interno, quindi verso gli istoni stessi. DNA ricco in GC viene ad avere la tendenza opposta, formando nucleosomi mantenendo il solco minore all’esterno. Tratti di DNA che alternano sequenze AT a sequenze CG, con una periodicità di circa 5 coppie di basi, possono essere siti di formazione preferenziale del nucleosoma. Una volta che i nucleosomi si sono formati, il passaggio successivo prevede delle strutture di ordine superiore della cromatina. Strutture di ordine superiore della cromatina Il PRIMO livello SUPERIORE di impacchettamento della cromatina dopo la formazione dei nucleosomi è grazie al legame da parte dell’istone H1 al DNA linker. H1è una proteina istonica che si viene a legare non solo al DNA linker, ma anche a una regione centrale del DNA core/nucleosomico, come se avesse due braccia che prendono due punti del DNA, avvicinandole, andando a portare il DNA a una maggiore adesione all’ottamero istonico. Il legame da parte dell’istone H1 determina un ulteriore impaccamento, nella fibra da 30nm. In particolare, in questo grado di impacchettamento, il rapporto di impacchettamento arriva a 40, quindi il DNA è impacchettato 40 volte in più rispetto alla sua lunghezza. In seguito a questo legame, creando questa fibra, sono stati proposti due modelli per descrivere questa fibra da 30 nm: MODELLO a SOLENOIDE: prevede che il DNA è organizzato in modo tale che i nucleosomi sono avvolti intorno a una superelica, che contiene 6 nucleosomi per giro. Questo tipo di modello è stato ottenuto da studi al microscopio elettronico e anche tramite diffrazione ai raggi X. Se si osserva il modello dall’alto, la superelica ha un foro centrale, con diametro di 11 nm circa. Questo foro non è attraversato dal DNA linker, è vuoto, dove il DNA linker è ai bordi del foro. MODELLO a ZIG ZAG: ottenuto tramite studi ai raggi X su di una singola molecola di DNA, si è visto che questa singola molecola di DNA aveva una conformazione diversa più simile a una molla, con i nucleosomi posizionati in maniera alternata, a “zig zag”, da cui prende il nome la struttura. Se si osserva dall’alto questo modello, il foro centrale è attraversato dal DNA linker, come mai? Questo tipo di modello richiede dei DNA linker più lunghi, che consentono quindi di permettere di attraversare il foro centrale e di consentire questa struttura, diversa dal solenoide. Qual è il modello giusto? Questi due modelli possono essere presenti entrambi nella stessa fibra di cromatina, oppure l’altra possibilità è che dipenda dall’organismo (bisogna ricordare infatti che il DNA linker ha lunghezze diverse in base al tipo di organismo). Quindi quegli organismi che hanno un DNA linker più lungo, quindi sufficientemente lungo per attraversare il foro centrale della fibra, possono assumere il modello a zig zag. Quelli che hanno un DNA linker più corto possono assumere il modello a solenoide. Una possibilità non esclude l’altra. La fibra da 30 nm è stabilizzata dall’interazione delle code amminoterminali. In questa immagine si nota proprio l’interazione tra H4 e H2A, ovvero tra la coda amminoterminale di H4 con il dominio dell’histone-fold, il dominio conservato, di H2A. L’estremità amminoterminale dell’istone H4, carica positivamente, interagisce con le cariche negative che si trovano nell’histone-fold. Questa interazione è tra le più importanti per la stabilizzazione della fibra di 30 nm, tant’è che questi residui sono altamente conservati nella maggior parte degli organismi eucariotici, a dimostrazione della loro importanza. Le code amminonoterminali degli istoni intervengono nella formazione e stabilizzazione della fibra da 30 nm, con particolare riferimento a questa interazione. Ma il livello di condensazione non è ancora sufficiente per 1-2 m di DNA in un nucleo di diametro pari a 10^-5 metri, quindi bisogna condensare ancora di più. Bisogna passare a livelli di organizzazione maggiori, come le ANSE di DNA, chiamate fibre da 100-400 nm, che possono contenere livelli di organizzazione inferiori, quali la fibra da 10 e 30 nm, che sono ancorate alla matrice nucleare durante l’interfase e si arriva così ad avere un ulteriore impacchettamento di 1000 volte, per arrivare a una condensazione massima che corrisponde a 10.000 volte nei cromosomi mitotici. In tutti i casi, ogni ansa rappresenta un’unità topologica a sé, in cui la fibra si presenta localmente con livelli di condensazione differenti. All’interno della stessa ansa ci può essere la fibra da 10, la fibra da 30, regioni di DNA nudo, coinvolto nella trascrizione e replicazione; è difficile che sia nudo, è un DNA libero riconosciuto da proteine ed enzimi specifici. Regolazione della cromatina Questi livelli di organizzazione sono finemente regolati. Il primo concetto è il fatto che l’interazione del DNA con l’ottamero istonico non è rigida ma è dinamica, ovvero il DNA attorno all’ottamero istonico non è incollato ma è dinamico. Il DNA viene ad essere disavvolto, a spostarsi, e quindi non è sempre lo stesso DNA ad essere avvolto all’ottamero istonico. L’interazione è dinamica e ad aiutare e supportare il movimento e la posizione dei nucleosomi sono dei complessi proteici, detti COMPLESSI di RIMODELLAMENTO dei NUCLEOSOMI, che hanno la funzione di facilitare i cambiamenti di posizione dei nucleosomi e quindi l’interazione poi tra il DNA e l’ottamero istonico. Per farlo, tutti questi complessi vanno ad utilizzare l’ATP. L’idrolisi dell’ATP fornisce l’energia necessaria per consentire a questi complessi di spostare e cambiare la posizione dei nucleosomi e quindi a far spostare il DNA lungo l’ottamero istonico. Tutti questi complessi (ne esistono di diversi tipi) vengono a catalizzare lo SCIVOLAMENTO, perché questi complessi hanno 3 possibilità con cui vanno a introdurre dei cambiamenti sulla posizione dei nucleosomi. Tutti i complessi di rimodellamento finora conosciuti sono in grado, quindi, di catalizzare lo scivolamento del nucleosoma. Nell’immagine più a sinistra si nota che il DNA avvolto nel nucleosoma contiene un sito di legame della proteina, che potrebbe essere un fattore di trascrizione, però il DNA è avvolto nel polinucleosoma e difficilmente la posizione sarà facilmente accessibile e occorre liberarla dall’interazione con l’ottamero istonico. Una possibilità è l’intervento di questi complessi di rimodellamento di questi nucleosomi che fanno scivolare il DNA lungo la superficie dell’ottamero istonico e consentono di liberare il DNA contenente il sito di legame della proteina, rendendolo accessibile alla proteina specifica. Funzionano come una sorta di mani che prendono il DNA e lo srotolano lungo la superficie dei nucleosomi. Un altro meccanismo, che però non è comune a tutti i complessi di rimodellamento dei nucleosomi, ma lo hanno solo alcuni, è l’espulsione o trasferimento à in questo caso il movimento è più drastico perché viene espulso un ottamero istonico, liberando così il DNA dall’interazione con le proteine istoniche. Viene detto anche trasferimento perché l’ottamero istonico che viene liberato viene in qualche modo trasferito/riciclato da un’elica all’altra del DNA. L’ultimo caso, che è un caso specifico, è lo scambio dei dimeri à ci sono dei complessi di rimodellamento dei nucleosomi che possono sostituire alcuni componenti dell’ottamero istonico con delle varianti istoniche. Fino ad ora si è parlato delle 4 proteine istoniche che costituiscono l’ottamero, ma ci sono delle varianti ed una di queste è H2AX. H2AX rappresenta una sorta di segnale per il DNA che deve essere riparato. Ovvero, in questo scambio di dimeri, che si vede nell’immagine, viene fatto uscire H2A e H2B e al suo posto viene inserito H2AX e H2B. H2AX viene fosforilata e in questo modo richiama delle proteine che sono coinvolte nel riparare i filamenti di DNA rotti. H2AX interviene quando si hanno delle rotture della doppia elica e le rotture della doppia elica sono uno dei danni peggiori, o meglio il peggiore, che può capitare al DNA e per ripararlo prontamente l’ottamero istonico viene sostituito con questa variante. La variante viene ad essere fosforilata e riconosciuta da enzimi che riparano il DNA, praticamente porta gli enzimi sul luogo del danno, consentendone la riparazione. Esistono diversi tipi di meccanismi di rimodellamento, tutti ATP-dipendenti: In questa tabella vengono riportati i diversi tipi di complessi di rimodellamento, con un numero variabile di subunità e tutti hanno un dominio di legame degli istoni che si distinguono in cromodominio o bromodominio. Il bromodominio è un dominio conservato all’interno di questi complessi che serve a riconoscere gli istoni e legare le code N-terminali istoniche che contengono lisine acetilate. Il cromodominio serve per legare gli istoni e in particolare le code N-terminali degli istoni a livello delle lisine metilate. Questi tipi di complessi di rimodellamento vanno a riconoscere e vanno a legare gli istoni andando a utilizzare dei domini conservati. Si ricorda infatti che le code N-terminali sono soggette a delle modifiche chimiche, che servono anche per consentire il riconoscimento da parte dei complessi di rimodellamento dei nucleosomi. Tutti questi complessi agiscono per scivolamento, ma solo alcuni per trasferimento (si veda tabella). I complessi di rimodellamento vengono reclutati a livello del cromosoma sia andando a legarsi a code N-terminali modificate oppure possono essere reclutati da fattori di trascrizione che hanno legato il DNA stesso (esempio: si ha il DNA in una forma compatta, a livello di quel DNA vi è una regione che deve essere trascritta, in parte vi è un sito di legame per un fattore di trascrizione libero, ecco che questo richiama ulteriormente i complessi di rimodellamento per rilasciare la cromatina e rendere disponibile il DNA ad essere trascritto). Quindi, il reclutamento del complesso di rimodellamento nei diversi siti del cromosoma può essere mediato da fattori di trascrizione oppure da specifiche modifiche delle code amminoterminali degli istoni. MODIFICAZIONE DELLE CODE AMMINOTERMINALI ISTONICHE Nell’immagine sono riportate tutte le diverse code N-terminali istoniche e i diversi simboli indicano le diverse modifiche e le posizioni dei diversi aa. Un’altra modifica, oltre a fosforilazione, metilazione e acetilazione, può essere l’ubiquitinazione, che riguarda non tanto la estremità N-terminale, ma la C-terminale. Lo stato della cromatina, quindi, viene alterato da modifiche chimiche che riguardano in particolare la coda N-terminale. Una coda può subire modifiche chimiche differenti in posizioni diverse e di tipo chimico diverso, ad esempio l’istone H2A può essere contemporaneamente acetilato e fosforilato in posti differenti e questo crea un codice istonico, che ci dice COME e QUANDO il DNA compattato è accessibile. È una sorta di alfabeto che si traduce in un possibile grado di compattamento del nucleosoma. Il codice istonico fornisce la posizione e il tipo di modifica chimica che ha la coda istonica e dà un’idea di come e quando il DNA compattato è accessibile. Esempio: 1)La metilazione sulla coda istonica di H3 nella posizione della lisina 4 e 36 in contemporanea va ad essere un sinonimo di espressione genica, in quanto la cromatina è meno compatta 2)Se le lisine sono metilate in posizione 9 e 27 significa repressione genica 3)L’acetilazione delle lisine in posizione 8 e 16 dell’istone H4 è associata ai siti di inizio di trascrizione dei geni espressi, quindi, anche questo sostiene una espressione genica 4)L’acetilazione delle lisine in posizione 5 e 12 dell’istone H4 neosintetizzate va a segnalare la formazione di componenti di nuovi nucleosomi. LE MODIFICHE DEGLI ISTONI INFLUENZANO LA FUNZIONE DEI NUCLEOSOMI: Quello che si sa è che, se si ha un istone non modificato, l’acetilazione delle code istoniche in posizioni diverse porta a uno stato di cromatina più aperta e rilassata e si dice ATTIVA, coinvolta in processi di replicazione e trascrizione. Lo stato di cromatina chiuso, detta INATTIVA, si ha quando le code istoniche sono metilate in diverse posizioni, in diverse code, H3 e H4 in particolare. Acetilazione → apertura della cromatina Metilazione → repressione genica, inattivazione della cromatina Tutte queste modifiche alle code N-terminali sono REVERSIBILI e, sia che vengano aggiunte o che vengano tolte, vengono sempre ad essere realizzate da degli enzimi specifici: L’acetilazione, comune sulle lisine, avviene sul gruppo Nterminale della lisina, catalizzata da HAT, istone acetiltransferasi. Questa modifica può essere rimossa dalle HDAC, istone deacetilasi, che rimuove l’acetilazione. La fosforilazione, invece, avviene solitamente sulla serina o treonina e in questo caso l’enzima che si occupa della fosforilazione è l’istone chinasi, mentre l’enzima che si occupa di togliere il gruppo fosfato aggiunto è l’istone fosfatasi. La metilazione avviene sulla lisina e il gruppo amminico terminale può essere MONO-, DI- o TRI- metilato e l’enzima è HMT, ovvero istone metil transferasi e anche in questo caso la metilazione può avvenire in senso opposto, si può quindi avere una demetilazione grazie a HCM, istone demetilasi. Per ogni tipo di modifica chimica si ha l’enzima corrispondente, che si occupa di aggiungere la modifica in specifiche posizioni e si ha anche il corrispondente enzima che la rimuove. Gli enzimi che modificano gli istoni sono spesso dei complessi proteici e anch’essi vanno a legare le code istoniche con dei bromodomini o cromodomini, ovvero gli stessi domini conservati che sono stati visti nei complessi di rimodellamento della cromatina. Questi enzimi che modificano gli istoni hanno anche molto spesso degli istoni bersaglio su cui vanno ad agire. Bisogna poi dire che la struttura della cromatina può essere modificata localmente mediante una cooperazione dei complessi di rimodellamento dei nucleosomi e degli enzimi che modificano gli istoni. Ricordiamo che quando si modificano le code istoniche questa è una modifica/un evento locale e così pure anche i complessi di rimodellamento non agiscono su tutto il DNA ma su delle regioni specifiche, che magari sono interessate ad essere eventualmente trascritte o replicate. In questa immagine si può vedere come lavorano insieme i complessi di rimodellamento dei nucleosomi e gli enzimi che modificano gli istoni, ovvero come cooperano per modificare localmente la struttura della cromatina. Nel primo disegno, in alto, vi è una fibra di cromatina da 30 nm, quindi, un livello di compattamento alto e da notare è che il DNA riportato nel disegno ha 3 siti, distinti da 3 colori, uno in arancio, uno in blu e uno in verde. La sequenza in blu viene riconosciuta da una proteina di legame che si lega al sito, che recluta per prima cosa un complesso istone acetil transferasi, enzima che modifica per gli istoni. In questo caso il sito blu si trova nel DNA linker che è accessibile a differenza dei siti arancio e verde, che fanno parte del DNA nucleosomico, che non sono accessibili ad eventuali proteine target quando il DNA è compattato in questa fibra da 30 nm. L’istone acetiltransferasi è un enzima che acetila le code istoniche dei nucleosomi adiacenti e fa si che la fibra da 30 nm passi a una fibra di 10 nm e rilassandosi rende accessibile il sito in arancio, che richiama la proteina “2”. La proteina 2 recluta il complesso di rimodellamento dei nucleosomi, che viene a far scivolare il nucleosoma facendo scorrere il DNA attorno ai nucleosomi successivi, tant’è che il sito in verde è reso accessibile al legame con una terza proteina. La terza proteina potrebbe essere una proteina coinvolta nella trascrizione, quindi, un fattore di trascrizione e in quella zona potrebbe iniziare la trascrizione del DNA. In questo esempio viene prima reclutato l’istone acetil-transferasi e poi i complessi di rimodellamento, ma può capitare anche l’inverso e gli esiti sono sempre gli stessi e con la stessa efficienza. Si può avere anche il reclutamento di enzimi che modificano gli istoni, non acetilando ma metilando e in questo modo si promuove una compattazione, rendendo la cromatina localmente inaccessibile. La replicazione del DNA I punti che verranno trattati sono: ● La replicazione del DNA è semiconservativa ● Origini di replicazione e bidirezionalità della replicazione ● I principi generali della replicazione del DNA (quindi quali sono i substrati utili, il meccanismo di azione della DNA polimerasi e come è costituita la forcella di replicazione) ● Meccanismo di replicazione del DNA nei procarioti e gli eucarioti ● Replicazione dei telomeri, i quali hanno un meccanismo diverso rispetto al resto del DNA, nei cromosomi lineari degli eucarioti La replicazione del DNA è semiconservativa Nell’immagine è raffigurato il DNA parentale, ovvero quello che funziona da stampo. I due filamenti della molecola di DNA parentale si separano e creano la forcella di replicazione e separandosi servono da stampo per la sintesi dei due filamenti complementari (indicati in arancione). La forcella di replicazione andrà a propagarsi lungo tutta il DNA non ancora replicato e si sposterà in modo da separare i due filamenti parentali affinché questi vengano copiati. Il risultato alla fine saranno due molecole figlie uguali alla molecola parentale di DNA originaria ma costituite da un filamento parentale (in viola) e da un filamento neosintetizzato (in arancione). Si dice semiconservativa perché quando il DNA viene replicato/duplicato (NB: duplicazione e replicazione sono la stessa cosa) si ha che le due molecole di DNA figlie hanno un filamento parentale, quello originario, utilizzato come stampo e un filamento neosintetizzato, copiato. Origini di replicazione e bidirezionalità della replicazione ORIGINE DI REPLICAZIONE = sito sul DNA che viene riconosciuto dalle proteine coinvolte per iniziare la replicazione. E’, quindi, una sequenza di DNA da cui parte il processo di replicazione. L’origine di replicazione viene anche chiamata REPLICATORE. Nell’immagine viene riportata la differenza tra procarioti ed eucarioti: Nei procarioti, il replicatore è uno solo ed è indicato in verde, che viene riconosciuto da un INIZIATORE, ovvero una proteina o un complesso proteico, che riconosce in maniera specifica questa origine di replicazione, avviandone la replicazione. L’immagine mostra bene che quando l’iniziatore riconosce il replicatore, questo determina una fusione locale del DNA a livello di questa regione riconosciuta e si va a formare così la bolla di replicazione, denaturando il DNA e formando quindi un singolo filamento, che può funzionare da stampo per la sintesi delle nuove molecole di DNA. Nella maggior parte dei casi, da questa bolla, si creano due forcelle di replicazione, una a destra e una sinistra, a livello della quale il DNA viene replicato nelle due direzioni. Il risultato alla fine è che si ottenga da una molecola di DNA due molecole di DNA figlie, che hanno un filamento parentale e un filamento neosintetizzato. Il replicone, invece, è quella porzione di DNA che viene replicata a partire da un replicatore/origine di replicazione. Nel caso dei procarioti, dove si ha un solo replicatore, il replicone corrisponde all’intero cromosoma o all’intero plasmide. Il fatto che si creino due forcelle di replicazione, dove una va in una direzione e una nell’altra, rende la replicazione BIDIREZIONALE, sia negli eucarioti, che nei procarioti. Negli eucarioti, invece, non vi è una sola origine di replicazione ma ve n’è più di una. Nell’immagine si vede un cromosoma lineare, con molte più origini di replicazioni rispetto ai procarioti (nell’uomo ve ne sono circa 10.000). Sono disegnate 5 origini di replicazione o replicatori. Anche in questo caso i replicatori vengono riconosciuti dagli iniziatori e il legame tra i due crea delle bolle di replicazione. Bisogna ricordare però che i cromosomi eucariotici vengono replicati una sola volta per ogni ciclo cellulare e questo significa che le origini degli eucarioti si attivino solo una volta per ciclo cellulare, assicurando così che il cromosoma venga replicato una sola volta per ciclo cellulare. Non tutte le origini di replicazione sono utilizzate in contemporanea ad ogni divisione cellulare, ad esempio nell’uomo vi sono 10.000 origini di replicazione, ma non vengono tutte e 10.000 attivate a ogni ciclo cellulare, ma solo alcune. La loro accensione è sotto uno stretto controllo temporale specifico, durante la fase S, dove il DNA si replica. Anche in questo caso dalle bolle di replicazione parte una replicazione bidirezionale e si creano due forcelle, dove una va a sinistra e l’altra a destra e via via si vanno ad allargare queste bolle, poi si fondono le une con le altre, creando una replicazione completa dei cromosomi lineari e permettendo una sola replicazione per ciclo cellulare. Anche negli eucarioti la replicazione è bidirezionale, nella maggior parte dei casi. Esistono delle eccezioni, dove la replicazione è UNIDIREZIONALE, in quanto si ha una forcella sola che va in una sola direzione. Come si vede nell’immagine, l’origine di replicazione è a sinistra, si è creata la bolla, ma si ha una sola forcella di replicazione, per cui il DNA si separa solo nella direzione indicata dalla freccia rossa, creando del DNA parentale a singolo filamento utile come stampo. Questo si verifica in alcuni casi, ad esempio nei plasmidi, nei fagi ed in alcuni virus di eucarioti. I principi generali della replicazione del DNA SUBSTRATI NECESSARI PER LA SINTESI DEL DNA La sintesi del DNA richiede, oltre la DNA polimerasi, enzima deputato alla sintesi del DNA, altri substrati fondamentali: 1) 4 deossiribonucleosidi trifosfato che vengono indicati con dNTP, dove N può essere, in base alla base, dATP, dGTP, dCTP o dTTP. È ovvio che si ha bisogno di tutti e quattro i nucleotidi, perché se si deve copiare tutto lo stampo, nello stampo si hanno tutte e 4 le possibili basi, quindi, è necessario avere tutti e i 4 deossiribonucleosidi trifosfato. (Il deossiribonucleoside trifosfato è un deossiribosio, quindi privo del 2’OH sullo zucchero, il quale è coniugato con una base e al 5’ con i tre gruppi fosfato, alfa, beta e gamma). Il nucleotide quando è ancora libero e non è ancora incorporato nella catena polinucleotidica di DNA o RNA, viene ad avere al 5’ tre gruppi fosfato, indicati con le lettere greche, sulla base che siano vicini o meno al carbonio in 5’. Il primo fosfato che è legato al C in 5’ è detto ALFA, a seguire beta e gamma. 2) COMPLESSO INNESCO-STAMPO o PRIMER-TEMPLATE: nell’immagine, in grigio, vi è il filamento stampo o DNA parentale. Per iniziare la sintesi, la DNA polimerasi non ha bisogno solo dello stampo ma anche di un primer, un innesco, ovvero una sequenza/tratto più o meno lunga/o di DNA o RNA che presenta l’estremità 3’OH libera, fondamentale perché è in questo punto che l’enzima, la DNA polimerasi, aggiungerà i nucleotidi complementari con le basi del filamento stampo. L’innesco può essere a DNA o RNA. In vivo, quindi all’interno delle cellule, l’innesco è sempre a RNA. In vitro, quando si fa la PCR (= reazione di polimerizzazione a catena che consente di andare ad amplificare tante copie di certe regioni di DNA, usando tutti i substrati di cui si sta discutendo in quel momento), l’innesco è sempre a DNA. La DNA polimerasi, per funzionare, ha bisogno del complesso innesco-stampo, oltre che dei dNTP. La RNA polimerasi, enzima dedicato alla sintesi del RNA, usando sempre il DNA come stampo, riesce a farlo senza inneschi. MECCANISMO DI SINTESI DELLA DNA POLIMERASI Lo stampo è in grigio e l’innesco in azzurro, con le basi appaiate per complementarietà con quelle dello stampo. In alto vi è il nucleotide da aggiungere, il dNTP. Quindi il nucleotide in entrata si appaia con la sua base complementare dello stampo e l’estremità 3’OH libera dell’innesco, catalizza, o meglio esercita un attacco nucleofilo sul fosfato alfa del nucleotide in entrata, il risultato è la formazione di un nuovo legame fosfodiesterico tra il nucleotide che è stato aggiunto all’estremità 3’ e l’innesco. Dal punto di vista chimico, la DNA polimerasi catalizza questa reazione, indicata con la freccia rossa, favorendo, quindi, questo attacco nucleofilo. Il risultato (immagine più in basso) è che l’innesco, addizionato di un nucleotide, ha ancora una estremità 3’OH libera, portata dal nucleotide aggiunto, che può essere allungata in una reazione successiva. La direzione con cui viene sintetizzato il filamento è 5’→ 3’; tutte le polimerasi sintetizzano in questa direzione, sia che siano a DNA o RNA. Nel momento in cui avviene questa reazione di catalisi, dove il 3’OH colpisce il fosfato alfa del nucleotide, viene rilasciato pirofosfato, in quanto il nucleotide è trifosfato (si rompe il legame tra fosfato alfa e beta). Il pirofosfato verrà a sua volta scisso in due molecole di fosfato ad opera della pirofosfatasi. L’idrolisi del pirofosfato è una reazione che rilascia molta energia, fondamentale per far avvenire la reazione di catalisi, in quanto la prima reazione di catalisi è una reazione che ha un'energia modesta. Il vero motore energetico che favorisce la reazione di catalisi è la successiva idrolisi del pirofosfato dalla pirofosfatasi. IL MECCANISMO DI AZIONE DELLA DNA POLIMERASI La DNA polimerasi ha un solo sito attivo per catalizzare la sintesi del DNA. Il 3’ OH libero dell’innesco servirà per fare l’attacco nucleofilo sul fosfato del nucleotide entrante. La DNA polimerasi non è in grado di discriminare dal suo sito attivo il nucleotide corretto, cioè quello che con sé porta una base complementare al suo stampo, rispetto ad un nucleotide non corretto. Quando il nucleotide entra nel sito attivo dell’enzima e si appaia correttamente con la sua base, con la base dello stampo, a singolo filamento, il nucleotide si trova a una distanza ottimale, o meglio il suo fosfato alfa si trova alla distanza ottimale per subire l’attacco nucleofilo da parte del 3’ OH. Nel sito attivo, infatti, può entrare un nucleotide errato e questo causa un mancato appaiamento delle basi e questo fa si che il nucleotide in entrata non sia ad una distanza corretta, ovvero vi sia una distanza eccessiva tra il 3’OH libero dell’innesco e il fosfato alfa. In questo caso la DNA polimerasi viene a ridurre notevolmente la sua velocità di polimerizzazione o velocità di incorporazione. La sua attività catalitica viene a ridursi di 10.000 volte rispetto alla situazione in cui il nucleotide in entrata è corretto. La DNA polimerasi favorisce la catalisi e perciò aumenta la velocità di formazione del legame, quando il nucleotide che entra è quello corretto. Un’altra funzione della DNA polimerasi è la discriminazione fra ribonucleosidi e deossiribonucleosidi trifosfato. Nella cellula, la concentrazione di ribonucleosidi trifosfato è, approssivamente, più alta di quella dei deossiribonucleosidi. Ciononostante, riesce ad incorporare il dNTP ad una velocità più elevata rispetto agli rNTP. Gli rNTP vengono incorporati ad una velocità che è ben 1000 volte più bassa di quella per incorporare i dNTP. Il motivo per il quale l’enzima li incorpora molto più lentamente è che, a livello del sito attivo dell’enzima, avviene la discriminazione sterica; lo zucchero del nucleotide (dNTP) entrante si colloca in una tasca del sito attivo, dove sono presenti aminoacidi discriminatori: in genere sono gli amminoacidi glutammici che formano interazioni deboli con l’anello dello zucchero (sono forze/interazioni di Van der Waals) e queste interazioni contribuiscono ad aiutare il fosfato a mantenere una distanza ottimale dall’estremità 3’OH. Se nel sito attivo entrassero gli rNTP, gli amminoacidi non potrebbero legarsi allo zucchero (che è un ribosio) in quanto quest’ultimo presenterebbe sul C2’ un gruppo OH che causerebbe ingombro sterico, che gli impedisce di andare a posizionare lo zucchero nella tasca di legame e di interagire con gli aa discriminatori. STRUTTURA DELLA DNA POLIMERASI La struttura della DNA polimerasi viene indicata con una mano, dove i suoi 3 domini sono il palmo, le dita e il pollice. Le dita e il pollice sono composti da 𝛼-eliche, il palmo da un foglietto-𝛽. Alloggiata sul palmo si trova la giunzione innesco-stampo. Il sito catalitico è posizionato tra le dita e il pollice. Il palmo contiene gli elementi principali del sito catalitico (siti di legame per gli ioni metallici bivalenti) e inoltre controlla l’appaiamento delle basi appena polimerizzate, influendo fortemente sull’accuratezza della sintesi del DNA (controllo della fedeltà replicativa). Nel palmo si svolge anche un’altra importante attività, oltre al sito attivo, chiamata attività di correttore di bozze o proofreading. Questo tipo di attività consente di andare a riparare eventuali errori di sintesi. Nel sito catalitico ci sono due ioni metallici bivalenti, che sono Mg2+ e Zn2+, importanti per la reazione di polimerizzazione perché funzionano da catalizzatori (velocizzano la reazione di polimerizzazione). Uno ione, nell’immagine lo ione metallico A, interagisce direttamente con l’estremità 3’-OH dell’innesco e va a ridurre l’affinità dell’ossigeno per l'idrogeno, in modo tale da generare un 3’O- (rendendolo molto elettrofilo), diventando particolarmente instabile e si velocizza l’attacco nucleofilo al fosfato alfa del dNTP . L’altro ione metallico, lo ione metallico B, stabilizza le cariche negative dei gruppi fosfato del nucleotide entrante (dNTP) , quindi ha una funzione stabilizzatrice; lo fa sia quando il dNTP è appaiato (ovvero quando sono presenti ancora i 3 fosfati), sia quando verranno rilasciati gli ioni ortofosfato (gamma e beta). LE DITA DELLA DNA POLIMERASI SONO IMPORTANTI PER LA CATALISI Le dita della DNA polimerasi sono costituite da 𝛼 eliche e una di queste, l’ELICA O, ha la capacità di ruotare. Le dita, con un ripiegamento da 40°, stabilizzano il legame tra il nuovo dNTP e il filamento stampo: stimolazione della catalisi spostando il dNTP in entrata vicino al sito di cationi bivalenti nel palmo. In posizione 5’ del filamento stampo è presente una cisteina, che deve essere riconosciuta dalla guanina entrante come dNTP. Quando G entra nel sito attivo e si appaia con C dello stampo, l’elica si piega di 40° e interagisce con il nucleotide in entrata attraverso 3 aa conservati: arginina, lisina e tirosina. Quando le dita interagiscono con il dNTP, lo spingono ancora di più verso il sito attivo e verso 3’-OH, in modo tale che venga facilmente attaccato. Anch’esse concorrono, come il palmo, alla reazione di catalisi. Le dita entrano in contatto anche con la regione dello stampo a singolo filamento e l’interazione delle dita con lo stampo a singolo filamento fa piegare di 90° il legame fosfodiesterico tra la prima e la seconda base dello stampo, che si trovano subito dopo la giunzione innesco stampo. In questo modo solo la prima base, subito dopo l’innesco, che deve ricevere quella complementare, risulta ben visibile. IL POLLICE DELLA DNA POLIMERASI Il pollice non è coinvolto nella catalisi enzimatica. Ha più una funzione stabilizzatrice, serve a stabilizzare il complesso tra innesco-stampo e DNA polimerasi, interagendo in particolare con il DNA neosintetizzato. Grazie a questa sua funzione di stabilizzazione si riesce a mantenere ad una corretta posizione a livello del palmo l’innesco a livello del sito attivo. FEDELTÀ DI REPLICAZIONE DEL DNA La replicazione o sintesi del DNA viene ad avere una caratteristica fondamentale, ovvero che ha un meccanismo fedele. Dire che un processo è fedele vuol dire che è un processo molto accurato, che fa pochi errori. Durante la sintesi del DNA vi è 1 errore ogni 109/1010 nucleotidi polimerizzati. Questa alta accuratezza è assicurata da 3 diversi elementi: 1. selettività della DNA polimerasi 2. attività esonucleasica 3. riparazione degli errori Solo la selettività non basterebbe, perché si riuscirebbe ad assicurare solo una frequenza di errori che arriva ad un errore ogni 10^5-10^6 nucleotidi polimerizzati. Nel palmo vi è un’attività di correzione di bozze, attività esonucleasica. Questa attività assicura una maggiore fedeltà della DNA polimerasi, portandola a 1 errore ogni 10^7 nucleotidi polimerizzati. Si raggiunge poi il massimo valore di fedeltà di replicazione attraverso i meccanismi di riparazione degli errori. ATTIVITÀ ESONUCLEASICA O PROOFREADING (= correttore di bozze) ESONUCLEASI: enzima che stacca i nucleotidi uno alla volta partendo da un'estremità del DNA a singolo filamento. L’attività dell’esonucleasi, ovvero correttore di bozze, si trova nel palmo e rimuove la base non correttamente appaiata all’estremità 3’ (direzione 3’→5’). In questo caso se vi è una C al posto di una T, si parla di MISMATCH o appaiamento delle basi scorretto, che viene rimosso attraverso un’attività esonucleasica 3’→ 5’, propria dell’attività esonucleasica. Una volta che il nucleotide errato è stato eliminato, la DNA polimerasi può riprendere la sua attività, usare di nuovo lo stampo, per sintetizzare correttamente il filamento. Quando c’è un’estremità 3’ male appaiata, gli ultimi nucleotidi dell’innesco diventano a singolo filamento, si separano dallo stampo e ciò determina una maggiore affinità per il sito attivo dell’esonucleasi. Infatti, la velocità di polimerizzazione diminuisce, mentre aumenta quella di correzione dell’errore da parte dell’attività esonucleasica, che rimuove dall’innesco il nucleotide errato (spesso anche un nucleotide in più). Una volta che il nucleotide errato è stato rimosso, l’innesco si riappaia con lo stampo e una volta ricreata la doppia elica, si riporta nel sito attivo e si riparte con l'attività polimerasica. CONFORMAZIONI TAUTOMERICHE L’ossigeno della T, U, G, preferisce la forma chetonica al posto dell’enolica. La forma amminica è preferita rispetto all’imminica. Gli appaiamenti di Watson e Crick sono possibili solo tramite forme tautomeriche preferite. Un altro esempio, l’immina, o meglio la citosina nella forma imminica, non si appaia con la guanina ma preferisce appaiarsi con l’adenina. Quando queste forme tautomeriche particolari, come l’enol-guanina o la citosina imminica, sono usate dalla DNA polimerasi come dNTP da polimerizzare, le va ad appaiare con le basi non corrette e si crea quindi un appaiamento errato. La presenza di mismatch si verifica perché la DNA polimerasi incorpora dei nucleotidi, non nella forma tautomerica più frequente, ma in quella più rara. PROCESSIVITÀ DELLA DNA POLIMERASI Un’altra caratteristica della DNA polimerasi, oltre alla fedeltà, è la processività. GRADO DI PROCESSIVITÀ: numero medio di nucleotidi polimerizzati dall’enzima ogni volta che si lega ad una giunzione innesco-stampo. Il legame della DNA polimerasi con il filamento innesco-stampo è un evento lento nell’ambito della biologia molecolare (dura circa 1 sec). Una volta che la DNA polimerasi riconosce la giunzione innesco stampo, e vi si lega, ci ritroviamo di fronte a due possibilità di DNA polimerasi, NON PROCESSIVA o PROCESSIVA. Il 1° tipo di DNA polimerasi, ovvero DNA polimerasi NON PROCESSIVA, aggiunge un solo dNTP all’estremità 3’-OH dell’innesco e successivamente si distacca dalla giunzione innesco stampo, quindi aggiunge 1 nucleotide al secondo. La DNA polimerasi di 2° tipo, PROCESSIVA, aggiunge molte dNTP alla volta, arrivando anche a 1000 nucleotidi al secondo; quando gli aggiunge poi si distacca. L’evento limitante della processività della DNA polimerasi è che essa rimanga associata alla giunzione innesco-stampo. A livello della forca replicativa la DNA polimerasi polimerizza da migliaia a milioni di nucleotidi senza mai lasciare la giunzione innesco-stampo. Come è possibile? Grazie a delle proteine aggiuntive, le SLIDING CLAMP (= pinza scorrevole) STRUTTURA E FUNZIONI SLIDING CAMP E’ un trimero (formato da 3 subunità) con forma circolare, a forma di ciambella, dove al centro scorrerebbe il DNA (filamento stampo + innesco). Tra il bordo interno della sliding camp e il DNA abbiamo uno spazio sufficiente che di solito è occupato da uno o due strati di molecole d’acqua; questi strati sono importanti per far scorrere velocemente la sliding camp sulla giunzione innescostampo. La sliding camp interagisce anche con la DNA polimerasi, impegnata in quella giunzione innescostampo a sintetizzare il DNA. Le sliding camp velocizzano la processività della DNA polimerasi a livello della forca replicativa. La DNA polimerasi tenderebbe a distaccarsi dalla giunzione innesco-stampo ogni 20-100 nucleotidi polimerizzati, però grazie all’interazione con la sliding clamp rimane in loco ed è pronta, quindi, a riattaccarsi prontamente alla giunzione. FORCA REPLICATIVA Entrambi i filamenti di DNA parentale vengono sintetizzati simultaneamente a livello della forca replicativa, ma in modo asimmetrico. Per forca replicativa si intende il punto in cui il DNA si deve separare, si disavvolge per essere duplicato (ma una parte rimane momentaneamente a doppia elica fino a quando non verrà disavvolta anche questa). I filamenti, essendo antiparalleli, devono essere entrambi usati come stampo e sintetizzare contemporaneamente → formazione di 2 filamenti (discontinuo e continuo). I due filamenti neosintetizzati vengono ad essere chiamati in due modi diversi: filamento guida (leading strand) e filamento discontinuo (lagging strand), perché i due filamenti separati della doppia elica a livello della forca replicativa vengono replicati in contemporanea, però essendo antiparalleli e essendo che la DNA polimerasi lavora comunque su entrambi i filamenti stampo in direzione 5’ à 3’, hanno delle caratteristiche differenti. Il filamento continuo, guida, non contiene frammenti, in quanto la DNA polimerasi segue la stessa direzione in cui si muove la forca replicativa, quindi, viene sintetizzato in maniera continua. Nel caso dell'altro filamento stampo, antiparallelo, la DNA polimerasi si deve muovere in direzione opposta (3’→ 5’) rispetto al movimento della forca replicativa. Questo comporta che la DNA polimerasi, nel sintetizzare il filamento discontinuo, non riesce a partire subito e a farlo in maniera continua, quindi, la sintesi del filamento discontinuo è ritardata, in modo tale che la forca replicativa possa creare via via una quantità sufficientemente lunga di filamento singolo che funge da stampo. Quindi una volta che si ha creato il primo filamento (in rosso a sinistra↓), la DNA polimerasi aspetta che una porzione sia libera, così torna indietro, usa l’altro primer (in verde a destra) e sintetizza un secondo frammento fino a quando non incontra l’estremità 5’del frammento precedentemente sintetizzato. Nel frattempo, la forca replicativa è andata avanti e si è liberato altro stampo, e quindi la DNA polimerasi torna indietro ancora e sintetizza sempre in direzione 5’→3’, direzione opposta alla forca replicativa. Come si può vedere dall’immagine, il filamento rosso di sintesi non è continuo, ma è formato da tanti frammenti, ognuno dei quali ha un proprio innesco e vengono chiamati FRAMMENTI DI OKAZAKI, che hanno delle dimensioni diverse (nei procarioti vanno dai 1000-2000 nucleotidi mentre negli eucarioti dai 100-400 nucleotidi). Questi frammenti vengono uniti da enzimi per formare un solo filamento unico e vengono definiti come degli intermedi temporanei, durante la replicazione del DNA. DUPLICAZIONE: https://www.youtube.com/watch?v=cIsiJcwwP_0 (si consiglia la visione) Gli enzimi, che agiscono a livello della forca replicativa, sono diversi: A livello della forca replicativa agiscono un complesso di numerose proteine, tant’è che si parla di REPLISOMA. Il replisoma è il complesso di tutte le proteine che operano a livello della forca replicativa e che concorrono al processo di duplicazione o sintesi del DNA. Le attività dei vari enzimi sono riportate nella tabella. RIMOZIONE INNESCHI A RNA: servono a rimuovere i primer a RNA alla fine della sintesi. RIMOZIONE SUPERAVVOLGIMENTI: serve perché i processi che aprono la doppia elica creano dei superavvolgmenti positivi a valle della bolla di replicazione e tali superavvolgimenti devono essere rimossi, perché sennò bloccano la replicazione. ENZIMI CHE AGISCONO A LIVELLO DELLA FORCA REPLICATIVA Ricordiamo che il complesso di tutte le proteine che operano a livello della forca replicativa viene detto REPLISOMA. Andiamo ora nel dettaglio di ognuna di queste: La elicasi viene ad essere colei che si occupa di disavvolgere la doppia elica del nostro DNA. Come vediamo nell'immagine, la sua funzione è, appunto, quella di andare a disavvolgere la doppia elica andando a circondare uno dei due singoli filamenti vicino alla forca replicativa. Come possiamo vedere dalla freccia, quella è la direzione attraverso cui si muove la forcella di replicazione e la nostra DNA elicasi si muove, ovviamente, nella stessa direzione andando praticamente a promuovere la rottura a livello di questa doppia elica che deve essere ancora replicata, che deve essere ancora copiata e sintetizzata; rompe e quindi promuove l'apertura di questa doppia elica rompendo i legami idrogeno e le interazioni idrofobiche fra le basi delle due catene. In particolare, in un primo momento la DNA elicasi si associa ad uno dei due filamenti singoli e poi una volta che lega l’ATP inizia a spostarsi lungo il filamento spostando e aprendo la doppia elica. Fornisce, perciò, un nuovo stampo a singolo filamento. È costituita da sei subunità identiche tra loro che qui vediamo colorate con sei colori diversi; viene chiamata proteina esamerica, con una forma somigliante ad una sorta di ciambella che si avvolge attorno al singolo filamento; ogni subunità è in grado di legare l’ATP. In particolare, in E. coli, ognuna delle subunità, in base al momento, lega l’ATP che verrà consumato e trasformato in ADP staccandosi dall’enzima stesso. In altre parole, la DNA elicasi si comporta da motore molecolare, capace di scorrere attivamente sul DNA, consumando ATP. Ogni monomero (subunità) ha una particolare conformazione se è legato all’ATP; una volta che idrolizza l’ATP scatta un’altra conformazione, quando poi l’ADP si stacca si promuove ancora un altro cambiamento conformazionale riportando ciascun monomero ad una sorta di stato iniziale e ricomincia un nuovo ciclo. Il passaggio coordinato delle sei subunità da una conformazione all’altra produce il movimento dell’elicasi lungo il singolo filamento. Grazie ai cambiamenti conformazionali indotti dal legame con l’ATP, con l’ADP o con il rilascio di ADP si determina il movimento dell’elicasi lungo il filamento. A due a due, le subunità si trovano nello stesso stato conformazionale. Questo passaggio, quindi, assicura il movimento. Si crea, in questo modo, un movimento oscillatorio responsabile dello scorrimento dell’elicasi lungo il DNA. Sono nella stessa conformazione le subunità che legano le stesse molecole in quel determinato momento. Le SSB sono proteine monomeriche che si legano al DNA a singolo filamento e consentono di mantenerlo tale stabilizzando la sua struttura prima che questo venga replicato. Il legame di queste proteine al singolo filamento è un legame cooperativo, ciò vuol dire che la presenza di una SSB facilita il legame di un’altra SSB sul tratto di DNA adiacente. Le SSB vanno a legarsi appena il singolo filamento emerge dall’elicasi, perciò non appena viene denaturato. Permettono al DNA di avere una forma ben distesa facilitando il ruolo che poi quel singolo filamento deve avere nelle successive reazioni, cioè di sintesi del DNA o sintesi del primer a RNA. L’interazione avviene in maniera sequenza-indipendente (non riconoscono, perciò, sequenze specifiche) attraverso interazioni elettrostatiche con gruppi fosfato e basi. RNA PRIMASI Sono enzimi che catalizzano la creazione del primer a RNA. Ricordiamo, infatti, che in vivo per creare la giunzione innesco-stampo ho bisogno di un primer a RNA (in vitro primer a DNA). Senza questo primer non si crea la giunzione e la DNA pol non può partire. L’RNA primasi può sintetizzare questi corti primer a RNA (5-10 nucleotidi) usando come stampo il DNA a singolo filamento. Vedremo che le RNA polimerasi, a differenza delle DNA polimerasi, per copiare un filamento non hanno bisogno di primer. La frequenza con cui interviene sui due filamenti di DNA è molto differente (il filamento discontinuo può ricevere centinaia di frammenti di Okazaki, ciascuno con il suo primer). Per la sintesi del filamento continuo ho bisogno di un solo primer, mentre per la sintesi del filamento discontinuo avrò bisogno di più primer a seconda di quanti sono i frammenti di Okazaki. La sua attività aumenta notevolmente quando è associata alla DNA elicasi a livello della forcella replicativa. L’RNA primasi è attiva solo sul DNA a singolo filamento svolto da poco sulla forca replicativa (stampo di ssDNA associato a proteine SSB). Ricordiamo che i primer, alla fine della sintesi, devono essere rimossi perché i miei filamenti di DNA neosintetizzati devono essere tutti a DNA. La rimozione degli inneschi è assicurata: -in E. coli dalla ribonucleasi H e dalla DNA polimerasi I; -negli eucarioti da un’endonucleasi FEN1; In questa immagine (E. coli) abbiamo in alto il filamento parentale e in basso in verde il primer con il frammento di Okazaki. Per rimuovere il primer interviene una ribonucleasi che elimina i nucleotidi uno alla volta andando a lavorare sui ribonucleotidi; stacca un ribonucleotide alla volta. Essa è specifica nell’andare ad idrolizzare l’RNA quando è appaiato al DNA. Rimuove tutto il primer tranne un ribonucleotide che è legato ad un deossiribonucleotide che è quello di inizio del frammento di Okazaki successivo. Interviene una esonucleasi 5’ ad eliminare questo ultimo ribonucleotide. Ottengo un gap che occorre riparare, interviene, quindi, la DNA polimerasi I. La DNA polimerasi I riconosce la giunzione innesco-stampo del frammento neosintetizzato ed inizia a colmare il gap aggiungendo deossiribonucleotidi. Negli eucarioti interviene FEN1 ed il meccanismo risulta leggermente differente. In questo caso la DNA polimerasi che si dedica alla sintesi del filamento discontinuo si chiama delta. Quando la DNA polimerasi delta viene a raggiungere l’estremità 5’ (del frammento di Okazaki precedente) non si ferma ma continua a sintetizzare spiazzando il filamento a valle ed andando ad estendere il frammento di Okazaki neosintetizzato. Spiazzandolo si crea un flap, un tratto che si stacca dallo stampo e viene sollevato, dove poi interviene una FEN 1. Il filamento stampo mancante continua ad essere colmato dalla DNA polimerasi delta che procede con la sintesi. Quando la DNA polimerasi è impegnata nella sintesi, in questo caso del filamento discontinuo, viene ad incontrare il frammento di Okazaki successivo neosintetizzato, lo spiazza e questo flap viene tagliato e l’eventuale gap viene colmato dalla DNA pol delta. A questo punto, quando arriva a colmare questo gap, il legame fosfodiesterico mancante viene saldato da una DNA ligasi. La DNA ligasi è un enzima che ingaggia un legame fosfodiesterico: La DNA ligasi, quindi, ripara i nic, cioè il legame fosfodiesterico mancante fra due nucleotidi adiacenti. In questo caso il legame deve essere instaurato tra l’estremità 5’ P di un nucleotide con l’estremità 3’OH di quello successivo. Per far ciò occorre attivare questa estremità 5’P con una molecola di ATP. La DNA ligasi utilizza ATP in quanto trasferisce AMP rilasciando pirofosfato sull’estremità 5’ così attivata, dal punto di vista energetico, e viene così attaccata dal 3’OH che esegue un attacco nucleofilo. RIMOZIONE SUPERAVVOLGIMENTI In E. Coli abbiamo Girasi e Topoisomerasi IV e negli Eucarioti Topoisomerasi II. I superavvolgimenti sono introdotti a valle della forcella di replicazione dall’azione della DNA elicasi che denatura i due filamenti. Questa apertura della doppia elica provoca la comparsa a valle di superavvolgimenti positivi e perciò con andamento destrorso. Se questi superavvolgimenti non vengono rimossi possono bloccare la replicazione; è importante quindi che, mentre l’elicasi disavvolge la doppia elica, la topoisomerasi vada direttamente a rimuovere i superavvolgimenti positivi. Cioè taglia i due filamenti, fa passare la doppia elica integra e rinsalda l’estremità creando un superavvolgimento negativo che è quello naturale e spontaneo del DNA. Meccanismo di replicazione del DNA nei procarioti e negli eucarioti Meccanismo di replicazione del DNA nei procarioti: La replicazione per avere inizio ha bisogno di un’origine di replicazione, chiamata anche replicatore. Nell’immagine è riportato il replicatore di E. coli, modello per gli organismi procarioti. Si presenta con cinque regioni ripetute da 9pb ciascuna (in verde) che rappresentano il sito di legame al DNA dell’iniziatore. Iniziatore sta ad indicare la proteina che riconosce l’origine di replicazione e promuove la fusione, separazione delle due doppie eliche, creando poi, di conseguenza, le due forcelle di replicazione. Questo perché la replicazione è bidirezionale e si basa, quindi, su due forcelle di replicazione. In E. coli l’iniziatore prende il nome di DnaA e il replicatore di OriC. Accanto alle sequenze in verde vediamo in blu tre sequenze ripetute da 13pb ciascuna che sono gli elementi che promuovono l’apertura della doppia elica. I Dna A associati all’ATP (più molecole) riconoscono i siti di riconoscimento dell’oriC. Una volta avvenuto il legame si ha la separazione della doppia elica a livello delle sequenze da 13pb. Si crea una bolla di replicazione. A livello di questa bolla, su ciascun filamento, vengono riconosciuti dal Dna B (una DNA elicasi) che, però, per legarsi al filamento necessita di essere legato ad un aiutante, cioè un caricatore che prende il nome di DnaC. Questo complesso è costituito da due copie, una si lega al filamento di Dna stampo e l’altra all’altro filamento. È importante notare che la Dna elicasi fintanto che è associata al suo caricatore è inattiva, quindi, sotto forma di complesso l’enzima Dna elicasi non funziona. La fase successiva è il riconoscimento e legame di una primasi. La primasi (indicata in verde) è l’enzima deputato a sintetizzare l’RNA, o meglio il primer a RNA. Una volta che la Dna elicasi ha reclutato una molecola di primasi si ha che la primasi sintetizza per ciascun filamento stampo un primo primer a RNA. Questo determina la dissociazione del caricatore dell’elicasi che rende attiva l’elicasi e associata alla primasi inizia a separare la doppia elica che deve ancora essere denaturata e copiata. Notiamo dall’immagine che abbiamo due direzioni e quindi due forcelle di replicazione per ogni origine di replicazione, una che va verso destra ed una che va verso sinistra. Dobbiamo immaginare tutti i protagonisti di questo processo in doppio: avremo, quindi, due replisomi, un replisoma che si impegna nella forcella di replicazione di destra ed un altro che si impegna nella forcella di replicazione di sinistra. Per rendere meglio l’idea possiamo immaginare una linea tratteggiata che, idealmente, divide in due metà ed abbiamo una forcella da una parte ed una dall’altra. Ogni forcella ha il suo corredo di proteine coinvolte nella replicazione. RIASSUMENDO: L’origine di replicazione viene riconosciuta da più proteine Dna A associate all’ATP. Dna A è l’iniziatore, cioè comprende quelle proteine che legano l’origine di replicazione, in particolare a livello delle sequenze ripetute da 9pb ciascuna. Questo determina la separazione della doppia elica creando una bolla di replicazione partendo da regioni ripetute da 13pb. Una volta disponibili i filamenti singoli avviene il caricamento della DNA elicasi associata al suo caricatore; quindi, il caricatore aiuta la DNA elicasi, che è un esamero circolare, ad aprirsi e ricongiungersi attorno a ciascun filamento. Ma la DNA elicasi quando è ancora associata al caricatore non è attiva. La fase successiva, infatti, prevede che l’elicasi si leghi, quindi, recluti una primasi e la primasi, nel momento in cui sintetizza il primer a RNA, determina il rilascio del caricatore con la conseguente attivazione della DNA elicasi. Nel punto (e) nell’immagine vediamo due frecce che indicano il movimento, una verso destra ed una verso sinistra creando le forcelle di replicazione e separando il DNA a doppia elica che deve ancora essere replicato. A questo punto, nel momento in cui lo stampo è disponibile entrano in gioco le DNA polimerasi rappresentate con una sorta di mano destra. Ce ne sono tre che lavorano in maniera coordinata grazie ad un anello. Le DNA polimerasi che lavorano per ciascuna forcella di replicazione sono tre e sono organizzate in un complesso chiamato: DNA polimerasi III oloenzima. In E. Coli l’RNA primasi viene chiamata DnaG. Per semplicità nell’immagine non sono state indicate le SSB, ma nel momento in cui la DNA elicasi viene a separare le nostre doppie eliche, le SSB vengono immediatamente a ricoprire il filamento singolo in modo da evitare che si vadano di nuovo ad accoppiare. Per ogni forcella di replicazione va sintetizzato sia il filamento continuo che quello discontinuo, quindi, per coordinare l’applicazione su entrambi i filamenti avremo più DNA polimerasi, per la precisione tre. In E. coli il coordinamento di queste tre polimerasi è coadiuvato dal legame con una struttura chiamata caricatore della sliding clamp. È costituita da cinque subunità, di cui tre hanno delle braccia flessibili che si muovono su e giù e vengono chiamate proteine t (tau); Facciamo chiarezza: l’enzima che si occupa della sintesi del DNA è chiamato core della Pol III; poi abbiamo il caricatore della sliding clamp e la sliding clamp; tutto questo complesso è chiamato Dna polimerasi III oloenzima. OLOENZIMA: indica un complesso multiproteico in cui ho una proteina (core) che ha l’attività catalitica ed è associata ad altri elementi, altre proteine che vanno ad aumentare, regolare, coadiuvare la sua funzione. Ho tre Pol III core perché una polimerasi sintetizza il filamento guida e le altre due si occupano della sintesi del filamento discontinuo. Per spiegare come funziona questo oloenzima a livello della forcella di replicazione è stato proposto un modello, il modello a trombone, che spiega come è possibile il coordinamento delle due DNA polimerasi impegnate nella sintesi del filamento discontinuo. Ricordiamo che modello sta per ipotesi di come queste DNA Pol lavorano e deriva da evidenze sperimentali. La doppia elica che vediamo in grigio è la doppia elica che deve essere ancora aperta. Vediamo, poi, i filamenti che sono stati aperti, sempre in grigio, e che fungeranno da stampo e per ognuno dei due sono collocate le proteine SSB. In mezzo c’è l’oloenzima con il caricatore, le braccia ed una DNA polimerasi per ogni braccio. La DNA polimerasi viene posta sul filamento stampo associata con la nostra ciambella, cioè la sliding clamp che assicura che la DNA polimerasi sia altamente processiva. Sul filamento continuo non c’è problema perché, abbiamo detto, nella sintesi del filamento guida (o continuo) la DNA polimerasi si muove verso destra, nella stessa direzione della forcella di replicazione e non ho nessun’interruzione. Nel disegno non è riportato il primer a RNA, ma ricordiamo che per il filamento singolo c’è ed è uno solo. È mostrata la DNA Elicasi (in arancione) che apre la doppia elica e manca la primasi che va a sintetizzare il primer a RNA. Ricordiamo che per il filamento discontinuo avremo un primer a RNA per ogni frammento di Okazaki presente. Nella sintesi di questo filamento sono coinvolte due polimerasi; una prima che sta finendo di sintetizzare un frammento di Okazaki; la seconda che viene reclutata immediatamente una volta che la DNA elicasi si è spostata di circa 1000 basi, momento in cui ho sufficiente stampo. In altre parole, in questo tipo di processo abbiamo una DNA polimerasi impegnata nel processo di sintesi del filamento continuo e le altre due DNA polimerasi impegnate nel processo di sintesi dei vari frammenti di Okazaki. Arrivano sul filamento stampo per la sintesi del filamento discontinuo non contemporaneamente ma prima una e poi l’altra, perché occorre avere una quantità di stampo sufficientemente lunga per poter essere copiato. Quando una DNA polimerasi viene a colpire l’estremità 5’ del frammento di Okazaki e quindi termina la sua sintesi, questa DNA polimerasi si stacca, attende che l’elicasi abbia separato la doppia elica di circa 1000 basi fornendo uno stampo a singolo filamento sufficiente su cui viene sintetizzato il primer ad innesco e viene caricata la sliding clamp con questa DNA polimerasi. Sul filamento stampo le due sliding clamp su cui non arrivano contemporaneamente possono essere impegnate nella sintesi contemporanea dei frammenti di Okazaki ma solo se ho sufficiente stampo; quindi, lavoreranno in maniera ritardata, cioè una delle due è avanti rispetto all’altra. RICAPITOLANDO: Sul filamento continuo ho una DNA polimerasi che lavora ininterrottamente fino alla fine. Sul filamento discontinuo lavorano in contemporanea le due DNA polimerasi ma non saranno mai entrambe allo stesso punto, perché il requisito fondamentale è che io abbia almeno 1000 basi sul filamento stampo. Vediamo le due forcelle, una che lavora verso sinistra ed una verso destra fino a giungere ad un punto di terminazione, momento in cui queste forcelle vanno ad incontrare sequenze apposite che si chiamano sequenze ter. La terminazione della replicazione è, perciò, controllata da queste sequenze ripetute di 23pb che sono esattamente all’opposto (180°) rispetto ad oriC (origine di replicazione). Le forcelle di replicazione andranno poi, quindi, ad incontrarsi dalla parte opposta rispetto al punto da cui erano partite. Per impedire che le forcelle di replicazione continuino e vadano oltre queste sequenze ter, queste legano alcune proteine dette TBP che sta per Ter Binding Protein e creano un blocco che fa fermare le forcelle. Alla fine della replicazione ottengo due molecole di DNA replicate con in grigio il filamento parentale e in arancione quello copiato. Per terminare il tutto bisogna separarle e per separarle occorre l’intervento di un ulteriore enzima, la Topoisomerasi IV di classe seconda, cioè quelle che rompono i due filamenti e fanno passare la doppia elica integra attraverso la rottura e rinsaldano la stessa. Quindi, tra le varie funzioni, le topoisomerasi possono decatenare i prodotti della replicazione. MECCANISMO DI REPLICAZIONE DEL DNA NEGLI EUCARIOTI La forca replicativa è più complessa negli eucarioti ed è anche meno conosciuta. Anche a livello eucariotico ad ogni attività corrisponde una proteina. Sono tre le differenze principali tra eucarioti e procarioti: 1. inizio replicazione 2. switching delle polimerasi 3. terminazione replicazione cromosomi lineari In questa immagine vengono illustrate le attività e le funzioni delle DNA polimerasi in procarioti ed eucarioti. Notiamo che nei procarioti (E. coli) le DNA polimerasi sono specializzate in ruoli diversi all’interno della cellula e sono piuttosto numerose; ne abbiamo più di cinque nei procarioti e negli eucarioti arriviamo a 15; NB: molte di queste DNA polimerasi intervengono con altre funzioni (non solo quelle specifiche per la replicazione) come, ad esempio, nella riparazione del DNA; Negli Eucarioti abbiamo, in particolare, le polimerasi che sono impegnate a livello della forcella di replicazione rappresentate dalla Pol alfa (sintesi innesco), Pol delta (sintesi DNA sul filamento discontinuo) e Pol epsilon (sintesi DNA sul filamento guida); Pol delta e Pol epsilon sono entrambe coinvolte anche in due meccanismi di riparazione, quello per escissione delle basi e dei nucleotidi; Esistono, inoltre, altre DNA pol a livello eucariotico coinvolte in altri meccanismi di riparazione. Lo switching è una caratteristica peculiare della forcella replicativa degli eucarioti: In questa immagine troviamo in alto il DNA parentale grigio ed è stato sintetizzato un frammento di Okazaki, con in verde il primer a RNA ed in grigio il DNA neosintetizzato. Occorre, ora, andare a sintetizzare un nuovo frammento di Okazaki; per prima cosa, bisogna sintetizzare il primer a RNA; Ecco che, quindi, lo stampo viene riconosciuto da questa DNA Pol alfa che è associata ad un’attività primasica; Successivamente la DNA Pol alfa continua ad allungare questo primer arrivando ad un segmento di DNA di circa 50-100 nucleotidi che comprende il primer e l’allungamento che è stato realizzato da Pol alfa. La DNA alfa, come vediamo, però, non è altamente processiva (non è associata a nessuna pinza scorrevole) ed infatti, dopo, si dissocia insieme alla primasi. Al suo posto interviene la Pol delta associata alla sliding clamp e provvede a terminare la sintesi del frammento di Okazaki fino ad incontrare l’estremità 5’ del frammento successivo. Lo switching, perciò, è dato dallo scambio sullo stampo della DNA Pol alfa primasi con la DNA Pol delta. Analoga situazione si presenta sullo stampo per il filamento continuo. In questo caso avremo la DNA Pol alfa primasi che andrà a sintetizzare quell’unico primer a DNA e lo andrà ad allungare di 50-100 nt. Anche in tal caso la DNA Pol alfa primasi andrà a dissociarsi e al suo posto viene reclutata sullo stampo la DNA Pol epsilon che è la DNA Pol che si occupa, appunto, della sintesi del filamento continuo. Lo switching, in altre parole, avviene tra la DNA Pol alfa primasi che switcha con la DNA Pol delta se siamo sullo stampo per la sintesi del filamento discontinuo o con la DNA Pol epsilon se siamo sullo stampo per la sintesi del filamento continuo. Nell’immagine non sono riportati altri elementi ugualmente importanti come, ad esempio, Mcm2-7 che rappresenta la nostra elicasi e RF-C che è il caricatore della sliding clamp. VISIONE ATTUALE DELLA FORCA REPLICATIVA NEI CROMOSOMI EUCARIOTICI: Come attività è identica a quella dei procarioti, cambiano solo i nomi. La struttura esamerica che vediamo è l’elicasi che negli eucarioti viene chiamata Mcm2-7. Abbiamo poi le due polimerasi, tra cui la Pol epsilon associata allo sliding clamp (PCNA). L’altra sliding clamp è associata con la Pol delta. Abbiamo un caricatore di sliding clamp che si chiama RFC che interagisce con le sliding clamp. Vediamo, poi, in giallo, le proteine RPA che sarebbero le SSB che ci assicurano che il filamento rimanga singolo nel momento in cui il DNA viene denaturato. ATTENZIONE: Una novità rispetto ai procarioti è rappresentata dalle GINS e cdc45, importanti molecole che provvedono ad attivare opportunamente l’elicasi. Altri attori: Pol alfa primasi: una volta sintetizzato il primer e allungato il nostro DNA di circa 100nt in totale (compreso il primer) si dissocia; FEN1, Ligasi: coinvolta nel rimuovere il primer a RNA. LA FASE DI INIZIO DELLA REPLICAZIONE NEGLI EUCARIOTI: Ricordiamo che i replicatori negli eucarioti sono molteplici. Nel cromosoma umano, ad esempio, arriviamo fino a 10.000 replicatori. I replicatori vengono ad essere attivati una sola volta per ciclo cellulare (fase S) ma non tutti in contemporanea, alcuni sì ed altri no. Ogni origine di replicazione assicura che durante la fase S tutto il DNA della cellula venga replicato solo una volta. MECCANISMO: Nell’immagine in alto vediamo il DNA parentale in grigio con cinque origini di replicazione riconosciute dall’iniziatore, proteina che provvede a legarsi all’origine di replicazione solo nei punti 3 e 5. In seguito a questo riconoscimento si crea la bolla di replicazione e le forcelle partono a partire dalla forcella di replicazione 3 e 5. Man mano che queste forcelle si spostano aprendo il DNA a destra e a sinistra di ciascuna bolla di replicazione abbiamo che praticamente le origini di replicazioni non attivate adiacenti vengono replicate in maniera passiva. Questo perché vengono rivestite dalla bolla di replicazione che si apre e viene copiata. Quindi le origini di replicazione che all’inizio non erano state riconosciute verranno comunque replicate in un secondo momento perché la bolla apre e investe (motivo per cui parliamo di passiva) quelle non riconosciute. Ad eccezione dell’origine 1 che si è attivata tramite riconoscimento con un iniziatore. Le croci in rosso indicano che l’attivazione dei replicatori parentali vengono a bloccare l’attivazione dei replicatori sulle molecole neosintetizzate (in rosso) fino al ciclo cellulare successivo. Nel momento in cui vengono attivate le origini di replicazioni sui cromosomi si crea un blocco nell’attivazione delle stesse origini di replicazione ma sul filamento neosintetizzato. In questo modo si evita che il DNA venga replicato due volte. L’origine di replicazione qui riportata è quella del lievito. ORC come anche la DnaA, per legarsi al replicatore viene ad essere associata ad ATP. Il replicatore (ORC) è costituito da due regioni conservate (verde) indicate con A e B1, mentre invece B2 è l’elemento dove viene caricata l’elicasi. Infatti, una differenza sostanziale con i procarioti è che ORC legato ad ATP si associa ai tratti conservati A e B1 ma non promuove la separazione dei due filamenti. Quello che fa è coadiuvare il reclutamento dell’elicasi nel tratto B2. A differenza del DnaA nei procarioti, che una volta legato il replicatore promuove la separazione delle regioni indicate in azzurro, ORC si lega alle regioni in verde ma non determina separazione nella regione adiacente. Piuttosto, in B2 favorisce il caricamento della elicasi. Il caricamento dell’elicasi e l’attivazione dell’elicasi avvengono in due momenti diversi della fase del ciclo cellulare. In particolare, il caricamento dell’elicasi sui replicatori avviene in fase G1 mentre l’attivazione dell’elicasi e l’assemblaggio del replisoma si avrà in fase S. Questa differenza temporale fra il caricamento dell’elicasi e l’assemblaggio del replisoma durante il ciclo cellulare è fondamentale perché assicura che ciascun cromosoma venga replicato soltanto una volta per ciclo cellulare. Come avviene il caricamento dell’elicasi? Abbiamo il replicatore del DNA che viene riconosciuto da ORC (iniziatore) associato ad ATP e successivamente viene legato da un caricatore di elicasi che si chiama Cdc6 associato anch’esso ad ATP. Con questo complesso va ad associarsi l’elicasi che negli eucarioti si chiama Mcm2-7 ed ha una struttura esamerica. Ogni elicasi è associata a sua volta ad un ulteriore caricatore di elicasi che si chiama Cdt1. A questo punto due copie di elicasi associate a quest’ultimo vengono ad essere reclutate dal complesso, creato precedentemente sul replicatore da ORC e Cdc6. Quindi a questo complesso vengono associate due elicasi ciascuna con il proprio caricatore. In seguito a questo caricamento vediamo che Cdc6 idrolizza l’ATP e viene rilasciato insieme all’altro caricatore. Questo fa si che le due copie di elicasi vengano, quindi, posizionate sul nostro DNA (caricamento) a livello dell’origine di replicazione. Successivamente anche ORC perde il contatto con l’elicasi con contemporanea idrolisi dell’ATP. RIEPILOGO: Il caricamento dell’elicasi avviene innanzitutto partendo dal riconoscimento del replicatore da parte dell’iniziatore (ORC associato ad ATP). Successivamente si ha l’entrata di uno dei due caricatori di elicasi (Cdc6 con ATP). A questo punto vengono reclutate, a livello del replicatore, due copie di elicasi ciascuna associata con un altro caricatore (Cdt1). In seguito a questo complesso proteico il caricatore (Cdc6) viene ad idrolizzare il suo ATP seguito dall’altro caricatore, determinando il posizionamento sulla doppia elica del DNA delle due elicasi. ORC idrolizza l’ATP e si dissocia dall’elicasi. Le due elicasi, una volta caricate, creano un contatto fra di loro chiamato contatto testa a testa. Tutto questo avviene in fase G1, quindi prima della replicazione del DNA. L’attivazione dell’elicasi avverrà nella fase successiva, ovvero nella fase S. L’attivazione dell’elicasi avviene in fase S. Le due elicasi caricate vengono attivate da due proteine che si chiamano Cdk e Ddk, due protein chinasi (aggiunta di gruppo fosfato). Una volta che in fase S queste due proteine hanno fosforilato le due elicasi la fosforilazione porta il legame all’elicasi delle proteine Cdc45 e GINS, due attivatori dell’elicasi. Questi due attivatori stimolano fortemente l’attività elicasica determinando la forma attiva dell’elicasi, chiamata complesso CMG. C sta per Cdc45, M per Mcm2-7 e G per GINS. L’attivazione dell’elicasi ha due effetti molto importanti: -vengono interrotti i contatti testa a testa fra le elicasi; -ogni elicasi si posiziona su un filamento ed ognuna viene a muoversi creando la direzione di replicazione della forcella. Ricordiamo che anche negli eucarioti la replicazione è bidirezionale, quindi a livello dell’origine di replicazione ho due forcelle che si muovono in contemporanea, una a destra ed una a sinistra. In fase G1, quindi, vengono selezionate le origini di replicazione che andranno poi ad essere attivate in fase S. Ricordiamo che in G1 non carico su tutte le origini di replicazione, ma solo su alcune. In fase S, poi, vengono solo attivate, non c’è nessun nuovo caricamento. Questo permette di avere la replicazione del DNA una sola volta durante ciascun ciclo cellulare. In fase G1 i livelli di Cdk sono molto bassi, motivo per il quale l’elicasi non viene attivata. Nelle fasi successive ho alti livelli di Cdk, perciò le elicasi caricate vengono attivate. In queste fasi, però, non ho altri caricamenti perché Cdk da una parte fosforila le elicasi promuovendo l’attivazione ma contemporaneamente fosforilano ORC e il caricatore di elicasi, evitando che questi carichino nuove elicasi. La fosforilazione ha, infatti, diversi significati. Per alcune proteine la fosforilazione promuove l’inibizione dell’attività enzimatica, per altre la promozione dell’attività enzimatica. Replicazione dei telomeri nei cromosomi lineari eucariotici La replicazione dei telomeri nei cromosomi lineari è un problema. Perché? Al termine della replicazione avrò il filamento continuo e il filamento discontinuo dove i diversi primer a RNA dovranno essere rimossi e il gap che si crea verrà colmato sfruttando il fatto che ciascun frammento di Okazaki avrà un’estremità 3’OH libera che sarà utilizzata come punto in cui aggiungere i nucleotidi, usando sempre il filamento stampo, per colmare questi gap. Va tutto bene fino a che non si raggiunge l’ultimo frammento di Okazaki, perché in questo caso non ho la possibilità di riparare quest’ultimo frammento, in quanto manca dell’estremità 3’OH. Questo DNA, che risulta non completamente replicato, nelle replicazioni successive creerà un cromosoma più corto. Il problema è che, via via, in questa situazione si perderebbe sempre del materiale genetico, producendo cromosomi sempre più corti. La natura, per deviare questo problema, si è inventata un particolare meccanismo di replicazione diverso che utilizza la telomerasi. La telomerasi è formata da una componente proteica (in grigio) e una componente a RNA (in verde) chiamata TER. Ricordiamo la struttura del telomero umano: Il telomero umano è costituito da una regione ripetuta TTAGGG che si presenta con un corto tratto a doppia elica ma anche un lungo tratto a singolo filamento al 3’. La telomerasi agirà proprio su questo filamento singolo andandolo ad allungare. L’RNA telomerasi (TER) ha una sequenza che si appaia con le ultime quattro basi dell’estremità 3’ del DNA a singolo filamento del telomero. Questa estremità viene ad essere riconosciuta dall’RNA della telomerasi e la componente proteica che ha un’attività di trascrittasi inversa va a copiare l’RNA a DNA aggiungendo i diversi nt al DNA a singolo filamento del telomero, che quindi viene allungato. La telomerasi ora trasloca, shifta, si riappaia con la sua componente a RNA e ricomincia la sintesi. Ripete questo passaggio fino a raggiungere una lunghezza notevole. La telomerasi è molto particolare. Possiamo dire che essa sia una DNA polimerasi che per riuscire a sintetizzare il DNA usa uno stampo non esogeno ma endogeno, cioè la sua stessa componente a RNA. In questo modo l’estremità 3’ viene allungata ma creo anche dello stampo per allungare il 5’. Consente perciò l’allungamento di entrambe le estremità e i geni all’interno del cromosoma vengono protetti. Le proteine che legano il telomero vanno ad influenzare l’attività della telomerasi e la lunghezza del telomero stesso. Abbiamo proteine che provvedono a legare le regioni a doppia elica promuovendo una regolazione in senso negativo dell’attività telomerasica, perciò inibendola. Queste proteine sono chiamate Rap1, Rif1 e Rif2. L’inibizione viene realizzata in questo modo: quando i telomeri sono piuttosto corti su di essi abbiamo un numero ridotto di questo tipo di proteine e quindi la capacità di inibire è trascurabile. La telomerasi continua la sua azione. In questo modo, infatti, la telomerasi continua ad allungare l’estremità 3’ per andare poi ad allungare anche l’estremità 5’. Allungando le regioni a doppio filamento si possono unire anche altre proteine che attraverso un’azione cooperativa producono maggiore inibizione sulla telomerasi creando una sorta di feedback negativo che si traduce in un’assenza di allungamento. RIEPILOGANDO: se il nostro telomero è corto ci sono poche proteine inibitorie quindi la telomerasi continua a lavorare indisturbata; continuando ad allungare l’estremità 3’ si viene a creare un ulteriore stampo su cui l’apparato replicativo può lavorare allungando anche l’estremità 5’ e creando un’estensione del telomero ed una regione a doppia elica. In questa regione a doppia elica si legano altre proteine inibitorie e la loro azione cooperativa inibisce l’attività di allungamento della telomerasi. D’altra parte, abbiamo che a promuovere l’attività telomerasica ci sono altre proteine che legano l’estremità 3’ e si chiamano Cdc13. Esse regolano in maniera positiva l’azione della telomerasi. Queste proteine, inoltre, hanno un’altra funzione molto importante, cioè quella di proteggere il telomero dall’azione degli enzimi di riparazione del DNA. Infatti, all’interno della cellula la presenza dell’estremità 3’ a singolo filamento potrebbe essere riconosciuta, in maniera errata, come una rottura del DNA a doppio filamento. Per evitare che ciò accada il telomero non deve essere mai lasciato nudo ma deve essere sempre associato a delle proteine che impediscono il suo erroneo riconoscimento da parte dei sistemi di riparazione. Studi successivi hanno proposto un’ipotesi alternativa su come i telomeri possono difendersi dagli enzimi di riparazione. I telomeri umani, in vitro, creano una struttura circolare chiamata T-loop. Nel T-loop l’estremità 3’ a singolo filamento del nostro telomero, in seguito al ripiegamento dell’estremità stessa del telomero, va ad appaiarsi con una regione complementare a livello della doppia elica. In questo modo, questa estremità invade il tratto a doppio filamento del telomero stesso, scansa uno dei due filamenti e si appaia con quello complementare. Come vediamo dall’immagine, ora il filamento con l’estremità 3’ non può più essere riconosciuto da eventuali enzimi di riparazione. Un’altra possibilità che è stata proposta è quella che questo T-loop, oltre a non essere riconosciuto, protegga da ulteriore azione della telomerasi, impedendo quindi di aggiungere ulteriormente nt a questa estremità quando non è più necessario. Danno al DNA, riparazione e ricombinazione In questo capitolo andremo a prendere in considerazione: • gli errori di replicazione e la loro riparazione • i danni al DNA • la riparazione e la tolleranza del danno al DNA • la ricombinazione omologa e non omologa • la ricombinazione per trasposizione • la ricombinazione conservativa sito-specifica (CSSR) Gli errori di replicazione e la loro riparazione Mutazioni puntiformi: transizioni e transversioni Le mutazioni sono dei cambiamenti, delle variazioni nella sequenza del DNA e le mutazioni più semplici sono quelle puntiformi, in cui abbiamo che una base nucleotidica viene modificata, viene sostituita con un’altra. Possiamo andare a distinguere queste sostituzioni nucleotidiche in: • transizioni à si ha quando una base purinica viene sostituita con un’altra base purinica (oppure una base pirimidinica viene sostituita con un’altra base pirimidinica), per esempio da adenina a guanina o viceversa • transversioni à sono determinate dalla sostituzione di purine con pirimidine o viceversa, per esempio un’adenina che viene sostituita con una citosina o timina o una guanina che viene sostituita con una timina o citosina Il processo a due passaggi della mutazione puntiforme Perché la mutazione puntiforme vada a diventare un danno permanente al DNA (e quindi si fissi nel DNA), occorre un processo a due passaggi à occorrono cioè due successive replicazioni. In particolare, se prendiamo ad esempio l’immagine sottostante, abbiamo un tratto di DNA e i due filamenti grigi fungono da stampo per il primo ciclo replicativo; in rosso abbiamo i due filamenti neo-sintetizzati, copiati sulla base dello stampo. Vediamo che però uno dei due filamenti neosintetizzati presenta un’incorporazione scorretta (che viene solitamente disegnata con una punta nel filamento), si ha infatti che la A, anziché avere una T, ha una G. A questo punto, abbiamo che, eventualmente, questo appaiamento scorretto o mismatch può essere riconosciuto e riparato. Se però la riparazione non avviene, perché non sempre le riparazioni sono infallibili (possono non riparare correttamente o non accorgersi del mismatch), allora questo filamento neo-sintetizzato contenente la base errata incorporata, quando viene usato come stampo, nel secondo ciclo replicativo, porterà a un DNA che presenta in quella posizione, anziché la coppia corretta AT, una coppia scorretta CG. In questo modo, quindi, ho una fissazione della mutazione con un danno permanente. Fedeltà di replicazione del DNA Sappiamo che la replicazione è un processo fedele e abbiamo visto come questa fedeltà è dovuta alla cooperazione di 3 elementi importanti: • la selettività delle polimerasi • l’attività esonucleasica (l’attività di correttore di bozze 3’-5’ che la DNA-polimerasi possiede) • la riparazione degli errori à sta a indicare che esiste quindi un sistema ulteriore dedicato specifico per riparare i mismatch, cioè gli appaiamenti scorretti à infatti, la DNApolimerasi non è infallibile e per fortuna abbiamo questo sistema di riparazione dei mismatch, il quale aumenta notevolmente la correttezza della sintesi del DNA, anzi è persino il principale responsabile della fedeltà della replicazione del DNA stesso Il sistema di riparazione dei mismatch (MMR) per la correzione degli errori di appaiamento in E. coli Il sistema di riparazione dei mismatch rappresenta quindi il principale sistema per correggere appaiamenti scorretti. Vediamo ora il suo meccanismo in E. coli, questo perché nei procarioti il meccanismo è più semplificato, anche se è fondamentalmente analogo anche negli eucarioti, si hanno infatti delle corrispondenti proteine, le quali cambiano ovviamente nome e solitamente sono anche presenti in numero maggiore, ma il filo logico del processo è lo stesso a quello che descriviamo ora nei procarioti come E. coli. Come avviene quindi questo processo? Nell’immagine abbiamo in grigio il filamento parentale del DNA e in rosso il filamento neosintetizzato che contiene una base errata, creando un appaiamento errato. L’appaiamento errato crea sempre una distorsione della doppia elica (che nel disegno viene indicata, come già detto, dalle punte). Questo meccanismo di riparazione dei mismatch utilizza, in particolare, 3 proteine, che si chiamano MutS, MutL e MutH: 1. MutS ha due tenaglie, si lega al DNA e inizia a scorrere su di esso finché non riconosce la distorsione sul DNA; si associa quindi alla distorsione e tra l’altro, legandosi poi l’ATP, va a distorcere ancora di più la doppia elica (nel disegno non si vede, ma possiamo vedere come la conformazione del dimero MutS viene modificata in virtù del fatto che questo va a distorcere ancora di più la doppia elica), per renderla più evidente laddove è presente il mismatch. 2. Dopodiché vediamo che MutS va a reclutare due altre proteine, MutL e MutH, che si posizionano sulla doppia elica in posizione adiacente a MutS (che si trova sull’appaiamento errato) à in particolare MutL sul filamento parentale e MutH su quello neo-sintetizzato. MutH, tra l’altro, è una proteina che possiede attività endonucleasica à quello che fa infatti, è andare a rompere un legame fosfodiesterico a livello del filamento neosintetizzato. In seguito a questo nick (rottura di un legame fosfodiesterico), vengono reclutate una elicasi (UvrD), che serve per denaturare e aprire la doppia elica, e una esonucleasi che, avendo questa estremità 5’ libera, ci si attacca e inizia a staccare ad uno ad uno i nucleotidi e lo fa fino a poco oltre il livello della distorsione, creando alla fine un bel gap. Questo gap deve essere ovviamente colmato, riparato, per fare ciò abbiamo lo stampo (il filamento parentale) che è integro e che può essere utilizzato come stampo per riparare il gap. Inoltre, vediamo che il filamento neo-sintetizzato presenta un’estremità 3’-OH libera ed è appaiato chiaramente con il filamento parentale, creando una sorta di giunzione innesco stampo. Ecco che quindi questo gap viene riparato dall’intervento di una DNA-polimerasi, che non è quella replicativa vista in precedenza, ma una differente coinvolta in questi meccanismi di riparazione (DNA-polimerasi III) à il suo meccanismo d’azione è analogo a quello della DNA-polimerasi replicativa, con l’unica differenza che questa è specifica per questi sistemi di riparazione. La DNA-pol III andrà quindi ad aggiungere nucleotidi all’estremità 3’, aggiungendo nucleotidi complementari allo stampo (e correggendo quindi il mismatch iniziale) e, come al solito, rimarrà un piccolo nick da riparare ad opera di una DNA ligasi (non indicata in immagine). Negli eucarioti, come già detto, gli attori sono analoghi, anche se cambia il nome e abbiamo un numero di proteine maggiore, ma il processo di base è identico. La metilazione Dam sulla forca replicativa Come fa MutH a riconoscere qual è il filamento che deve tagliare (quello neo-sintetizzato)? Per spiegarlo dobbiamo ricordare l’azione di un enzima molto importante in E. coli, che si chiama Dam metilasi à è un enzima responsabile della metilazione del DNA a livello di una sequenza ripetuta, palindromica, che è (in direzione 5’-3’) GATC. Nel genoma di E. coli si ha che questa sequenza palindromica 5’ GATC 3’ viene ad essere metilata a livello dell’adenina e questo tipo di sequenza palindromica è molto frequente (1 ogni 256 bp). Quando andiamo a replicare il nostro DNA, nella forca replicativa, si avrà che il DNA parentale sarà metilato in questa sequenza, mentre quello neo-sintetizzato deve essere ancora metilato dall’enzima (la metilazione è quindi una modifica post sintesi del DNA) ed esiste un lasso di tempo, di pochi minuti, prima che la Dam metilasi vada a metilare queste sequenze ripetute anche sul filamento neo-sintetizzato. Praticamente, da quando il DNA viene sintetizzato a quando il filamento neosintetizzato viene metilato, si ha quindi un gap di qualche minuto, nel quale si ha uno stato del DNA che si chiama emi-metilato, cioè abbiamo che queste sequenze ripetute palindromiche si troveranno in uno stato di emi-metilazione (metilate sul filamento parentale ma non su quello neo-sintetizzato, in attesa di venir metilato da Dam metilasi). Sfruttando questi minuti in cui il DNA è nello stato emi-metilato, il filamento di nuova sintesi risulta identificabile à la proteina MutH viene a legarsi a questi siti emi-metilati (quindi sul filamento neo-sintetizzato avremo tante MutH che si associano a livello di questi siti). A questo punto, la MutH legata a questi siti emi-metilati ha una attività endonucleasica ridotta, latente e si attiva se e solo se viene in contatto con un’adiacente MutS e MutL ad esso associato che ha riconosciuto il mismatch. Le cellule eucariotiche hanno il sistema di riparazione dei mismatch, ma non presentano MutH e tantomeno, a differenza di E. coli, la possibilità di distinguere il filamento parentale dal filamento neo-sintetizzato attraverso la presenza di questi siti emi-metilati. Quindi come può avvenire il riconoscimento della base erroneamente inserita sul filamento neosintetizzato? Se pensiamo alla sintesi del filamento discontinuo, questo viene sintetizzato tramite i frammenti di Okazaki, i quali, prima di essere uniti, sono separati tra di loro da un nick, che ricorda proprio quello creato da MutH in E. coli. Recentemente, inoltre, si è visto negli esperimenti che l’omologo umano di MutS, che si chiama MSH, viene a interagire con la pinza scorrevole, che, una volta terminata la replicazione, rimane associata al DNA (mentre la DNA-polimerasi si stacca) e una delle sue funzioni è quella di reclutare appunto MSH. In questo modo MSH viene portato sul filamento discontinuo che si sta sintetizzando e scorre fino a riconoscere la distorsione creata dal mismatch. Successivamente vengono reclutate altre proteine e in particolare un’esonucleasi, che andrà a tagliare fino ad arrivare alla distorsione o poco oltre. Un sistema analogo può avvenire anche sul filamento guida o continuo à anche in questo caso, l’interazione con la sliding clamp potrebbe consentire il reclutamento delle proteine coinvolte nel sistema di riparazione dei mismatch, questa volta sull’estremità 3’ crescente del filamento guida (sappiamo infatti che nel filamento guida non ho frammenti e quindi lavoro direttamente sull’estremità 3’ in accrescimento, quindi mentre avviene la sintesi del DNA). Quindi, nel caso degli eucarioti, il ruolo fondamentale è quello della sliding clamp, che serve a reclutare le proteine coinvolte nei sistemi di riparazione del DNA, tra cui il sistema di mismatch repair. I danni al DNA e la riparazione e la tolleranza del danno al DNA Naturalmente le mutazioni del DNA possono insorgere non solo per errori di replicazione, quindi per appaiamenti errati come visto poco fa, ma anche in seguito a danni al DNA, che possono essere causati da fattori esogeni, ovvero fattori ambientali esterni (es. radiazioni, sostanze mutagene come composti chimici che possono aumentare la frequenza di insorgenza delle mutazioni) ma anche da fattori endogeni, come ad esempio l’acqua, che può provocare delle mutazioni spontanee nel DNA, favorendo meccanismi di idrolisi. Tipi di danno al DNA I danni al DNA possono essere a carico delle basi o a carico dello scheletro zucchero-fosfato. Danni alle basi: • Errori di replicazione (incorporazione di un nucleotide scorretto, mismatch, di cui abbiamo già parlato) • Idrolisi del legame beta-N-glicosidico (idrolisi delle basi) à si va quindi a perdere delle basi • Ossidazione • Deamminazione • Alchilazione • Fotoriattivazione Danni allo scheletro zucchero-fosfato: • Determinano delle rotture a singolo o doppio filamento Nella tabella sottostante ci viene mostrato quale tipo di meccanismo e quindi sistema di riparazione del DNA viene messo in atto in base al danno: La cosa importante da ricordare qui è che per ogni tipo di danno abbiamo uno o più meccanismi di riparazione dedicati. Modificazioni di nucleotidi causate da danni endogeni al DNA Per quanto riguarda le modificazioni di nucleotidi a carico del DNA, in particolare a causa di danni endogeni, vediamo nell’immagine diversi tipi di modificazioni: A. Per esempio, le basi puriniche possono essere depurinate à in questo caso l’acqua promuove un’idrolisi del legame beta-N-glicosidico (quindi tra lo zucchero e la base azotata, la guanina) e quindi la guanina viene persa e lo zucchero risulta privo della base. Questi siti vengono anche chiamati siti abasici o apurinici B. Ancora l’acqua può anche promuovere la rimozione del gruppo amminico sulla citosina, producendo una deamminazione e convertendo la citosina in uracile, il quale legherà in questo caso l’adenina e quindi se questo danno non viene riparato, si creerà un appaiamento errato e di conseguenza la possibilità di introduzione di una mutazione puntiforme C. La guanina, inoltre, può essere anche alchilata; una delle posizioni più frequenti è l’ossigeno sul C6, che viene metilato/viene alchilato à in queste condizioni, la O6-metilguanina non si appaia più con la citosina, ma con la timina e, quindi, anche in questo caso si possono creare degli appaiamenti errati e quindi mutazioni puntiformi D. Anche l’ossidazione delle basi a carico delle specie reattive dell’ossigeno (ROS) viene praticamente ad essere un esempio di danno alle basi del DNA; molto spesso una delle posizioni più frequentemente ossidate è quella sul C8 della guanina, che viene quindi ossidata a 8-Oxoguanina à la quale può appaiarsi sia con la citosina (appaiamento corretto) ma anche con l’adenina (appaiamento scorretto) e quindi si può avere una transversione (perché da GC passo a AT) e di conseguenza si instaura, anche in questo caso, una mutazione puntiforme I danni endogeni al DNA sono, tra l’altro, molto frequenti e, in questa tabella, si può vedere la frequenza di questi danni: NB: Lesioni al DNA e danni al DNA sono sinonimi Fortunatamente, per questi danni alle basi abbiamo un meccanismo di riparazione dedicato, che si chiama riparazione per escissione di basi à l’enzima chiave di questo meccanismo è la DNA glicosilasi Riparazione per escissione di basi (BER, Base Excision Repair) Per semplicità, nell’immagine vediamo solo il filamento in cui c’è stata, in questo caso, una deaminazione. La glicosilasi interviene quindi tagliando il legame beta-N-glicosidico tra questa citosina deaminata (che è diventata quindi un uracile) e lo zucchero à il risultato dell’azione della glicosilasi è la creazione di un sito abasico (sito AP), in cui rimane solo lo zucchero privato della base danneggiata. A questo punto interviene la endo/exo nucleasi AP (un complesso costituito da una endonucleasi e una esonucleasi) à la endonucleasi taglierà sopra il sito abasico, producendo un’estremità 3’-OH libera, mentre dall’altra parte abbiamo la esonucleasi che taglia fino a subito dopo il sito abasico. In altre parole, il sito abasico viene rimosso dal taglio di una endonucleasi (che crea un nick) e di una esonucleasi (che poi rimuove questo zucchero privo di base). Quello che si crea è un piccolo gap e perciò, nella fase successiva, si avrà l’azione di una DNA-polimerasi I che sfrutterà il 3’-OH libero per addizionare il nucleotide mancante e per capire qual è questo nucleotide mancante sfrutterà il filamento stampo integro parentale (qui non illustrato), in modo da addizionare la base corretta (una citosina in questo caso appunto). Infine, come al solito, interviene una DNA ligasi per ricreare il legame fosfodiesterico. Esistono diversi tipi di DNA glicosilasi, di cui le principali (di mammifero) sono riportate in questa tabella: Ogni DNA glicosilasi viene identificata con una sigla e un nome specifico, ma la cosa da ricordare è che le DNA glicosilasi vengono ad essere importanti perché ogni glicosilasi si occupa di riconoscere una lesione specifica lavorando su un substrato specifico. Struttura del complesso DNA-glicosilasi In questa immagine, ottenuta per cristallografia ai raggi X, vediamo la struttura del complesso DNA-glicosilasi. In viola abbiamo le due eliche di DNA e in grigio la DNA glicosilasi. In rosso è indicata la base danneggiata che deve essere rimossa dalla glicosilasi. La prima cosa che si può notare è che, grazie a questi studi di cristallografia ai raggi X, vediamo che la base danneggiata viene proprio “ribaltata” fuori dal DNA ed è come se si andasse a posizionare/a sedere nella tasca enzimatica della glicosilasi. Questi enzimi di riparazione per escissione di basi, quindi, eliminano le basi danneggiate “ribaltandole” fuori dal DNA. Però, è anche vero che diventa piuttosto difficile pensare che la glicosilasi, mentre scorre sul DNA, vada a ribaltare una base alla volta, alla ricerca della sua anomalia specifica à questo perché richiederebbe un gran consumo di energia. Quello che ancora non è conosciuto è proprio il meccanismo specifico con il quale questi enzimi ricercano le basi danneggiate sul DNA. Dimeri di pirimidina e loro effetto sulla doppia elica del DNA Un altro tipo di danno molto frequente a livello del DNA è la formazione di dimeri di pirimidina. Questo tipo di danno è causato dalla luce ultravioletta à in particolare, le radiazioni che presentano lunghezze d’onda di circa 260nm sono fortemente assorbite dalle basi (grazie ai loro anelli). Quello che accade molto spesso, come si può vedere in immagine, tra due timine adiacenti, è una vera e propria fusione fotochimica che determina la formazione di un anello ciclobutanico (un anello a 4 atomi di C tra i carboni 5 e 6 delle due timine adiacenti). Naturalmente, queste basi così dimerizzate non sono in grado di formare legami idrogeno con le basi complementari e quindi portano la DNA-pol ad arrestarsi durante la replicazione (è un danno parecchio ingombrante) Anche in questo caso abbiamo dei meccanismi dedicati. In realtà, per i dimeri di pirimidina, non abbiamo un solo meccanismo, ma più di uno à il primo che andiamo a vedere è quello della fotoriattivazione (una prima possibilità di andare a riparare questo danno) e che viene realizzato ad opera della DNA fotoliasi. Fotoriattivazione: riparazione diretta del danno al DNA La fotoriattivazione rappresenta un esempio di meccanismo di riparazione diretta del danno. Abbiamo, infatti, che i raggi UV vanno a creare questo dimero di timina fra le due timine adiacenti e, in assenza di luce, la DNA fotoliasi riconosce questo dimero di timina. La luce visibile, poi, azionerà l’azione della DNA fotoliasi, che provvederà a rimuovere l’anello ciclobutanico, ripristinando le due timine. Quindi, un primo meccanismo è proprio la riparazione diretta del danno tramite la fotoliasi. Questi dimeri di pirimidina vengono riparati anche da un altro tipo di meccanismo, ovvero la riparazione per escissione di nucleotidi à agisce non solo sui dimeri di pirimidina ma anche sugli addotti voluminosi sulle basi. Anche in questo caso ci sono molti enzimi coinvolti nel meccanismo (ci sono degli enzimi presenti in E. coli e loro corrispondenti nell’uomo). Ma cosa sono questi addotti voluminosi sulle basi? Addotti voluminosi o ingombranti sulle basi Sono l’addizione alle basi di gruppi ingombranti à ad esempio possiamo vedere nell’immagine il benzo[a]pirene (una molecola policiclica) che viene ad essere uno dei componenti del fumo di sigaretta ed è un forte agente alchilante del DNA. In particolare, questa molecola viene metabolizzata dai citocromi epatici e convertita in una forma epossidica à questo derivato epossidico è particolarmente aggressivo nei confronti del DNA e, in particolare, è in grado di legare le basi guaniniche del DNA, creando un addotto molto ingombrante sulle basi. Queste basi così ingombranti non sono più in grado poi di formare degli appaiamenti corretti e possono quindi portare a mutazioni se non vengono riparate accuratamente. Riparazione per escissione di nucleotidi (NER, Nucleotide Excision Repair) in E. coli Anche in questo caso vediamo il meccanismo in E. coli e prevede l’intervento di proteine UvrA, B, C e D. Come si vede nell’immagine, per prima cosa si può vedere in alto la base che è stata, ad esempio, alchilata e che quindi è stata addizionata a un addotto voluminoso, oppure può essere un dimero di timina à questi due casi creano una distorsione nella doppia elica del DNA. Arrivano quindi due proteine UvrA, associate a due proteine UvrB e, legate all’ATP, legano il DNA e questo complesso UvrAB inizia a scorrere sul DNA alla ricerca di distorsioni. Una volta che la distorsione è stata riconosciuta, le due subunità di UvrA escono dal complesso e UvrB promuove la separazione locale del DNA intorno alla distorsione (si vede come le due subunità di UvrB si posizionano proprio ai lati della distorsione stessa, quindi della base con l’addotto voluminoso o del dimero di timina). A questo punto arriva UvrC (sembra un paraorecchie) e una delle due subunità UvrB esce, mentre l’altra si posiziona centralmente sulla distorsione, mentre UvrC, va a posizionarsi a cavallo di UvrB e della distorsione stessa. UvrC viene a produrre delle incisioni alle due estremità, 5’ e 3’ della distorsione e il taglio che fa non è proprio simmetrico, questo perché UvrC crea una incisione posizionata 5 nucleotidi al 3’ della lesione, mentre la seconda è posizionata circa 8 nucleotidi al 5’ rispetto alla lesione. Questi due tagli danno luogo a una regione a singolo filamento di 12-13 nucleotidi che viene rimossa dall’azione della DNA elicasi UvrD, la quale rimuove gli ultimi appaiamenti e permette il rilascio di questa regione a singolo filamento contenente la distorsione e anche l’uscita di UvrC (che ha terminato la sua azione). Adesso abbiamo quindi un bel gap di 12-13 nucleotidi che deve essere colmato e perciò, anche in questo caso, interviene una DNA-pol I, quindi diversa da quella replicativa ma che funziona in maniera analoga ad essa, cioè sfrutta sempre l’estremità 3’-OH di una giunzione innesco-stampo creata dal DNA non coinvolto nella lesione e usa l’altro filamento non tagliato come stampo. A questo punto avremo quindi del nuovo DNA sintetizzato per riparare questo gap e, per ultimo, interviene sempre una DNA ligasi. Negli eucarioti il meccanismo d’azione è identico, tant’è che nell’uomo sono state identificate delle proteine analoghe, anche se in numero maggiore. Riparazione per escissione di nucleotidi accoppiata alla trascrizione sia negli eucarioti che procarioti La riparazione per escissione di nucleotidi, inoltre, è accoppiata anche alla trascrizione. In questo caso, quando la nostra RNA-pol (anch’essa lavora creando una bolla di trascrizione) viaggia lungo il DNA e incontra la distorsione, essa si blocca, si ferma e la trascrizione viene interrotta. A questo punto l’RNA-pol viene a reclutare nel sito dove c’è questo danno le proteine della riparazione per escissione di nucleotidi, che provvederanno a riparare il danno. In questi casi, come nell’immagine, possiamo vedere che l’RNA-pol si distacca, intervengono le proteine di riparazione e poi successivamente l’RNA-pol andrà a ripartire con la sua trascrizione. Un’altra possibilità, invece, è che, al posto di distaccarsi, l’RNA-pol arretri, faccia riparare il danno e poi riparta. Questo meccanismo è comune sia a livello procariotico che eucariotico. Un ultimo meccanismo di riparazione dei danni al DNA è la sintesi del DNA per translesione à non è in realtà un vero meccanismo di riparazione, ma piuttosto è un sistema che si basa sulla tolleranza del danno ed è molto frequente per superare danni quali dimeri di pirimidina, siti apurinici o addotti ingombranti sulle basi. L’enzima chiave di questo sistema è un particolare tipo di DNA-pol che viene chiamato DNA polimerasi di tipo Y. Le difese cellulari contro il danno al DNA: sintesi di translesione (TLS) La sintesi di translesione, come già detto, rappresenta l’ultima possibilità che ha la cellula per difendersi contro un danno al DNA. Nell’immagine vediamo il DNA in grigio e una stella rossa che sta a indicare un danno al DNA. In questo caso, il danno può essere riparato attraverso uno dei meccanismi già descritti, però ricordiamo che i sistemi di riparazione non sono sempre del tutto efficienti e quindi può capitare talvolta, che la DNApol incontri, mentre sta replicando, una lesione come un dimero di pirimidina o un sito apurinico che non è stata proprio riparata. Succede perciò che il filamento di DNA contenente il danno viene comunque utilizzato come stampo e la replicazione viene portata a termine ad opera di questa particolare categoria di DNA polimerasi appartenenti alla famiglia Y, le quali consentono non di riparare il danno, ma di superarlo/tollerarlo per consentire comunque la replicazione del DNA, anche a livello di questo danno. Infatti, una caratteristica molto importante di queste DNA polimerasi di tipo Y è che, benché come tutte le DNA polimerasi hanno bisogno dello stampo per replicare, sono in grado di incorporare nucleotidi in modo indipendente dall’appaiamento delle basi e questa è una capacità fondamentale perché, quando arrivano al livello del danno, queste polimerasi sono in grado appunto di incorporare sul filamento neo-sintetizzato nucleotidi in maniera indipendente dall’appaiamento delle basi e quindi la sintesi di translesione può introdurre, talvolta, degli errori e, di conseguenza, il nucleotide che viene incorporato, in questo caso, potrebbe essere non quello corretto. Ricordiamo però che alcune DNA polimerasi di translesione, in realtà, non incorporano nucleotidi in maniera casuale, ma sono specializzate nell’incorporare specifici nucleotidi à ad ogni modo il tutto avviene senza leggere lo stampo e quindi questo sistema di tolleranza al danno ha effettivamente un certo livello di mutagenesi (è potenzialmente mutageno), ecco perché l’azione delle DNA-pol di translesione deve essere attentamente controllata. Per esempio, in E. coli, abbiamo in condizioni normali le DNA-pol di translesione che non vengono sintetizzate à la loro sintesi è attivata solo in risposta a un danno al DNA. C’è proprio una risposta, chiamata SOS (una risposta specifica), che è attivata in E. coli solo nel momento in cui c’è un danno al DNA e ha come conseguenza la sintesi della DNA-pol di translesione. Nelle cellule di mammifero l’attivazione di questa sintesi di translesione passa attraverso delle modifiche covalenti alle pinze scorrevoli. Nell’immagine vediamo il filamento stampo con il sito di DNA danneggiato e la pinza scorrevole associata alla DNA-pol replicativa e che stanno scorrendo lungo il DNA. Nel momento in cui la DNA-pol incontra il DNA danneggiato, si blocca e questo offre l’occasione per andare a modificare covalentemente la pinza scorrevole à una delle più frequenti di queste modifiche covalenti è sicuramente l’ubiquitinazione, ovvero l’attacco covalente alla pinza di un piccolo peptide chiamato ubiquitina. L’ubiquitinazione è una marcatura delle proteine usata molto spesso a livello degli eucarioti per indirizzare le proteine verso specifici processi (uno dei più frequenti è la degradazione); in questo caso l’ubiquitinazione della pinza scorrevole consente di attivare la sintesi di translesione, perché nel momento in cui la pinza scorrevole viene ubiquitinata, la DNA-pol replicativa viene rilasciata e al suo posto viene reclutata la DNA polimerasi di translesione, la quale, come già detto, supera il danno introducendo nuovi nucleotidi in maniera indipendente dall’appaiamento delle basi. Una volta superato il danno, le modifiche covalenti sulla sliding clamp vengono rimosse e la nostra DNA-pol di translesione viene rimossa e al suo posto viene ricaricata la DNA-pol replicativa, che procederà con la sintesi del DNA. Accanto a questo modello riguardo alla sintesi di translesione, chiamato modello di scambio delle polimerasi, è stato proposto un altro modello chiamato di riempimento dell’interruzione à semplicemente quello che prevede questo modello è che la nostra DNA-pol replicativa, quando raggiunge il DNA danneggiato, anziché bloccarsi ed essere sostituita, vada a saltare la lesione; oltrepassa cioè il danno e continua la sintesi del DNA a valle del danno stesso, lasciandosi dietro un gap chiaramente. Successivamente, poi, le DNA-pol di translesione (una o più di una in base ai danni) vengono reclutate in un secondo momento a livello delle interruzioni, andando a ripararle. Specializzazioni della DNA polimerasi Esistono poi, tra l’altro, diverse DNA-pol di translesione à ad esempio in E. coli ne abbiamo due coinvolte in questo processo di TLS. Negli eucarioti ne abbiamo persino 5, tra l’altro alcune specializzate nel riconoscere specifici danni La ricombinazione omologa e non omologa Danno al DNA causato da rotture dell’elica durante la replicazione Il danno più grave che la cellula può subire a livello del DNA è la rottura delle sue eliche, dei suoi filamenti, in particolare, le rotture a doppio filamento (DSB, double-strand break). Nell’immagine vediamo in azzurro i due filamenti di DNA stampo a livello della forca replicativa e in arancio la sintesi del filamento guida e del filamento lento. Se uno dei due filamenti parentali (che fungono da stampo) subisce una rottura, cioè si rompe il legame fosfodiesterico, quello che succede è che si ha il collasso della forcella replicativa e quindi, quando la DNA polimerasi incontra questa rottura su uno (uno solo nel caso dell’immagine (a)) dei due filamenti stampo, avremo un cromosoma fratello integro, mentre l’altro sarà interrotto a causa del collasso della forcella di replicazione. Ma come abbiamo già detto, il danno più grave si ha quando ho la rottura di entrambi i filamenti stampo (immagine (b)) à anche in questo caso la forcella di replicazione collassa, però entrambe le molecole di DNA replicate saranno interrotte, cioè entrambi i cromosomi fratelli saranno interrotti e quindi abbiamo una perdita di materiale genetico (un danno gravissimo). Se queste rotture non vengono riparate, mancando uno stampo integro, si perde una parte dello stampo, la forcella di replicazione collassa (quindi si blocca la replicazione) e si ottengono cromosomi non replicati per intero, cioè ho perso dell’informazione genetica. I meccanismi di riparazione delle rotture doppie del DNA (DSB, double-strand break) Di fronte a queste rotture (che sono prodotte da agenti esogeni, come i raggi X o le radiazioni à le rotture a doppia elica, quindi, sono dovute, dal punto di vista esogeno, a raggi X, radiazioni ionizzanti, …), la cellula mette in atto due tipologie di sistemi di riparazione: • Giunzione non omologa delle estremità (NHEJ, nonhomologous end joining) • Ricombinazione omologa (HR, homologous ricombination) Giunzione non omologa delle estremità (NHEJ, nonhomologous end joining) in eucarioti • È un meccanismo che avviene anche nei procarioti, ma è predominante negli eucarioti e specialmente nei mammiferi (è quindi un meccanismo che le nostre cellule utilizzano molto frequentemente, in primis, di fronte a una rottura a doppia elica). • È una riparazione inaccurata/non precisa à perché nel riparare c’è una delezione di alcuni nucleotidi • È un meccanismo di emergenza molto veloce (di fronte a un danno così grave è meglio riparare la doppia elica in modo inaccurato che si blocchi la replicazione e si vada a perdere molto più materiale genetico à quindi, anche se non è un meccanismo accurato, serve comunque a evitare il collasso della forca replicativa) • Non dipende dai cromatidi fratelli (tant’è che si realizza in G1) • Si attiva in G1 in cellule aploidi e diploidi (prima che il DNA venga replicato à quindi se il danno avviene prima che il DNA venga replicato e non si hanno cromatidi fratelli integri da usare come stampo, la cellula usa questo meccanismo) Come avviene questo tipo di processo? Come possiamo vedere dall’immagine, abbiamo una doppia elica con una rottura su entrambi i filamenti. Questa rottura viene riconosciuta da un complesso costituito da due proteine (Ku70/Ku80 à servono per stabilizzare il tutto e legare le estremità), associate a una protein chinasi, la DNA-PK (PK = protein chinasi) à ho quindi che un complesso di questo tipo riconosce una estremità interrotta e un altro complesso identico che riconosce l’altra estremità e l’obiettivo di questo complesso proteico è riconoscere e legare le estremità, avvicinandole. Quello che succede, in particolare, è che le Ku70/80 riconoscono le estremità e, tramite l’altra componente del complesso, la DNA PK, si associano con il complesso corrispondente sull’altra estremità, creando un ponte; quindi, questo è un complesso che serve a riconoscere le estremità interrotte e tenerle unite/vicine, tramite un’interazione proteina-proteina (cioè tra i due complessi identici alle due estremità). Questo è il primo step di questo meccanismo. Poi arriva un altro complesso, chiamato MRN (il nome deriva dalle iniziali delle sue 3 componenti, MRE11, RAD50 e NBS1 à RAD e NBS sono delle proteine stabilizzatrici, servono a stabilizzare il complesso, mentre MRE11 è una esonucleasi e va quindi a processare le estremità). Questo complesso, quindi, viene reclutato da queste estremità riconosciute e, in particolare, la sua componente MRE11 va a processare parzialmente le estremità (rimuove solo 1-2 nucleotidi, massimo 3). Quindi, come abbiamo appena visto, le estremità non vengono unite subito, ma vengono prima processate. La fase finale è quindi la saldatura, dove intervengono altri enzimi, tra cui la DNA ligasi, che ha la funzione di riformare il legame fosfodiesterico, e la XRCC4. Capiamo quindi che questo processo non è accurato, questo perché non usa uno stampo e, tra l’altro, prima di saldare le estremità si va anche ad avere la perdita di uno o alcuni nucleotidi. Possiamo perdere anche in questo modo dell’informazione genetica quindi, però, considerando che la percentuale di DNA genomico che appartiene ai geni è veramente esigua, si spera sempre che questa rottura non avvenga in questa esigua percentuale di esoni (cioè le regioni che codificano per le proteine), ma nel resto à ecco perché la cellula tollera una situazione di questo tipo (meglio rischiare la perdita di qualche nucleotide e sperando che ciò non avvenga negli esoni, che avere il blocco della replicazione, il che farebbe perdere molta più informazione genetica). Ricorda: le nucleasi sono enzimi che rimuovono un nucleotide alla volta (vanno a degradare quindi le nostre catene polinucleotidiche), rompendo i legami fosfodiesterici tra un nucleotide e l’altro, e si dividono in: • Endonucleasi à tagliano in mezzo alla nostra catena, non hanno bisogno di estremità libere • Esonucleasi à partono da delle estremità libere (in altre parole, iniziano a staccare i nucleotidi riconoscendo un’estremità 5’ o 3’, tant’è che si hanno 5’-esonucleasi e 3’esonucleasi) La ricombinazione omologa (HR, homologous ricombination) per riparare DSB in eucarioti • È una riparazione accurata (perché utilizza uno stampo integro) • Prevale nelle cellule in fase S e G2 (perché ha bisogno di uno stampo integro) • Usa il cromosoma omologo o cromatidio fratello come stampo • È un meccanismo di emergenza veloce Modello di riparazione dei DSB mediante ricombinazione omologa La ricombinazione omologa non ha solo un ruolo nella meiosi (funzione fisiologica, desiderata, è fondamentale che ci sia), ma anche un ruolo di riparazione delle rotture a doppia elica dovute ad agenti esogeni (meccanismo di riparazione del DNA, che mi consente di intervenire quando il DNA è danneggiato da eventi esogeni à quindi la rottura a doppia elica è un evento avverso che il DNA subisce, non una cosa fisiologica che la cellula desidera). Il meccanismo di base è lo stesso (già visto nella meiosi in genetica), ma gli attori sono diversi. Come possiamo vedere in immagine, quando si parla di ricombinazione omologa, è sempre molto utile, per capire i prodotti che essa può dare, andare ad allineare le molecole di DNA omologhe a doppio filamento à abbiamo infatti le due molecole di DNA omologhe (in grigio e blu) allineate a livello degli stessi loci allelici (perché sono praticamente identiche ma con alleli diversi per lo stesso gene); inoltre, solo una di queste due molecole a doppia elica ha subito una rottura. Il primo step è che queste estremità vengono processate da delle nucleasi che vanno a digerire le estremità 5’, in modo tale da produrre delle estremità 3’ protundenti (cioè a singolo filamento). Quindi, il primo step, ricapitolando, è processare le estremità interrotte ad opera di queste nucleasi (che qui lavoreranno in direzione 5’-3’, con il risultato di avere delle estremità 3’ protundenti a singolo filamento. Poi le estremità 3’ protundenti vanno a invadere la molecola di DNA integra (che verrà usata come stampo e quindi deve per forza essere intatta per questo processo), creando una giunzione innescostampo, con una estremità 3’-OH libera pronta per una DNA polimerasi, che provvederà a riparare la rottura aggiungendo nucleotidi (all’estremità 3’ appunto) usando la molecola di DNA integra. Chiaramente, mentre una estremità 3’ invade il filamento, si crea una separazione dei due filamenti integri e così il secondo filamento integro diventa disponibile per appaiarsi con la seconda estremità 3’. Tra l’altro, si nota che per creare questo appaiamento, il filamento da riparare e quello integro interagiscono tra di loro creando un incrocio, la cosiddetta giunzione di Holliday. Nella fase successiva, quindi, la DNA polimerasi ripara il filamento rotto usando come stampo il filamento integro (in rosso nell’immagine si vede il DNA neo-sintetizzato) e ovviamente durante questo processo di sintesi la giunzione di Holliday non rimane immobile, ma migra, si sposta, seguendo la direzione di sintesi, perché durante la sintesi si ha una continua fusione di appaiamenti e contemporaneamente la formazione di nuovi tra il filamento da riparare e quello integro usato come stampo à in altre parole, si ha praticamente sempre una lunghezza stabile perché, mentre da una parte vengono aggiunti nuovi nucleotidi e si formano nuovi appaiamenti, dall’altra il filamento da riparare si stacca da quello integro (fondendo gli appaiamenti precedenti quindi) continuamente. Questo fa sì che questo incrocio non sia sempre a livello delle stesse sequenze, ma si abbia una migrazione (è una struttura “dinamica”). Alla fine, quando ho riparato le due estremità con questo movimento e quindi si sono riunite alle estremità opposte (5’), si ottengono due giunzioni di Holliday con, in rosso, le due porzioni di DNA riparate usando la molecola di DNA integra come stampo. Queste due giunzioni devono poi essere risolte (cioè devo andare a riformare le due molecole separate di DNA) e questo è il passaggio più critico della ricombinazione omologa. Modello di Holliday applicato a rottura a doppio filamento (DSB) sul DNA: la risoluzione della giunzione di Holliday In base al tipo di risoluzione di queste giunzioni il risultato/il prodotto che si ottiene di DNA è differente à si parla infatti dei prodotti del non crossing over e prodotti del crossing over. Nell’immagine vediamo le nostre due giunzioni di Holliday, indicate per facilità con X e Y à per risolvere queste giunzioni abbiamo diverse possibilità, cioè i siti di ricombinazione, cioè di taglio per separare le due molecole, sono indicati con i numeri 1 e 2 in immagine (questo vale per entrambe le giunzioni); quindi, per riuscire a separare le due molecole di DNA, i tagli a livello di ciascuna giunzione possono arrivare sulle posizioni 1 (quindi a livello dei filamenti non coinvolti direttamente nell’incrocio) o nelle posizioni 2 (a livello dei filamenti coinvolti nell’incrocio): • se entrambe le giunzioni vengono tagliate sullo stesso sito (1 o 2 ma su entrambe), quello che ottengo sono i prodotti del non crossing over, anche chiamati prodotti patch (rispetto al sito di taglio, di ricombinazione, si ha che gli alleli non si sono riassortiti), cioè i geni non si sono riassortiti a livello del sito di ricombinazione. • se, invece, per le due giunzioni vengono usati due siti di taglio diversi, ovvero che per la prima giunzione viene utilizzata la posizione 1 e per la seconda giunzione la posizione 2, o viceversa, ottengo dei prodotti del crossing over à ho cioè che gli alleli si sono riassortiti. NB: È quindi fondamentale, per capire gli effetti della ricombinazione, allineare le molecole di DNA omologhe e utilizzare gli alleli (con le lettere maiuscole o minuscole), perché ciò ci aiuta molto nel capire cosa succede. Ovviamente, tutti questi passaggi fondamentali vengono catalizzati da una serie di fattori proteici, che saranno diversi per procarioti ed eucarioti: In E. coli (classico organismo modello nei procarioti perché è molto facile da coltivare, conosciuto, caratterizzato, poco costoso, cresce rapidamente) l’appaiamento delle molecole omologhe e l’invasione del filamento vengono condotti dalla proteina RecA. Per quanto riguarda l’introduzione delle rotture a doppio filamento (DSB), invece, possiamo vedere che in E. coli non c’è alcun fattore, questo perché non presenta la meiosi e quindi non ha senso che ci sia à questa funzione fisiologica (la seconda funzione prima descritta per la ricombinazione omologa) si ha solo negli eucarioti, dove la ricombinazione omologa va a intervenire su rotture della doppia elica auto-create dalla cellula durante la meiosi. Quindi, in E. coli, le rotture a doppia elica non avvengono per fattori endogeni, ma unicamente per fattori esogeni. Poi abbiamo la funzione di processare le rotture, per creare le estremità 3’ protundenti, che viene fatta dal complesso RecBCD nei procarioti, con doppia azione elicasi/nucleasi. Il complesso RuvAB riconosce invece le giunzioni di Holliday e ne aiuta la migrazione, mentre RuvC va a risolverle (a tagliarle). Quindi, per ogni funzione ho una corrispondente attività enzimatica, sia nei procarioti che negli eucarioti. Negli eucarioti, poi, ci sono alcuni enzimi, come detto poco fa, che agiscono solo nella meiosi e nella tabella sono indicati con una citazione fra parentesi. NB: Per certi passaggi, gli enzimi non sono ancora stati identificati negli eucarioti. La ricombinazione omologa (HR, homologous ricombination) in E. coli (RecBCD e RecA) Nell’immagine possiamo vedere l’azione del complesso RecBCD, che ha doppia attività elicasica/nucleasica. In rosa si vede il DNA e per semplicità è riportata solo una delle due estremità interrotte ma, in pratica, ciascuna estremità viene riconosciuta da questo complesso RecBCD, che la apre e ha poi un’attività 3’-esonucleasica e inizia a processare l’estremità 3’ appunto. Inizialmente, quindi, questo complesso agisce partendo dall’estremità 3’ e togliendo un nucleotide alla volta e lo fa finché non incontra delle determinate sequenze, chiamate Chi à quando arrivano a questa sequenza Chi (una corta sequenza di 8 nucleotidi, GCTGGTGG), il complesso inverte la sua attività nucleasica, cioè non lavora più sul filamento 3’, ma sul 5’, degradandolo. Il risultato è sempre lo stesso, cioè creare una estremità 3’ a singolo filamento pronta per l’invasione. Poi, il filamento, per essere preparato per la successiva invasione, viene riconosciuto da queste singole proteine, RecA (sfere in rosso nell’immagine), che mantengono il filamento in questa forma singola e coadiuvano la sua capacità di invadere la molecola di DNA integra. RuvAB e RuvC Il complesso RuvAB è colui che riconosce la giunzione di Holliday e promuove la migrazione delle nostre giunzioni o chiasmi, mentre RuvC è colui che taglia, cioè promuove la separazione delle due molecole di DNA, risolvendo le giunzioni di Holliday. Il complesso RuvAB è costituito da RuvA e RuvB. RuvA è una sorta di ciambella, in grado di riconoscere proprio la giunzione di Holliday, mentre RuvB, che sono due e sembrano delle cuffie (sono delle proteine esameriche e ci sono appunto due subunità) si posizionano una a destra e una a sinistra di RuvA e sono responsabili di far migrare le giunzioni di Holliday. Quindi, mentre RuvA riconosce la giunzione di Holliday, RuvB, ad essa associata, promuove la migrazione della giunzione (con quel meccanismo di appaiamento e fusione degli appaiamenti), è quindi un vero e proprio motore molecolare (come la DNA elicasi). A questo punto ci manca solo RuvC, che è responsabile di risolvere le giunzioni di Holliday (in alcuni testi è riportato che RuvC faccia sempre parte del complesso RuvAB e non che sia qualcosa di separato) à in base a che filamenti taglia, va a risolvere i diversi intermedi di ricombinazione. È una endonucleasi e taglia due dei filamenti di DNA omologo con la stessa polarità a livello della giunzione di Holliday à lo fa in maniera preferenziale riconoscendo sequenze del tipo 5’-A/T-T-T-T-G/C-3’ (dove lo / sta a indicare che può essere o l’una o l’altra, mentre le 3 T centrali sono conservate). Parliamo ora di eucarioti à come già detto, negli eucarioti ci sono i corrispondenti delle proteine di E. coli, ma non sempre, poiché non tutti i complessi sono stati scoperti ad oggi e, inoltre, si hanno alcune proteine specifiche che intervengono solo nella meiosi (si occupano di intervenire su una rottura a doppia elica a livello del processo di meiosi) che, come già detto, non è presente nei procarioti. Inoltre, esiste il meccanismo chiamato Mating type à particolare meccanismo di ricombinazione omologa che serve a scambiare delle sequenze di DNA specifiche in specifici punti del DNA cromosomico (è piuttosto comune e osservato nel lievito) ed ha una funzione, soprattutto, di regolazione dell’espressione genica. Crossing over meiotico negli eucarioti Come già detto, questo è l’altro evento in cui avviene la ricombinazione omologa à qui però la funzione è fisiologica (non di riparazione). Prima di entrare nella meiosi I è fondamentale che avvengano l’appaiamento dei cromosomi omologhi e la ricombinazione, step fondamentali affinché ci sia una corretta segregazione del materiale genico nei gameti à se non avvengono correttamente, i due cromosomi non saranno separati in maniera opportuna nei gameti e ciò si rifletterà in problemi perché il corredo genetico non è corretto (se non sui gameti, si riflette poi con problemi nella fertilità). Ricombinazione meiotica negli eucarioti La ricombinazione omologa (che avviene tra i cromatidi non fratelli) è necessaria per appaiare questi cromosomi omologhi in preparazione della prima divisione nucleare e può portare anche a fenomeni di crossing over. Nell’immagine a lato vediamo due cromosomi omologhi (in blu e rosso), dopo essere stati duplicati da un ciclo di replicazione e possiamo vedere come i cromatidi non fratelli, appunto, sono oggetto della ricombinazione RICOMBINAZIONE MEIOTICA TRA CROMOSOMI OMOLOGHI Dall’immagine capiamo che: • ogni struttura rappresenta una molecola di DNA replicata e a doppio filamento (cromatide) • ogni coppia è composta da cromatidi fratelli e la ricombinazione avviene tra le coppie dei non fratelli Ricombinazione meiotica Anche nella ricombinazione meiotica è necessaria l’introduzione di una rottura della doppia elica, qui non causata da fattori esogeni, ma da proteine endogene che hanno proprio questa funzione (tra l’altro, anche qui abbiamo in immagine i due cromatidi non fratelli allineati tra di loro). Intervengono quindi Spo11 e MRX à Spo11, in particolare, introduce una rottura a doppio filamento su uno dei due omologhi e, insieme ad essa, è associata MRX, che provvede degradare il filamento dal 5’ al 3’ per creare le estremità 3’ protundenti. Queste estremità sono quindi pronte a invadere l’altra molecola di DNA e per fare ciò vengono assistite dalle proteine Dmc1 e Rad51, una per estremità 3’ protundente (cioè Dmc1 su una estremità e Rad51 sull’altra) (queste due proteine svolgono quindi la funzione che RecA svolgeva nei procarioti). Le fasi successive sono poi identiche a ciò che abbiamo visto finora (replicazione del DNA, formazione e risoluzione delle giunzioni, …), anche se, come già detto, per il riconoscimento delle giunzioni di Holliday e la migrazione del chiasma non sono ancora stati caratterizzati i complessi proteici coinvolti. La ricombinazione per trasposizione Esistono all’interno della cellula altri esempi di ricombinazione oltre a quella omologa, non correlati con danno al DNA e con lo scopo di riparazione, ma che possono comunque spostare/ricombinare elementi genici da una posizione all’altra (questi sono la ricombinazione per trasposizione e quella conservativa sito-specifica). La trasposizione di un elemento genetico mobile in un nuovo sito nel DNA ospite La trasposizione è lo spostamento di un elemento genetico (una sequenza di DNA) da un punto a un altro all’interno del genoma. Questo elemento genico viene chiamato trasposone o elemento trasponibile. Ci sono due modalità generali di funzionamento: • movimento in assenza di duplicazione à il trasposone viene scisso dal sito originario e trasloca nel nuovo punto, senza lasciare una copia di sé nel punto originario • movimento con duplicazione à si ha che il trasposone si sposta da un punto all’altro, lasciando una copia di sé nel sito originario La trasposizione non avviene utilizzando delle sequenze specifiche, ma in maniera casuale, anche se è comunque un sistema che viene regolato dalla cellula (andando a controllare il numero di copie di trasposoni e anche il movimento da una sequenza all’altra) per evitare di creare dei danni quando un elemento si va a trasferire da un punto all’altro (per esempio con la potenziale capacità di riattivare un oncogene). I trasposoni nei genomi: frequenza e distribuzione I trasposoni nei genomi hanno un’abbondanza diversa à sono, per esempio, molto frequenti nel genoma del mais e dell’uomo, meno in drosophila, nel lievito e ancor meno in E. coli à quindi la loro frequenza è differente in base all’organismo. Le tre classi principali di trasposoni o elementi trasponibili Esistono tre classi di trasposoni (2 principali, di cui la seconda classe si suddivide ulteriormente in 2 sottoclassi): • Trasposoni a DNA • Retrotrasposoni o Retrotrasposoni LTR (Long Terminal Repeat) o SIMILRETROVIRALI o Retrotrasposoni NON-LTR o NON RETROVIRALI o retrotrasposoni poli-A Meccanismo di trasposizione dei trasposoni a DNA (A) e dei Retrotrasposoni (B) I trasposoni a DNA hanno fondamentalmente un meccanismo principale, chiamato trasposizione taglia e cuci à vuol dire che il trasposone viene scisso dal sito di origine e traslocato in un’altra posizione, senza lasciare una copia nel sito originale. Invece, i retrotrasposoni (sia LTR che NON-LTR) vanno a trasporre utilizzando un intermedio ad RNA à si ha che il DNA donatore viene trascritto da una RNA-pol, producendo un intermedio ad RNA, il quale viene poi trasformato di nuovo in DNA (o meglio cDNA) da una trascrittasi inversa e poi viene inserito nel nuovo sito (quindi si ha movimento con duplicazione in questo caso). Trasposoni a DNA Nell’immagine a fianco è riportata l’organizzazione genetica dei trasposoni a DNA e, come si può vedere, in grigio è indicato il DNA fiancheggiante dell’ospite in cui è integrato il trasposone à il trasposone contiene un elemento centrale che è il gene che codifica per la trasposasi, ossia l’enzima deputato a far avvenire la reazione di trasposizione. Più in là del gene per la trasposasi abbiamo che l’elemento trasponibile è fiancheggiato da delle sequenze, indicate in verde, chiamate sequenze terminali ripetute e invertite, le quali vengono ad avere una lunghezza che varia dalle 25 fino anche ad alcune centinaia di paia di basi e rappresentano i siti di ricombinazione (cioè i siti dove l’elemento trasponibile si andrà a tagliare per poi andare a spostarsi). Accanto a queste sequenze terminali ripetute e invertite abbiamo poi, in blu, le duplicazioni del sito bersaglio, che sono dei segmenti, che vanno da 2 a 20 paia di basi, che derivano dal processo di ricombinazione stesso. Trasposoni a solo DNA: trasposizione taglia e cuci I trasposoni a DNA, per la maggior parte, lavorano attraverso una trasposizione taglia e cuci, per cui vengono ad essere tolti da una regione (DNA dell’ospite) e si vanno a integrare nel DNA bersaglio, senza lasciare una copia di sé nel DNA dell’ospite originario. Nell’immagine vediamo che il primo step consiste nel fatto che il gene all’interno della trasposasi venga trascritto e tradotto à a questo punto, le trasposasi, vengono a creare un multimero di trasposasi (le trasposasi singole interagiscono cioè le une con le altre), che viene a prendere contatto con le sequenze terminali invertite e ripetute (i siti di ricombinazione), andando a creare una struttura ad U, chiamato complesso sinaptico o traspososoma. Questo complesso sinaptico, poi, è pronto per essere tagliato su entrambi i filamenti ad opera sempre della trasposasi à si ottiene quindi che il trasposone viene scisso e avrà per ciascun filamento un’estremità 5’ e una 3’. A questo punto, sono proprio i 3’-OH che creano un attacco nucleofilo sui legami fosfodiesterici (uno per ciascun filamento) del DNA bersaglio. Da notare che il taglio che viene eseguito dai due 3’-OH non avviene sullo stesso punto, ma si ha che il 3’-OH colpisce il legame fosfodiesterico su ciascun filamento non nella stessa posizione, ma in posizione sfalsata di diversi nucleotidi à quindi, quando il trasposone poi si integra, avendo rotto e riformato il legame fosfodiesterico, quello che avviene è che in virtù di questa rottura sfalsata simmetrica, avremo dei gap da riparare (della lunghezza che dista tra i due punti in cui ciascun 3’-OH ha colpito sul legame fosfodiesterico del DNA bersaglio). Questi gap devono quindi essere riparati e abbiamo un 3’-OH libero su un filamento del DNA bersaglio e uno stampo integro sull’altro filamento e, quindi, questo gap viene riparato da una DNA polimerasi e le scissioni verranno saldate dalla solita DNA ligasi. Quindi, alla fine di questo processo di trasposizione, si ha che il trasposone, dal DNA originario si è trasferito in un DNA bersaglio; per farlo si è portato dietro i siti di ricombinazione e le sequenze accanto sono state duplicate proprio per il meccanismo con cui questo tipo di trasposone opera il taglio sul DNA bersaglio (perché i due filamenti bersaglio vengono tagliati in maniera sfalsata e questo crea dei siti che devono poi essere riparati appunto). Retrotrasposoni simil retrovirali Presentano, dal punto di vista strutturale, un gene che codifica per due tipi di enzimi (l’integrasi, un altro tipo di ricombinasi, che catalizza cioè la reazione di trasposizione, come la trasposasi prima, e l’RT, ovvero la trascrittasi inversa). In questo caso, il gene centrale è poi fiancheggiato dalle sequenze LTR (Long Terminal repeat), che sono delle lunghe sequenze terminali ripetute, molto frequenti anche nei retrovirus (da cui il nome simil retrovirali) à queste sequenze contengono i siti di ricombinazione (le sequenze terminali ripetute e invertite) e anche il promotore, che sarà poi riconosciuto dai fattori di trascrizione per permettere la trascrizione dell’integrasi e dell’RT. Anche in questo caso, poi, si vede che il trasposone è fiancheggiato da dei siti che derivano dalla duplicazione del sito bersaglio, sempre collegati al processo di ricombinazione. Retrotrasposoni similretrovirali: meccanismo di trasposizione mediante intermedio a RNA Questi retrotrasposoni usano sempre un intermedio ad RNA e lasciano una copia di sé stessi nel DNA ospite di partenza. Sfruttando il promotore contenuto a livello della sequenza LTR, si ha che questo elemento viene trascritto perciò ad RNA à l’RNA poi, a sua volta, viene retrotrascritto e copiato a cDNA (una copia di DNA a doppia elica usando lo stampo ad RNA appena citato) ad opera della trascrittasi inversa che, come già detto, viene prodotta dallo stesso mRNA à quindi, l’elemento di RNA viene in parte retrotrascritto ma in parte anche tradotto per produrre l’integrasi e la trascrittasi inversa. A questo punto, questo cDNA così ottenuto (ricordiamo che l’elemento trasponibile di partenza rimane integrato nel DNA ospite di partenza) non è attivo e, per consentire la sua integrazione nel DNA bersaglio, le estremità 3’ vengono processate dall’integrasi. Questa proteina toglie infatti due nucleotidi, creando delle estremità 5’ protundenti, attivando quindi l’attacco nucleofilo di ciascun 3’-OH del cDNA sul DNA bersaglio, con un meccanismo molto simile a quello visto per i trasposoni a DNA. Anche in questo caso, ciascun 3’-OH colpisce il DNA bersaglio su due posizioni sfalsate, tant’è che anche in questo caso, quando il cDNA si va a integrare, abbiamo un gap che dovrà essere colmato, determinando la duplicazione del sito bersaglio (tutto questo sempre grazie a una DNA polimerasi e una DNA ligasi). Alla fine, quindi, si ha una nuova copia del retrotrasposone integrata nel DNA bersaglio, mantenendo una copia nel sito di origine iniziale. Retrotrasposoni non retrovirali L’ultimo tipo di retrotrasposone che prendiamo in considerazione è il retrotrasposone non retrovirale. Utilizza sempre un intermedio ad RNA, ma non presenta le sequenze LTR, piuttosto presenta le due regioni 5’ UTR e 3’ UTR (UTR sta per Untranslated, quindi ricorda molto la struttura di un mRNA), fiancheggiate dalla solita duplicazione del sito bersaglio. Inoltre, adiacente alla regione 3’ UTR abbiamo un tratto poli-A (e quindi poli-T nell’altro filamento), che poi darà una coda poli-A molto simile alla coda degli mRNA (tant’è che questi retrotrasposoni vengono chiamati anche retrotrasposoni poli-A). Poi, nel centro, abbiamo due geni, ORF1 e ORF2 à il primo codifica per una proteina che si lega all’RNA, mentre il secondo codifica per una proteina con attività sia di trascrittasi inversa che endonucleasica. Retrotrasposizioni non virali: meccanismo di trasposizione mediante trascrizione inversa innescata dal sito bersaglio (o splicing inverso) In questo caso, quindi, il meccanismo di trasposizione avviene sempre attraverso una trascrizione inversa, innescata però da un sito bersaglio. Da notare che anche in questo caso il promotore per andare a trascrivere questo trasposone è contenuto sempre all’interno del trasposone stesso (nella regione 5’ UTR in questo caso). Nell’uomo questi retrotrasposoni sono molto frequenti e si chiamano DNA LINE (il 20% del genoma umano ha queste sequenze LINE e tra l’altro alcune di queste sono responsabili di malattie). Il nostro retrotrasposone, quindi, viene trascritto grazie al promotore e l’RNA che si ottiene, che avrà una regione 5’ UTR, una regione 3’ UTR e un tratto poli-A, viene portato nel citoplasma e qui viene tradotto. Le proteine tradotte, ORF1 e ORF2, si associano tra di loro e vanno a legare l’mRNA LINE, creando un complesso che poi ritrasloca nel nucleo per svolgere il meccanismo di trasposizione. Nel nucleo, abbiamo che ORF1, che è legato all’RNA e fa parte del complesso, si lega al DNA bersaglio; successivamente, il DNA bersaglio viene tagliato ad opera di ORF2 e così si crea un ibrido tra l’mRNA LINE (in particolare con il suo tratto poli-A) e il DNA derivato dal taglio fatto da ORF2. A questo punto, nella fase successiva si crea la solita giunzione innesco stampo e ORF2, che è anche una trascrittasi inversa, sfruttando il 3’-OH libero del DNA nell’ibrido DNA-RNA, va a copiare l’RNA, creando un cDNA LINE a singolo filamento. Successivamente, l’RNA LINE viene degradato (anche se il meccanismo e gli attori alla base di ciò non sono ancora ben chiari) e viene completata la sintesi del secondo filamento. Il tutto poi viene ad essere saldato e integrato all’interno del DNA bersaglio (anche se, come già detto, queste ultime parti del processo non sono ancora state del tutto chiarite). Quello che ottengo, alla fine, è un nuovo elemento DNA LINE integrato, per l’appunto, nel DNA bersaglio. La ricombinazione conservativa sito-specifica (CSSR) Esempio di ricombinazione sito-specifica (CSSR) e trasposizione a confronto In questa immagine vengono messe a confronto la ricombinazione sito-specifica (in alto nell’immagine) e la trasposizione (in basso) à si vede come una differenza sostanziale tra i due elementi è che la ricombinazione sito-specifica è limitata a sequenze specifiche di DNA aventi specifici siti di ricombinazione, mentre la trasposizione, anche se usa anch’essa dei siti di ricombinazione, si integra in maniera casuale a livello del DNA bersaglio (la trasposizione è infatti spesso regolata in modo da evitare danni al genoma bersaglio in virtù di questa trasposizione casuale à questo avviene regolando il numero di trasposoni e regolando i nuovi siti di inserzione con diversi meccanismi). Esempio di CSSR: integrazione del genoma di batteriofago λ nel cromosoma batterico della cellula ospite Questo è un classico esempio di CSSR à in rosso abbiamo il genoma del batteriofago e in blu il cromosoma batterico e in rosso e blu scuro si notano i siti di ricombinazione (fagico e batterico). Quindi il batteriofago si integra con il suo genoma all’interno del cromosoma batterico non in maniera casuale, ma andando a integrarsi utilizzando dei siti di ricombinazione specifici sul fago e sul cromosoma batterico. In questo modo, attraverso questa ricombinazione chiamata integrativa, ottengo quello che viene chiamato profago. In conclusione, la ricombinazione sito-specifica avviene su specifiche sequenze del DNA bersaglio e il segmento di DNA che viene spostato porta con sé i siti di ricombinazione. CSSR • Può dare origine a tre diversi tipi di riarrangiamento del DNA: o Inserzione di un segmento di DNA in un sito specifico (es. batteriofago lambda) o Delezione di un tratto di DNA o Inversione di un pezzo di doppia elica • • L’organizzazione dei siti di ricombinazione (come sono orientati) determina il tipo di riarrangiamento Ogni sito di ricombinazione ha: o Due sequenze di riconoscimento laterali della ricombinasi (anche in questo caso ho un enzima che catalizza la reazione di ricombinazione quindi) o Una sequenza centrale: regione dello scambio o del crossing over (dove avvengono il taglio e la riunione del DNA; quindi, dove la ricombinasi va a tagliare e dove vengono riunite le estremità del DNA) § Si può notare che la sequenza centrale non è palindromica, perché è un TAGC, questo conferisce alla sequenza centrale un orientamento intrinseco, una polarità, che viene indicata con una freccetta à questo determina poi l’orientamento del nostro sito di ricombinazione à è proprio questo orientamento, indicato dalle freccette, che va a determinare un diverso tipo di riarrangiamento. Le strutture coinvolte nella CSSR Come possiamo vedere nell’immagine, durante lo svolgimento della CSSR, vengono coinvolti due siti di ricombinazione (in rosso e in blu) e, ogni metà rispetto alla regione di scambio viene a combinarsi con quella dell’altro sito. Sempre nell’immagine, si può vedere come le subunità della ricombinasi legano le sequenze di riconoscimento à la ricombinazione quindi prevede che la regione centrale venga tagliata ad opera della ricombinasi, in modo tale che l’estremità rossa a sinistra si ricombini con le estremità prodotte dalla rottura del sito blu, prendendo l’estremità blu a destra e viceversa per le altre due subunità à si crea quindi un incrocio del sito in rosso e del sito in blu e dopo la ricombinazione, avrò in un caso la parte sinistra in rosso e quella destra in blu, mentre nell’altro caso la parte sinistra in blu e quella destra in rosso à in conclusione, ogni metà va a ricombinarsi con l’altra metà corrispondente dell’altro sito e tutto questo avviene perché la ricombinasi, con le sue quattro subunità, riconosce le sequenze di riconoscimento (fiancheggianti la regione centrale di taglio di ciascun sito), andando in questo modo a ricombinare ciascuna estremità dell’altro sito bersaglio. I tre tipi di ricombinazione Come dicevamo, la regione di scambio non è palindroma e quindi determina un’asimmetria nel sito di ricombinazione à questa asimmetria viene indicata graficamente da un quadratino con una freccia interna: • Se i siti di ricombinazione hanno la stessa orientazione (le due freccette indicano la stessa direzione): o Sulla stessa molecola di DNA permettono la delezione o Su molecole di DNA differenti permettono l’inserzione • Se i siti di ricombinazione hanno orientazione opposta sulla stessa molecola di DNA producono l’inversione di quella regione genica Meccanismo dell’intermedio covalente utilizzato dalle serina e tirosina ricombinasi Naturalmente, la ricombinasi, per riuscire a tagliare la regione di scambio centrale, utilizza un amminoacido conservato, che può essere la serina o la tirosina à entrambe hanno un gruppo OH che può colpire il legame fosfodiesterico, a livello delle basi della regione di scambio, e interrompere in questo modo il filamento (lo scheletro zucchero-fosfato). Per questo motivo abbiamo per l’appunto serina e tirosina ricombinasi, che agiscono con meccanismi molto similari, ma entrambe per rompere la regione di scambio utilizzano un amminoacido conservato che può essere, in base alla tipologia di ricombinasi, o una serina o una tirosina. In particolare, nell’immagine vediamo all’opera una serina ricombinasi, di cui la serina colpisce il legame fosfodiesterico, andando a romperlo e creando un intermedio con il gruppo fosfato, un intermedio covalente tra la proteina (indicata con Rec-Ser) e il DNA. Poi, l’estremità 3’-OH interrotta del DNA sull’altro sito di ricombinazione andrà a colpire il gruppo fosfato, andando a ricreare il legame fosfodiesterico, creando il prodotto ricombinato e liberando l’enzima, che potrà colpire nuovamente altri siti. Ricapitolando, le ricombinasi sito-specifiche tagliano e riuniscono il DNA per mezzo di un intermedio covalente proteina-DNA. Esempio di ricombinazione mediata dalla serina ricombinasi Per capire meglio questo meccanismo, nell’immagine possiamo vedere un esempio di ricombinazione mediata dalla serina ricombinasi. Quando arriva la serina ricombinasi, essa è costituita da 4 subunità (R1, R2, R3, R4) e due riconoscono i siti di riconoscimento indicati in blu e le altre due i siti rossi. Ogni subunità, poi, crea l’intermedio serina-DNA citato poco fa, cioè ogni subunità rompe il filamento a cui sono legate, creando una rottura, una estremità 3’-OH libera e un intermedio proteina-DNA. Questo avviene per ciascun filamento (sia in rosso che in blu). A questo punto, avviene lo scambio dei filamenti prima descritto (R2 si posiziona vicino a R3 e viceversa per R1 e R4). In questo modo i filamenti si sono scambiati e ciascun 3’-OH libero, di ciascuna metà, va a colpire l’intermedio enzima-DNA per riunire le estremità e andare a liberare l’enzima. Ricombinazione V(D)J dei geni per le immunoglobuline nei vertebrati Questo è un classico esempio di ricombinazione genetica nei vertebrati (specialmente nei mammiferi), tra l’altro molto simile come meccanismo alla scissione dei trasposoni a DNA. Ricordiamoci prima della struttura degli anticorpi à essi constano di due catene più lunghe, quelle pesanti, e di due catene più corte, quelle leggere, tenute insieme da dei ponti disulfuro. Sia le catene leggere che pesanti hanno alle loro estremità delle regioni variabili, responsabili di riconoscere l’antigene specifico. Meccanismo di ricombinazione V(D)J nei vertebrati per generare una grande varietà di anticorpi La grande varietà di anticorpi è possibile perché i segmenti che compongono queste catene leggere e pesanti subiscono dei meccanismi di ricombinazione (molto simili al meccanismo di scissione dei trasposoni a DNA). In particolare, possiamo vedere che la catena leggera viene specificata a livello del DNA della linea germinale da tutta una serie di segmenti, ossia consta praticamente da circa 300 regioni di tipo V, che vengono a essere responsabili nel codificare le diverse versioni della regione variabile della catena leggera e tra queste regioni variabili V e la regione costante C, che è una sola, abbiamo inoltre 4 segmenti genici chiamati J (che sta per joining). Ne deriva che, tramite ricombinazione (da cui il nome V(D)J perché vengono ricombinati i segmenti V, J e poi D nelle catene pesanti e C), con le diverse combinazioni di V, J e C (anche se ce n’è solo una), si possono ottenere 1200 versioni di catene leggere per anticorpo. Dall’immagine si può vedere come, dal DNA della linea germinale, si ha un riarrangiamento del DNA durante il differenziamento delle cellule B. In questo esempio, infatti, nel DNA delle cellule B possiamo vedere che si sono riarrangiati V3 con J3. Quando questo DNA poi viene trascritto, avremo che verrà trascritto V3, riarrangiato con J3, poi J4 e C. In seguito allo splicing dell’RNA, poi, vengono tolti gli introni e le regioni in essi contenuti à nel nostro caso viene deleto J4 e viene ricombinato V3 e J3 insieme all’unica regione C (C4). Alla fine, ottengo una ricombinazione tra V3 e J3 che poi verrà associata a C4. Quando poi si avrà la traduzione, si otterrà una particolare catena leggera. Nella catena pesante il discorso è analogo à in questo caso abbiamo 100 diverse versioni per le regioni V, 4 regioni J, 12 regioni D (sta per diversity e si trova solo nelle catene pesanti ed è un segmento anch’esso coinvolto nella generazione di diversi tipi di anticorpo) e 5 regioni C che differiscono una per ciascuna tipologia di anticorpo à infatti, in base al tipo di regione C della catena pesante, si avrà una particolare tipologia di anticorpo, che sono 5 à per esempio, Cmu nelle IgM; Cdelta nelle IgD, Cgamma nelle IgG, Cepsilon nelle IgE, Calfa nelle IgA à di conseguenza, considerando che ogni tipo di anticorpo avrà una particolare regione C unica, si avranno ben 4800 diverse versioni di catene pesanti per ciascuna delle 5 tipologie di anticorpi disponibili. La trascrizione La via dal DNA a proteine Finora abbiamo visto la replicazione e la riparazione del DNA e la ricombinazione genetica. Dal DNA, però, abbiamo la sintesi dell’RNA tramite la trascrizione, perché il DNA può fungere da stampo anche per sintetizzare l’RNA (cioè copiare la sua informazione in una molecola di RNA). L’RNA così ottenuto (dopo essere stato processato etc.) servirà poi per tradurre l’informazione in proteine (nella sintesi proteica o traduzione). In questo capitolo andremo a prendere in considerazione: • L’unita di trascrizione e le tre fasi della trascrizione • Le RNA polimerasi • La trascrizione nei procarioti e la sua regolazione • La trascrizione negli eucarioti e la sua regolazione L’unità di trascrizione e le tre fasi della trascrizione Unità di trascrizione L’unità di trascrizione è un tratto di DNA che va dal promotore al terminatore ed è espresso come una singola molecola di RNA. In particolare, l’RNA polimerasi, che in immagine vediamo con una forma a C, viene a legarsi sul DNA riconoscendo delle sequenze specifiche sul DNA, chiamate promotore. Esso si trova all’inizio del gene e contiene, tra l’altro, anche il nucleotide da cui parte la sintesi dell’RNA (il sito d’inizio della trascrizione, anche chiamato TSS oppure indicato con il numero +1). La trascrizione, poi, procede lungo lo stampo di DNA fino a raggiungere delle sequenze specifiche chiamate terminatore (almeno nei procarioti, poi vedremo che ci sono delle differenze tra procarioti ed eucarioti), definendo in questo modo l’unità di trascrizione. Nel promotore, poi, oltre al sito d’inizio, indicato con +1, i nucleotidi che stanno prima del sito d’inizio vengono sempre indicati con un numero negativo e, in particolare, -10 e -35 rappresentano due sequenze conservate nel promotore. Tutti i nucleotidi sul DNA successivi al promotore, contenuti cioè nel gene che deve essere trascritto in RNA, vengono invece indicati con un numero positivo. Le sequenze che precedono il sito d’inizio della trascrizione, inoltre, vengono anche definite sequenze Upstream (a monte), mentre le sequenze dopo vengono anche indicate come Downstream (a valle). Infine, le sequenze che si trovano vicino al sito d’inizio della trascrizione vengono chiamate regioni o sequenze prossimali, mentre quelle più lontane distali. L’RNA polimerasi trascrive uno solo dei due filamenti della doppia elica del DNA Anche nella trascrizione abbiamo una polimerasi à in questo caso, l’enzima che sintetizza l’RNA su uno stampo di DNA è per l’appunto la RNA polimerasi. Anche in questo caso, affinché l’RNA polimerasi trascriva la molecola di DNA, ha bisogno di uno stampo e utilizza però uno solo dei due filamenti della doppia elica di DNA, al contrario della replicazione. Inoltre, anche in questo caso, affinché questo stampo sia accessibile, è necessaria la creazione di una bolla di trascrizione, cioè occorre una regione del DNA che si vada a denaturare. In particolare, possiamo identificare, a livello della bolla di trascrizione, il filamento di DNA codificante (il filamento che non viene utilizzato come stampo) e il filamento di DNA stampo (che viene utilizzato dalla RNA polimerasi in modo tale da aggiungere i nucleotidi complementari e produrre l’RNA). Anche in questo caso, la direzione di sintesi dell’RNA ad opera della RNA polimerasi è sempre in direzione 5’-3’ (le polimerasi lavorano sempre sintetizzando in questa direzione) e si sfrutta sempre un’estremità 3’-OH (questa volta sul filamento di RNA di sintesi) per aggiungere il nuovo nucleotide con la sua base complementare a quella del DNA stampo. Bisogna poi anche osservare che questa bolla di trascrizione fornisce all’enzima il filamento stampo e la bolla si muove insieme all’enzima e il DNA si apre via via che l’enzima procede e si richiude dopo il passaggio dell’enzima (a monte), tant’è che in questo processo la bolla di trascrizione rimane sempre di una lunghezza costante. Man mano che la trascrizione procede, inoltre, si ha che l’RNA trascritto rimane accoppiato solo per un breve tratto per poi staccarsi e, tra l’altro, al termine, l’RNA verrà dissociato dallo stampo di DNA. Nella tabella sottostante, inoltre, sono riportate le similitudini e le differenze rispetto alla replicazione. Tra l’altro, il filamento stampo può essere sia il 3’-5’ ma anche il 5’-3’. In particolare, l’RNA polimerasi si lega al promotore con un orientamento prefissato, così dallo stesso promotore viene sempre trascritto lo stesso filamento di DNA. Per fare un esempio, nell’immagine abbiamo un gene 1 e un gene 2, il nostro RNA e la RNA polimerasi. Nel gene 1 il filamento stampo è quello con direzionalità 5’-3’ e la RNA polimerasi si muove sempre sintetizzando l’RNA in direzione 5’-3’, mentre nel gene 2, invece, l’RNA polimerasi si orienta/posiziona sul promotore in modo opposto al caso precedente, perché utilizza come filamento stampo quello 3’-5’ e, di conseguenza, l’RNA è sempre sintetizzato in direzione 5’-3’, ma lo stampo è quello 3’-5’. In una bolla di trascrizione, l’RNA polimerasi ha, in altre parole, una preferenza per ciascun promotore per uno dei due filamenti stampo e, in quello stesso promotore, viene usato come stampo sempre lo stesso filamento di DNA à in questo modo l’RNA polimerasi si orienterà in modo da tale da utilizzare o un filamento oppure l’altro ma, per ciascun promotore, ho fisso l’utilizzo di quello specifico filamento stampo. Lo vediamo anche nell’immagine superiore, dove abbiamo 3 geni à si vede infatti che per ciascun gene, in base al filamento stampo che viene utilizzato, se 5’-3’ o 3’-5’, quindi in base a come si orienta poi la polimerasi, viene usato uno dei due filamenti come stampo (ma la sintesi dell’RNA avviene sempre in direzione 5’-3’, quello che cambia è l’orientamento della RNA polimerasi sulla bolla di trascrizione, in modo tale da utilizzare uno dei due filamenti, ma solo uno specifico per ciascun promotore). Lo stampo di DNA per la sintesi di RNA Nell’immagine si vede la sequenza del DNA codificante, quella del DNA stampo e quella dell’RNA (che utilizza come stampo il filamento stampo ovviamente). Viene indicato anche il codone d’inizio, che è l’ATG. Per convenzione, il gene, il promotore e le sequenze di regolazione del DNA si scrivono come appaiono sul filamento codificante (anche su PubMed per esempio), ricordando che il filamento codificante o DNA nonstampo risulta avere la stessa sequenza dell’RNA trascritto, mentre la sequenza del DNA stampo è complementare, ovviamente, all’RNA trascritto e al filamento codificante à quindi, in base al filamento codificante, facilmente possiamo dedurre la sequenza dell’RNA, che sarà praticamente identica, e quella del DNA stampo, che sarà complementare al filamento codificante e all’RNA trascritto. Accoppiamento trascrizione/traduzione nei procarioti Inoltre, nei procarioti abbiamo anche un accoppiamento tra trascrizione e traduzione à vediamo infatti che l’RNA, che viene trascritto durante la sintesi dell’RNA stesso, non rimane appaiato per tutta la lunghezza della trascrizione al DNA stampo, ma vi rimane solo per un piccolo tratto, per poi dissociarsi completamente al termine della trascrizione. Ma durante la trascrizione abbiamo che la disponibilità di questo mRNA permette nei procarioti di far sì che, appena si ha un mRNA di lunghezza sufficiente per posizionare i ribosomi, la traduzione inizia immediatamente. Quindi, nei procarioti, si ha che trascrizione e traduzione avvengono praticamente in contemporanea à mentre si allunga l’mRNA durante la sua sintesi, si ha che questo viene contemporaneamente tradotto in proteine. Negli eucarioti questo non è possibile perché l’mRNA messaggero negli eucarioti non è immediatamente pronto per la traduzione, ma deve subire un processo di maturazione à solo quando poi è maturo e quindi pronto per essere tradotto, viene traslocato dal nucleo al citoplasma, dove avverrà la traduzione (quindi anche la presenza di un comparto subcellulare fa sì che trascrizione e traduzione non siano accoppiate). Le fasi della trascrizione in procarioti ed eucarioti 1. Inizio à in realtà, consta di diversi sottostep 2. Allungamento 3. Fine (o terminazione) Ricorda: La trascrizione procede sempre in direzione 5’3’ Inizio La fase di inizio prevede diversi sotto-step à per prima cosa il promotore deve essere riconosciuto dalla RNA polimerasi; quindi, nel primo step la RNA polimerasi si lega al promotore, senza denaturare immediatamente il DNA e formare la bolla di trascrizione, ma creando un legame, ciò che viene chiamato complesso chiuso. Una volta che l’RNA-pol si è stabilmente legata al promotore, abbiamo una serie di cambiamenti conformazionali all’interno della nostra polimerasi che promuovono l’apertura della bolla di trascrizione (di circa 13 bp) e quindi la formazione di quello che viene chiamato un complesso aperto. Questa bolla coinvolge la parte finale del promotore, incluso il sito d’inizio della trascrizione e le sequenze a vallo del sito d’inizio della trascrizione. Questa seconda fase viene anche chiamata melting del promotore, proprio perché c’è questa apertura della doppia elica che crea la bolla di trascrizione. Infine, in virtù della nuova disponibilità del DNA stampo, l’RNA-pol inizia a sintetizzare l’RNA à come si può vedere, all’inizio essa sintetizza RNA senza distaccarsi dal promotore e inizia a fare una sorta di serie di tentativi di sintetizzare un RNA sufficientemente lungo, che ibridizza quindi con il DNA stampo e deve essere un ibrido stabile; infatti, questo ultimo step viene chiamato inizio abortivo, cioè l’RNA polimerasi non parte subito a sintetizzare l’RNA a gran velocità ma, piuttosto, inizia sintetizzare dei frammenti di RNA (una serie di tentativi), finché non riesce a produrre un RNA di 10 bp, che è una lunghezza sufficiente per creare un ibrido stabile DNA-RNA e, a questo punto, inizia la sintesi. Tutti i corti RNA dei tentativi precedenti si dissociano dal DNA (ecco perché inizio abortivo). Questo inizio abortivo avviene perché l’RNA-pol non utilizza un primer, una giunzione innesco-stampo per partire con la sintesi dell’RNA e quindi è lei che sintetizza immediatamente l’RNA, con una serie di tentativi iniziali. A questo punto, la polimerasi può rilasciare il promotore e proseguire nella fase di allungamento. Allungamento L’RNA-pol abbandona, come già detto, il promotore e inizia ad allungare l’RNA. Tra l’altro, durante la fase di allungamento, l’enzima si muove in modo da sintetizzare sempre in direzione 5’-3’ l’RNA e, mentre si sposta lungo il DNA, muove con sé anche la bolla di trascrizione. Inoltre, il DNA si apre nella direzione di sintesi (nel caso specifico dell’immagine da sinistra verso destra) e si richiude alle sue spalle, in modo tale da mantenere la bolla di trascrizione di una lunghezza costante. L’RNA polimerasi in questa fase ha diverse funzioni, quindi: • Sintetizza l’RNA • Separa i due filamenti di DNA a valle e li riavvolge a monte dell’enzima • Stacca la catena di RNA dallo stampo di DNA (in modo che l’ibrido DNA-RNA mantenga una lunghezza costante) • Funziona da correttore di bozze (nel caso in cui venga incorporato un nucleotide non corretto, può andare a riparare questo nucleotide errato, attraverso proprio questa funzione di correttore di bozze) Durante la fase di allungamento vengono introdotti superavvolgimenti L’azione di apertura della doppia elica per creare la bolla di trascrizione viene a generare a valle dell’RNA-pol dei superavvolgimenti positivi (come nella replicazione) e, quindi, per evitare che la trascrizione si blocchi a causa di questi superavvolgimenti positivi, dovranno intervenire le topoisomerasi a risolverli e rimuoverli. Terminazione Nella terminazione l’RNA-pol rilascia l’RNA prodotto, si dissocia dal DNA e nei batteri, come vedremo, esistono delle sequenze specifiche alla fine del gene che sono appunto i terminatori (ne esistono di diversi tipi), che consentono proprio questa dissociazione della polimerasi. Le RNA Polimerasi LE SUBUNITA’ DELLE RNA POLIMERASI I batteri, come si vede nella tabella, hanno una sola RNA polimerasi, RNAP core, mentre le cellule eucariotiche ne hanno 3, RNAP I, RNAP II, RNAP III. Ogni polimerasi negli eucarioti è specifica per la sintesi di determinati RNA: ● La RNA pol I si occupa della sintesi degli rRNAs ● La RNA pol II si occupa della sintesi degli mRNAs, microRNA (= piccoli RNA non codificanti, con la funzione di regolare l’espressione genica di geni bersaglio) e alcuni RNA non codificanti ● La RNA pol III si occupa della sintesi di tRNAs, rRNA 5s (uno degli RNA ribosomiali), snRNA (= small nuclear RNA, ovvero piccoli RNA nucleari) Recentemente sono state identificate altre due RNA polimerasi, che utilizzano sempre il DNA come stampo, che sono RNA pol IV e RNA pol V. Queste due polimerasi si trovano solo nelle piante, dove vanno a trascrivere dei piccoli RNA interferenti, non codificanti, che hanno la funzione di silenziare la trascrizione di geni bersaglio (hanno sempre una funzione di regolazione dell’espressione genica, per altri target). Nella RNA pol batterica, la componente enzimatica è la RNAP core ed è costituita da una serie di subunità: ● 2 subunità beta ● 2 subunità alfa ● 1 subunità omega Per ciascuna di queste unità, negli eucarioti vi è la corrispondente componente proteica, come si vede nella tabella. Negli eucarioti, la composizione in subunità è più elevata di 5 perchè oltre alle 5 corrispondenti a quelle batteriche per funzione, si hanno tante altre subunità in più. Anche in questo caso il core enzimatico è il P core, come già detto, ma quando a questo core si associa un altro fattore, detto fattore sigma, si parla di oloenzima della RNA polimerasi batterica; è un oloenzima con una struttura più semplice rispetto a quello che si è visto con la DNA pol batterica, però anche in questo caso una componente proteica aggiuntiva supporta l’attività enzimatica dell’RNA P core. ARCHITETTURA DELLE RNA POLIMERASI La struttura della RNA pol viene indicata con una figura che ricorda una chela di un granchio. (La DNA pol viene invece paragonata alla mano destra). Le pinze corrispondono alle subunità beta e beta’. Il sito attivo, dove avviene la polimerizzazione, perciò la sintesi e l'aggiunta dei ribonucleotidi, si trova alla base delle due pinze, quindi tra le due subunità beta e beta’. Questa regione, in cui si trova il sito attivo, si chiama solco centrale attivo. In queste due immagini viene paragonata la struttura della RNA pol batterica con quella della RNA pol II eucariotica e si nota che la forma a chela di granchio è mantenuta in entrambe le strutture e in generale la struttura è molto simile. Ogni colore corrisponde a una subunità, come si legge dalla legenda. IL MECCANISMO DELLA SINTESI DI RNA La reazione di polimerizzazione è analoga a quella della DNA polimerasi. La RNA polimerasi sintetizza il filamento in direzione 5’→ 3’ e in questo caso specifico si ha un filamento stampo di DNA indicato con gli zuccheri in rosso, mente il filamento con gli zuccheri in verde è il filamento di RNA nascente. Anche per la RNA pol l’estremità 3’OH libero del filamento di RNA nascente va a colpire il fosfato alfa del nuovo ribonucleotide, che è entrato nel sito dell’enzima e che si è appaiato con la sua base complementare allo stampo di DNA. La reazione, come al solito, prevede il rilascio di pirofosfato con l'addizione del nuovo ribonucleotide alla catena di RNA. Anche in questo caso l’enzima presenta nel sito attivo due ioni magnesio, che consentono di ridurre l’affinità dell’idrogeno per l’ossigeno in posizione 3’, in modo da creare un ossigeno carico negativamente, che va a colpire il fosfato alfa rilasciando pirofosfato. Anche i fosfati beta e gamma, aventi cariche negative, vengono stabilizzati dagli ioni magnesio. L’unica differenza, rispetto al meccanismo di sintesi della DNA pol, è che si ha l’utilizzo di un unico filamento stampo e che si sta sintetizzando un RNA, quindi, entrano nel sito attivo dei ribonucleotidi e non dei deossiribonucleotidi. I CANALI DELLA RNA POLIMERASI La RNApol ha diversi canali, che consentono il passaggio del DNA, RNA e ribonucleotidi verso e dal solco centrale. A livello del solco centrale ci sono diversi canali: ● Un primo canale permette l’ingresso del DNA, che deve essere denaturato e trascritto ● Un canale consente l’ingresso dei ribonucleotidi ● Dall’altra parte un canale da cui esce l’RNA neosintetizzato L’RNA viene sempre sintetizzato in direzione 5’→ 3’, quindi all’estremità 3’ viene addizionato il ribonucleotide, che dovrà essere complementare alla base dello stampo. RNA pol ha una sorta di perno che consente la separazione dei due filamenti rendendo disponibile il filamento stampo (in rosso) (in blu il filamento codificante). All’interno della RNA pol si forma una bolla di denaturazione, dove i due filamenti vengono separati e a monte vi è il canale d’ingresso e a valle il canale di uscita del DNA, che è di nuovo riappaiato. Durante l’allungamento, quindi durante la sintesi, la bolla viene sempre mantenuta di una dimensione costante, proprio perché per una base che dissocia sul filamento di DNA, se ne riappaia una successiva. In questo modo la bolla rimane sempre costante. LA TRASCRIZIONE NEI PROCARIOTI E LA SUA REGOLAZIONE Il core enzimatico è l’RNA P core, che viene ad essere associato ad un fattore SIGMA. Questo fattore nell’immagine riportata in alto a sinistra è la struttura in fucsia, mentre a destra, nella struttura a chela di granchio, è quello in grigio. Il fattore sigma crea proprio l’oloenzima, ovvero l’intera RNA pol batterica, dove viene mantenuta questa attività. Il fattore sigma è importante, perché la sua presenza assicura alla RNA pol batterica di legarsi con notevole affinità al promotore (da ricordare infatti che la trascrizione ha inizio con il riconoscimento del promotore da parte della RNA pol). Il fattore sigma agisce come un fattore di trascrizione a tutti gli effetti. Nei procarioti si ha quindi un solo fattore di trascrizione. Quando sigma è legato alla RNA pol si riduce la capacità globale della polimerasi di legare il DNA, mentre aumenta notevolmente la sua affinità per il promotore. Ricapitolando, quando c’è il fattore sigma, RNA polimerasi si lega con alta affinità al promotore. Quando il fattore sigma non c’è, essa si lega al DNA, senza andare a disperdersi nella cellula. Il fattore sigma deve essere perciò associato alla RNA pol durante la fase di inizio della trascrizione, in quanto in questa fase RNA pol deve rimanere legata al promotore. Nella fase di allungamento, dove vi è il disimpegno del promotore, ovvero la RNA pol si sposta dal promotore, il fattore sigma si stacca. Il fattore sigma ha dei domini che sono rivolti verso l’esterno e servono per riconoscere e legare il promotore. Gli altri domini sono nella regione interna, fra le due parti della pinza e vanno a occupare parzialmente il canale dove si posiziona il DNA. Anche questa struttura ci permette di capire la funzione del fattore sigma, in quanto ci fa capire come la presenza di questo fattore sigma ci assicuri il fatto che esso si lega al promotore grazie ai domini esterni però dall’altra parte viene a ridurre notevolmente l’affinità della RNA polimerasi per il DNA grazie ai domini interni che vanno a occupare parzialmente il canale dove passa il DNA. Esistono diversi fattori sigma. Il fattore predominante in E. coli è il fattore sigma70. Esistono anche altri fattori come il fattore sigma32, che entra in gioco quando i batteri subiscono uno shock termico, il fattore sigma54 agisce in seguito a una carenza di azoto o il fattore sigma28 che fa parte del sistema del flagello. Per ogni fattore si ha una sequenza specifica a -35 e a -10 nel promotore e la distanza che è interposta tra le due sequenze conservate differisce in base al fattore. Quello principale è appunto il fattore sigma70 e le sequenze conservate a -35 e a -10 sono rispettivamente TTGACA e TATAAT. Questa è la struttura classica di un promotore riconosciuta da sigma70. Nell’immagine si nota che tra le due sequenze conservate si ha una distanza di 17-19 pb e una distanza di 5-9 pb tra la sequenza a -10 e l’inizio della trascrizione. Queste sequenze consenso sono state ottenute confrontando ben più di 300 promotori presenti nel genoma di E. coli, che vengono riconosciuti dal fattore sigma70. Confrontando questi promotori si è potuto produrre le sequenze consenso a -35 e a -10. Ogni colore indica una base e sulle ordinate è indicata la frequenza di ciascun nucleotide. Sulla base di queste sequenze consenso, bisogna ricordare che non tutti i promotori contengono esattamente la sequenza consenso, quella che è riportata è quella predominante, più frequente, come si vede dalle barre più alte (indicano maggior frequenza) ma ci sono delle piccole variazioni che sono responsabili della forza di un promotore. Un promotore che presenta una sequenza a -35 e -10 nel suo promotore, che è identica o quasi a queste sequenze consenso, è un promotore molto forte, mentre viceversa, quando un promotore si diversifica da queste sequenze consenso, è molto più debole (tanto più sono diverse, più il promotore è debole). I geni costitutivi sono quei geni che la cellula vuole esprimere ad alti livelli continuamente, indipendentemente da stimoli esterni e vengono detti “housekeeping”, come l’actina o geni legati al metabolismo del glucosio, coinvolti nella glicolisi, come una aldolasi o chinasi. I geni non costitutivi invece sono quelli inducibili, regolati da fattori esterni, come un attacco virale o un'infezione o infiammazione. In questa immagine è riportato il confronto di 3 strutture possibili per il fattore sigma70 dei promotori da lui riconosciuti: per il fattore sigma70, infatti, alcuni promotori possono essere differenti da quelli riportati in A. ● In A vi è quello classico ● In B vi è un classico promotore che si trova a monte dei geni che codificano per rRNA ed è un esempio di promotore molto forte, perché si ha sempre bisogno che l’rRNA sia prodotto dalla cellula ad alti livelli. Inoltre, esso contiene, oltre le sequenze a -35 e a -10, l’elemento UP. L’elemento UP è un elemento di interazione ulteriore del RNA pol attraverso non il fattore sigma ma una coda, detta coda C Terminale della subunità alfa o 𝛼CTD Gli elementi -10 e -35, sono riconosciuti dal fattore sigma associato alla RNA pol, ma appunto l’RNA pol ha un’estremità, come si può vedere dall’immagine, che è la coda C Terminale della subunità alfa, che interagisce con l'elemento UP rendendo ancora più stabile l’interazione della RNA pol con il promotore, ecco perché è un promotore forte. La coda ha un ponte flessibile, consentendole di interagire ancora più facilmente con questo elemento, creando un ulteriore interazione tra l'enzima e il DNA. ● In C invece vi è una variante ancora, dove non c’è né l'elemento -35, né l’elemento UP, ma c’è solo l’elemento -10, che però è esteso. Anziché essere di 6 pb, è un po’ più lungo, intorno alle 10. Questo tipo di elemento è molto frequente nel promotore dei geni GAL, che non contengono la sequenza -35, tanto meno l’elemento UP e per compensare hanno un elemento -10 esteso. Il fattore interagisce con il promotore e lo fa mediante delle regioni specifiche. Il fattore sigma contiene 4 regioni principali o domini, che vengono indicati con i numeri 1, 2, 3, 4 a partire dall’estremità N-terminale fino all’estremità C-terminale. Di questi domini si ha che il dominio 2 interagisce con la sequenza consenso a -10, mentre il dominio 4 interagisce con la sequenza consenso a -35 del promotore. Se si ha il caso di avere il promotore esteso, in questo caso saranno coinvolte le regioni 2 e 3. Tra la regione 3 e 4 si ha un linker che collega queste due regioni, ma se ne parlerà più avanti. Considerando un promotore classico per sigma70, quindi, i domini coinvolti nell'interazione con il promotore, sono il 2, con la regione -10 e il 4, con la regione -35. La regione 4 interagisce con la sequenza consenso -35 sul promotore attraverso una struttura elica giro elica, quindi, il dominio 4 ha questa struttura. Questa struttura fornisce l’energia di legame per assicurare la polimerasi sul promotore. Questa interazione tra dominio 4 e la sequenza consenso è fondamentale per assicurare la polimerasi sul promotore ed avviene grazie al fatto che il dominio 4 sia organizzato in questa struttura elica giro elica. Il motivo elica giro elica è molto comune per altre proteine che legano il DNA. Dall’immagine sono riportate le due strutture ad 𝛼 elica e si può notare come una delle due eliche è chiamata R (che sta per elica di riconoscimento), che si inserisce nel solco maggiore e interagisce direttamente con il DNA, mentre l’altra si posiziona più esternamente e va a interagire con lo scheletro zucchero-fosfato del DNA. Il dominio 2 interagisce con la regione -10, mediante una struttura ad alfa elica. Questa interazione ha un ruolo importante nella transizione da complesso chiuso a complesso aperto. Durante l’inizio della trascrizione, inizialmente RNA pol si lega al DNA riconoscendo la regione -35, però non produce subito una denaturazione del DNA, ma rimane legata al promotore e passa dal complesso chiuso, dove il DNA ancora non è denaturato, al complesso aperto, dove il DNA viene denaturato (con RNA pol sempre sul promotore, in quanto siamo ancora nella fase di inizio). L’interazione tra questa regione e la sequenza consenso è fondamentale per consentire la denaturazione locale che coinvolge questa sequenza consenso a -10 del DNA. Questa interazione del dominio due del fattore sigma consente di stabilizzare il DNA una volta che è aperto. Riepilogando: ● la regione -35 fornisce l’energia necessaria per assicurare l’energia di legame per assicurare la polimerasi sul promotore ● Sulla regione -10 avviene l’inizio della separazione del DNA durante la transizione dal complesso chiuso ad aperto e l’interazione con la regione 2 permette di stabilizzare il DNA aperto Durante la transizione da complesso chiuso a complesso aperto, la RNA polimerasi subisce dei cambiamenti strutturali: 1. Le pinze beta e beta’ vanno a chiudersi a valle del sito di inizio della trascrizione, come se andassero a tenere fermo il DNA, su cui la RNA pol si è legata 2. La regione amminoterminale del fattore sigma si sposta dal solco attivo centrale ad una posizione più esterna consentendo libero accesso al filamento stampo nel sito attivo e dare l’avvio alla sintesi dell’RNA. INIZIO ABORTIVO Dal passaggio da complesso chiuso a complesso aperto vi è l’inizio abortivo, ovvero l’RNA pol è collocata sul promotore e tenta di iniziare la sintesi dell’RNA. Il promotore è indicato in viola con il sito di inizio della trascrizione. Nell’immagine si vede l’RNA pol, che rimanendo ferma sul promotore cerca di andare a sintetizzare l’RNA. L’inizio viene detto abortivo perché fintanto che la polimerasi non riesce a sintetizzare un filamento di RNA lungo almeno 10 nucleotidi, non abbandona il promotore e la trascrizione non prosegue. Questo piccolo trascritto di RNA che non ha 10 nucleotidi (in verde nell’immagine) viene rilasciato e RNA pol riprova a fare questo ciclo, fino a quando non si arriva ad avere un trascritto di RNA con almeno 10 nucleotidi, che crea un ibrido stabile con il DNA stampo e in questo modo si può andare a disimpegnare il promotore, per cui RNA pol abbandona il promotore e inizia a muoversi sul DNA, entrando nella fase di allungamento. Il disimpegno del promotore è accompagnato dal fatto che vi è il rilascio del fattore sigma dal complesso con RNA pol. Quando il fattore sigma viene rilasciato, l’RNA pol rimane però legata al DNA, basta che non sia però la regione del promotore. MECCANISMO DI INIZIO DELLA TRASCRIZIONE Come si muove il sito attivo dell’enzima lungo lo stampo del DNA nei primi cicli abortivi della trascrizione? La RNA pol rimane durante la fase di inizio trascrizione ferma sul promotore, ciò nonostante riesce a sintetizzare un RNA di massimo 10 nucleotidi che le consente di abbandonare il promotore ed iniziare la fase di allungamento. Sono stati proposti 3 modelli per spiegare tale fenomeno ma il modello più accreditato dal punto di vista sperimentale è quello sotto riportato, detto modello di accartocciamento o scrunching. Dall'immagine si nota che si è già in un complesso aperto, dove si è creata una bolla di trascrizione che viene a coinvolgere la regione -10, oltre ovviamente il sito di inizio della trascrizione. In questo processo, l’RNA pol rimane ferma, legata al promotore e richiama al suo interno un tratto di DNA, lo trae quindi all’interno. Il DNA, una volta tratto all’interno, si va ad organizzare sotto forma di protuberanza. L’RNA pol poi provvede a sintetizzare questo primo tratto. Questo processo viene detto di accartocciamento, perché è come se la RNA pol fosse una mano che trascina il DNA all’interno di sé e il DNA a singolo filamento, nella bolla, si accartoccia a formare una protuberanza. L’ RNA pol inizia a sintetizzare il filamento sulla base delle sequenze disponibili e nel momento in cui RNA pol raggiunge la lunghezza limite di max 10 pb, si è pronti ad entrare nella fase di allungamento, abbandonando il promotore. Quando viene prodotta una molecola di RNA più lunga di 10 nucleotidi, il fattore sigma, che nella fase iniziale è ancora legato alla RNA pol, viene espulso, o meglio una sua componente, il linker ¾, che è posizionato solitamente nel canale di uscita della RNA. Quindi il passaggio dall’inizio abortivo alla fase di allungamento prevede l’espulsione del linker. L’espulsione consente di liberare il canale di uscita dell’RNA, che viene via via sintetizzato e l'espulsione di questo linker sembra che sia responsabile di un’associazione più debole del fattore sigma con RNA polimerasi, che infatti durante la fase di allungamento viene allontanato ed esce dal complesso con RNA pol. ALLUNGAMENTO Durante l’allungamento RNA pol non avendo più il fattore sigma, ha lasciato il promotore e scorre lungo il filamento e l’allungamento del RNA procede per tutto il DNA stampo, fino alla fine. Durante questa fase l’RNA pol aggiunge un nucleotide alla volta al trascritto di RNA neosintetizzato, usando uno dei due filamenti di DNA come stampo. Come già detto, la bolla di trascrizione viene mantenuta costante nelle sue dimensioni. Consideriamo che una bolla ha una dimensione di 12-14 pb o nucleotidi, come lunghezza, mentre l’ibrido che si sta creando tra il DNA stampo e RNA neosintetizzato è intorno agli 8-9 nucleotidi. Durante tutto il processo di allungamento, la dimensione della bolla rimane costante, perché per ogni coppia di basi che viene dissociata davanti all’enzima, si riforma un appaiamento dietro all’enzima stesso. La freccia rossa rappresenta una posizione fissa all’interno della polimerasi, che è sempre la stessa in tutte le parti della figura. È un punto di riferimento per far capire il movimento della RNA polimerasi e della bolla stessa; indica una posizione prestabilita all’interno della polimerasi che è sempre la stessa per quanto riguarda le diverse figure. Aiuta a capire come si muove la bolla durante l’allungamento. A: si è nel punto di partenza, in cui si ha la bolla e l’RNA è appaiato creando un ibrido, con 9 pb. B: RNA pol trasloca in avanti di uno e come si vede, mentre trasloca si porta dietro la bolla di trascrizione e quando trasloca in avanti, si ha che una coppia di basi in avanti si dissocia e un’altra dietro all'enzima di viene ad appaiare. In questo modo la bolla rimane sempre di 12-14 pb. RNA traslocando ha una base dissociata che porta verso il canale di uscita, tant’è che l’ibrido tra DNA e RNA non è più di 9 ma di 8, questo perché si ha una nuova base sullo stampo che deve essere letta per aggiungere il nucleotide. C: Il +1 sta a indicare che in B il nucleotide non è stato ancora aggiunto sullo stampo mentre in C si sta aggiungendo. RNA pol è traslocata in avanti di 1. Ecco perché l’ibrido è tra 8-9, in base al momento in cui l’enzima trasloca di uno; questo processo viene ripetuto per l’intero stampo. L’ibrido tra DNA e RNA ha questa lunghezza di 8-9 nucleotidi e il resto del RNA è dissociato perché è espulso attraverso il canale di uscita. RNA pol batterica sintetizza RNA a una velocità di circa 50-90 nucleotidi al secondo. AUTOCORREZIONE DA PARTE DELLA RNA POLIMERASI Durante la fase di allungamento, RNA pol fa anche da autocorrezione. Ha una funzione di correttore di bozze. Per farlo utilizza due tipologie, due meccanismi d’azione: 1. Autocorrezione cinetica o editing pirofosforolitico: nell’immagine si vede che l’ultima base aggiunta all’estremità 3’ OH del filamento non è corretta, perché la base del ribonucleotide non è complementare a quella dello stampo e quindi in questo meccanismo quello che succede è che RNA pol entra in stallo dopo aver incorporato questa base mal appaiata nella catena di RNA nascente. Entrando in stallo, attiva il suo sito attivo, svolgendo una reazione inversa che catalizza la rimozione del ribonucleotide. Il pirofosfato rilasciato durante l’aggiunta del ribonucleotide va a colpire il legame fosfodiesterico, rompendolo e in questo modo stacca la base errata e a quel punto RNA pol può riprendere la sintesi dell’RNA. 2. Autocorrezione nucleolitica o editing idrolitico: RNA pol, nel momento in cui si accorge dell’errore un po’ in ritardo e quindi dopo di questo sono inseriti degli appaiamenti corretti, torna indietro fino alla base errata e con la sua attività nucleasica va a rompere il legame fosfodiesterico a monte della base errata, utilizzando l’acqua e i nucleotidi (sia quello errato che quelli successivi) vengono eliminati. Viene proprio eliminata l’intera sequenza contenente la base errata; a questo punto l’RNA pol può ripartire e continuare la sua sintesi di RNA. RNA pol fa comunque 1 errore ogni 10^4/10^5 nucleotidi incorporati ed è meno accurata della DNA pol che fa un errore ogni 10^6 nucleotidi incorporati. Questo è anche ovvio perché di DNA ne abbiamo una sola di molecola, mentre di RNA ne facciamo tante copie. TERMINAZIONE DELLA TRASCRIZIONE Nei procarioti la trascrizione termina quando l’RNA pol arriva su delle sequenze specifiche del DNA, che si chiamano TERMINATORI. TERMINATORE = sequenza sul DNA che una volta trascritta da una RNA pol consente la fine della trascrizione con il rilascio dell’enzima dal DNA ed il rilascio dell’RNA neo-sintetizzato. Nei procarioti esistono due tipi di terminatori: 1. Terminatore RHO-indipendente, detto anche terminatore intrinseco: terminatore che non ha bisogno di questa proteina RHO. Quando RNA pol incontra il terminatore, l’RNA trascritto corrispondente ha la struttura mostrata dalla figura. Se si osserva tale struttura si osserva che questo terminatore presenta due sequenze ripetute e invertite, seguite da una sequenza poliA e poliT. Quando il terminatore viene trascritto si forma una struttura a “stem loop”, ovvero a forcina, dove il trascritto che deriva dalle sequenze ripetute e invertite crea la struttura a forcina che termina, grazie al tratto poliA e poliT, con una coda poliU. RNA che termina con questa regione induce il termine della trascrizione. Come fa l’RNA che termina con questa regione a indurre il termine della trascrizione? (DNA in grigio e RNA in verde) Quando l’RNA pol trascrive il terminatore si forma la struttura a forcina, che rende l’RNA instabile. RNA è tenuta insieme nell’ultimo tratto dal poliU. Il tratto poliAU è un tratto che, rispetto a un tratto GC, è instabile, in quanto ha due legami a idrogeno per ogni coppia AU e quindi è ovvio che se già il terminatore, ovvero la struttura a forcina, rende instabile l’RNA ed è solo tenuto insieme dal tratto poliU, questo aiuta/assicura la dissociazione dell’RNA dallo stampo. (Ancora non è chiarissimo come avviene il distacco, ma le interazioni deboli che ci sono tra il trascritto e lo stampo sembrano favorire il distacco in virtù del fatto che il tratto poliU è preceduto dalla struttura a forcina) 2. Terminatore RHO-dipendente: In rosso vi è il prodotto trascritto. Questo terminatore ha una prima regione, che viene chiamata sequenza RUT, che è una sequenza che una volta trascritta produce sull’RNA una sequenza molto ricca in C. La sequenza RUT può essere seguita, con una distanza più o meno grande, da due brevi sequenze ripetute e invertite, le quali a loro volta daranno sull'RNA una struttura a stem loop, più piccola rispetto a quella vista nell’altro terminatore, che si viene a creare nella parte 3’, quindi nella parte terminale dell’RNA trascritto. I terminatori prevedono il reclutamento di un fattore che riconosce la sequenza RUT e questo fattore è RHO. Nell’immagine vediamo la sequenza CCGCC, che indica che RNA pol ha trascritto la sequenza RUT, che viene riconosciuta dall’esamero RHO (in viola nell’immagine), che non è altro che una elicasi esamerica con attività ATPasica (ricorda molto la DNA elicasi). Come motore molecolare riconosce la sequenza e grazie alla sua attività ATPasica comincia a scorrere lungo l’RNA seguendo il movimento della polimerasi. Nel frattempo, quando la polimerasi sintetizza le sequenze al termine del terminatore, ovvero le sequenze brevi ripetute e invertite, l’RNA assume la struttura a forcina (nell’immagine non si vede) e assumendo tale struttura, l’RNA pol rallenta, in quanto la struttura a forcina destabilizza sia l’RNA che la stessa RNA polimerasi, entrando in stallo. Rallentando, viene raggiunta da RHO che ne provoca il distacco. L’attività elicasica di RHO dissocia alla fine l’ibrido DNA-RNA, portando a termine la trascrizione. REGOLAZIONE DELLA TRASCRIZIONE NEI PROCARIOTI La trascrizione viene finemente regolata. Partiamo con un esempio di procarioti. Le cellule procariotiche sono sensibili a segnali che si trovano all’esterno della cellula, quindi, ad esempio molecole presenti nel terreno di coltura entrano poi all’interno della cellula e vengono ad avere una funzione regolatrice della trascrizione in senso positivo oppure negativo. In particolare, le proteine che regolano la trascrizione in senso positivo vengono chiamate ATTIVATORI ed esplicano quindi una regolazione positiva ovvero vengono ad attivare, incrementare la trascrizione del gene bersaglio. Invece, le proteine regolatrici di tipo negativo hanno la funzione di regolare la trascrizione in senso negativo e in tal caso questo tipo di proteine si chiamano REPRESSORI e la loro azione consiste nell’andare a regolare in senso negativo la trascrizione e quindi ad inibirla. Entrambe le proteine, sia i repressori che gli attivatori trascrizionali, agiscono a livello della fase iniziale della trascrizione; vedremo in altri processi, non solo la trascrizione ma anche la traduzione, che le fasi di questi processi che vengono regolate sono proprio quelle iniziali. In genere, come si vede nell’immagine, abbiamo il DNA, in viola il promotore che viene riconosciuta dalla RNApol. In assenza di attivatori o repressori trascrizionali l’RNApol si lega al DNA promotore in maniera debole e l’espressione quindi dei geni controllati da questo promotore è un’espressione basale, si dice un LIVELLO DI ESPRESSIONE COSTITUTIVA BASALE. Quindi, quando non ho attivatori o repressori l’RNApol si lega comunque al promotore ma in maniera debole stimolando quindi un livello di trascrizione basale costitutivo dei geni bersaglio. Questa trascrizione poi può essere completamente inibita dal repressore à il repressore, come detto prima, è una proteina che in particolare inibisce la trascrizione perché si lega al promotore, in particolare si lega ad una regione chiamata operatore che è una sequenza sul DNA specifica, e questo operatore può essere sovrapposto, ovvero inglobato all’interno del promotore (come nell’immagine) oppure adiacente al promotore a cui si lega l’RNApol. Quando quindi il repressore vi si lega, impedisce l’accesso dell’RNApol al promotore stesso e l’effetto è un’assenza di trascrizione. Nel caso invece dell’attivatore, ha due domini di legame, 2 perché un dominio interagisce con l’RNApol legata al promotore e l’altro dominio lega il DNA in una sequenza sul DNA che è adiacente al promotore ma non coincide con esso, in questo modo si crea quello che viene chiamato un LEGAME COOPERATIVO della proteina sul DNA e grazie a questo legame cooperativo si ha che l’attivatore stimola il passaggio da complesso chiuso a complesso aperto che come sappiamo è una dei primi passaggi della fase d’inizio della trascrizione (si ricorda infatti che l’RNApol si lega all’inizio al promotore ma non promuove subito una denaturazione locale a livello del DNA ma si lega senza promuovere questa denaturazione, si parla quindi di complesso chiuso e solo in un secondo momento si passa al complesso aperto dove il DNA viene denaturato, l’attivatore favorisce questo passaggio). Nel genoma dei procarioti, poi, i geni sono soprattutto organizzati in operoni. Cos’è un operone? È un insieme di geni che vengono regolati in modo strettamente coordinato à un operone è formato da promotore, operatore e i geni chiamati geni strutturali. Quest’ultimi, tutti vicini l’uno all’altro, vengono trascritti insieme in un'unica molecola di mRNA (in rosso nell’immagine), da cui derivano una serie di proteine. Questa singola molecola di mRNA che deriva dalla trascrizione di più geni strutturali adiacenti viene chiamato anche mRNA policistronico. Gli operoni hanno un numero variabile di geni che possono essere da uno a più di 12 e sono una caratteristica specifica dei procarioti. In realtà anche negli eucarioti ci sono delle eccezioni che riguardano ad esempio i nematodi che hanno alcuni geni organizzati in operoni come nei procarioti o anche in mRNA virali che sono policistronici, in generale però è una prerogativa dei procarioti, questo perché i geni negli eucarioti non sono organizzati in operoni ma vengono trascritti singolarmente, quindi da ogni gene deriva un mRNA singolo e si parla di mRNA monocistronico. Com’è strutturato l’operone? Contiene i geni strutturali che sono tutti adiacenti, i quali vengono tradotti in una singola molecola di mRNA che poi verrà tradotta dando le diverse proteine corrispondenti a ciascun gene strutturale. Queste proteine vengono ad essere funzionalmente correlate, perché sono proteine che sono coinvolte nella stessa via metabolica. I geni strutturali sono sotto controllo di un promotore (in verde nell’immagine e indicato con la (P)), il quale contiene l’operatore (indicato nell’immagine con la O), sequenza che lega il repressore. Il repressore, a sua volta, viene ad essere trascritto da un gene regolatore che quindi codifica per la proteina regolatrice, gene che non fa parte però dell’operone, infatti, si può trovare anche in punto lontano del genoma lontano dall’operone stesso. Il repressore a sua volta può essere attivato o inibito ad opera di metaboliti che si trovano nel terreno di coltura o che vengono metabolizzati dalle cellule in risposta a dei segnali extracellulari (il concetto per l’attivatore è lo stesso). Quindi, l’operone è formato dal promotore con il sito di legame per il repressore (operatore) e i geni strutturali. Esempio di regolazione dell’inizio della trascrizione nei procarioti: Geni coinvolti nel metabolismo del lattosio in E. coli (operone Lac) à operone inducibile a controllo negativo e positivo. Ricalca la struttura descritta in precedenza. Contiene quindi una serie di geni strutturali, nello specifico 3: ● lacZ à gene strutturale che codifica per la β-galattosidasi ● lacYà gene strutturale che codifica per la permeasi del lattosio ● lacA à gene strutturale che codifica per la tiogalattoside transacetilasi Inoltre, questi geni strutturali sono sotto il controllo del promotore che contiene parzialmente sovrapposta la sequenza dell’operatore. Adiacente al promotore abbiamo il sito del legame dell’attivatore che in E. coli viene chiamato CAP (proteina attivatore catabolita) o CRP (proteina recettore del cAMP) Ruolo dei 3 enzimi nella via metabolica del lattosio Il lattosio, come ricordiamo, viene acquisito dalle cellule batteriche come fonte energetica in assenza di glucosio, la fonte primaria di energia è il glucosio e la seconda fonte è il lattosio quando il glucosio è assente. Nell’immagine viene riportata la cellula con la membrana plasmatica, lo spazio extracellulare e il citoplasma. Il lattosio entra all’interno della cellula grazie ad una permeasi, una proteina di membrana che si chiama per l’appunto permeasi del galattoside o permeasi del lattosio, che è codificata da lacY. Il lattosio è un disaccaride e una volta entrato nella cellula viene scisso in glucosio e galattosio dalla β-galattosidasi (prodotta dal gene lacZ), la quale oltre a idrolizzare il lattosio (reazione principale), può isomerizzare il lattosio ad allolattosio. Per ultimo la tiogalattoside transacetilasi è un enzima che ha la funzione di trasferire gruppi acetilici ai β-galattosidi. Come viene repressa la trascrizione di questo operone? Controllo negativo dell’operone LAC Ricordiamo, questo operone LAC viene attivato in presenza di lattosio e in assenza di glucosio. Quando invece ho glucosio, quindi, la cellula ha già la sua fonte energetica primaria e questa via deve essere repressa perché non ha senso che la cellula produca enzimi coinvolti nel metabolismo del lattosio quando ha già la possibilità di ricavare energia dalla sua fonte primaria. Quindi, quando sono in assenza di lattosio e in presenza di glucosio, ho l’operone con lacZ, lacY e lacA e i siti di controllo con il promotore e l’operatore e il repressore (indicato in arancio nell’immagine) e succede che il gene regolatore che si chiama lacI viene trascritto per produrre il repressore Lac, il quale andrà a legarsi sull’operatore bloccando la trascrizione dei geni strutturali e quindi inibendo la trascrizione dell’operone LAC. Come dicevamo, infatti, il repressore viene trascritto da geni che si trovano lontano dall’operone stesso e che appunto indotti dall’assenza di lattosio e in contemporanea presenza di glucosio vengono ad essere trascritti producendo il repressore LAC. Quando, invece, ho il lattosio e quindi sono in contemporanea in assenza di glucosio, questa via deve essere attivata e per essere attivata occorre che il repressore LAC sia inibito. Quindi interviene un induttore che si chiama allolattosio, il quale viene a legarsi al repressore modificandolo in maniera conformazionale e in questo modo gli impedisce di legare la sua sequenza bersaglio sul DNA. In questo modo, quindi, il repressore ha una conformazione differente che gli impedisce in questo stato di legarsi all’operatore e l’RNApol ha libero accesso al promotore e la trascrizione avviene senza nessun problema. Ma come è possibile che l’allolattosio riesca ad avere questa funzione se la conversione del lattosio in allolattosio è catalizzata dalla β-galattosidasi che a sua volta è codificata dal gene lacZ dell’operone LAC? Ricordiamo che l’RNApol riesce in maniera anche se debole a legarsi al promotore producendo un livello basale di trascrizione, quindi anche quando i geni lac sono repressi, ogni tanto viene sintetizzato un trascritto poiché l’RNApol riesce a legarsi al promotore al posto del repressore Lac, perciò anche in assenza di lattosio, vi sono bassi livelli di β-galattosidasi utili per catalizzare la conversione del lattosio in allolattosio. Com’è costituito il repressore LAC? In figura si può vedere in rosso e arancione il repressore lac, il quale lega il suo sito di legame sul DNA (arancione e viola nell’immagine) attraverso un dimero, in rosso un monomero e in arancio l’altro e ciascun monomero consta di un dominio Nterminale che serve per legare il DNA, un dominio centrale che ha la funzione di regolazione perché contiene il sito di legame dell’induttore (allolattosio) e poi un dominio C-terminale che serve per la oligomerizzazione. I domini N-terminali (rappresentano una sorta di teste) legano il DNA ciascuna in sequenze (in alto nell’immagine) che rappresentano le sequenze dell’operatore lac che vengono riconosciute dal repressore lac. Questa sequenza è costituita da 2 sequenze palindromiche (ripetute e invertite) e ogni sequenza viene chiamata emisito. Ogni emisito viene riconosciuto da una delle 2 teste del repressore lac. Inoltre, l’interazione di questi domini N-terminali con il DNA avviene mediante un motivo elicagiro-elica. Quindi questo dominio N-terminale è costituito da 2 α eliche, dove una si posiziona sul solco maggiore per legarsi al DNA e viene chiamata elica R o elica di riconoscimento e l’altra si posiziona più verso l’esterno per interagire con lo scheletro zucchero fosfato del DNA stesso e stabilizzando in questo modo l’interazione. Quando non c’è l’allolattosio il repressore si lega al DNA utilizzando queste teste Nterminali una per ogni emisito, quando però il nostro repressore lega l’allolattosio (in verde nell’immagine) subisce un cambiamento conformazionale (riportato nell’immagine di destra) e le due teste si vengono ad allontanare impedendo l’interazione con l’operatore, in particolare in questo modo il repressore non è più in grado di rimanere legato al suo sito operatore e quindi libera il promotore rendendolo accessibile al legame con l’RNApol. Come abbiamo visto il repressore lac viene ad interagire quindi con 2 monomeri sul DNA, in realtà però il repressore lac si lega come tetramero e non come dimero, infatti come possiamo vedere nell’immagine abbiamo rappresentato il repressore lac in cui abbiamo un monomero in arancio e uno in rosso legato per l’appunto ad un operatore che viene chiamato O1 (operatore principale) e associato a formare un tetramero abbiamo l’altro monomero in arancione e l’altro in rosso che lega un altro operatore. Vediamo però che ogni operatore è a contatto con soli 2 monomeri del tetramero, quindi, ogni operatore viene ad interagire con l’estremità N-terminale di due monomeri alla volta. Questo significa che abbiamo più operatori riconosciuti dal repressore lac, ovvero c’è un operatore principale che è chiamato O1 e gli altri invece a cui quindi interagiscono due delle 4 subunità disponibili, ovvero gli altri due monomeri del tetramero vanno a legare uno degli altri due operatori disponibili che sono O2 ed O3, questi ultimi vengono chiamati operatori ausiliari che si trovano rispettivamente a 410 paia di basi a valle rispetto a O1 o nel secondo caso a 83 paia di basi a monte dell’O1. Quindi, riassumendo, in viola abbiamo i siti degli operatori, l’operatore lac principale riconosciuto dal repressore lac è O1 ed è quello che si sovrappone parzialmente al promotore lac, l’operatore interagisce con le teste di 2 monomeri ma il repressore lac non si lega come dimero ma come tetramero infatti gli altri due monomeri interagiscono con le loro teste sempre con la modalità identica con gli altri due possibili operatori ausiliari che sono O2 e O3 i quali si trovano più distanti, infatti come si vede nell’immagine il DNA si piega per aiutare l’interazione formando un’ansa. Come viene attivata la trascrizione di questo operone? Controllo positivo dell’operone Lac L’operone inducibile Lac è anche sotto il controllo positivo ad opera di un attivatore che si chiama CAP (proteina regolatrice), acronimo di attivatrice dei geni catabolici. L’attivatore CAP viene chiamato anche CRP che sta per recettrice del cAMP. Il controllo perciò positivo viene realizzato da questo attivatore CAP o CRP. Nell’immagine si vede il ruolo dell’attivatore CAP che quindi svolge un controllo positivo sull’operone inducibile Lac. In alto si trova l’operone con i 3 geni strutturali, il promotore che contiene in parte anche l’operatore e accanto al promotore il sito che viene riconosciuto dall’attivatore CAP. Come per il repressore lac visto precedentemente anche l’attivatore CAP viene trascritto da un gene che si trova anche parecchio lontano rispetto all’operone lac. Quindi da questo gene CAP lontano rispetto all’operone lac si ottiene l’mRNA (in rosso nella figura) che viene poi tradotto nell’attivatore CAP (in verde nella figura). Quando ci troviamo in una situazione in cui abbiamo la presenza di glucosio nel terreno di coltura dei nostri batteri ovviamente la via del lattosio non è necessario attivarla e quindi l’operone lac deve essere inattivato. Infatti, in presenza di glucosio, l’attivatore CAP che viene prodotto, da solo non è in grado di riconoscere il sito che si trova a monte del promotore dell’operone lac e di conseguenza la sua azione di attivatore non viene esplicata. Quindi CAP da solo non riesce ad attivare l’operone lac. In assenza di glucosio e in presenza di lattosio è necessario che l’attivatore lac venga attivato e perciò viene prodotta come molecola segnale la cAMP che funge da induttore e segnala proprio l’assenza di glucosio (pallina in rosso nella figura) e si lega alla proteina CAP la quale cambia la sua conformazione attivandosi e legandosi al sito adiacente al promotore promuovendo la trascrizione dell’operone lac. Abbiamo visto che gli attivatori funzionano legando il DNA ad un sito adiacente al promotore e in più interagiscono con l’RNApol favorendo il passaggio chiave della trascrizione passando da complesso chiuso a complesso aperto. Perciò l’attivatore CAP per essere funzionale e attivo deve legare la cAMP. Ricordiamo che l’AMP ciclico viene ad essere prodotto da un enzima che è l’adenilato ciclasi che converte l’ATP in cAMP ovvero adenosina monofosfato 3’ 5’ ciclico. Questo avviene nel momento in cui abbiamo dei livelli cellulari di glucosio molto bassi, i quali attivano l’enzima adenilato ciclasi andando ad aumentare i livelli di cAMP. Livelli alti di quest’ultimo quindi vanno a segnalare che abbiamo bassi livelli di glucosio e che quindi occorre attivare una via alternativa che permetta di attivare la produzione di glucosio per scissione del lattosio. In questo caso l’AMP ciclico funziona non solo come segnalatore (segnala bassi livelli di glucosio) ma funziona anche come induttore perché interagisce con l’attivatore specifico dell’operone lac, ovvero CAP che si lega sul DNA e interagisce con l’RNApol. Nell’immagine a lato si può vedere la struttura del complesso tra l’attivatore CAP, l’RNApol e il DNA. I due nastri che osserviamo in grigio e in rosa rappresentano la doppia elica di DNA che interagisce con CAP in azzurro associato all’induttore AMP ciclico (molecole all’interno in figura). Inoltre, in viola troviamo l’RNApol e in particolare troviamo la porzione αCTD (dominio carbossi- terminale della subunità α della polimerasi) della nostra RNApol che interagisce con CAP che funge da ponte, in quanto presenta 2 domini, uno che interagisce con l’RNApol e l’altro per interagire con il DNA. Anche in questo caso, la proteina che interagisce con il DNA lo fa sempre con il motivo elica – giro – elica. Come abbiamo già detto, quindi, quando CAP interagisce con l’AMP ciclico subisce un cambiamento conformazionale tale da assicurargli la configurazione ottimale per legare il DNA ed inoltre interagisce con l’RNApol attraverso un legame che viene chiamato legame cooperativo perché stabilizza l’RNApol e favorisce il passaggio da complesso chiuso a complesso aperto. Questi diversi attori, ovvero il repressore lac, l’attivatore CAP e l’RNApol vengono tutti a lavorare all’interno del promotore, quindi una regione molto ridotta come dimensioni (circa un centinaio di paia di basi). Nell’immagine riportata sotto, vediamo i diversi siti di questi attori. Abbiamo il +1 (sito d’inizio della trascrizione), in rosso è indicata la regione del DNA che viene riconosciuta dal repressore lac (regione che si sovrappone parzialmente al promotore); inoltre possiamo osservare a 35 e a -10 le sequenze consenso conservate tipiche dei promotori procariotici. Infine, a monte del promotore, all’inizio dell’operone troviamo il sito di legame di CAP. Quindi, riassumendo, l’attivazione della trascrizione dell’operone lac richiede 2 elementi fondamentali: 1. La presenza del lattosio (o meglio del suo metabolita allolattosio che lega il repressore Lac impedendogli il legame all’operatore) 2. L’assenza di glucosio (fonte di energia preferita) nel mezzo di coltura (tale assenza determina alti livelli dell’induttore cAMP che lega l’attivatore CAP attivandolo così da legare il suo sito di legame sul DNA e l’RNApol) Viceversa, l’inibizione della trascrizione dell’operone lac richiede: 1. L’assenza di lattosio e perciò l’assenza dell’induttore allolattosio permette al repressore lac di legare l’operatore 2. La presenza di glucosio che determina i bassi livelli dell’induttore cAMP, lasciando solo l’attivatore CAP che non lega così il suo sito di legame sul DNA né l’RNApol Inoltre, ricordiamo che il controllo negativo dell’operone Lac consiste nell’inibizione della trascrizione dei geni Lac ad opera del repressore Lac, ma lo stesso repressore Lac subisce una regolazione negativa attraverso l’induttore allolattosio che lo inibisce. Invece, il controllo positivo dell’operone Lac consiste nell’attivazione della trascrizione dei geni Lac ad opera dell’attivatore CAP, ma lo stesso attivatore CAP subisce una regolazione positiva attraverso l’induttore cAMP che lo attiva. Secondo esempio di regolazione dell’inizio della trascrizione nei procarioti: Geni coinvolti nella sintesi del triptofano (operone Trp = operone reprimibile a controllo negativo) Innanzitutto, l’operone Trp è costituito da una serie di geni continui che codificano per una serie di enzimi coinvolti nella sintesi dell’amminoacido triptofano. Come avviene per tutti gli operoni che sono coinvolti nella produzione di enzimi deputati alla via metabolica di sintesi degli amminoacidi, come l’operone trp, anche in questo caso gli operoni sono reprimibili, cioè l’espressione di questi geni viene repressa nel momento in cui nel terreno di coltura è presente l’amminoacido corrispondente, ovvero in questo caso l’aa triptofano. L’operone a triptofano è soggetto a 2 tipi di regolazione: 1. Agisce a livello dell’inizio della trascrizione che riguarda il controllo negativo 2. Agisce nella fase di terminazione della trascrizione (meccanismo diverso da quello che abbiamo visto fino ad ora perché per adesso abbiamo parlato solo di meccanismi che avvengono all’inizio della trascrizione) Vediamo nell’immagine a lato, la struttura dell’operone trp. I geni strutturali sono ben 5: trpE, trpD, trpC, trpB e trpA, ciascuno di questi geni codifica per un enzima diverso coinvolto nella sintesi del triptofano (quindi abbiamo delle sintetasi, delle fosfosintetasi, delle trasferasi, ...). A monte di questi geni strutturali troviamo un ulteriore sequenza che si chiama sequenza leader, la quale ha un ruolo fondamentale nel secondo meccanismo di regolazione. ON sta indicare il nostro sito d’inizio della trascrizione e il fatto che stia avvenendo la trascrizione stessa in questo caso e a monte abbiamo il promotore (in viola nell’immagine) sovrapposto in parte dall’operatore (in arancio nella figura) riconosciuto dal repressore del trp. Nel primo meccanismo succede che la regolazione di questo operone è di tipo negativo e quindi come tale si realizza tramite un repressore, indicato nell’immagine con 2 subunità e si chiama repressore trp. Quindi praticamente questo repressore trp viene ad essere inattivo quando è da solo e in assenza di trp e di conseguenza l’operone trp viene trascritto. Quando invece nella cellula abbiamo la presenza di trp, in rosso nell’immagine, si lega al repressore trp inducendo un cambiamento conformazionale e portandolo a legare l’operatore inibendo in questo modo la trascrizione (OFF). Quindi il triptofano stesso funge da co-repressore. ATTENUAZIONE DELLA TRASCRIZIONE DELL’OPERONE TRP (II meccanismo) Abbiamo visto come la maggior parte dei meccanismi di controllo di trascrizione nei procarioti avvenga nella fase iniziale ma è possibile avere un altro tipo di meccanismo che agisce alla fine della trascrizione, l’operone trp ci fornisce l’opportunità di descrivere questo secondo meccanismo che si chiama ATTENUAZIONE, in realtà questo meccanismo non è specifico solo per l’operone trp ma si riscontra anche in altri operoni che producono altri aa, quindi è frequente per operoni che hanno geni strutturali che codificano gli enzimi per una specifica via metabolica di sintesi per un aa specifico. Questo meccanismo interrompe la sintesi prematura del nostro mRNA policistronico in risposta alla presenza di trp intracellulare, questo perché anche se a bassi livelli è presente del triptofano e quindi non è necessario sintetizzarne dell’altro. Per spiegare questo meccanismo occorre conoscere la sequenza leader, che nell’immagine più avanti è in forma di mRNA, infatti abbiamo visto precedentemente che l’operone trp a monte dei geni strutturali ha un altro gene trpL o sequenza leader. Questa consta di 161 nt e contiene una breve sequenza codificante di aa (detta ORF) che contiene tra l’altro 2 codoni che codificano per il trp (in totale presenta 13 codoni), inoltre contiene 4 sequenze indicate come 1, 2, 3, 4 che comprendono parzialmente ORF stessa. Queste sequenze (1, 2, 3, e 4) sono in grado di creare degli appaiamenti intramolecolari consentendo all’mRNA di assumere quella classica struttura a forcina. In particolare, la regione 3 viene ad appaiarsi con la 2 o con la 4. Quando si appaia con la 2 crea una struttura a forcina che non dà effetti alla trascrizione, quindi non interrompe la trascrizione. Mentre quando si appaia con la 4 crea una struttura a forcina che viene a bloccare la trascrizione, questo perché dopo il 4 abbiamo un tratto poli-U (abbiamo visto infatti in precedenza che nei procarioti la trascrizione può essere terminata ad opera di terminatori chiamati ϱ-indipendenti, che hanno proprio la tipica struttura a forcina seguita da una sequenza di 7 U). In base alla struttura che assume la sequenza leader una volta che è stata tradotta in mRNA, io posso avere la creazione di una struttura a forcina che funziona da terminatore e che quindi va a bloccare la trascrizione dei geni strutturali in maniera prematura, impedendo che la trascrizione dell’intero operone venga conclusa. Vediamo questo in funzione della concentrazione del trp: Se il trp all’interno della cellula è presente anche se non a livelli eccessivi ma comunque sufficiente per le attività metaboliche cellulari e quindi per consentire anche di avere i nostri tRNA carichi del trp, succede che il nostro mRNA della sequenza leader (nei procarioti l’mRNA viene subito tradotto) viene riconosciuta dai ribosomi che si occupano della traduzione di questo mRNA, tramite il tRNA carico dell’aa specifico, riconoscono il codone, se quest’ultimo presenta trp i ribosomi legano la breve sequenza codificante e iniziano a tradurre producendo il peptide che è composto da 13 aa (palline in rosso nella figura). Nel fare questo i ribosomi impediscono alla regione 3 di appaiarsi con la 2 mentre le consentono di far sì che la regione 3 si appai con la 4, in questo modo si crea un terminatore intrinseco, ottenendo così un mRNA corto chiamato mRNA attenuato e verrà degradato. Viceversa nel caso in cui le concentrazioni di trp siano molto basse, quindi insufficienti per le attività metaboliche, succede che quando il ribosoma arriva a tradurre ORF e arriva dove ci sono i codoni del trp accade che siamo in carenza di trp, quindi i tRNA carichi con l’aa specifico (trp) non ci sono e quindi i ribosomi entrano in una fase di stallo e questo consente alla regione 3 di appaiarsi con la regione 2 che non funziona da terminatore e l’RNA pol può continuare a trascrivere l’intero operone trp, comprendendo anche i geni strutturali. ATTENUAZIONE DELLA TRASCRIZIONE DELL’OPERONE Trp RICAPITOLANDO, è stato visto come la maggior parte dei meccanismi di controllo della trascrizione nei procarioti avvenga nella fase di inizio della trascrizione. Però è possibile avere un altro tipo di meccanismo di regolazione che agisce nella fase di terminazione. L’operone Trp offre l'opportunità di descrivere questo secondo meccanismo, che si chiama attenuazione. In realtà il meccanismo di attenuazione non è specifico solo per l’operone trp, perciò non regola solo questo operone, ma lo si incontra anche per altri operoni che codificano per enzimi coinvolti nella sintesi di altri aa, cioè è molto frequente per operoni che hanno geni strutturali dai quali vengono codificati gli enzimi coinvolti in una specifica via metabolica di sintesi di un aa specifico. Il fenomeno dell'attenuazione va a interrompere la sintesi prematura dell’mRNA policistronico dell’operone Trp in risposta alla presenza di triptofano intracellulare. In presenza di triptofano a livello intracellulare a bassi livelli ma sufficienti per le attività metaboliche cellulari, viene bloccata prematuramente la sintesi dell’mRNA e quindi l’espressione di tutti gli enzimi coinvolti nella sintesi di triptofano, perché all’interno della cellula è già presente triptofano e quindi non c’è bisogno di sintetizzarne dell’altro. Per spiegare questo fenomeno occorre spiegare la sequenza leader o trpl, che è presente in forma di mRNA e si trova a monte dei geni strutturali dell’operone trp. La sequenza leader consta di 161 nucleotidi e contiene una breve sequenza codificante di aa, dove sono presenti due codoni adiacenti che codificano per il triptofano. La sequenza leader contiene 4 regioni, che comprendono parzialmente l’ORF, infatti, i codoni adiacenti si trovano nella regione 1. Le sequenze/regioni 1, 2, 3, 4 sono in grado di creare degli appaiamenti intramolecolari, consentendo alla molecola di mRNA di assumere le strutture a forcine. La regione 3 può appaiarsi con la regione 2 e la regione 4: ● Quando si appaia con la regione 2, la struttura a forcina che creano non ha effetti sulla trascrizione ● Quando si appaia con la regione 4, la struttura a forcina blocca la trascrizione, perché dopo la regione 4 c’è una regione poliU. Si ricordi che nei procarioti la trascrizione può essere terminata ad opera dei terminatori RHO-indipendenti, che hanno proprio la struttura a forcina seguita da una sequenza di sette U e queste strutture promuovono la terminazione della trascrizione stessa. Quando l’mRNA assume questa struttura, la trascrizione viene terminata, l’mRNA si dissocia dallo stampo di DNA e l’RNA pol viene rilasciata. Ricapitolando in base alla struttura che viene assunta dalla sequenza leader una volta che è stata trascritta a mRNA, si riesce ad avere la creazione di una struttura a forcina che funziona da terminatore che va a bloccare la trascrizione dei geni strutturali in maniera prematura, impedendo che la trascrizione dell’intero operone venga conclusa (questo se il triptofano è presente, a livelli non eccessivi ma comunque sufficienti per le attività metaboliche cellulari, per consentire ai tRNA di essere carichi di triptofano). L’mRNA (che nei procarioti una volta trascritto inizia ad essere subito tradotto), o meglio la sequenza leader, una volta trascritta viene subito riconosciuta dai ribosomi, i quali si occupano della traduzione dell’mRNA, che attraverso l’azione di tRNA carichi con l’aa specifico, riconoscono il codone sul mRNA e portano l’aa specifico. Se il trp c’è all’interno della cellula, questo può essere associato al tRNA corrispondente che riconosce i codoni adiacenti trp. Quello che accade è che in presenza di concentrazioni sufficienti di triptofano e quindi di corrispondenti tRNA carichi con l’aa corrispondente, i ribosomi legano l’ORF che comprende i due codoni adiacenti e iniziano a tradurre la sequenza, reclutando i tRNA carichi di triptofano che vanno a legare i codoni. I ribosomi scorrono quindi lungo la sequenza leader, traducendo il peptide, la breve ORF, che contiene i due codoni adiacenti, che in parte si sovrappone alla regione 1 e tale sequenza è costituita da 13 codoni, quindi, il peptide che si ottiene è un filamento di 13 aa tra cui due triptofani adiacenti. Quindi quello che avviene è che i ribosomi legano l’ORF producendo un piccolo peptide di 13 aa, che in futuro verrà comunque degradato. Nel fare questo i ribosomi impediscono alla regione 3 di appaiarsi con la 2, mentre le consentono di andarsi ad appaiare con la 4, andando a creare un terminatore intrinseco. L’effetto di questo appaiamento è che la trascrizione viene a terminare prematuramente, ottenendo un mRNA tronco, non completo, tant’è che i geni strutturali non sono stati trascritti e di conseguenza l’mRNA viene detto attenuato e di conseguenza degradato. I geni strutturali non vengono trascritti perché attraverso un blocco prematuro della trascrizione, l’mRNA non viene completamente trascritto in quanto l’RNA pol si blocca appena dopo la sequenza leader. Quello che si ottiene è una trascrizione prematura, con un mRNA tronco che verrà degradato, come il peptide leader corto di 13 aa. Nel caso inverso in cui le concentrazioni di triptofano sono molto basse, quindi insufficienti per le attività metaboliche cellulari, il ribosoma arriva a tradurre l’ORF dove ci sono i codoni adiacenti al triptofano, ma essendo in carenza di trp, i tRNA carichi con il triptofano non ci sono e quindi quando i ribosomi si trovano su i codoni adiacenti, entrano in stallo, proprio perché non si hanno i tRNA carichi con il triptofano; la traduzione è bloccata. Lo stallo consente alla regione 3 di appaiarsi con la regione 2, che non funziona da terminatore e quindi l’RNA pol può continuare a trascrivere completando la traduzione dell'intero operone trp, comprendendo anche i geni strutturali; questo permetterà di poter andare a tradurre l’intero operone. Attraverso questo meccanismo, si viene a creare una struttura a forcina in cui le regioni 2 e 3 non vengono ad essere un blocco per la trascrizione, ma anzi consentono di continuare la sintesi dell’intero mRNA. LA TRASCRIZIONE NEGLI EUCARIOTI La trascrizione negli eucarioti e procarioti presenta un processo identico, quindi, quello che è stato visto come fase di inizio, allungamento e termine è comune sia nei procarioti che negli eucarioti. Però negli eucarioti la situazione è più complessa. Nella tabella sono mostrate le differenze tra procarioti ed eucarioti: Come si vede nella tabella, bisogna fare una distinzione se si parla di trascrizione: ● in vitro, quindi che avviene usando come stampo un DNA senza istoni, quindi un DNA non organizzato nella cromatina. ● in vivo invece vi è un DNA organizzato in cromatina e che quindi prevede l’intervento di diversi attori. Nella tabella sono riportati i nomi delle 3 RNA polimerasi che agiscono nella trascrizione degli eucarioti, i loro prodotti, dove sono localizzati e quali sono gli elementi conservati di ciascun promotore riconosciuto per ogni specifica polimerasi: Il nucleolo oltre ad essere la struttura responsabile della sintesi degli RNA ribosomiali, è anche il luogo dove avviene l’assemblaggio delle diverse subunità dei ribosomi. La pol II è quella principale, la quale si occupa di sintetizzare gli mRNA, oltre ad altri come si legge nella tabella. PROMOTORI DELLA POL II IN EUCARIOTI SUPERIORI Con CORE o ELEMENTO CENTRALE DEL PROMOTORE si indica il tratto di DNA indispensabile che viene ad essere riconosciuto dai fattori di trascrizione, ed è fondamentale per far avviare la trascrizione stessa. Nell’immagine si trova il DNA e nei vari colori si hanno le sequenze. Nella parte in basso vi è la sequenza che è riportata come sequenza del filamento codificante della doppia elica e in alcune posizioni si ha la doppia base, che sta a indicare che in questa posizione si possono trovare entrambe, è indifferente. Ogni sequenza viene indicata con un nome specifico e nella parte in alto viene riportata la posizione rispetto al sito di inizio di trascrizione, che viene sempre indicato con il +1. Nella parte in alto, inoltre, vengono riportati i fattori di trascrizione che vanno a legare le sequenze. ● Come si può vedere il promotore contiene la sequenza Inr, che sta per iniziatore, da cui parte la trascrizione, infatti comprende il +1, che solitamente è una adenina. ● Un altro elemento molto importante è la sequenza a -26, che viene chiamata TATA BOX, che è catalizzata dalla sequenza conservata TATAAA. La sequenza conservata permette di essere riconosciuta da una proteina specifica, la TBP (“Tata Binding Protein”) che è una delle componenti delle subunità che costituiscono il fattore di trascrizione TFIID. ● Accanto al TATA BOX si ha frequentemente la sequenza BRE, che permette il legame di un altro fattore basale, che è il TFIIB. ● A valle del sito di inizio della trascrizione si trovano anche altri elementi, come il DPE, che è tipico in promotori che non hanno il TATA BOX e viene riconosciuta sempre da TFIID. ● Ci sono infatti dei promotori che vengono detti TATA LEX. Si ricordi che il 50% dei promotori hanno il TATA BOX. ● Gli elementi DCE possono essere presenti in più copie nei promotori che hanno il TATA BOX. ● Nei promotori sono presenti delle isole, ovvero delle regioni dinucleotidiche, GC, chiamate isole CPG, che stanno a indicare questi elementi dinucleotidici GC ripetuti. Più del 50% dei promotori umani contiene queste sequenze dinucleotidiche GC, che sono molto importanti perché, se metilate, vanno ad avere un ruolo fondamentale nella regolazione dell’espressione genica. ➢ Oltre a questo core, l’elemento centrale, che si sta parlando di una regione che va dai 40 ai 60 nucleotidi a monte e a valle del sito di inizio della trascrizione, il promotore contiene elementi che si trovano fino a 200 pb a monte del sito di inizio della trascrizione e in questo caso si parla di elementi prossimali. ➢ Si hanno anche elementi a lungo raggio o distali, che stanno molto distanti, anche 10.000 nucleotidi dal sito di inizio della trascrizione e che vengono riconosciuti da altre proteine che hanno la funzione di regolare la trascrizione stessa e di attivarla. Questi elementi distali o a lungo raggio, vengono anche detti Enhancer, in quanto potenziano la trascrizione, quindi la favoriscono. INIZIO DELLA TRASCRIZIONE DELLA RNA POL II IN VITRO (= non si ha l'organizzazione con la cromatina) In alto si può notare la TATA BOX, a -26, che viene ad essere riconosciuta dalla proteina TBP, che fa parte del TFIID, un fattore di trascrizione generale che consta di 12 subunità. Alla TBP sono associati i TAF (TBP associated factors, ovvero delle proteine che si associano alla TBP e che insieme costituiscono il fattore TFIID). TFIID, grazie alla subunità TBP, si associa alla TATA BOX; è il primo fattore di trascrizione generale che si lega al DNA e al promotore. Dopo di lui vengono reclutate altre due proteine, TFIIA (con 3 subunità) e TFIIB (una sola subunità). TFIIA ha la funzione di stabilizzare il legame tra TFIIB e TBP. TFIIB lega la proteina TBP, si associa al complesso e aiuta a reclutare la RNA pol. Il complesso TBP-DNA-TATA BOX TBP è una proteina molto importante perché lega il DNA, avendo una regione a beta-foglietto che le consente di riconoscere e legare il TATA BOX e in particolare interagire con il suo solco minore. Il TATA BOX ha delle sequenze TA, quindi l'appaiamento ha solo due legami H, facilmente separabili. Quando la proteina TBP si associa al TATA BOX, si inserisce nel solco minore, lo apre, sfruttando gli appaiamenti TA e porta a piegare il DNA di 180°, creando una sorta di superficie piana di piattaforma che sarà molto utile per reclutare tutti gli altri fattori di trascrizione generali. Il complesso TFIIB/TBP/TATA BOX Nello step successivo viene reclutato TFIIB, che interagisce sia con la TBP ma anche con la RNA pol, quindi, è importante perché rappresenta un ponte tra TBP, associata al TATA BOX e la RNA pol. Questo è importante perché in questo modo, grazie all'azione di TFIIB, l’RNA pol è posizionata correttamente sul sito di inizio della trascrizione. Il legame di TFIIB al complesso TBP-DNA è asimmetrico, perché si posiziona in uno dei due lati e questa asimmetria è importante per andare a determinare l'unidirezionalità della trascrizione (da ricordare che la trascrizione va solo in un senso specifico, da +1 in poi e questo è assicurato dal fatto che TFIIB, riconoscendo TBP, si leghi da un lato riuscendo a dare l’unidirezionalità in quanto recluta l’RNA pol consentendo di avere una trascrizione in una direzione specifica e posizionando correttamente RNA pol sul sito di inizio della trascrizione stessa). Riepilogando, la TATA BOX viene riconosciuta da TBP, che fa parte di TFIID, quindi, è il primo fattore che si lega al DNA. Successivamente arriva TFIIB che interagisce con TBP e aiuta il reclutamento della RNA pol. RNA pol II (in viola) non arriva sul DNA al promotore da sola ma con un aiutante che è TFIIF, che si associa al TFIIB e viene a far da ponte tra RNA pol e TFIIB e in questo modo la RNA pol è associata al promotore. A completare il “complesso del pre-inizio” vengono reclutate altre due proteine, TFIIE e TFIIH. TFIIE è sempre un aiutante di TFIIH nel complesso di preinizio, mentre TFIIH è un’altra proteina importante perché ha un’attività elicasica. In particolare, TFIIH grazie a questa attività consente di aprire il DNA creando la bolla di trascrizione e quindi promuovere l’apertura del promotore, ovvero promuovere il passaggio da complesso chiuso a complesso aperto. Riepilogando, RNA pol accompagnata da TFIIF, si associa agli altri fattori di trascrizione, si posiziona a livello del promotore e viene ad essere reclutata, completando il complesso di preinizio; si ha poi TFIIH che è associata a TFIIE, la quale aiuta il reclutamento di TFIIH in questo complesso. TFIIH ha anche un’altra funzione importante oltre all’attività elicasica ATP-dipendente, ovvero va a modificare quella che viene chiamata coda CTD; questa coda è una prerogativa specifica della RNA pol II eucariotica e non è da confondere con l’alfa CTD (carbossi terminal domain) della RNA pol procariotica. L’alfa CTD era l’estremità carbossi terminale della subunità alfa della RNA pol procariotica. Qui la coda è sempre una estremità carbossi terminale ed è una lunga coda costituita da un eptapeptide ripetuto tante volte. Le ripetizioni cambiano in base all'organismo, infatti nel lievito le ripetizioni sono pari a 27 volte, mentre nell’uomo 52 volte. Il TFIIH ha quindi un’attività chinasica, in particolare va a fosforilare la coda CTD, infatti, prima apre il DNA e successivamente fosforila la coda, che inizialmente è associata con i fattori di trascrizione generali. La fosforilazione ad opera di TFIIH determina come si vede bene dall’immagine la dissociazione e il distacco della RNA pol II dal promotore e dai fattori di trascrizione generali, permettendole di abbandonare il promotore e di entrare nella fase successiva, ovvero quella di allungamento. La fosforilazione della coda CTD promuove l’evasione del promotore, permettendo non solo l’inizio della fase di allungamento (reclutando i fattori di allungamento come TFIIS e TFIIF), ma anche il reclutamento, nella fase di allungamento, degli enzimi coinvolti nella maturazione dell’mRNA; infatti negli eucarioti l’mRNA non è subito pronto per essere tradotto (bisogna ricordare che la trascrizione avviene nel nucleo, mentre la traduzione nel citoplasma), quindi prima di essere tradotto deve essere maturato, ovvero deve subire una serie di modificazioni posttrascrizionali che gli consentono di essere pronto per la traduzione nel citoplasma. La coda fosforilata consente di reclutare gli enzimi chiave coinvolti nella maturazione dell’mRNA, che prevede tre modifiche principali: il capping, lo splicing e la poliadenilazione. Tutte queste modifiche hanno bisogno di enzimi specifici reclutati dalla coda fosforilata. Questo fa capire che la fase di allungamento, la sua terminazione e maturazione sono eventi collegati tra di loro. Durante l’allungamento e la terminazione, l’mRNA viene maturato, quindi viene aggiunto un CAP al 5’, vengono rimossi gli introni attraverso lo splicing e viene aggiunta la coda poliA, attraverso il processo di poliadenilazione al 3’ dell’mRNA. IL COMPLESSO DI PRE-INIZIO IN VIVO In vivo la situazione è più complessa, perché si ha a che fare con la cromatina e di conseguenza occorre l'intervento di altri fattori, oltre a quelli generali visti precedentemente. In particolare, intervengono proprio perché il DNA è impacchettato nella cromatina, quindi reclutare l’RNA pol e il fattore di inizio trascrizione diventa più difficile, perciò, è importante l’intervento di proteine regolatrici, che sono gli attivatori. Gli attivatori sono anche distanti dal promotore come si vede dall’immagine, riconoscono delle sequenze specifiche sul DNA e aiutano a reclutare la polimerasi al promotore e a stabilizzare il legame stesso e questo reclutamento è mediato da una serie di interazioni tra gli attivatori legati al DNA, a sequenze specifiche e a diversi attori, come i fattori di modificazione della cromatina, come ad esempio HAT (che sta per istone acetiltransferasi) che sono quelli enzimi che modificano le code istoniche, andando a promuovere uno stato di cromatina più rilassata o più compatta. Altro esempio sono i rimodellatori della cromatina, che lavorano in associazione con gli enzimi che modificano le code istoniche. Tutti questi attori coinvolti nell’andare a modificare e rimodellare la cromatina interagiscono con gli attivatori. Un altro tipo di interazione degli attivatori è con il mediatore, o meglio il complesso del mediatore che è associato alla coda CTD (in viola), che viene a fare da ponte tra gli attivatori e la RNA pol e i fattori di trascrizione. Il complesso del mediatore viene definito un coattivatore, che crea un ponte tra gli attivatori trascrizionali legati al DNA, l’RNA pol e i fattori di trascrizione, facilitando l’assemblaggio di tutti questi attori sul promotore. IL COMPLESSO DEL MEDIATORE Il mediatore è un complesso di più di 20 proteine, non ancora del tutto caratterizzate. Nell’immagine è comparato il mediatore del lievito con quello umano e in azzurro più chiaro ci sono le subunità che hanno un’omologia di sequenza significativa tra il lievito e l’uomo. Il mediatore è un grosso complesso, che interagisce con la coda CTD della RNA pol e fa da ponte tra l’attivatore e tutto il complesso del pre-inizio, aiutando l’assemblaggio del complesso di pre-inizio (è quindi un co-attivatore). MODELLO DI ALLUNGAMENTO SU SEQUENZE ORGANIZZATE IN NUCLEOSOMI ASSISTITO DA FACT Come fa l’RNA pol, durante l'allungamento, a risolvere il problema degli istoni? In vivo il DNA è organizzato nei nucleosomi, dove intervengono delle proteine, dei complessi chiamati chaperoni, che reclutano e legano gli istoni dai nucleosomi stessi, smantellandoli, rendendo così libero il DNA per essere trascritto ad opera della RNA pol II. In grigio vi è il DNA, con la RNA pol che si muove in direzione della freccia e quello che sta a valle (sulla destra della RNA pol II) è un DNA che deve essere ancora trascritto, mentre a monte vi è quello che è già stato trascritto. Intervengono in questo senso, gli chaperoni, in particolare si ha il FACT, che è uno chaperone costituito da due proteine, SSRP1 e Spt16. Questo eterodimero smantella i nucleosomi che si trovano davanti l’RNA pol, in modo da liberare il DNA e renderlo pronto per essere trascritto dalla RNA pol stessa. Nell’immagine si vede che al passaggio 1, FACT viene a legare i dimeri H2A e H2B (si ricordi che i nucleosomi sono costituiti dalle subunità H2A, H2B, H3, H4). FACT si occupa di legare e smantellare il nucleosoma, legando e staccando il dimero H2A e H2B. Non solo lo smantella ma lo riassembla, perché il DNA che sta a monte (a sinistra) della RNA pol occorre, una volta trascritto, che venga riassemblato nei nucleosomi e FACT ha anche questo ruolo, ovvero è capace di andare a riassemblare nuovamente il DNA in nucleosomi dietro la RNA pol con i dimeri H2A e H2B (passaggio 2). Ad H3 e H4 è associato un altro chaperone, che si chiama SPT6. ● H3 e H4 → SPT6 ● H2A e H2B → FACT Questi chaperoni, quindi, hanno la capacità di interagire con le specifiche proteine istoniche, vanno a smantellare il nucleosoma a valle della RNA pol, in modo da liberare il DNA dal nucleosoma e a riformare il nucleosoma a monte, dopo che la RNA pol ha trascritto, in modo da ricreare il complesso DNA-proteine istoniche. FASE DI ALLUNGAMENTO Grazie alla fosforilazione della coda CTD della Pol II si entra nella fase di allungamento. La polimerasi abbandona il promotore e avviene quella che viene chiamata evasione del promotore e la polimerasi inizia a scorrere lungo il DNA, trascrivendo l’RNA stesso. Grazie a questa fosforilazione si ha la transizione dall’inizio all’allungamento e vengono reclutati i fattori di allungamento che aiutano questa fase; sono chiamati sulla coda fosforilata gli enzimi coinvolti nella maturazione dell’mRNA. EVENTI DI MATURAZIONE DELL’mRNA EUCARIOTICO La maturazione dell’mRNA eucariotico avviene attraverso 3 eventi che nell’ordine sono: 1. Capping all’estremità 5’ 2. Splicing 3. Poliadenilazione dell’estremità 3’ In base al grado di fosforilazione della coda di RNA pol si ha il reclutamento di diversi attori ed enzimi coinvolti nella maturazione dell’RNA. Nell’immagine è mostrata l’RNA pol, è indicato con i numeri 1, 2, 3, lo stato della coda e gli enzimi che vengono ad essere reclutati nei 3 diversi momenti. Per capire meglio i 3 diversi momenti si deve guarda lo stato di fosforilazione della coda CTD: Nell’immagine si vede l’epta-peptide, che bisogna ricordare essere ripetuto in un numero variabile di volte; nell’immagine è mostrato il grado di fosforilazione dell’eptapeptide, ma bisogna immaginare che il grado sia ripetuto su tutti gli eptapeptidi, quindi su tutta la lunghezza della coda. Ogni eptapeptide presenta uno specifico grado di fosforilazione, in base alla fase che si sta analizzando. Infatti, in base alla fase di trascrizione si vanno a vedere i fattori che vengono reclutati sulla coda fosforilata e che sono utili per il processamento o maturazione dell’RNA. I vari fattori responsabili dei tre processi di maturazione dell’mRNA si trovano legati al CTD solo nei momenti in cui è richiesta la loro azione: La prima modifica è il capping e in questo caso la coda è fosforilata in posizione 5, quindi in ogni eptapeptide ripetuto si ha che la serina in posizione 5 è fosforilata. Questo stato di fosforilazione coincide con quella che è la fase della trascrizione, in cui si ha il passaggio dall’inizio all’allungamento, ovvero quando la coda è fosforilata in posizione 5 della serina, questo è il segnale della RNA pol di evadere il promotore; c’è, perciò, il passaggio dall’inizio alla fase di allungamento. In questa fase e su questa coda vengono reclutate gli enzimi che sono coinvolti ad andare a svolgere e aggiungere il cap all’estremità 5’ dell’mRNA. In particolare, il CAP viene aggiunto nelle primissime fasi della trascrizione, dopo che il trascritto nascente ha raggiunto una lunghezza di 2040 basi. Successivamente, durante la fase di allungamento la coda viene fosforilata anche in posizione della serina 2 e questa doppia fosforilazione si accompagna con reclutamento, quindi in piena fase di allungamento, dei fattori coinvolti nello splicing. Man mano che l’allungamento va avanti si osserva una progressiva defosforilazione della serina in posizione 5, quindi rimane fosforilata solo la serina in posizione 2 e in questo grado di fosforilazione la coda va a reclutare gli enzimi necessari per la poliadenilazione e il taglio dell’RNA. In altre parole, si hanno 3 diversi stati della coda, che coincidono con 3 diversi momenti della trascrizione e a cui corrispondono in base allo stato di fosforilazione il reclutamento di diversi fattori coinvolti nei 3 eventi di maturazione dell’mRNA. Gli enzimi vengono reclutati sulla coda, che ha un certo grado di fosforilazione specifico solo nel momento in cui è richiesta la loro azione. La realizzazione del CAP si realizza proprio nel momento in cui l’RNA pol abbandona il promotore e quindi quando l’RNA va a raggiungere una lunghezza di 20-40 basi. In altre parole, si verifica quando l’RNA trascritto esce dal canale di uscita che si trova nella RNA pol II. Capping dell’RNA Sulla coda vengono reclutati gli enzimi che sono coinvolti nella prima modifica a cui è sottoposto l’RNA, che è il capping. Il capping non è altro che l’aggiunta di una guanina metilata all'estremità 5’ dell’mRNA. Nell’immagine è mostrato il trascritto nascente, dove al 5’ ha l’adenina con i 3 gruppi fosfato, alfa, beta e gamma. Il capping è perciò l’aggiunta di una guanina metilata e questo avviene grazie all’intervento di 3 enzimi specifici che vengono reclutati sulla coda al momento opportuno per poter agire sull’mRNA. Questi 3 enzimi sono: ● RNA trifosfatasi: rimuove il fosfato gamma all’estremità 5’ del trascritto nascente ● Guaniltransferasi: trasferisce la guanina all'estremità 5’ del trascritto nascente e in particolare catalizza l’attacco nucleofilo del fosfato beta del trascritto nascente, che va a colpire il fosfato alfa del GTP, in questo modo si viene a creare un legame fosfato-fosfato e si libera pirofosfato dal GTP iniziale. Ricapitolando il beta colpisce il fosfato alfa del GTP, rompendo il legame tra fosfato alfa e beta, dove viene rilasciato il pirofosfato, creando così un legame tra i due gruppi fosfato insolito, perché è un 5’-5’ fosfato, mentre si è sempre visto un legame 5’-3’. ● Metiltransferasi: modifica la guanosina, in particolare aggiungendo un gruppo metile in posizione 7 Questi 3 enzimi catalizzano ciascuno uno step utile per ottenere alla fine una guanina attaccata all’estremità 5’ del trascritto nascente, con il legame insolito 5’-5’ e una guanina metilata in posizione 7. Funzioni del CAP: ➢ Protegge il terminale 5’ del pre-mRNA dall’azione delle esonucleasi 5’-3’ (bisogna ricordare che l’mRNA, una volta trascritto dalla RNA pol II e quando non è ancora maturato, viene indicato come pre-mRNA. L’mRNA maturo, che ha subito capping, splicing e poliadenilazione ed è quindi pronto ad andare nel citoplasma dove viene tradotto, viene detto mRNA). ➢ Aiuta a trasferire l’mRNA maturo nel citoplasma, attraverso l’interazione del CAP con delle proteine specifiche che sono dette CBC (“Cap Binding Complex”) ➢ Assicura un corretto svolgimento della traduzione, perché nel citoplasma si viene a legare al CAP un fattore di inizio della traduzione, chiamato eIF4E, che scarta CBC e si lega al CAP. Questo è importante perché aiuterà il legame dell’mRNA con il ribosoma, proprio nelle primissime fasi della traduzione stessa. Splicing L’mRNA è sottoposto alla rimozione degli introni e questo avviene quando la coda viene fosforilata anche in posizione della serina 2 ed è in questo momento specifico, dove si è in piena fase di allungamento, che lo splicing avviene, attraverso il reclutamento sulla coda di fattori che sono coinvolti in questo processo. (Questo argomento verrà trattato più approfonditamente in una lezione dedicata) Poliadenilazione e taglio dell’mRNA La coda fosforilata solo in posizione della serina 2 è capace di reclutare i fattori che sono coinvolti nella poliadenilazione e nel taglio. È l’ultimo evento di maturazione dell’mRNA e in questo caso si ha che quando la polimerasi ha raggiunto l’estremità di un gene, incontra e trascrive delle sequenze specifiche (in verde nell’immagine), che sono chiamate segnali di poliadenilazione o sequenza del segnale di poliA nel nostro DNA. Quando questa sequenza viene trascritta, questo innesca il trasferimento dei fattori che sono coinvolti nella poliadenilazione dell’mRNA, dalla coda alla sequenza del segnale di poliA del segnale stesso. I fattori CstF e CPSF sono tratteggiati, a indicare che quando l’RNA pol trascrive il segnale di poliadenilazione sull’mRNA, questo rappresenta il la affinché questi fattori vengano trasferiti dalla coda dell’RNA pol alla sequenza segnale di poliA sull’mRNA stesso. Questi due fattori sono importanti perché permettono il taglio dell’mRNA, in particolare CPSF, stimolata dal CstF, che va a tagliare immediatamente dopo il segnale di poliadenilazione e questo determina il rilascio di CstF, rimanendo associato alla sequenza il fattore CPSF che aiuterà il reclutamento di una poliA polimerasi, chiamata con l’acronimo PAP, che riconosce l’estremità 3’ creata dal taglio di CPSF e inizia ad aggiungere tanti residui di adenina, creando all’ estremità 3’ una vera e propria coda poliA di circa 200 adenine. Contemporaneamente, man mano che la coda viene sintetizzata si legano delle proteine, che vengono dette poly-A-binding-proteins (= sono delle proteine che si associano alla coda stessa). Il processo è accompagnato al fatto che nel momento in cui l’mRNA viene tagliato e subisce l’allungamento, l’mRNA rimasto viene degradato, mediante una nucleasi; questo porterà alla fine della trascrizione. Poliadenilazione e terminazione sono due eventi distinti: prima viene tagliato l’mRNA e viene aggiunta la coda poliA e nel frattempo l’RNA pol continua a correre lungo lo stampo di DNA a sintetizzare una seconda molecola di RNA, anche lunga (si può parlare di migliaia di nucleotidi). Funzioni della coda Poli-A La coda poliA è molto importante in particolare le proteine che la legano hanno diverse funzioni: ● Regolano l’azione delle PAP, ovvero l’enzima che va ad aggiungere le adenine all’estremità 3’, in modo tale che la lunghezza della coda sia sempre intorno ai 200-500 nucleotidi ● Proteggono l’mRNA stesso dall’azione delle esonucleasi 3’-5’ che potrebbero aggredire il terminale 3’ ● Aiutano il passaggio e l’esportazione dell’mRNA dal nucleo al citoplasma ● Sono importanti nella traduzione, in quanto interagiscono con un fattore di inizio eIF4G MODELLI PER LA TERMINAZIONE DELLA TRASCRIZIONE Nel momento in cui l’mRNA viene tagliato e viene aggiunta la coda poliA, la RNA pol continua a trascrivere, non si ferma e produce un secondo messaggero, piuttosto lungo, anche di migliaia di nucleotidi, che poi viene degradato. In particolare, per far avvenire questo meccanismo che porta successivamente alla terminazione della trascrizione, ci sono due modelli: ● Modello a siluro: alla RNA pol è associata un’altra proteina (in rosso), che è una ribonucleasi 3’-5’, che viene definito il siluro, che ha due nomi diversi, Rat1 (identificata nel lievito) e Xrn2 (identificato nell’uomo). RNA pol una volta che trascrive la sequenza di poliA, va a trasferire la coda alla sequenza sull'mRNA, che poi viene tagliata. Questo determina il trasferimento della ribonucleasi dalla RNA pol all’estremità 5’ del secondo messaggero. Quello che succede è che l’mRNA privo di CAP viene riconosciuto dalla ribonucleasi che lo inizia a tagliare. La ribonucleasi viene caricata sul trascritto dalla RNA pol stessa e va a degradare questo secondo messaggero. Quando la ribonucleasi incontra la polimerasi ne promuove la dissociazione dallo stampo, portando alla terminazione della trascrizione. ● Modello allosterico: si basa sul fatto che dice che l’RNA pol è altamente processiva lungo tutto il gene, quando però supera la sequenza poliA diventa meno processiva, rallenta e questa minore processività potrebbe essere causata da una modifica o da un cambiamento conformazionale. Il cambiamento conformazionale produce una terminazione spontanea molto veloce, perché in seguito a questo cambiamento la RNA pol diventa meno processiva e si dissocia dallo stampo in maniera spontanea. Anche in questo caso il secondo mRNA viene degradato da una ribonucleasi 3’-5’. Secondo questo modello, però, la dissociazione è dovuta dal fatto che la RNA pol, una volta superata la sequenza del segnale poliA diventi meno processiva e quindi si vada a dissociare spontaneamente dallo stampo di DNA determinando una terminazione della trascrizione. A indurre il cambiamento può essere il trasferimento degli enzimi, dalla coda al segnale di poliadenilazione; sono gli enzimi che si trovano sulla coda, CstF e CPSF, che una volta che vengono trasferiti dalla coda della RNA polimerasi alla sequenza del segnale poliA sull’mRNA, potrebbero produrre un cambiamento conformazionale sull’RNA pol rendendola meno processiva. Un’altra possibilità è il fatto che sulla coda vengano reclutati altri fattori, non ancora identificati, capaci di indurre questo cambiamento conformazionale. CONTROLLO TRASCRIZIONALE NEGLI EUCARIOTI Promotore della RNA polimerasi II: presenta un core che contiene l’iniziatore con il sito +1 di inizio trascrizione, vari elementi a valle del sito di inizio trascrizione (Tss), la sequenza TATA e la sequenza BRE adiacente ad essa. Oltre a questi elementi facenti parte del core, indispensabile per il riconoscimento da parte dell’RNA polimerasi, abbiamo anche altri elementi importanti a completare la struttura dei promotori eucariotici. In particolare, questi elementi son suddivisi in elementi del promotore prossimali ed elementi del promotore distali o a lungo raggio. Gli elementi del promotore prossimali si trovano a circa 200pb rispetto al sito di inizio della trascrizione. Agli elementi prossimali si legano i fattori basali di trascrizione, la polimerasi ed anche alcuni attivatori. Gli elementi distali o a lungo raggio vengono a trovarsi a distanze più lontane che, fino a 100kb di distanza, hanno la funzione di essere riconosciuti da fattori di regolazione, quindi da attivatori e repressori trascrizionali. Gli elementi prossimali, poi, vengono riconosciuti anche da alcuni attivatori o repressori. Essi sono organizzati in modo tale da contenere delle sequenze nucleotidiche a blocchi, chiamati box. Questi box vengono ad essere riconosciuti da fattori specifici. Ad esempio, il CAAT box è riconosciuto da un fattore specifico chiamato nfy che serve per influenzare l’efficienza di un promotore. Un’altra è il GC box, una sequenza ricca in C e G, riconosciuta da un fattore che si chiama sp1, frequente nei promotori di molti organismi compreso l’uomo. Spesso troviamo il GC box nei promotori di geni housekeeping, cioè geni espressi a livelli molto elevati in maniera costitutiva senza essere indotti da stimoli per essere trascritti. Troviamo questa box anche in promotori di geni coinvolti nella risposta a stimoli ben precisi, come particolari tipi di stress o esposizione ad inquinanti come, ad esempio, i metalli pesanti. Gli elementi distali vengono riconosciuti da proteine regolatorie sia attivatori che repressori. Hanno diverse funzioni. Gli enhancer funzionano da amplificatori e perciò vengono ad avere una funzione di controllo positivo della trascrizione. Controllo positivo vuol dire che c’è una regolazione positiva della trascrizione, cioè c’è un incremento dell’attività trascrizionale. Gli enhancer vengono, quindi, riconosciuti perché son delle sequenze, a -700 o più, riconosciute da proteine che fungono da attivatori trascrizionali. Questi enhancer non vengono riconosciuti da un singolo attivatore ma da più di uno. Notiamo che questi enhancer si possono trovare anche a -10 o +10 kpb rispetto al sito di inizio della trascrizione (E). Vengono ad avere una lunghezza intorno alle 500pb e contengono fino a 10-12 siti di legame per fattori di trascrizione differenti. Il complesso di proteine legato all’enhancer viene chiamato enhanceosoma. L’enhanceosoma può, poi, interagire con il mediatore facilitando il reclutamento dell’RNA polimerasi sul promotore e di tutti i vari fattori di trascrizione basali sul promotore stesso. Gli elementi enhancer vengono anche chiamati elementi che agiscono in cis, cioè sequenze del DNA che si trovano vicino al gene che deve essere trascritto a mRNA. Con trans, invece, si indicano fattori di regolazione che vengono prodotti da regioni molto distanti rispetto al gene su cui essi agiscono controllandone l’espressione. Con cis elements indichiamo quindi: promotore, enhancer, silencer, insulator ecc. Con trans, invece, fattori trascrizionali che riconoscono questi elementi che vengono però a loro volta prodotti da regioni del DNA molto distanti. Gli enhancer posso essere trovati sia a monte che a valle del gene che controllano. Per esplicare la loro funzione spesso formano delle anse in modo da avvicinarsi ai co-attivatori con cui devono agire. Inoltre, funzionano in entrambi gli orientamenti rispetto alla direzione della trascrizione. Esoni = regioni che codificano per le proteine. Introni = regioni non codificanti. Gli enhancer si possono trovare anche a livello degli introni. La controparte degli enhancer sono i silencer, cioè silenziatori. Funzionano al contrario ma con lo stesso meccanismo. Essi legano dei repressori in grado di inibire la trascrizione con meccanismi diversi a quelli degli attivatori. Un altro tipo di elementi sono gli isolatori, detti anche insulator e sono esempi di elementi che agiscono in cis. Servono ad influenzare l’azione degli enhancer o silencer a loro vicini. Gli isolatori, quindi, vengono ad impedire l’attivazione o la repressione di un gene da parte di un enhancer o di un silencer. Perché possa funzionare, un isolatore deve essere posizionato in mezzo fra un enhancer o silencer ed il promotore. a) Un enhancer, in assenza di isolatore, può legarsi al promotore ed agire attivando la trascrizione. b) In presenza di isolatore, invece, esso è impossibilitato a legarsi al promotore, perciò non potrà attivarlo. Non c’è comunicazione tra enhancer e promotore. La trascrizione si spegne. Nel caso c) vediamo che un enhancer controlla sia un promotore a destra che uno a sinistra. L’isolatore si trova tra il promotore di destra e l’enhancer; perciò, sarà bloccata l’interazione con il promotore di destra. L’interazione con quello di sinistra, invece, può avvenire perché non vi è nessun isolatore tra enhancer e promotore di sinistra ad ostacolare il tutto. In d) accade esattamente il contrario. Sia nei procarioti che negli eucarioti, queste proteine, sia che siano attivatori o repressori, hanno sempre un dominio di attivazione ed un dominio di legame al DNA separati. Mentre i motivi strutturali di dominio di legame al DNA sono stati ben studiati, quelli di attivazione ancora non sono conosciuti del tutto. Gli attivatori o repressori trascrizionali sono solitamente dei dimeri. In questa forma dimerica, ogni monomero ha un dominio di legame al DNA. Il motivo è un motivo a elica-giro-elica, ma non è l’unico. Negli eucarioti questi dimeri non sono solo omodimeri, ma possono essere anche eterodimeri o monomeri. Abbiamo anche un dominio di dimerizzazione che consente al dimero di andare a dimerizzare. STRUTTURA DEI DOMINI DI LEGAME AL DNA DEGLI ATTIVATORI E REPRESSORI TRASCRIZIONALI EUCARIOTICI Oltre al motivo elica-giro-elica possiamo avere proteine con omeodominio, domini proteici contenenti atomi di zinco, motivo a cerniera di leucine (leucine zipper), proteine elica-ansa-elica. Le proteine che legano il DNA mediante un omeodominio sono costituite da tre alfa eliche. La 2 e la 3 formano una struttura ad elica-giro-elica dove la 3 funziona da elica di riconoscimento. Infatti, con gli aa sporgenti di ser, arg, asn si inserisce nel solco maggiore del DNA. A stabilizzare l’interazione con il DNA, abbiamo che l’alfa elica 1 presenta una coda a residuo di Arg che interagisce con il solco minore del DNA. In questo caso, abbiamo l’atomo di Zn coordinato con due His che appartengono all’elica di riconoscimento e con due Cys che appartengono al dominio N-terminale a beta-foglietto. In questi domini ho un’alfa-elica all’estremità carbossi terminale ed un betafoglietto all’N-terminale. In questo modo, l’elica di riconoscimento viene ad essere tenuta in una posizione opportuna per il legame con il DNA. La posizione ottimale per il legame con il DNA, quindi, è ottenuta dall’interazione con il beta-foglietto. Questa interazione è possibile grazie allo Zn che forma legami di coordinazione con due aa dell’elica di riconoscimento e due aa dell’elica a betafoglietto. In A vediamo la struttura primaria di questi motivi. Notiamo la presenza di residui di leucina ripetuti ogni 7 aa. Questa disposizione fa in modo che nella struttura secondaria, cioè nel monomero (B), le leucine siano esposte tutte nello stesso lato. Ogni giro di alfa elica corrisponde a 3 residui e mezzo di aa; quindi, le leucine si trovano ogni due giri sullo stesso lato. Le leucine sullo stesso lato rappresentano il dominio di dimerizzazione. In C vediamo che i dimeri dimerizzano grazie alla regione ricca di L che instaurano tra di loro una serie di legami idrofobici. A seguire, abbiamo un dominio basico, costituito da aa basici, come Arg, Lys, fondamentali per legare il DNA. Infatti, come vediamo in D, i dimeri sono uniti a livello delle leucine, mentre a livello degli aa basici si forma una sorta di motivo a due dita che diviene il sito di interazione con il DNA, in particolare con il solco maggiore. Abbiamo due monomeri costituiti da un’alfa-elica un po' più lunga ed una un po' più corta. La differenza rispetto al classico elica-giro-elica è che ho un’ansa con una sequenza aa molto più lunga. Le due alfaeliche più brevi servono a far dimerizzare mentre quelle più lunghe si mettono a cavallo, una a destra ed una a sinistra, del solco del DNA, al fine di interagire con le basi. Le zone che riconoscono il DNA sono costituite anche qui da aa basici. GLI ATTIVATORI RECLUTANO ANCHE MODIFICATORI E RIMODELLATORI DEI NUCLEOSOMI CONSENTENDO AL COMPLESSO TRASCRIZIONALE DI LEGARSI AL PROMOTORE O INIZIARE LA TRASCRIZIONE. Gli attivatori vengono ad interagire anche con i complessi di rimodellamento e modificazione della cromatina. Questi contengono tutti quegli enzimi che modificano chimicamente le code istoniche, come ad esempio HAT. In vivo il DNA è avvolto attorno ai nucleosomi, quindi non sempre il promotore è accessibile. Per cui gli attivatori reclutando questi attori del complesso di rimodellamento della cromatina e gli enzimi modificatori di code istoniche, riescono a rendere più accessibili i promotori al complesso trascrizionale rilassando la cromatina. Si può avere, quindi, un’alterazione locale della cromatina stessa. In questa immagine vediamo il DNA avvolto intorno ai nucleosomi. In verde abbiamo il sito riconosciuto dal nostro attivatore, mentre in viola il nostro promotore. In questo caso, essendo il promotore avvolto intorno al nucleosoma, non può reclutare RNA polimerasi ecc. e la trascrizione non può partire. Bisogna liberarlo. Per liberarlo, l’attivatore ha diverse possibilità. L’attivatore potrebbe, ad esempio, reclutare l’istone acetil transferasi, che va ad acetilare le code istoniche sui nucleosomi adiacenti permettendo alla cromatina di assumere uno stato più rilassato (eucromatina). In questo stato il promotore si libera ed è accessibile. Un’altra possibilità è rappresentata dal reclutamento da parte dell’attivatore del complesso di rimodellamento della cromatina che permette di andare localmente a far scivolare il DNA sulla superficie del nucleosoma liberando il promotore. È così permessa l’attivazione della trascrizione. I repressori eucariotici riconoscono i silencer. Si occupano di un controllo negativo della trascrizione. I repressori possono agire con diversi meccanismi per inibire la trascrizione stessa. a) Il primo può essere un meccanismo di competizione con l’attivatore stesso. Il sito in verde di legame con l’attivatore viene a sovrapporsi al sito di legame per il repressore. Quando il repressore si lega al suo sito impedisce all’attivatore di legarsi al DNA. C’è una competizione tra repressore e attivatore sul DNA stesso proprio perché i loro siti si sovrappongono parzialmente, e quindi, quando c’è l’uno non può esserci l’altro. b) La seconda possibilità è un’inibizione dell’attività dell’attivatore stesso. Il repressore, in questo modo, viene a mascherare i domini di attivazione dell’attivatore, inibendo l’attivatore. c) Il terzo caso è rappresentato da un’inibizione diretta. Il repressore agisce direttamente con il mediatore inibendo e bloccando il complesso sul promotore. Anziché essere gli attivatori, qui è il repressore che viene ad interagire direttamente con il mediatore inibendone l’azione. d) Reclutamento degli enzimi che modificano le code istoniche. Esistono delle deacetilasi che fanno sì che la cromatina assuma una struttura molto più compatta (eterocromatina) e la trascrizione viene bloccata indirettamente. SILENZIAMENTO DI UN GENE MEDIANTE METILAZIONE DEL DNA E MODIFICAZIONE DEGLI ISTONI Bisogna poi ricordare che per silenziare un gene esiste un’altra importante modifica. Accanto al reclutamento di complessi di rimodellamento della cromatina e modificatori delle code istoniche, esiste la possibilità di avere silenziamento genico mediante metilazione. Il DNA viene metilato in alcune zone soggette a questo, cioè le isole CpG. In particolare, ad essere metilata è la citosina. Le isole CpG possono essere presenti a livello degli enhancer, a livello del promotore ma anche in siti distanti dal punto di inizio della trascrizione. Queste regioni, una volta soggette a metilazione, vengono a reclutare delle proteine che possono funzionare da repressori. A loro volta, queste proteine possono silenziare ulteriormente il gene reclutando alcuni attori, cioè gli istoni deacetilasi e i complessi di rimodellamento della cromatina. La cromatina, ora, viene compattata e si ha un completo silenziamento genico. Questo pattern di metilazione del DNA può essere mantenuto ed ereditato sul DNA neosintetizzato grazie a degli enzimi chiamati metilasi di mantenimento. Durante la replicazione la regione CpG non metilata non viene riconosciuta dagli enzimi di mantenimento che, invece, riconoscono i siti emimetilati, perché presentano una C metilata sul parentale ed una C non metilata sul neosintetizzato. Ora la metilasi di mantenimento provvede a metilare la C sul filamento neosintetizzato. Questi profili di metilazione possono, quindi, essere ereditati. Questo fa parte dell’epigenetica, che comprende le modifiche al DNA che avvengono dopo la replicazione e che possono realizzarsi anche durante la vita. L’epigenetica viene infatti modificata da fattori ambientali come stato di nutrizione della madre in gravidanza, inquinamento, smog, fumo ed altri fattori. Questo pattern di metilazione, quindi, può essere alterato da fattori esterni ed essere quindi causa dell’insorgere di malattie. LO SPLICING In questa unità didattica andremo a prendere in considerazione: • Splicing o Chimica dello splicing o Il macchinario dello spliceosoma e le fasi di reazione dello splicing o Varianti di splicing, splicing alternativo e sua regolazione • Editing • Traslocazione nucleo-citoplasmatica degli RNA SPLICING Il pre-mRNA negli eucarioti, per diventare mRNA pronto per essere traslocato da nucleo a citoplasma e nel citoplasma essere sottoposto alla traduzione in proteina, deve subire delle modifiche, cioè una maturazione. La maturazione prevede l’aggiunta di un cap al 5’, l’aggiunta della coda poliA al 3’ e lo splicing. Nel pre-mRNA la trascrizione fa sì che vengano trascritti sia gli esoni che gli introni, capiamo bene quindi che non è ancora pronto per essere traslocato nel citoplasma. Deve subire un capping, la rimozione degli introni e la poli-adenilazione. Può subire anche un’ulteriore modifica, non comune a tutti i pre-mRNA, che consiste nell’editing. Il risultato della maturazione è un mRNA che al 5’ ha un cap, al 3’ una coda poli A e gli introni sono stati rimossi. L’mRNA, così pronto, viene trasportato dal nucleo al citoplasma, dove viene tradotto in proteina. L’mRNA presenta, inoltre, al 5’ e al 3’ delle regioni UTR, che stanno per regioni untranslated, cioè non tradotte. Queste regioni fiancheggiano la regione CDS che, invece, rappresenta la regione codificante, ovvero quella che viene tradotta in proteina. GENE TIPICO EUCARIOTICO Subito dopo la trascrizione abbiamo un pre-mRNA che contiene sia gli esoni che gli introni e al 5’ e 3’ regione leader e non codificante. In seguito a splicing gli esoni si avvicinano e al 5’ e al 3’ troveremo le regioni UTR. Il numero di introni per gene nelle diverse specie eucariotiche è piuttosto variabile. Nel lievito, ad esempio, il numero di introni è molto scarso. Aumentano notevolmente nel topo e nell’uomo. LA CHIMICA DELLO SPLICING Quali sono le sequenze che troviamo alla fine tra introni ed esoni, fondamentali per la reazione di splicing? In bianco e nero sono evidenziate le sequenze conservate a livello delle giunzioni tra esone ed introne sia a destra che a sinistra. Dove troviamo due lettere sovrapposte sta ad indicare che in quella zona io posso trovare, in maniera indistinta, una base o l’altra. Y indica una delle possibili basi pirimidiniche, mentre R una possibile base purinica. N, invece, una qualsiasi base. Guardando i confini tra esoni ed introni, notiamo che nel pre-mRNA ci sono due siti, chiamati siti di splicing 5’ e 3’. Il sito di splicing 5’ si trova tra l’estremità 3’ dell’esone e l’estremità 5’ dell’introne. Il sito di splicing 3’ corrisponde all’estremità 3’ dell’introne stesso. Per far avvenire lo splicing, oltre a questi siti, esiste una terza sequenza presente all’interno dell’introne. È importante l’A, il cui punto in cui si trova viene detto punto di ramificazione o branch point site. Un altro modo per chiamare i siti di splicing è, rispettivamente, sito donatore al 5’ e sito accettore al 3’. Ci sono, poi, delle sequenze conservate la cui presenza è fondamentale per determinare dove avviene lo splicing (guardare le box). Sono ultraconservate a livello del sito di splicing 5’ il nucleotide GU, a livello intronico l’A e a livello del sito di splicing 3’ il nucleotide AG, ed infine il tratto Y11 formato, appunto, da 11 pirimidine. LA REAZIONE DI SPLICING La reazione di splicing, e quindi la rimozione di un introne fra due esoni, prevede due reazioni di trans-esterificazione à due reazioni successive in cui i legami fosfodiesterici vengono rotti e riformati di nuovi. I) La prima reazione prevede il coinvolgimento dell’A del branch point. L’A, infatti, grazie al suo 2’-OH viene a svolgere un attacco nucleofilo al legame fosfodiesterico tra G intronica e G esonica. Viene così rotto il primo legame fosfodiesterico che c’è al confine tra l’esone e l’introne. Il risultato è che, rompendo questo primo legame fosfodiesterico, l’esone 1 viene ad avere un’estremità 3’-OH libera, mentre l’A forma un legame fosfodiesterico con la G intronica formando una sorta di struttura a cappio. II) La seconda reazione di splicing prevede un secondo attacco nucleofilo al legame fosfodiesterico al sito di splicing 3’ tra la G intronica e la G esonica ad opera dell’estremità 3’-OH dell’esone 1. Il legame si rompe e l’introne viene rilasciato a forma di cappio. I due esoni, intanto, si sono ricongiunti. Bisogna, poi, aggiungere che in questa reazione di splicing, in cui ho due legami fosfodiesterici che vengono rotti e due che vengono riformati, non abbiamo dispendio di energia, proprio perché due se ne rompono e due se ne riformano. Non è necessario ATP per questo tipo di reazione. Però, il processo di splicing è un processo altamente energetico in cui viene utilizzato tantissimo ATP. Questa energia, derivante dall’ATP, è necessaria, quindi, non per le reazioni di splicing ma per il corretto assemblaggio e funzionamento del macchinario di splicing o meglio spliceosoma. Il macchinario dello spliceosoma e le fasi di reazione dello splicing Lo spliceosoma è un enorme macchina molecolare che esegue lo splicing dell’RNA, costituita da oltre 200 proteine e 5 RNA. Ha dimensioni simili al ribosoma, che sappiamo essere coinvolto nella traduzione. Le reazioni di splicing, quindi, avvengono tramite questo complesso. I 5 RNA, in particolare, sono degli small nuclear RNA, piccoli RNA nucleari lunghi intorno ai 100 nucleotidi indicati con l’acronimo snRNA. Questi piccoli small nuclear RNA formano, con le proteine, dei complessi ribonucleoproteici. I 5 RNA sono U1, U2, U4, U5, U6. Il nome dipende dall’ordine temporale della loro scoperta. L’U3 manca perché è stato scoperto essere coinvolto nel processo di maturazione degli RNA ribosomiali, non partecipa quindi allo splicing degli mRNA. Tali complessi RNA-proteine sono chiamati piccole ribonucleoproteine nucleari, cioè snRNP, small nuclear ribonuclear proteins, “snurp”, con composizione differente in base ai diversi passaggi della reazione di splicing. Servono per riconoscere il sito di splicing 5’ e il punto di ramificazione e per catalizzare o assistere il taglio e la giunzione dell’RNA avvicinando i siti di splicing. La composizione dello spliceosoma è profondamente dinamica, fattore molto importante per le sue funzioni. LE FASI DELLA REAZIONE DI SPLICING MEDIATA DALLO SPLICEOSOMA L’assemblaggio e il funzionamento dello spliceosoma segue un ordine temporale progressivo e ben preciso e in questa immagine viene riportato come avviene questo ordine. Andiamo ad analizzare le varie parti più nel dettaglio: Il ciclo inizia con il legame della snRNP U1 che viene a riconoscere e legare il sito di splicing al 5’ tramite l’interazione tra RNA ed RNA perché una regione di U1 (l’estremità 5’ di U1) è complementare con il sito di splicing in 5’. Il branch point viene ad essere riconosciuto da un’altra proteina che si chiama BBP, acronimo di branch-point binding protein. BBP non è una snurp, quindi ci sono anche altre componenti proteiche. Queste sono proteine che non sono complessate con i piccoli RNA nucleari ma sono proteine da sole che interagiscono con l’introne da tagliare ma che, però, non sono snurp. Inoltre, vediamo che accanto alla BBP abbiamo un altro fattore proteico costituito da due subunità, chiamato U2AF. Ogni subunità interagisce con una posizione specifica del nostro introne. Il tratto U2AF65 interagisce con il tratto polipirimidinico mentre la subunità 35 interagisce con il sito di splicing 3’. Accanto ad ogni complesso è indicata una lettera, perché abbiamo detto che la composizione è variabile e per distinguere la composizione, appunto, indichiamo i complessi con delle lettere. E sta per early e il complesso indicato con questa lettera ha lo scopo di riconoscere l’introne che deve essere rimosso. Interviene, poi, U2 che scarta BBP e viene a legarsi al suo posto sul sito di ramificazione. U2 ha bisogno di ATP. Una molecola di ATP, quindi, viene consumata per consentire ad U2 di scalzare BBP. Anche in questo caso, U2 interagisce, tramite la sua piccola componente a RNA, alla regione complementare che coinvolge il sito di ramificazione. Notiamo bene che, però, l’A non si appaia, ma protrude. Questa interazione, quindi, non è perfetta perché l’A non si appaia con la sequenza di RNA di U2. Grazie alla protrusione dell’A, la prepara alla prima reazione di transesterificazione, che prevede appunto l’attacco nucleofilo ad opera dell’A. Il complesso ora viene chiamato A. Non siamo ancora pronti ad andare a realizzare la prima reazione di transesterificazione perché occorre avvicinare questa A protrudente al sito di splicing 5’. Perché questo avvenga abbiamo bisogno di altre snurp. Intervengono, quindi, U4, U5, U6 che viene chiamata trisnurp. Questa triade scalza U2AF con entrambe le subunità e viene ad interagire con U1 ed U2 in modo da creare un ponte e avvicinare il sito di splicing 5’ all’A. Si induce quindi l’avvicinamento del sito di splicing 5’ al sito di ramificazione. U4 ed U6 sono tenuti insieme attraverso un appaiamento di basi dei loro piccoli RNA nucleari. La snurp U5 è legata in maniera più lassa, attraverso un’interazione proteina-proteina. Vien da sé che ora anche il sito di splicing in 3’ è più vicino alla triade. Questo complesso è chiamato B, ma è inattivo. Per attivarlo occorre una fase ulteriore. La fase successiva prevede l’uscita di U1 dal complesso. U1 viene rilasciato ed U6 viene ad appaiarsi con il sito di splicing 5’. Quando viene scalzato U1, U6 si appaia con la sua piccola regione di RNA nucleare al sito di splicing 5’. Questa operazione di scambio richiede ATP. La fase successiva richiede il rilascio di un'altra componente che è U4. Questo consente l’interazione tra U6 ed U2. È sempre un’interazione RNA-RNA per complementarità. La forma attuale è la forma attiva dello spliceosoma. Ora può catalizzare la reazione di transesterificazione. Rimane l’introne a cappio che viene poi staccato grazie alla seconda reazione di transesterificazione in cui viene utilizzata un’altra molecola di ATP. In questa seconda reazione l’estremità 3’ dell’esone a monte colpisce il sito di splicing 3’. I due esoni vengono di nuovo congiunti. La fase successiva sarà che le componenti snurp dissoceranno dall’introne ed il complesso dello spliceosoma verrà disassemblato in modo tale che queste snurp possano essere riciclate in un altro ciclo. L’introne viene degradato. RIEPILOGO: Per prima cosa, abbiamo U1 che riconosce il sito di splicing 5’ tramite un’interazione del suo piccolo RNA nucleare con una sequenza complementare al sito di splicing 5’ dell’introne stesso mediante appaiamenti di Watson e Crick. Il sito di ramificazione, invece, viene riconosciuto da una non snurp, cioè da una semplice proteina non associata a piccoli RNA nucleari che si lega all’A, base conservata a livello del sito di ramificazione. Il tratto polipirimidinico viene riconosciuto da un’altra non snurp, U2AF costituita da due subunità, la 65 e la 35. Anche l’U2AF interagisce con questi siti tramite interazione proteinaRNA perché ricordiamo che U2AF è costituito solo da proteina. La fase successiva è l’uscita di BBP che viene scalzata da un’altra snurp che è U2. U2 per far ciò consuma ATP. Interagisce anch’essa con il suo piccolo RNA nucleare ma la complementarità non è perfetta perché l’A del sito di ramificazione non si appaia con il piccolo RNA nucleare di U2. L’A protrude e ciò consente di poter avere un’A già pronta per la prima reazione di transesterificazione che, tuttavia, prima di avvenire ha bisogno di passaggi ulteriori. Il passaggio ulteriore è il reclutamento della triade U4, U5, U6. Questa triade viene a spiazzare l’altra non snurp, la U2AF e interagendo con U1 ed U2 avvicina il sito di splicing 5’ al sito di ramificazione preparando per la prima reazione di transesterificazione. Nel far ciò, di conseguenza, avvicina anche il sito di splicing 3’. La reazione successiva prevede, poi, che U1 venga scalzato da U6 nell’interazione con il sito di splicing 5’. Anche in questo caso viene consumata una molecola di ATP e la snurp interagisce con il sito di splicing in 5’ per complementarità. L’ultimo step per arrivare alla forma dello spliceosoma attivo e quindi con attività catalitica è l’uscita di U4 dal complesso. Ora U6 ed U2 sono fra loro in contatto e questo rende lo spliceosoma attivo e quindi pronto per andare a catalizzare la prima reazione di transesterificazione che prevede la liberazione del primo esone che avrà un 3’OH libero e la formazione del nuovo legame fosfodiesterico creando un introne con la forma a cappio. Per catalizzare questa reazione lo spliceosoma usa un’altra molecola di ATP. La seconda reazione di transesterificazione utilizza anche ATP per velocizzare. Il risultato è il rilascio di un mRNA (maturo) e il rilascio dell’introne a cappio che verrà poi degradato dalle nucleasi. Qui vedete a confronto la reazione di splicing per i pre-mRNA. Le reazioni di self-splicing del gruppo II sono, dal punto di vista chimico, identiche a quelle per il pre-mRNA. Quello che cambia è che la rimozione dell’introne, in questo caso, avviene in maniera autonoma, senza l’ausilio dello spliceosoma. Infatti, questo introne effettua in maniera autonoma lo splicing. La stessa cosa avviene per gli introni self-splicing del gruppo I. Anche questi non hanno bisogno dello spliceosoma. Notiamo che, però, qui al sito di ramificazione non ho una A ma una G libera. La G è associata all’introne ma non fa parte della sequenza dell’introne. L’introne viene, poi, eliminato non sotto forma di cappio ma in forma lineare. Questi introni di gruppo I e gruppo II, quindi, possono effettuare queste reazioni senza spliceosoma, in vitro. In vivo, invece, abbiamo visto esserci delle componenti proteiche che hanno la funzione di stabilizzare la struttura dell’introne sostenendolo nella sua attività di self-splicing. Sono introni che non lavorano in combinazione con lo spliceosoma ma che utilizzano proteine che gli consentono di stabilizzare la sua struttura secondaria. La molecola si ripiega a creare strutture secondarie tramite selfannealing. L’A viene avvicinata al sito di splicing al 5’ favorendo la reazione. Questi introni sono di dimensioni variabili, dai 400 ai 1000 nucleotidi. In vitro non hanno bisogno di proteine. In vivo hanno bisogno di proteine. Nel caso degli introni del gruppo I la reazione è catalizzata da una sorta di tasca, struttura secondaria conservata, a livello della quale viene legato il nucleotide che servirà per fare la prima reazione. Tra l’altro, questi introni hanno una sequenza di guida interna che si appaia con il sito di splicing 5’ consentendo l’attacco nucleofilo della G nel punto desiderato. POSSIBILI ERRORI COMMESSI NELLA SELEZIONE DEI SITI DI SPLICING Come lo spliceosoma riesce ad essere accurato nel riconoscere in maniera corretta e specifica i siti di splicing? Succede che le snurp e non snurp devono riconoscere e avvicinare i siti in modo tale da consentire il taglio dell’introne. Un gene umano contiene in media circa 6-7 introni; quindi, ritroviamo un esone disperso tra 6-7 introni. La lunghezza degli esoni e degli introni è molto diversa, gli esoni hanno una lunghezza di circa 150 nucleotidi mentre gli introni sono molto più lunghi, dai 3000 agli 800000 nucleotidi. Gli esoni, perciò, sono dispersi in un mare di introni. Il riconoscimento dei siti di splicing deve, perciò, essere il più preciso e accurato possibile. I possibili errori commessi possono essere il salto dell’esone e la selezione di uno pseudo sito di splicing. Il pre-mRNA è caratterizzato dagli esoni e dagli introni ancora ovviamente mantenuti. Abbiamo, poi, che in seguito a questo errore nella selezione dei siti di splicing si ha un salto dell’esone. Ottengo, così, un mRNA non corretto perché incompleto. Si verifica questo errore se i componenti dello splicing al 5’ vengono a riconoscere e interagire con i componenti al 3’ dell’introne successivo e non dello stesso. La snurp al 5’ interagisce non con i siti al 3’ dello stesso introne in cui si trova ma con quelli dell’introne successivo, cioè a valle. L’esone presente nel mezzo, perciò, viene saltato. L’altro errore è la selezione di uno pseudo sito di splicing, anche chiamato sito criptico. Questi siti sono molto simili ma non identici ai siti di splicing canonici che vengono confusi dallo spliceosoma che li riconosce erroneamente. Lo spliceosoma ha riconosciuto al 3’ come sito di splicing un sito che si trova nell’esone, commettendo un errore. Il risultato è che si otterrà l’esone intero ma fuso solo con una parte dell’esone successivo perché lo splicing si porta via anche metà esone avendo riconosciuto un sito criptico facente parte dell’esone. Come aumentare l’accuratezza della selezione dei siti di splicing? La cellula mette in atto due meccanismi fondamentali, uno per ognuno dei potenziali errori: 1. La coda CTD della Pol II trasporta proteine necessarie per la maturazione (per ridurre il possibile “salto” dell’esone). 2. Riconoscimento dei siti di splicing vicino agli esoni (definizione dell’esone) (per ridurre il riconoscimento di siti non corretti). L’RNA Pol II mentre trascrive, quindi durante la fase di allungamento, viene a trasportare diverse proteine che servono per la maturazione dell’RNA. In base allo stato di fosforilazione della sua coda CTD viene a reclutare fattori necessari per il processamento dell’RNA nelle diverse fasi. Durante l’allungamento, l’mRNA viene sottoposto a splicing e ciò è possibile perché sulla sua coda vengono reclutati componenti della fase di splicing che vengono trasferiti immediatamente sull’mRNA. Abbiamo infatti detto che la trascrizione e la maturazione sono eventi che avvengono in contemporanea e, in particolare, durante l’allungamento abbiamo lo splicing. Quando viene trascritto il sito di splicing al 5’ immediatamente dalla coda viene trasferita U1 e viene a riconoscere e legare il sito di splicing 5’ sulla molecola di RNA neosintetizzata. La snurp viene, quindi, trasferita immediatamente dalla coda CTD della Pol II al nostro pre-mRNA, al sito di splicing. Man mano che continua a trascrivere, quando vengono trascritti il punto di ramificazione, il tratto polipirimidinico e il sito di splicing 3’, ecco che vengono trasferiti dalla coda gli altri fattori, ossia BBP, U2AF. Il reclutamento delle componenti nei siti di splicing è perciò sequenziale e i siti di splicing vengono riconosciuti prima che vengano trascritti gli altri siti competitori a valle, quindi prima che vengano trascritti gli introni successivi. Questo riduce ulteriormente la possibilità di errore. In questo caso, abbiamo l’intervento di proteine che si chiamano SR, attivatori dello splicing. Sono molto importanti perché vanno a legare delle sequenze specifiche che troviamo all’interno degli esoni. Nell’immagine vediamo in verde scuro gli esoni ed in verde chiaro gli introni. Le SR riconoscono sequenze precise situate all’interno degli esoni che sono chiamate sequenze ESE. Le proteine SR vengono ad interagire con la proteina U2AF nel sito di splicing 3’ a monte dell’esone e con U1 nel sito di splicing 5’ a valle dell’esone. Quindi i componenti dello spliceosoma sono reclutati attorno all’esone piuttosto che all’introne da rimuovere. Per riuscire a definire perfettamente gli esoni riduco la possibilità che siti criptici vengano riconosciuti in maniera errata. Accadrà, poi, che i componenti vicino ad un esone si appaieranno con quelli dell’esone adiacente per andare ad eliminare l’introne. Le proteine SR sono delle proteine fondamentali per lo splicing, sono degli attivatori e regolatori dello splicing in grado di assicurare l’efficienza sia dello splicing canonico ma anche dello splicing alternativo. Queste proteine hanno due domini, un dominio per l’RNA ed un dominio per l’interazione con le componenti dello splicing. Ci sono diversi tipi di SR, questo perché le SR possono essere costitutive e quindi sempre attive all’interno della cellula o indotte da specifici stimoli fisiologici (inducibili). Abbiamo anche delle SR che hanno un’espressione cellula-specifica, cioè vengono espresse solo in alcuni tipi cellulari. Questo accade perché, soprattutto per lo splicing alternativo, ci sarà un controllo cellula-tessuto specifico. VARIANTI DI SPLICING, SPLICING ALTERNATIVO E SUA REGOLAZIONE Le varianti di splicing si distinguono in: 1. splicing in trans 2. splicing catalizzato dallo spliceosoma minore (AT-AC) Lo splicing in trans è piuttosto raro, è stato riscontrato nei nematodi, in particolare in Cercnodaptis Elegans. Prevede che siano congiunti insieme due esoni posizionati su due RNA differenti, cioè su due molecole di RNA ben distinte. Questi esoni vengono uniti da questo splicing in trans. Nei nematodi tutti gli RNA subiscono splicing in trans e a seguire molti hanno anche splicing in cis, cioè quello canonico. La prima reazione di transesterificazione si realizza, in questo caso, tramite l’A di un RNA che colpisce il sito di splicing di un altro RNA distinto. Libero così l’esone 1 che ha l’estremità 3’OH libera e potrà colpire il sito di splicing al 3’ appartenente all’RNA 2 e creare quindi la giunzione esone 1- esone 2. In altre parole, vedete che il risultato attraverso questo splicing in trans è identico al risultato di uno splicing canonico ed anche il macchinario di spliceosoma è il classico, con l’unica eccezione che è rappresentata dalla mancanza di U1. L’altra differenza è la forma dell’introne che non è a cappio ma a forma di Y, questo proprio perché i due attori appartengono a siti di RNA distinti. All’inizio lavoro con due molecole di RNA distinte e perciò l’azione iniziale viene ad unire due molecole di RNA anziché creare un’ansa all’interno dell’unica molecola di RNA. L’altro tipo di splicing coinvolge uno spliceosoma minore. Gli eucarioti superiori, come i mammiferi e le piante, utilizzano lo spliceosoma con meccanismo canonico. Questo spliceosoma viene anche chiamato maggiore. In questi organismi, ad eccezione dei lieviti, per alcuni pre-mRNA il processamento è catalizzato dallo spliceosoma minore. Ci sono pochi pre-mRNA processati con lo spliceosoma minore ma non sono poi così rari. Introni minori vengono rimossi grazie all’azione dello spliceosoma minore. Anche nello spliceosoma minore ho delle snurp però con delle differenze. U1 ed U2 sono sostituite dalle snurp U11 ed U12 che riconoscono sequenze diverse. Abbiamo poi due componenti, U4 ed U6, chiamate in maniera identica a quella dello spliceosoma maggiore. Benché condividano lo stesso nome sono però delle snurp diverse. L’unica componente completamente comune è U5. Lo spliceosoma minore riconosce introni in generale piuttosto rari che hanno sequenze consenso diverse rispetto a quelle degli introni maggiori. Notiamo come il sito di splicing al 5’ e il sito di splicing al 3’ abbiano sequenze differenti. Le sequenze di splicing degli introni canonici, invece, hanno delle sequenze canoniche conservate. Il sito di splicing 5’ per gli introni minori, anziché avere un GU, ha un AU e il sito di splicing 3’ ha un AC. Questo è il motivo per il quale lo spliceosoma minore viene chiamato AT-AC. I siti di taglio riconosciuti sono AU al 5’ ed AC al 3’ che corrispondono, sul DNA, rispettivamente ad AT ed AC. Nonostante i siti di taglio siano diversi, il processo e lo spliceosoma sia differente nelle sue componenti, vediamo che il meccanismo di splicing è lo stesso. Il meccanismo chimico è sempremcon le due reazioni di transesterificazione, la prima che parte dall’A che colpisce il sito di splicing al 5’ e la seconda che usa l’estremità 3’OH libera dell’esone liberato sul sito di splicing 3’ sono identiche con la sola differenza che le sequenze ai siti di splicing sono diverse. U11 riconosce il sito di splicing al 5’, U12 il punto di ramificazione ed anche in questo caso abbiamo una triade U4, U5, U6 che si associa alle snurp legate al sito di splicing 5’ e al punto di ramificazione. Avvicinando il sito di splicing 5’ al sito di ramificazione si arriva poi alla forma attivata dello spliceosoma con l’uscita di U4. La forma attiva ora catalizza le reazioni di transesterificazione. SPLICING ALTERNATIVO Lo splicing alternativo è piuttosto frequente nei geni umani ed offre il vantaggio di avere l’opportunità che un singolo gene possa dare origine a prodotti diversi. Da un unico pre-mRNA sottoposto a diversi splicing alternativi ottengo diversi mRNA e prodotti proteici differenti. Molti geni negli eucarioti superiori codificano RNA che vengono tagliati e processati generando due o più RNA diversi e quindi più prodotti proteici, chiamati, poi, isoforme. Generalmente i prodotti alternativi sono due ma si può arrivare anche ad un centinaio. Nella drosophila vi è un gene che arriva a produrre anche migliaia di prodotti alternativi. Nella maggior parte dei casi il processo di splicing alternativo è finemente regolato in modo da produrre prodotti diversi in base ad istotipi cellulari diversi o in base a stimoli differenti. Questo splicing è accuratamente regolato. Nella slide vediamo un esempio per il gene della Troponina T. Le troponine sono delle proteine che troviamo a livello del muscolo scheletrico e cardiaco e sono importanti perché coinvolte nel meccanismo di contrazione muscolare. Dal gene della troponina vengono ottenute due isoforme, isoforma alfa ed isoforma beta. Queste due isoforme sono espresse a livelli diversi in base allo stadio di sviluppo del muscolo scheletrico. La troponina beta la troviamo espressa a livello fetale, mentre l’alfa viene ad essere prodotta in fase più tardiva di sviluppo. Grazie a questo meccanismo di splicing alternativo ho che, per quanto riguarda l’mRNA della alfa troponina T, è stato saltato l’esone 4. L’mRNA processato della troponina T beta ha, invece, gli esoni 1, 2, 4 e 5 e manca del 3. Questi mRNA differiscono, seppur entrambi mancanti di un esone, per l’identità dell’esone di cui ognuno è stato privato. Lo splicing alternativo può avvenire anche attraverso altri meccanismi: ATTENZIONE: l’esone saltato nel caso dello splicing alternativo è qualcosa di voluto e non un errore!!! Il trascritto primario dell’immagine è formato da tre esoni intervallati da due introni. 1. Posso avere la rimozione di entrambi gli introni secondo un meccanismo di splicing normale. 2. Posso avere un esone saltato. Il sito di splicing al 5’ di un introne si combina con il sito di splicing di un introne successivo a valle (non è un errore). 3. Esone esteso à esistono siti criptici vantaggiosi che ci permettono di produrre RNA alternativi. Si ha la combinazione dei tre esoni ma uno di questi è esteso perché comprende anche una porzione intronica. 4. Introne mantenuto. 5. Esoni alternativamente eliminati, come per la troponina. Regolazione dello splicing alternativo mediante attivatori o repressori Sia gli enhancer che i silencer e gli attivatori e repressori che li legano sono importanti per dirigere il macchinario di splicing su molti esoni, anche quando non c’è splicing alternativo. Quindi, sia lo splicing canonico che quello alternativo necessitano di essere regolati, mediante attivatori o repressori di splicing. Gli attivatori o repressori di splicing sono delle proteine che legano l’RNA riconoscendo dei siti specifici sull’RNA e andando in questo modo ad attivare o reprimere lo splicing. Gli attivatori di splicing si legano a siti specifici sull’RNA chiamati enhancer, mentre i repressori sui silencer. Ricordiamo inoltre che questi siti si possono trovare sia a livello degli esoni che degli introni. I repressori reprimono quindi lo splicing sui siti di splicing adiacenti, mentre gli enhancer sono riconosciuti dagli attivatori che vengono, legando componenti dello spliceosoma, a promuovere lo splicing nei siti di splicing adiacenti (quindi, gli attivatori vanno a dirigere il macchinario di splicing sui siti di splicing adiacenti agli enhancer, mentre i repressori non vanno a reclutare/dirigere lo spliceosoma nei siti adiacenti, inibendo in questo modo lo splicing stesso). In questa immagine ci viene descritto il meccanismo d’azione degli attivatori e dei repressori di splicing (che è equiparabile sia nella regolazione dello splicing canonico che di quello alternativo). Il primo caso (a) riguarda il meccanismo di funzionamento di un repressore di splicing (proteina che riconosce sequenze specifiche sul pre-mRNA e ne va a reprimere lo splicing), mentre il secondo caso (b) rappresenta il processo di un attivatore di splicing (proteina che permette di reclutare alcuni componenti dello spliceosoma direttamente presso i siti di splicing). Entrambi i casi sono suddivisi tra tipo cellulare I, in cui la proteina regolatrice non è presente, e tipo cellulare II, in cui essa è presente a. Nel tipo cellulare I abbiamo il nostro trascritto primario di RNA e adiacente o parzialmente sovrapposto al sito di splicing si trova il sito repressore (silencer). Non avendo nessun repressore (in questo tipo cellulare non viene espressa questa proteina) che viene prodotto, lo spliceosoma si può formare in questo sito di splicing (che, come possiamo notare, si sovrappone al sito silencer) e può rimuovere l’introne. Ottengo quindi un mRNA che è stato processato normalmente tramite lo splicing (lo splicing non è stato inibito perché non c’è nessun repressore che riconosce il silencer, il quale viene appunto ad essere sovrapposto ai siti di splicing a livello di questo introne). Nel tipo cellulare II, invece, il repressore è prodotto (viene espresso). Esso riconosce quindi il sito repressore (silencer), adiacente o parzialmente sovrapposto al sito di splicing, ci si lega e, in questo modo, impedisce allo spliceosoma (o alcuni suoi componenti) di venir reclutato e di riconoscere il suo sito di splicing specifico (questo a causa di un ingombro sterico). In questo modo, l’RNA a livello di questo sito non è sottoposto a splicing. Tra l’altro, questi repressori sono delle proteine che hanno dei domini con i quali legano l’RNA, ma sono privi di domini che legano le componenti del macchinario di splicing. Quindi, hanno dei domini conservati per legarsi ai silencer dell’RNA, ma non hanno dei domini per l’interazione con i componenti dello spliceosoma e, quindi, in questo modo, non favoriscono il reclutamento degli stessi sui siti di splicing. Questi repressori di splicing sono delle proteine che fanno parte di una famiglia che si chiama hnRNP à sono quindi delle ribonucleoproteine nucleari eterogenee che hanno la capacità di legare l’RNA con dei domini conservati, ma non sono in grado di reclutare il macchinario di splicing perché, appunto, non hanno dei domini per il riconoscimento del macchinario di splicing; tuttavia, bloccano, come abbiamo detto, i siti di splicing specifici impedendo per ingombro (perché legano proprio dei siti adiacenti o sovrapposti al sito di splicing di interesse) il loro riconoscimento. b. Gli attivatori, invece, funzionano aiutando il reclutamento del macchinario di splicing nei siti di splicing adiacenti. Nel tipo cellulare I, ad una certa distanza dal sito di splicing è presente il sito attivatore (enhancer, in blu nell’immagine). In assenza di attivatore (in questo tipo cellulare non viene espresso à le proteine SR, infatti, possono essere inducibili, cioè espresse in seguito a dei segnali oppure in base all’istotipo cellulare), lo spliceosoma non viene reclutato nel sito di splicing adiacente e, quindi, in questo caso l’RNA non è soggetto a splicing a livello di questo sito. Nel tipo cellulare II, d’altro canto, in presenza dell’attivatore, questo riconosce l’enhancer e aiuta il reclutamento dello spliceosoma, o perlomeno di alcune sue componenti, a livello del sito di splicing, questo perché l’attivatore, a differenza del repressore, riesce proprio a interagire con i componenti dello spliceosoma e a portarli nei siti di splicing adiacenti. In realtà, gli attivatori li abbiamo già incontrati quando abbiamo parlato della definizione dell’esone come strategia messa in atto per evitare uno dei possibili errori di splicing, ossia il riconoscimento di siti non corretti, e sono infatti le proteine SR (che riconoscono sequenze all’interno degli esoni e, una volta legate, richiamano a destra e sinistra dell’esone stesso, presso i siti di splicing laterali, le nostre snRNP). Queste proteine sono degli attivatori dello splicing e possono essere costitutivamente espresse, indotte da stimoli oppure prodotte in base all’istotipo cellulare, come già detto, e sono importanti perché riconoscono gli enhancer, siti a livello esonico che permettono di attivare lo splicing e stimolarlo. Le proteine SR possiedono due domini (a differenza delle hnRNP): uno di legame all’RNA (all’enhancer, adiacente al sito di splicing) e uno, all’estremità carbossiterminale, di interazione con alcune componenti proteiche del macchinario di splicing (il sito che serve a interagire/dirigere con le componenti dello spliceosoma per portarli sui siti di splicing adiacenti è un sito conservato e si chiama dominio RS, questo perché ricco in arginina e serina), reclutando, quindi, in questo modo il macchinario di splicing nel sito di splicing adiacente. Come esempio di repressori, invece, come già detto, abbiamo ribonucleoproteine nucleari eterogenee (hnRNP), le quali fungono appunto da repressori di splicing. Anche queste proteine hanno un dominio che lega l’RNA, ma non hanno un dominio con cui possono interagire con le altre proteine. Regolazione dello splicing Sia attivatori che repressori riconoscono, come già detto, specifiche sequenze sull’RNA, rispettivamente enhancer e silencer. Questi siti si trovano sia a livello degli esoni che a livello degli introni; quindi, ho, per gli attivatori ESE (Exonic Splicing Enhancer) e ISE (Intronic Splicing Enhancer), mentre per i repressori ESS (Exonic Splicing Silencer) e ISS (Intronic Splicing Silencer). Nell’immagine possiamo vedere in verde gli introni con indicati il sito di ramificazione e di splicing 3’ nell’introne a monte e il sito di splicing 5’ dell’introne a valle e poi abbiamo l’esone in mezzo ai due introni. In arancione e in viola sono invece indicate rispettivamente le sequenze enhancer e silencer. Nel caso dell’esone abbiamo un enhancer, che viene riconosciuto dall’attivatore che si chiama SR, e in viola il silencer che viene riconosciuto dal repressore che si chiama hnRNP. L’enhancer, quindi, viene riconosciuto dalla proteina SR, la quale, come vediamo dalle frecce, interagisce con le proteine U2 e U1 rispettivamente al sito di splicing 3’ dell’introne a monte dell’esone e al sito di splicing 5’ dell’introne a valle dell’esone dove la proteina SR è legata e, in questo modo, con un meccanismo che abbiamo già visto quando abbiamo parlato della definizione dell’esone, interagendo tramite il suo dominio RS con queste proteine, aiuta il reclutamento nei siti di splicing adiacenti. hnRNP, invece, che interagisce con il suo silencer sull’esone, non è in grado di interagire con U2 e U1 (ecco perché c’è una barretta al posto della freccia) proprio perché gli manca il dominio per l’interazione con questi componenti. Quindi, si lega e impedisce a livello esonico il reclutamento di queste proteine nei siti di splicing adiacenti sugli introni a monte e a valle dell’esone stesso. Ma, come già detto, questi enhancer e silencer si possono trovare anche sugli introni stessi à prendiamo ad esempio l’introne a monte, dove troviamo un enhancer e un silencer, i quali vengono anch’essi riconosciuti dagli stessi attivatori e repressori (SR e hnRNP). Il meccanismo è sempre lo stesso, cioè il nostro enhancer intronico riconosce la proteina SR, la quale può interagire e aiutare il reclutamento della snRNP nel sito di splicing adiacente (in questo caso con la U2 nel sito di splicing 3’ adiacente; nell’altro introne andrebbe ad aiutare con il reclutamento di U1 con il sito di splicing 5’). Viceversa, l’hnRNP, come al solito, si lega ma non aiuta con il reclutamento di U2 (nel caso di questo introne) o di U1 (nel caso dell’introne a valle) a livello dei siti di splicing corrispondenti. Editing Un altro meccanismo di modifica dell’RNA è quello che viene chiamato EDITING. Editing dell’RNA • È un’alterazione delle sequenze nucleotidiche dei trascritti di RNA una volta che sono stati sintetizzati mediante deamminazione sito-specifica o inserzione o delezione di uridina diretta da RNA guida • Meccanismi di editing dell’mRNA (negli animali, specialmente nei mammiferi) o Deamminazione dell’adenina a inosina (editing da A a I) o Deamminazione della citosina a uracile (editing da C a U) Questi sono i due meccanismi più frequenti, ma sono comunque degli eventi rari NB: L’altro tipo di editing (inserzione o delezione di uridina diretta da RNA guida) è, invece, molto comune a livello dei mitocondri di Trypanosoma (è quindi un caso molto specifico, per cui non andremo a descriverlo) Deamminazione sito-specifica Negli animali, quindi, e specialmente nei mammiferi, può avvenire più frequentemente la deamminazione sito-specifica à questa deamminazione, come vediamo nell’immagine, può riguardare le basi della citosina e dell’adenina per produrre rispettivamente uracile e inosina. In particolare, nel primo caso (a) si ha che la citosina viene ad essere deamminata ad opera di un enzima che si chiama citidina deamminasi, che converte, appunto, la citosina in uracile (non fa altro che rimuovere il gruppo amminico della citosina, che diventerà quindi un uracile). Nel caso dell’adenina, invece, si ha sempre una deamminazione e interviene l’enzima ADAR, che converte l’adenina in inosina (riconosce delle adenine e viene a rimuovere il gruppo amminico, trasformando perciò l’adenina in una inosina). Esempio di editing dell’mRNA mediante deamminazione sitospecifica: apolipoproteina umana Vediamo un esempio del primo caso, cioè della conversione della citosina in uracile à è un evento non così frequente negli animali e l’esempio più noto è quello dell’editing dell’mRNA mediante deamminazione sitospecifica per l’apoliproteina B nei vertebrati (compreso l’uomo). Qui possiamo osservare il pre-mRNA e viene indicato il codone 2153 (ricordiamo che gli RNA vengono letti in codoni/triplette durante la traduzione), che si trova all’interno dell’esone 26 à questo codone contiene la sequenza CAA. Il pre-mRNA verrà quindi ad essere naturalmente maturato a mRNA, il quale può poi praticamente avere due possibilità in base al tipo di tessuto di cui stiamo parlando: • A livello epatico non si ha editing su questa citosina appartenente all’esone 26 e quindi l’mRNA, quando viene prodotto, produce una proteina full length (cioè intera) di 4563 aa, dove il codone 2153 con la citosina, che non ha subito fenomeni di editing, codifica/specifica per la glutammina • A livello intestinale, invece, dove avviene questo processo di deamminazione, accade che la citosina viene convertita ad uracile (ad opera della citidina deamminasi) e quindi il CAA si trasforma in UAA, il quale rappresenta un codone di stop prematuro (prematuro perché non è alla fine del nostro messaggero, ma sta in mezzo). Quindi, quando il nostro mRNA viene tradotto, non viene tradotto completamente come avveniva a livello epatico, ma viene ad essere tradotto fino a questo codone di stop prematuro e questo determina una proteina molto più corta, di 2153 aa In questo caso, quindi, il risultato sono due isoforme di apolipoproteina à una full lenght a livello epatico (dove la citidina deamminasi non è attiva) e una più corta a livello intestinale (dove l’enzima è invece attivo). Ricordiamo che l’apolipoproteina serve per il trasporto dei lipidi e quindi è coinvolta nel loro metabolismo à questa diversa lunghezza ne determina, tra l’altro, una diversa funzione. In particolare, l’apolipoproteina umana a livello epatico serve per trasportare il colesterolo e i trigliceridi endogeni a livello cellulare, mentre, invece, a livello intestinale, l’apolipoproteina umana più corta si occupa sempre di trasportare i lipidi, ma quelli che noi introduciamo con la dieta, ai diversi tessuti. Meccanismo di editing da A a I nei mammiferi Un altro tipo di meccanismo, diffuso soprattutto nei pre-mRNA dei mammiferi e soprattutto dell’uomo, è l’editing da adenina ad inosina (e questo avviene ad opera dell’enzima ADAR). In questo caso, l’enzima ADAR viene ad agire su pre-mRNA nucleari (prima che il loro processamento sia completato). In particolare, l’enzima lavora su adenine specifiche che fanno parte di RNA a doppio filamento che nasce da regioni complementari, in particolare in questo esempio si ha una regione esonica (in rosso) e una intronica (in verde), che si appaiano e questa regione (struttura a stem-loop) viene poi riconosciuta in maniera specifica dall’enzima ADAR. Questo editing si può avere anche su regioni ripetute e invertite che si possono appaiare tra di loro. Uno degli eventi di editing maggiormente conosciuto della tipologia A-I è quello che riguarda il canale ionico AMPA à in questo caso, l’enzima ADAR viene proprio ad agire su un pre-mRNA nucleare prima che venga completato il processamento ed agisce su un RNA a doppio filamento dell’esempio prima descritto (cioè su un RNA a doppia elica creato dall’appaiamento di una regione esonica complementare ad una intronica) e contenente l’adenina su cui l’enzima deve agire. In particolare, in questo caso, l’editing riguarda soprattutto il codone CAG (l’adenina si trova all’interno di questo codone), a carico del quale avviene appunto questo fenomeno di editing da A a I. CAG codifica per la glutammina e questa deamminazione porta alla conversione da CAG a CIG, il quale è praticamente “sinonimo” del codone CGG, che codifica per l’arginina. Quindi, alla fine, questo editing da A a I su questo codone determina una differente sequenza amminoacidica, perché in quella posizione avrò l’arginina al posto della glutammina. Questa modifica amminoacidica è molto importante perché va ad alterare la permeabilità che ha questo canale ionico al calcio, con conseguenze importanti sul funzionamento a carico soprattutto del cervello. Senza questa tipologia di editing, lo sviluppo del cervello è gravemente compromesso (una disregolazione di questo editing è alla base di diverse patologie neurologiche umane, come la depressione, l’epilessia o la schizofrenia), per cui è fondamentale avere questo editing. Traslocazione nucleo-citoplasmatica degli RNA Il trasporto dell’mRNA Il trasporto dell’mRNA avviene dal nucleo al citoplasma una volta che l’mRNA ha concluso il suo processamento, che vuol dire che si è dotato di un cap, di una coda poli-A e che gli introni sono stati rimossi (quindi, ha subito in ordine capping, splicing e poli-adenilazione) e quindi è pronto per essere traslocato/esportato dal nucleo al citoplasma. L’mRNA pronto ad essere esportato viene ad essere riconosciuto perché è associato a tutta una serie di proteine che abbiamo già visto in precedenza à in particolare, il cap è associato ad una proteina che si chiama CBC, la coda poli-A, invece, è riconosciuta dalle proteine specifiche che legano i tratti poli-A, le poly A binding proteins e, a livello dell’esone, abbiamo le nostre proteine SR, ovvero i nostri attivatori che rimangono comunque associati agli esoni quando hanno riconosciuto dei siti di legame a livello esonico. Inoltre, una novità è data dalle EJC (in viola nell’immagine). Complesso di giunzione degli esoni EJC sta per Exon Junction Complex ed è un complesso di quattro proteine responsabile del controllo della qualità dell’mRNA à sta a indicare che il nostro mRNA viene ad essere maturo e pronto per l’esportazione (una sorta di marker di qualità dell’mRNA che deve essere esportato dal nucleo al citoplasma à indica cioè che lo splicing è avvenuto correttamente e che, quindi, l’mRNA è pronto per la traslocazione appunto). EJC è depositato sull’mRNA dopo lo splicing, a monte di ogni giunzione esone-esone. Tra l’altro, queste proteine che abbiamo indicato prima, compreso l’EJC, accompagnano l’mRNA maturo fuori dal nucleo e nel citoplasma. Notiamo poi che, ovviamente, il passaggio avviene attraverso la membrana nucleare e, in particolare, attraverso i pori nucleari. Ricapitolando, l’mRNA è associato a un corredo di proteine che lo marcano, indicando appunto il suo destino, cioè che è pronto per essere traslocato dal nucleo al citoplasma perché ha subito il processo di maturazione completo. Queste proteine, come già detto, non abbandonano l’mRNA nel passaggio da nucleo a citoplasma, ma vengono cotrasportate insieme ad esso. Il trasporto attraverso la membrana nucleare avviene mediante una struttura specifica che si chiama complesso del poro nucleare, il quale permette il passaggio “naturale” passivo (senza alcun aiuto quindi) di molecole molto piccole, cioè intendiamo proteine o in generale molecole che hanno un peso al di sotto dei 50 kD. In tutti gli altri casi, invece, è necessario un trasporto attivo, quindi con consumo di energia, ed è quello che avviene anche per gli mRNA associati a tutte queste proteine. Ovviamente, l’mRNA maturo associato a tutte queste proteine non ha un peso inferiore ai 50 kD, è molto più pesante, quindi, riesce ad attraversare i pori nucleari attraverso un trasporto attivo, non riesce a trasferirsi in maniera semplice e senza consumo di energia. Ricordiamo poi che alcune delle proteine stesse associate all’mRNA contengono delle sequenze segnale di esportazione nucleare, quindi, sono delle sequenze che indicano alla cellula che quell’mRNA deve essere traslocato dal nucleo al citoplasma. Quindi, le stesse proteine associate all’mRNA (non tutte ma alcune di esse) contengono dei segnali di esportazione nucleare che vengono riconosciuti da dei recettori, chiamati recettori dell’esportazione, che guidano l’mRNA attraverso il poro stesso, aiutando il passaggio dell’mRNA dal nucleo al citoplasma. Una volta nel citoplasma, l’mRNA si spoglia di alcune di queste proteine, per esempio alcune SR vengono riportate dal citoplasma al nucleo, altre proteine, invece, rimangono associate, come la CBC che rimane associata al cap o le poly A binding proteins e anche le EJC rimangono associate. Quindi, queste proteine che l’mRNA si porta dal nucleo al citoplasma, in parte vengono a dissociarsi e vengono, con un meccanismo di trasporto attivo però inverso rispetto a prima, riportate nel nucleo in modo da essere riciclate per altri mRNA. All’mRNA nel citoplasma rimangono però associate comunque alcune proteine. Abbiamo detto che questo trasporto dell’mRNA richiede energia, in particolare, questa esportazione richiede l’idrolisi del GTP à esiste, in particolare, una GTPasi chiamata Ran, la quale, idrolizzando il GTP, regola questo trasporto. La proteina Ran, quindi, è una proteina che si trova infatti in due conformazioni differenti in base al fatto che leghi il GTP o il GDP; in questo modo, in base al tipo di conformazione, la proteina Ran viene a regolare il trasporto in un senso o nell’altro. In particolare, quando Ran è legata al GTP, oltre che al nostro cargo ovviamente, essa viene a rilasciare il suo cargo nel nucleo, quindi, è quello che avviene per le proteine che devono essere riportate nel nucleo. Quando, invece, Ran è legata al GDP (il GTP è stato idrolizzato), il movimento attraverso il poro nucleare è inverso, cioè c’è un meccanismo di esportazione (si ha una conformazione che favorisce/dirige il trasporto dal nucleo al citoplasma) ed è quello che si ha quando l’mRNA deve essere trasportato fuori dal nucleo. Un’altra cosa importante riguarda gli hnRNP, che sono i repressori dello splicing à si ritrovano spesso, ad esempio, negli introni escissi e sono in questo caso un segnale per far sì che quei pezzi di RNA intronici rimangano nel nucleo per venir degradati. Quindi, il corredo di proteine associato all’RNA determina il suo trasporto nel citoplasma o la sua ritenzione a livello nucleare. Perciò, non è tanto una singola proteina a marcare l’RNA e a segnare il suo destino, ma un corredo di proteine appunto. LA TRADUZIONE I punti principali di questo argomento sono: • Gli attori della traduzione: mRNA, tRNA, ribosomi • Il codice genetico • Inizio della traduzione in procarioti e eucarioti • Allungamento della traduzione • Terminazione della traduzione • Regolazione della traduzione Gli attori della traduzione RNA messaggero (mRNA) L’mRNA per gli eucarioti ha un cap 5’, una coda poli(A) che sono prerogative degli eucarioti, e ha vari esoni giuntati dopo lo splicing per rimozione degli introni. La regione dell’mRNA che specifica e codifica per la proteina è chiama ORF che sta per Open Reading Frame, è organizzata in una serie di codoni, cioè una serie di triplette di nt e ogni tripletta è specifica per un amminoacido e determina quindi l’ordine preciso dei diversi aa che compongono la nostra proteina. La traduzione quindi si realizza quando queste triplette vengono lette in successione senza sovrapposizione, ricordando che ogni codone codifica per uno specifico aa. L’ORF ha inizio sempre con un codone d’inizio e finisce sempre con un codone di termine, i codoni d’inizio per i batteri sono 3: - AUG à codifica per la metionina - GUG à codifica per la valina - UUG à codifica per la leucina Negli eucarioti invece abbiamo un solo codone d’inizio che è AUG, poiché quest’ultimo è sempre il più comune. Mentre i codoni di fine che segnano la fine della nostra traduzione sono 3 e sono comuni sia per i batteri che per gli eucarioti: - UAG - UAA - UGA Una ORF è quindi segnata da un inizio e da una fine da una di queste triplette d’inizio e da una di queste triplette di fine. Ma ORF non coincide con l’inizio e la fine dell’mRNA, poiché vediamo che a monte e a valle dell’ORF troviamo una regione non tradotta chiamata 5’ UTR ( UTR sta per Untraslated) e una regione 3’ non tradotta, quindi a monte e a valle dell’ORF ho queste due regioni che fanno da cuscinetti e che non vengono tradotte, ciò che serve per tradurre l’mRNA è l’ORF che si trova appunto ad essere in mezzo. La ORF è anche importante perché le varie triplette vanno lette una di seguito all’altra in maniera non sovrapposta e questo fa si che un codice di questo tipo permette di avere per un ORF 3 quadri di lettura che nell’immagine vediamo indicati con 1, 2 , 3. Con la freccia viene indicato l’inizio con cui si inizia a leggere la ORF. Dunque, quando ci troviamo davanti a un codice di questo tipo, non sovrapposto come ORF, formato da triplette successive l’una all’altra, io ho 3 potenziali quadri di lettura che danno esiti differenti e quindi ci mostra come andando ad avere un codone d’inizio ci permette di determinare la corretta cornice di lettura o reading frame, in base al quale ogni 3 residui nt inizia un nuovo codone. Nel primo caso si crea una cornice di lettura che permette di avere una sequenza specifica. Le lettere nell’immagine indicano i diversi amminoacidi che per convenzione possono essere indicati anche con la singola lettera. Nel secondo caso la cornice di lettura è cambiata completamente, gli aa sono differenti perché le triplette in successione, cambiando l’inizio di questa lettura, vengono ad essere modificate, così anche per il 3. Questo sta a indicare come sia importante avere una corretta cornice di lettura, trovando la AUG nella ORF che ci dà il la per un reading frame corretto. Il codice genetico È universale, è organizzato in codoni (3 nt) che vengono riconosciuti dagli anticodoni dei tRNA, ricordiamo infatti che ogni codone per essere tradotto deve essere riconosciuto dal tRNA e nella fattispecie da quella porzione di tRNA che si chiama anticodone e in questo modo il tRNA in base al codone che riconosce si porta un aa corrispondente durante la sintesi della nostra proteina. Esistono 64 possibili combinazioni per specificare 20 aa, questo perché dobbiamo considerare come si vede nella tabella la prima posizione del codone al 5’, la seconda e la terza posizione e abbiamo le 4 possibili basi nucleotidiche, facendo tutte le varie combinazioni del caso, ottengo ben 64 combinazioni possibili come si vede in grigio. Ma queste 64 combinazioni non specificano per 64 aa diversi, più che altro da questi 64 codoni ho la possibilità di specificare 20 aa differenti. Questo significa che ho più codoni diversi che codificano per uno stesso amminoacido, questi codoni che codificano per gli stessi aa sono chiamati SINONIMI e questo fenomeno viene chiamato DEGENERAZIONE, infatti, quando sentiamo dire che il codice genetico è degenerato ciò sta a significare proprio questo fenomeno, ovvero che i codoni che codificano per lo stesso amminoacido sono più di uno. Per esempio, vediamo che per la serina ne ho ben 4, così come per la prolina, per la leucina ne ho 2 e via dicendo. Da notare che la AUG codifica per la metionina, mentre invece in rosso sono indicati i 3 codoni di stop. I codoni sono sempre letti nella direzione 5’-3’, nell’ORF sono in successione e non si sovrappongono. Il codone d’inizio, ripetendo, determina il ritmo di lettura ovvero la cornice di lettura. Sull’mRNA ho il mio codone che viene letto in direzione 5’-3’ ed è riconosciuto dall’anticodone del tRNA che si appaierà ovviamente con le sue basi complementari al codone in direzione 3’-5’. Nella parte sotto della figura sono riportati i diversi codoni che specificano per ciascuno amminoacido, oltre alle triplette di stop e i nomi degli amminoacidi con la lettera che per convenzione li determina. Occorre sottolineare che un tRNA per lo stesso amminoacido può riconoscere diversi codoni utilizzando quello che viene chiamato appaiamento tentennante al 5’, cioè questa ultima posizione del codone o la prima dell’anticodone è chiamata posizione tentennante o appaiamento tentennante delle basi tra codoni e anticodoni. In questa base ho che nei batteri, ad esempio, quando nell’ultima posizione del codone ho una U, l’anticodone nella sua prima posizione in 5’ può avere in maniera differente un A, una G o una I; oppure se ho una C nell’ultima posizione del codone, questa si può appaiare con un anticodone che in 5’ ha una G o una I e così via. Questa possibilità della base tentennante, come si può vedere, ha più variabili, più combinazioni nei batteri. Negli eucarioti invece ha meno combinazioni ma comunque sono presenti, ad esempio la U si può appaiare con l’anticodone A, G o I o la C con una G o una I. Questa base tentennante è importante perché ci permette di avere un tRNA che porta lo stesso amminoacido che però è in grado di riconoscere codoni differenti sfruttando questo accoppiamento tentennante. Esempio di accoppiamento tentennante delle basi Nell’immagine abbiamo gli esempi di accoppiamenti tentennanti tra codone e anticodoneà inosina-citosina; inosina-uracile; inosina-adenina; guanina-uracile. In questo caso abbiamo un tRNA che ha un anticodone UCU e riesce ad appaiarsi con dei codoni diversi che però portano allo stesso amminoacido (questo esempio aiuta a capire il discorso dei codoni sinonimi) quindi abbiamo un tRNA che con lo stesso amminoacido riconosce con lo stesso anticodone codoni differenti che però sono sinonimi e quindi specificano per lo stesso amminoacido. Nell’esempio abbiamo due codoni differenti che vengono riconosciuti dallo stesso tRNA che porta allo stesso amminoacido arginina, questo perché AGA e AGG sono due sinonimi per lo stesso amminoacido e ciò è possibile perché la base è tentennante, data da questa U che può riconoscere senza problemi ed appaiarsi con l’ultima posizione del codone indipendentemente se questo è A o G. Oppure un altro esempio è la glicina che ha 3 codoni sinonimi, i quali differiscono tutti per la terza posizione poiché in uno c’è una U, nel secondo c’è una C e nel terzo una A e questi codoni sinonimi vengono riconosciuti tutti dallo stesso tRNA avente lo stesso anticodone che ha nella posizione tentennante l’inosina. Quest’ultima abbiamo visto che è una base molto variabile perché se nell’anticodone c’è l’inosina questa si può appaiare con la citosina, con l’uracile, con l’adenina. Quindi ancora una volta il tentennamento dell’ultima posizione del codone o della prima dell’anticodone, in base da quale punto di vista lo vogliamo prendere, permette di consentire di riconoscere tanti codoni diversi che codificano per lo stesso amminoacido. L’mRNA nei procarioti è chiamato mRNA policistronico perché è costituito da tante ORF una dietro l’altra, dove tra l’altro ogni ORF traduce per una diversa proteina, molto spesso queste ORF codificano per proteine che sono coinvolte nella stessa via metabolica (es. operone LAC). Nell’immagine vediamo riportato l’mRNA procariotico, quindi l’mRNA policistronico ovvero che ha ORF una dietro l’altra. Ogni ORF è determinata da un codone d’inizio e da un codone di stop. A monte di ogni ORF c’è una sequenza che viene chiamata RBS, questa sequenza RBS sta per Ribosome-Binding Site ed è il sito di legame del ribosoma. È una sequenza conservata, che si posiziona circa 3-9 basi prima rispetto a ciascun codone d’inizio. Questo RBS è molto importante perché come dice il suo nome serve per legare il ribosoma nella parte iniziale della traduzione. In particolare come vediamo in alto nell’immagine, questa sequenza RBS ha N che sta ad indicare un qualsiasi nt, mentre GGAGG è invece la sequenza conservata la quale è importante perché interagisce con le basi complementari di uno dei componenti del ribosoma, infatti il ribosoma è costituito da proteine ma anche da RNA ribosomiale (rRNA), in particolare nei procarioti l’rRNA 16S si appaia con questa sequenza RBS conservata, andando praticamente a creare degli appaiamenti di Watson e Crick e in questo modo si determina l’allineamento del ribosoma con l’inizio dell’ORF. Quindi è fondamentale questa RBS perché permette di legare il ribosoma e di allinearlo correttamente sul codone d’inizio. Questa sequenza RBS viene chiamata anche sequenza di Shine-Dalgarno. Negli eucarioti non abbiamo l’RBS e l’mRNA viene chiamato monocistronico perché abbiamo una sola ORF che ha il suo codone d’inizio e il suo codone di stop. Quindi, la prima differenza è che abbiamo negli eucarioti degli mRNA monocistronici quindi che hanno una solo ORF; un’altra differenza è che l’mRNA eucariotico ha un cap al 5’ e una coda poli-A e inoltre non c’è il RBS, infatti per l’mRNA eucariotico il ribosoma riconosce il cap al 5’ e da qui inizia la sua ricerca dell’AUG d’inizio. Dunque il cap al 5’ richiama il ribosoma, il quale inizierà a scorrere in direzione 5’-3’ fino ad incontrare il codone d’inizio AUG. In alcuni mRNA l’AUG d’inizio trova a monte una possibile base purinica e a valle dopo l’AUG d’inizio una guanina, questa viene chiamata sequenza KOZAK e non è comune a tutti gli mRNA ma è presente solo in alcuni mRNA eucariotici. La sequenza KOZAK non ha la funzione dell’RBS ma quando è presente aumenta l’efficienza di traduzione, in questo caso non perché le sequenze interagiscono con il ribosoma o col suo rRNA ma piuttosto perché viene ad interagire con il tRNA iniziatore, quest’ultimo è il primo tRNA (porta la metionina), quello che col suo anticodone si lega all’AUG d’inizio. RNA transfer (tRNA, RNA di trasferimento) Servono come adattatori tra mRNA e amminoacido, infatti nell’immagine abbiamo l’mRNA stilizzato con le triplette e notiamo che il tRNA è l’intermediario tra l’amminoacido che lui porta e l’mRNA, dove il tRNA va a leggere questo mRNA attraverso il suo anticodone. Questo tRNA quindi, da una parte lega l’amminoacido, dall’altra parte invece riconosce con quello che viene chiamato anticodone l’mRNA stesso, consentendo quindi di tradurre il messaggio contenuto nei codoni dell’mRNA in uno specifico amminoacido. Il tRNA è una molecola di circa 75-95 nt che viene ad avere una struttura comune a tutti i tRNA che viene rappresentata come un trifoglio. Questo trifoglio è caratterizzato da delle regioni specifiche, in particolare questo stelo accettore il quale ha una regione a doppia elica che è così chiamato perché all’estremità 3’ del singolo filamento verrà legato l’amminoacido. Quindi è chiamato così perché è il sito d’attacco dell’amminoacido. Da notare che questo stelo accettore in tutti i tRNA ha questa estremità 3’ a singolo filamento che termina con questa tripletta CCA alla quale verrà legato l’amminoacido specifico. Le altre regioni sono delle anse o dei stem loop o a forcina, che sono chiamate ansa D o ansa ΨU in funzione per l’appunto della presenza in queste anse di specifiche basi modificate. Infatti, il tRNA ha la presenza di numerose basi diverse rispetto a quelle canoniche, ad esempio l’ansa D viene così chiamata perché al suo interno ci sono numerose basi di diidrouridina, mentre l’ansa ΨU è così chiamata perché al suo interno ci sono delle basi di pseudouridina. Cosa sono queste diidrouridina e pseudouridina? Nell’immagine in alto a sinistra troviamo l’uridina, la pseudouridina (comune nell’immagine all’ansa in giallo) è un isomero dell’uridina, perché la differenza è che la base di uracile nell’uridina è attaccata al ribosio grazie al suo N1, mentre invece nella pseudouridina invece è attaccata al ribosio tramite il C5 dell’anello aromatico. Quindi, nella pseudouridina si tratta di isomeri, dove cambia il punto di attacco allo zucchero, nell’uridina è attaccato grazie all’N1 mentre nella pseudouridina grazie al carbonio 5. L’ansa D si chiama così invece perché presenta diidrouridina che confrontata con l’uridina deriva da una riduzione enzimatica del doppio legame tra il C5 e il C6. Oltre a queste basi, nel tRNA, esistono altre basi insolite come ad esempio la ipoxantina, la metilguanina o la timina che come sappiamo è una base prerogativa del DNA e non dell’RNA. Ritornando alla struttura del tRNA abbiamo poi un’altra ansa che è l’ansa variabile che si trova tra l’ansa ΨU e quella che viene chiamata ansa dell’anticodone, ed è chiamata variabile perché ha una lunghezza variabile che va dai 3 ai 21 nucleotidi. L’ultima ansa che sta opposta all’accettore è quella dell’anticodone che come dice il nome sta a significare che ha l’anticodone, ovvero i 3 nt, che sono in grado di appaiarsi con legami di Watson e Crick con il codone sull’mRNA, ed è importante proprio per lo specifico accoppiamento con il codone sull’mRNA. Riepilogandoà il tRNA ha una struttura secondaria che viene rappresentata per l’appunto come un trifoglio, è caratterizzata da uno stelo accettore con un’estremità a singolo filamento di 3 nt conservati CCA e alla A verrà poi caricato l’amminoacido. Le due anse ΨU e D vengono ad essere così chiamate perché hanno la presenza rispettivamente di pseudouridina che è un isomero dell’uridina e di diidrouridina che è una forma ridotta dell’uridina stessa. Si ha poi l’ansa variabile che è un’ansa dalla lunghezza variabile in base al tRNA e infine un’ansa chiamata dell’anticodone che è utile perché ha i 3 nt che aiutano il tRNA a riconoscere e quindi ad appaiarsi con le basi del codone sull’mRNA stesso. Inoltre, abbiamo anche detto che il tRNA contiene anche altri tipi di basi insolite come la ipoxantina, la metilguanina e la timina. Queste basi insolite non sono fondamentali per la funzione propria del tRNA però nelle cellule dove non sono presenti queste basi si è visto che queste cellule crescono più lentamente, quindi, questo ci sta ad indicare che queste basi migliorano la performance del tRNA anche se non sono fondamentali ma la loro presenza ci permette di migliorare la funzione del tRNA stesso. Per esempio, la ipoxantina si è visto che viene a svolgere un ruolo molto importante ad andare a riconoscere alcuni codoni da parte dei tRNA che la contengono, quindi aiuta in altre parole il tRNA a riconoscere i codoni. Se poi andiamo a vedere la struttura terziaria del tRNA, più che un trifoglio è una struttura che ha la forma ad L, dove appare chiaramente che lo stelo accettore dove viene caricato l’amminoacido è a un lato della molecola e dalla parte opposta della molecola c’è invece lo stelo dell’anticodone dove c’è il riconoscimento del codone sull’mRNA. Quindi nella realtà il tRNA non è un trifoglio ma è a forma ad L tridimensionale con queste due componenti che vanno da parte opposta. Anche il tRNA negli eucarioti subisce il processamento come abbiamo visto per il pre-mRNA. Il tRNA negli eucarioti viene trascritto da una polimerasi ben precisa che si chiama Pol III. Il prodotto del trascritto primario del tRNA presenta delle regioni che devono essere rimosse e tagliate, che sono riportate nell’immagine in giallo, ma il meccanismo di processamento è diverso rispetto a quello che abbiamo visto per il pre-mRNA. In particolare, in questo caso, il nostro tRNA viene per prima cosa processato alle sue estremità 5’-3’ perché queste regioni in giallo vengono tagliate da delle nucleasi, rispettivamente la ribonucleasi D che taglia all’estremità 3’ un piccolo filamento e la ribonucleasi P che taglia invece il frammento più grande all’estremità 5’ nel trascritto primario del tRNA. L’intermedio che però si ottiene non è ancora maturo ma viene sottoposto ad uno splicing che però non prevede l’intervento di uno spliceosoma ma di endonucleasi che vengono a tagliare questo introne (in giallo nell’immagine) e poi si ha una ligasi ATP dipendente che unirà le estremità generate, riformando il nostro intermedio quasi definitivo. Per cui nel processamento del tRNA eucariotico non abbiamo l’intervento di uno spliceosoma come abbiamo visto per il pre-mRNA e l’unico splicing che avviene non si realizza attraverso le reazioni di transesterificazione che abbiamo visto per i pre-mRNA ma avviene piuttosto attraverso una reazione di taglio ad opera delle endonucleasi che quindi rimuovono l’introne e una ligasi ATP dipendente che unisce le estremità che sono state rotte. L’intermedio che si ottiene poi non è ancora maturo e per diventarlo le basi devono essere modificate, abbiamo infatti detto che il tRNA presenta diverse basi atipiche e queste quindi vengono modificate dopo che sono state trascritte, inoltre oltre alla modifica delle basi, all’ estremità 3’ viene aggiunto il trinucleotide CCA che abbiamo visto essere fondamentale per caricare l’amminoacido, questo viene realizzato ad opera di una nucleotiltransferasi dedicata (tRNA nucleotil-transferasi) che provvede ad aggiungere questa estremità a singolo filamento CCA al 3’ del tRNA stesso. Riepilogando à Il tRNA, innanzitutto, viene trascritto da una polimerasi specifica detta Pol III e il processamento prevede come prima cosa un processamento delle estremità 5’ e 3’, rimuovendo queste parti del pre-tRNA ad opera della ribonucleasi P e D, poi in un secondo momento l’introne viene rimosso ad opera di una endonucleasi che realizza questo splicing senza però l’intervento di spliceosomi e le estremità vengono unite ad opera di una ligasi ATP dipendente. Infine, le basi vengono modificate chimicamente e viene aggiunto all’estremità 3’ il trinucleotide CCA. Il tRNA ha la sua estremità 3’ dove viene legato il suo amminoacido specifico, quando il tRNA è legato all’amminoacido viene chiamato amminoacil-tRNA oppure tRNA carico. Quando invece il tRNA è privo di amminoacido si parla di tRNA scarico. Spesso si può trovare il tRNA nominato anche in maniera più specifica, ovvero specificando l’amminoacido con cui è legato, per esempio se ho un tRNA legato con valina parlerò di valil-tRNA, oppure nel caso di un tRNA che lega la glicina si parlerà di glicil-tRNA. Quando, quindi, il tRNA è legato all’amminoacido parliamo di tRNA carico o amminoacil-tRNA e viene rappresentato, come si vede nell’immagine, con questo “pettine” dove i 3 denti rappresentano le basi del nostro anticodone e dalla parte opposta è legata all’estremità 3’del tRNA l’amminoacido (in rosso nell’immagine). Nello specifico viene ingrandito nella parte destra dell’immagine la parte dell’estremità 3’ dell’amminoacil-tRNA dove si può notare che l’amminoacido è legato al tRNA, in particolare all’adenina, formando questo legame tra il gruppo carbossilico dell’amminoacido e il gruppo ossidrilico dello zucchero dell’adenina (ricorda infatti che il tRNA termina all’estremità 3’ con l’adenina), in particolare l’amminoacido caricato usa o il 3’-OH dello zucchero dell’adenina oppure il 2’-OH. Quindi l’amminoacido può formare questo legame, che si chiama legame acilico tra il gruppo carbossilico dell’amminoacido e il gruppo ossidrilico in posizione 3’ o 2’ dello zucchero dell’adenina appartenente al tRNA. Questo tipo di legame, inoltre, è altamente energetico ed è un aspetto non banale perché l’idrolisi di questo legame consentirà l’energia utile per la formazione del legame peptidico tra questo amminoacido posto dal tRNA e la catena peptidica nascente che si sta sintetizzando durante la traduzione. Quindi il legame che si crea tra l’amminoacido e l’estremità 3’ del tRNA è un legame altamente energetico che verrà quindi idrolizzato per consentire di fornire l’energia utile per la formazione del legame peptidico tra l’amminoacido portato dal tRNA e la catena polipeptidica nascente. Il tRNA viene caricato col suo amminoacido ad opera di un enzima specifico che si chiama amminoacil-tRNA sintetasi, quindi, la formazione del tRNA carico è ad opera di un enzima che è l’amminoacil-tRNA sintetasi. Questo enzima carica il tRNA attraverso due passaggi: 1. Il primo passaggio è una adenililazione 2. Il secondo passaggio è il caricamento del tRNA Quindi perché io ottenga il tRNA carico con il suo amminoacido specifico ho bisogno dell’intervento dell’enzima che si chiama amminoacil-tRNA sintetasi, quest’ultimo carica il tRNA in due passaggi che sono l’adenililazione e il caricamento del tRNA. Cosa è l’adenililazione? Abbiamo l’amminoacido e il tRNA da caricare. L’adenililazione non è altro che una sorta di reazione di attivazione dell’amminoacido andando a legare all’amminoacido la AMP (adenina, ribosio e fosfato). Quindi nella reazione di adenililazione, l’amminoacido viene fatto reagire con una molecola di ATP permettendo il trasferimento di un AMP sull’amminoacido, quest’ultimo diventa un amminoacido adenililato. Si parla di adenililazione perché trasferisco sull’amminoacido una molecola di AMP (adenosina monofosfato). Diversa è la adenilazione che invece consiste nel trasferimento di una adenina, nel caso dell’adenililazione trasferiamo una molecola di AMP all’amminoacido con il rilascio di una molecola di pirofosfato che verrà poi idrolizzato dalla pirofosfatasi fornendo così l’energia per la seconda tappa. Quindi, il primo step è il legame dell’amminoacido con una molecola di AMP, presa ovviamente dall’ATP e rilasciando in questo modo pirofosfato che verrà poi idrolizzando a fosfato da una pirofosfatasi (legame ad alta energia). In cosa consiste il caricamento del tRNA? Si ha un trasferimento dell’amminoacido legato all’AMP all’estremità del tRNA, in particolare può essere legato o all’estremità 3’ OH del ribosio del tRNA o al 2’ OH sempre del ribosio del tRNA. Il risultato è quindi un amminoacido caricato sul tRNA, quindi un amminoacil-tRNA e si ha il rilascio di AMP. Quindi, in questo secondo step, l’amminoacido viene trasferito dall’AMP al tRNA, ottenendo l’amminoacil-tRNA finale e rilasciando l’AMP. Da notare che l’amminoacil-tRNA sintetasi per realizzare questi due step presenta nella sua struttura 3 siti di legame: 1. Per l’ATP 2. Per l’amminoacido 3. Per il tRNA Esistono inoltre 2 classi di amminoacil-tRNA sintetasi, che vengono indicate con i numeri romani, classe I e classe II. Ogni amminoacil-tRNA sintetasi è specifica per uno dei 20 amminoacidi. Quindi ciascuno dei 20 amminoacidi viene legato ai suoi tRNA da una singola tRNA sintetasi specifica, tant’è che come si vede nella tabella sottostante, sia quelli della classe II che quelli della classe I, ognuna sintetasi viene identificata in base al tipo di amminoacido di cui si occupa, ossia ogni tRNA sintetasi è specifica per un certo amminoacido, quindi abbiamo l’amminoacil-tRNA sintetasi che è specifica per caricare la gly sui tRNA, quella che invece si occupa dell’alanina ecc. Che differenza c’è tra quelli di classe I e quelli di classe II? La differenza sta nel fatto che gli enzimi di classe I vengono solitamente ad essere dei monomeri, ci sono solo due eccezioni di dimeri, la struttura quaternaria infatti indica per l’appunto che sono dei monomeri (indicate con la subunità α); inoltre un’altra differenza fondamentale della classe I è che vengono a legare l’amminoacido al 2’ OH del tRNA. Viceversa quelli di classe II hanno una struttura quaternaria più complessa, sono infatti dei tetrameri costituiti da una sola subunità o 2 subunità differenti (α e β) e hanno la capacità di legare l’amminoacido al 3’ OH del tRNA. Quindi quelli di classe I si occupano di legare l’amminoacido al 2’ OH del tRNA, quelli di classe II al 3’ OH del tRNA, i primi sono solitamente monomerici mentre i secondi sono solitamente dimerici o tetramerici. Bisogna poi ricordare che per uno stesso amminoacido io ho più codoni diversi e quindi avrò più tRNA diversi, le amminoacil-tRNA sintetasi caricano l’amminoacido a tutti i tRNA appropriati, ovvero quelli che vengono chiamati tRNA isoaccettori che sono tRNA che legano lo stesso amminoacido (hanno caricato lo stesso amminoacido) ma hanno anticodoni diversi, questo perché sappiamo che per ogni amminoacido ho più codoni diversi per cui ho tRNA differenti che quindi avranno anticodoni diversi ma che saranno caricati dall’amminoacil-tRNA sintetasi con lo stesso amminoacido. Ricapitolando à l’amminoacil-tRNA sintetasi è specifica per ciascun amminoacido e carica ciascun amminoacido per il quale lei è specializzata a tutti i tRNA appropriati, cioè a tutti quei tRNA che per esempio per l’arginina hanno anticodoni diversi ma che sono caricati con lo stesso amminoacido, appunto il tRNA isoaccettore. Quali sono gli elementi strutturali fondamentali del tRNA che permettono all’amminoacil-tRNA sintetasi di riconoscerlo? L’amminoacil-tRNA sintetasi si deve infatti confrontare con due problematiche importanti: 1. Deve innanzitutto riconoscere l’insieme dei tRNA specifici per l’amminoacido 2. Deve caricare questo amminoacido su tutti i tRNA isoaccettori Quindi deve riuscire a discriminare queste due cose, ovvero identificare l’insieme dei tRNA per uno specifico amminoacido e caricare lo stesso amminoacido su tutti i tRNA isoaccettori. Per quanto riguarda il primo punto, cioè riconoscere i tRNA per uno specifico amminoacido, intervengono degli elementi strutturali che sono fondamentali perché interagiscono per l’appunto con l’amminoacil-tRNA sintetasi stessa. In particolare gli elementi principali sono lo stelo accettore che viene praticamente ad interagire e ad essere la componente specifica che viene riconosciuta dall’amminoacil-tRNA sintetasi, in particolare appena dopo lo stelo accettore, appena inizia il singolo filamento prima del trinucleotide abbiamo una base discriminante e in alcuni casi la variazione di questa singola base viene a modificare la specificità di un tRNA da una sintetasi all’altra. Quindi uno degli elementi strutturali fondamentali è lo stelo accettore e in particolare per alcuni una singola base che può fare la differenza nel riconoscimento specifico dell’amminoacil sintetasi per un tRNA rispetto ad un altro. Altro elemento importante ma non in tutti è l’ansa dell’anticodone, che è un'altra regione del nostro tRNA che contribuisce alla specificità di riconoscimento da parte della tRNA sintetasi. La tRNA sintetasi può fare degli errori, anche perché la sua difficoltà maggiore non è tanto andare a riconoscere il tRNA sfruttando le parti specifiche di un tRNA ma piuttosto la difficoltà è selezionare l’amminoacido giusto da caricare sui vari tRNA isoaccettori. Consideriamo che l’amminoacil-tRNA sintetasi è piuttosto accurata perché fa 1:1000 tRNA caricato con un amminoacido errato. Questa accuratezza è assicurata dal fatto che l’amminoacil-tRNA sintetasi ha 3 siti, un sito di legame per il tRNA, uno per l’amminoacido e uno per l’ATP. Nell’immagine a lato possiamo vedere ad esempio che la sintetasi per la tirosina ha una tasca che accoglie la tirosina ma non riesce a legare la fenilalanina, in questo caso infatti la sintetasi per la tirosina è in grado di distinguerla dalla fenilalanina perché nella sua tasca forma un legame H molto forte con il gruppo ossidrile che troviamo nella tirosina ma che è assente nella fenilalanina. Quindi la possibilità della tasca di legame della sintetasi per la tirosina di formare questo legame H che può creare solo con l’ossidrile presente sulla tirosina gli permette di discriminare la tirosina con la fenilalanina che è molto simile. Dunque la tirosil-tRNA sintetasi riesce a discriminare questi due amminoacidi molto simili, in particolare la tirosina con la fenilalanina, perché con la tirosina forma questo legame H molto forte sfruttando questo gruppo OH che è d’altronde la differenza che c’è tra questi due amminoacidi. Così pure vediamo che la isoleucina e la valina differiscono per un metile e quindi in questo caso la valil-tRNA sintetasi viene ad avere nel suo sito catalitico la tasca molto ridotta e riesce ad accogliere la valina e non la isoleucina che a causa del metile è molto ingombrante. Quindi le dimensioni dei siti catalitici possono essere differenti e sono adattate all’amminoacido specifico che quella sintetasi deve legare. Quindi l’amminoacil-tRNA sintetasi ha tutte una serie di strategie che le consentono a livello dei suoi siti di legame per l’amminoacido di discriminare l’amminoacido corretto da quelli similari strutturalmente. Inoltre, alcune amminoacil-tRNA sintetasi hanno anche una sorta di sito di correzione che viene utilizzato sull’amminoacido legato all’AMP per verificare che sia effettivamente l’amminoacido corretto. Noi infatti sappiamo che l’amminoacil-tRNA sintetasi ha 3 siti di legame e che nella prima reazione entra nell’enzima l’ATP e l’AMP per fare avvenire il trasferimento dell’AMP sull’amminoacido (1° reazione di adenililazione) e nella reazione successiva entra nel sito attivo il tRNA e in questo momento l’enzima forza l’amminoacido legato all’AMP in una tasca di controllo che è adiacente al sito catalitico e questa tasca di controllo presenta un’attività idrolitica, che viene ad idrolizzare il legame tra l’amminoacido e l’AMP solo e solo se questo amminoacido non è corretto. Quindi è un controllo che l’amminoacil-tRNA sintetasi fa sugli amminoacidi che sono stati adenililati prima di caricarli sul tRNA. È un controllo che non avviene per tutte le amminoacil-sintetasi ma solo alcune hanno questa ulteriore capacità, per esempio la isoleucil-sintetasi (ha il gruppo metile) è una di queste. Immaginiamo che la isoleucil-sintetasi abbia legato come amminoacido la valina piuttosto che la isoleucina, in questo caso quando arriva il tRNA, questa valina viene forzata nella tasca di controllo della sintetasi, le cui dimensioni escludono l’accesso all’amminoacido corretto mentre consentono l’accesso per l’amminoacido correlato ma non corretto cioè per la valina. Quindi in questo sito idrolitico entra la valina legata erroneamente all’AMP ma non la isoleucina e viene idrolizzata e in questo modo si riesce attraverso un controllo idrolitico ad aumentare l’accuratezza di caricamento di circa 40000 volte. I Ribosomi Sono costituiti da 2 subunità, la subunità maggiore e la subunità minore. La subunità maggiore e quella minore sono presenti in entrambi gli organismi, sia eucarioti che procarioti. Il ribosoma eucariotico è chiamato 80S, mentre quello procariotico è chiamato 70S. Da notare che il ribosoma eucariotico 80S è costituito da subunità maggiore e minore chiamate rispettivamente 60S e 40S; mentre quello procariotico viene ad essere costituito dalla subunità maggiore 50S e dalla subunità minore 30S. Cosa sta ad indicare S? Con S si indica la velocità di sedimentazione che viene indicata come Svedberg, quindi S è l’unità di misura che viene usata per misurare la velocità di sedimentazione. Tanto più è alto il valore di S tanto più è maggiore è la velocità di sedimentazione e maggiore è la dimensione della molecola, questo perché il tasso di sedimentazione, quindi la velocità che mi serve per sedimentare una molecola sottoposta ad ultracentrifugazione, viene calcolato dividendo la velocità di sedimentazione (costante) per l’accelerazione applicata per far precipitare la particella d’interesse. Quindi maggiore è l’accelerazione che io applico, come ad esempio nel caso delle molecole più piccole, minore sarà il tasso di sedimentazione, perché questo tasso è dato dalla divisione detta precedentemente. Quindi 40S e 60S non stanno ad indicare il peso molecolare, tant’è che quando noi consideriamo il ribosoma nella sua interezza non mettiamo 100S ma indichiamo 80S, perché è sempre riferito alla velocità di sedimentazione necessaria per far precipitare la particella intera oppure le singole subunità. Ogni subunità consta di una combinazione di diversi rRNA e di proteine ribosomiali, per esempio la subunità 60S del ribosoma eucariotico consta di 3 rRNAà rRNA 5,8S di 160 nt; rRNA 5S di 120 nt ed rRNA 28S di 4700 nt + 49 proteine. La subunità inferiore invece consta di un altro rRNA che viene detto 18S di 1900 nt + 33 proteine. Nel caso delle subunità dei procarioti invece, abbiamo la subunità maggiore che ha come rRNA il 5S di 120 nt e l’rRNA 23S di 2900 nt + 34 proteine; mentre la subunità minore ha come rRNA il 16S di 1540 nt + 21 proteine. Da notare che anche in questo caso i diversi rRNA vengono identificati mediante la velocità di sedimentazione. Aspetto molto importante quindi è la composizione del ribosoma che è costituito da rRNA e da molte proteine, inoltre i primi contribuiscono sulla massa del ribosoma mentre i secondi contribuiscono ma in minime percentuali, basti pensare che 2/3 della massa del ribosoma è costituito da rRNA, questo perché le proteine ribosomiali sono molto piccole e perché un nucleotide pesa 330 Da e sia negli eucarioti che nei procarioti gli rRNA non sono corti anzi sono molto lunghi, per cui se noi andiamo a moltiplicare il numero di nt per il peso di un singolo nt, il risultato è che è molto più pesante quello ribosomiale rispetto a quello proteico. Infine, le subunità presentano dei centri molto importanti, quello della subunità maggiore viene chiamato centro peptidil trasnferasico, il centro dove si formano i legami peptidici. Mentre la subunità minore contiene il centro di decifrazione dove i tRNA carichi legano i codoni dell’mRNA. Modificazioni del pre-rRNA eucariotico Anche l’RNA ribosomiale viene trascritto come pre-RNA, ovviamente sempre a livello eucariotico, dove esiste una RNA polimerasi, la RNA pol 1, che è specializzata nella trascrizione degli RNA ribosomiali, o meglio, dei pre-rRNA. Il pre-rRNA, come vediamo nell’immagine, viene trascritto come un lungo precursore, chiamato 45S, lungo 13.000 nucleotidi. In questo caso, l’rRNA precursore, poi, per essere da lui prodotti gli rRNA maturi, deve innanzitutto subire una modifica chimica, che qui troviamo indicata con i triangoli e i pallini. La modificazione chimica a cui è soggetto questo rRNA precursore viene realizzata da delle particolari ribonucleoproteine, chiamate snoRNP. Modificazioni del pre-rRNA da parte degli RNA guida Queste snoRNP le vediamo in questa immagine e sono praticamente delle piccole ribonucleoproteine nucleolari (si trovano a livello del nucleolo) e vengono ad essere costituite da una componente proteica e una componente a RNA; quest’ultima è molto importante perché attraverso di essa la nostra snoRNP viene portata su posizioni specifiche sul nostro pre-rRNA, in cui lo snoRNA si appaia con le sue basi con quelle del pre-rRNA. Quindi, si dice che la snoRNA, cioè la componente a RNA della snoRNP, funziona da RNA guida, perché porta la nostra ribonucleoproteina in posizioni precise del prerRNA, appaiandosi con esse. Una volta che grazie a questi RNA guida lo snoRNP si è posizionato in punti precisi del prerRNA, la sua componente proteica provvede ad indurre la modifica chimica (i triangoli e pallini di prima) à il triangolo sta a indicare simbolicamente la metilazione a livello dell’ossidrile 2’-OH del ribosio (si produce, quindi, un nucleotide 2’-O-metilato); quindi, abbiamo una snoRNP che si occupa di introdurre questa modifica. Invece, l’altra snoRNP indicata in immagine si occupa di produrre una pseudouridina (è un isomero dell’uridina dove l’uracile è attaccato allo zucchero attraverso il suo C5, anziché a livello dell’azoto). Ritornando al nostro pre-rRNA, quindi, abbiamo capito che questo precursore 45S subisce delle modifiche chimiche ad opera di snoRNP. Successivamente, le parti introniche vengono rimosse/degradate ad opera di una serie di endonucleasi, che vengono proprio a tagliare queste componenti, a fare un’escissione di esse e degradarle. Rimangono solamente tre parti (in azzurro nell’immagine) che corrispondono a 3 dei 4 RNA ribosomiali tipici degli eucarioti (rRNA 18S, rRNA 5.8S, rRNA 28S). A completare questi RNA ribosomiali abbiamo anche l’RNA ribosomiale 5S che però viene prodotto altrove e, tra l’altro, anche da un’altra RNA polimerasi, non la pol I ma la pol III; inoltre, i suoi geni si trovano in una posizione del genoma diversa rispetto a quella che codifica per l’RNA ribosomiale precursore 45S. A questo punto, a livello del nucleolo, questi RNA ribosomiali vengono inglobati/aggregati con le proteine ribosomiali a creare la subunità minore e maggiore del ribosoma. In particolare, ricordiamo che nella subunità minore abbiamo rRNA 18S, mentre la subunità maggiore consta di ben 3 rRNA, cioè tutti gli altri. Il nucleolo: fabbrica che produce ribosomi Abbiamo detto che la zona della cellula che produce i ribosomi è il nucleolo à fa parte del nucleo • Esso è il sito di modificazione degli rRNA e del loro assemblaggio nelle subunità dei ribosomi • È un aggregato di macromolecole (appare in maniera più elettrondensa al microscopio elettronico): o geni per rRNA o pre-rRNA o rRNA maturi o enzimi per la modificazione degli rRNA (es. endonucleasi) o snoRNP o fattori di assemblaggio (ATPasi, GTPasi, proteine chinasi, RNA elicasi) o proteine ribosomiali o ribosomi parzialmente assemblati Eventi della traduzione: il ciclo ribosomiale Durante la traduzione, poi, abbiamo detto che il ribosoma è costituito da due subunità, quella minore e quella maggiore appunto. Questo ribosoma non rimane in questa forma assemblata tra queste due subunità per tutto il processo di traduzione, ma è una struttura dinamica, tant’è che si parla, durante la traduzione, di un vero e proprio ciclo ribosomiale. Il punto di partenza di questo ciclo è riportato nell’immagine con il numero (1) à la prima fase, quindi, è che la subunità minore si associ con il nostro mRNA da tradurre, che verrà riconosciuto a livello dell’AUG di inizio dal tRNA iniziatore (quel tRNA che con il suo anticodone si lega all’AUG di inizio). A questo punto arriverà la subunità ribosomiale maggiore e, una volta in cui si è formato il ribosoma completo, inizierà la fase di allungamento della traduzione, in cui il ribosoma inizierà a scorrere lungo l’mRNA, spostandosi di codone in codone e i diversi tRNA carichi, o amminoaciltRNA, andranno a inserirsi uno dopo l’altro nei siti di decifrazione e nel sito peptidil-transferasico del ribosoma. Ricordiamo, infatti, che l’amminoacil-tRNA deve entrare nel sito di decifrazione perché è il sito dove il tRNA con il suo anticodone si lega al codone specifico sull’mRNA e, poi, una volta che è arrivato, il sito peptidil-transferasico (che si trova nella subunità maggiore) permette di formare il nuovo legame peptidico tra la catena polipeptidica nascente e il nuovo amminoacido portato dal tRNA carico appena entrato nel sito di decifrazione. Quindi, questo processo avviene in modo tale che tutti i codoni vengano ad uno ad uno letti e quindi il ribosoma si sposta in maniera successiva da un codone all’altro e i diversi tRNA carichi vengono inseriti uno dopo l’altro per poter riconoscere il codone specifico sull’mRNA e recare l’amminoacido che verrà aggiunto alla catena polipeptidica nascente a livello del sito peptidiltransferasico. Una volta che il ribosoma arriva a leggere il codone di stop, la traduzione termina, la subunità maggiore e minore si dissociano e vengono rilasciati la catena polipeptidica neo-sintetizzata, il tRNA e l’mRNA (che può quindi riprendere il ciclo di traduzione un’altra volta). È da notare che tutti questi movimenti sono coadiuvati da dei fattori importanti che intervengono per aiutare e supportare questi eventi sia nella fase iniziale della traduzione, che nell’allungamento e nella terminazione (lo vedremo più avanti). Poliribosoma Inoltre, altro elemento molto importante è il fatto che il ribosoma può sintetizzare un singolo polipeptide alla volta, ma l’mRNA (o meglio, la sua ORF) può essere simultaneamente tradotto da più di un ribosoma à tant’è che si parla di un mRNA associato a più ribosomi, chiamato poliribosoma o polisoma. In particolare, vediamo che nell’immagine per semplicità viene indicato un mRNA che ha una singola ORF (quindi è un mRNA eucariotico, ma questo avviene anche sulle diverse ORF nei procarioti), ovvero la regione che codifica/traduce per una proteina e che ha un AUG di inizio e un codone di stop. Come possiamo vedere, nel momento in cui si ha un ribosoma, esso parte, inizia a tradurre e nel frattempo, essendosi liberato l’AUG di inizio, esso può essere riconosciuto da un secondo ribosoma e, quindi, in serie, ho vari ribosomi che simultaneamente traducono il mio mRNA. Questa capacità di più ribosomi di tradurre un solo mRNA, inoltre, ci fa anche capire come mai nella cellula l’mRNA è effettivamente presente in una quantità limitata (siamo tra l’1 e il 5% dell’RNA totale circa) à questo ha senso perché un singolo RNA può essere tradotto contemporaneamente da più ribosomi appunto. Consideriamo poi che in questo mRNA associato a più ribosomi, o poliribosoma, ho che ogni ribosoma crea dei contatti con l’mRNA per circa 30 nucleotidi; considerando poi, inoltre, che il ribosoma non è piccolo ma ha dimensioni piuttosto elevate, questo fa sì che un ribosoma si posiziona circa ogni 80 nucleotidi. Quindi, ad esempio, una ORF di 1000 basi, che di solto ci permette di codificare una proteina intorno ai 35 kD, può essere associata a ben più di 10 ribosomi e quindi portare alla sintesi di più di 10 catene polipeptidiche contemporaneamente. I tre siti di legame per il tRNA nel ribosoma Il ribosoma presenta tre siti di legame, quindi, tra la subunità maggiore e minore esistono tre siti di legame che vengono identificati dalle lettere A, P ed E. Quindi, nel ribosoma ho tre siti di legame per accogliere il tRNA. • Nel sito A viene accolto l’amminoacil-tRNA, ossia il tRNA carico, legato all’amminoacido che deve essere aggiunto alla catena polipeptidica che si sta sintetizzando. Infatti, tra l’altro, alla base del sito A, abbiamo il centro di decifrazione. • Successivamente, abbiamo che nel sito P, invece, si posiziona il peptidil-tRNA, cioè il tRNA che praticamente reca la catena polipeptidica nascente che si sta allungando. • Il sito E, infine, è quello per legare il tRNA scarico, che quindi viene rilasciato nel momento in cui la catena polipeptidica nascente viene trasferita all’amminoacil-tRNA/al nuovo amminoacido legato al tRNA. Struttura tridimensionale del ribosoma 70S con tre tRNA legati In particolare, in questa immagine possiamo vedere la struttura tridimensionale del ribosoma 70S e vediamo che vengono indicate le diverse componenti sia proteiche che di rRNA del ribosoma, nonché i tre tRNA legati ai tre siti del ribosoma. Da quest’immagine, tra l’altro, riceviamo un’informazione molto importante, cioè che le proteine ribosomiali sono distribuite verso l’esterno del nostro ribosoma, delle nostre due subunità; invece, le componenti ad rRNA sono verso l’interno de ribosoma e sono infatti gli rRNA che avvolgono, che costituiscono il centro peptidiltransferasico, che si trova nella subunità maggiore tra il sito P ed A e il centro di decifrazione, che si trova nella subunità minore a livello della parte basale del sito P ed A. in entrambi i casi, quindi, i centri sono costituiti da rRNA e le proteine hanno una distribuzione verso l’esterno del ribosoma, la loro funzione è più strutturale. Il canale di uscita della catena polipeptidica nella subunità 50S Inoltre, il ribosoma presenta anche dei canali, perché deve avere un canale di entrata e di uscita dell’mRNA che deve essere letto e un canale dove esce la catena polipeptidica. Nell’immagine vediamo la subunità maggiore 50S e quella minore 30S e in verde e in rosso sono rappresentati i canali (in rosso quello di uscita per la catena polipeptidica che viene sintetizzata durante la traduzione). È da notare che il canale per l’mRNA scorre nella subunità minore del ribosoma e che permette di far entrare e uscire l’mRNA. Viene ad essere un canale che non è molto largo, consente di far entrare un RNA che non ha strutture secondarie e questo ha un senso perché il nostro ribosoma quando scorre deve avere un RNA con basi libere e non impegnate in strutture secondarie, perché deve leggere l’mRNA e i suoi codoni uno ad uno, in quanto i codoni devono essere riconosciuti dall’anticodone dell’amminoacil-tRNA. Inoltre, vediamo che in questo canale di passaggio dell’mRNA abbiamo tra il sito A e P una piccola piega, quindi l’mRNA, passando attraverso questo canale, subisce una piccola piega à essa è molto importante perché consente di distinguere chiaramente i codoni del sito A da quelli del sito P. Altra cosa molto importante è che anche il canale di uscita della catena polipeptidica, che si trova, invece, nella subunità maggiore del ribosoma, è un canale non di dimensioni elevate e che quindi riduce i possibili ripiegamenti che può fare la catena polipeptidica. In questo canale, infatti, la catena può, ad esempio, formare la struttura ad alfa-elica, ma non è in grado, per mancanza di spazio, di assumere strutture secondarie o addirittura terziarie più complesse (per esempio, non riesce a formare beta-foglietti o interazioni terziarie più complicate che, quindi, vengono a crearsi solo dopo che la catena polipeptidica è uscita dal canale o addirittura, per le strutture tridimensionali/terziarie, quando la traduzione è terminata e l’intera proteina è stata neosintetizzata). Incorporazione di un amminoacido in una proteina: reazione peptidiltransferasica Un nuovo amminoacido viene incorporato alla catena polipeptidica nascente attraverso quella che viene chiamata reazione peptidiltransferasica. Affinché avvenga questo nuovo legame peptidico tra la catena polipetidica nascente e l’amminoacido abbiamo bisogno del ribosoma. • I nuovi amminoacidi vengono attaccati all’estremità C-terminale della catena polipetidica nascente (sintesi della proteina dall’ammino-terminale al carbossi-terminale) durante la fase di allungamento • I legami peptidici si formano mediante trasferimento della catena polipeptidica nascente da un tRNA all’altro (la catena polipeptidica nascente viene trasferita dal peptidil-tRNA all’amminoacil-tRNA in entrata) Quindi, affinché questa reazione avvenga, sia il polipeptide nascente che il nuovo amminoacido sono associati a dei tRNA e allocati in uno dei siti fondamentali del nostro ribosoma à nell’immagine vediamo sia il sito A (con l’amminoacil-tRNA) che il sito P (con il peptidil-tRNA). Il legame tra il nuovo amminoacido e la catena polipeptidica nascente prevede quindi un attacco nucleofilo del gruppo amminico del nostro amminoacido attaccato al tRNA dell’amminoacil-tRNA sul gruppo carbonilico dell’amminoacido legato al tRNA del peptidil-tRNA (sintesi della proteina dall’ammino-terminale al carbossiterminale). È da notare che, nel momento in cui questo gruppo amminico colpisce questo gruppo carbonilico all’estremità carbossi-terminale appunto, vediamo che il legame tra la catena polipeptidica nascente e il tRNA viene rotto à questo legame tra il tRNA e la catena polipeptica o l’amminoacido è un legame acilico e, quindi, ad alta energia; perciò, la formazione del legame peptidico è sostenuta dalla rottura di questo legame acilico (nel sito P). Il risultato è che la catena polipetidica nascente viene praticamente ad addizionarsi sull’amminoacil-tRNA e perciò sul nuovo amminoacido; quindi, come già detto, i legami peptidici si formano attraverso un trasferimento della catena polipetidica nascente da un tRNA all’altro e, in particolare, dal peptidil-tRNA all’amminoacil-tRNA in entrata. La fase successiva, poi, sarà quella in cui questo peptidil-tRNA con addizionato il nuovo amminoacido si sposta dal sito A al sito P, mentre il tRNA scarico (quello che prima si trovava nel sito P) viene forzato e spostato nel sito E, dal quale uscirà. Questa procedura avviene man mano che il ribosoma si sposta lungo l’mRNA di codone in codone. Inoltre, perché si possa realizzare questo tipo di reazione, è importante che le estremità 3’ di questi due tRNA siano vicine, quindi, che siano avvicinate nel ribosoma e siano posizionate a livello del centro peptidil-transferasico (dove viene catalizzata la formazione di questo legame peptidico) • Il ribosoma catalizza solo la formazione del legame peptidico e, in particolare, la componente che catalizza questa reazione è la sua componente a rRNA; questa reazione, infatti, avviene a livello del centro peptidiltransferasico (nella subunità maggiore ed è avvolto dall’rRNA appunto) In questa immagine vediamo che i tRNA, per semplicità, vengono indicati con dei numeri (secondo l’ordine in cui arrivano) à vediamo che il tRNA 3 è associato alla catena polipeptidica, quindi, rappresenta il nostro peptidiltRNA che è attaccato all’estremità carbossi-terminale della catena polipeptidica nascente. Arriva quindi il nuovo amminoacil-tRNA, indicato con il numero 4, con il tRNA sempre attaccato all’estremità carbossi-terminale dell’amminoacido. Avviene quindi la reazione prima descritta (dove si idrolizza il legame acilico ad alta energia e si forma il nuovo legame peptidico) e si arriva ad avere, alla fine, un nuovo peptidil-tRNA (il 4) con addizionato il nuovo amminoacido appunto (questo peptidil-tRNA si andrà poi a spostare, come già detto, nel sito P, liberando il sito A per poter far avvenire di nuovo questa reazione). Questa reazione appena vista ci fa capire ancora meglio come mai il ribosoma ha questi famosi 3 siti à la reazione peptidiltransferasica richiede che il ribosoma abbia per l’appunto 3 siti e, in particolare, questi 3 siti mi permettono di legare nel ribosoma, in contemporanea, i due attori, cioè i due tRNA. Successivamente, poi, abbiamo detto che il tRNA scarico verrà posizionato nel sito E, dove viene rilasciato il tRNA in seguito al trasferimento della catena polipeptidica nascente al nostro amminoacil-tRNA. Inizio della traduzione in procarioti ed eucarioti Schema riassuntivo degli eventi dell’inizio della traduzione Sia nei procarioti che negli eucarioti abbiamo che perché l’inizio della traduzione avvenga ha necessità di tre eventi principali, schematizzati nell’immagine. Innanzitutto, per iniziare la traduzione, ho bisogno di diversi attori à ho bisogno dell’mRNA, del ribosoma (dissociato in subunità minore e maggiore, non ho bisogno del ribosoma già completo ma che le due subunità siano dissociate), del tRNA iniziatore legato all’amminoacido che viene specificato solitamente dall’AUG d’inizio, che è la metionina. Quali sono però questi 3 eventi che si devono verificare per avere l’inizio della traduzione? • Innanzitutto, si ha l’associazione della subunità minore sull’mRNA, che è il primo step • Poi occorre che un tRNA carico, il cosiddetto tRNA iniziatore, deve essere posizionato nel sito P del ribosoma, dove troverà l’AUG di inizio a cui si legherà • Successivamente, il ribosoma deve posizionarsi esattamente sul codone d’inizio ed associarsi con la subunità maggiore, completando la struttura del ribosoma NB: l’esatto posizionamento del ribosoma sul codone d’inizio (è fondamentale che l’AUG di inizio venga a trovarsi nel sito P del ribosoma) è cruciale poiché fissa la fase di lettura per la traduzione dell’mRNA o meglio della sua ORF Questi 3 eventi avvengono sia nei procarioti che negli eucarioti, ma attraverso l’intervento di proteine che supportano e anche meccanismi specifici che differiscono tra i due. Inizio della traduzione nei procarioti Interazione rRNA 16S con RBS per posizionare l’AUG nel sito P Come abbiamo detto, l’inizio della traduzione, anche nei procarioti, prevede inizialmente il reclutamento della subunità minore sull’mRNA à questo avviene attraverso una sequenza, di cui abbiamo già parlato, che si chiama RBS, o sito di legame per il ribosoma, che troviamo sull’mRNA dei procarioti. Quindi, nell’mRNA dei procarioti, esiste a circa 3-9 nucleotidi a monte dell’AUG di inizio una sequenza conservata (AGGAG) chiamata sequenza RBS (o anche sequenza di Shine-Dalgarno). Questa sequenza è molto importante perché viene ad appaiarsi con la subunità minore del ribosoma e, in particolare, attraverso l’rRNA 16S, il quale viene ad appaiarsi (tramite appaiamenti di Watson e Crick) con questo sito sull’mRNA. È da notare che abbiamo diversi mRNA che non hanno una spaziatura adeguata (perché ricordiamo che per avere un corretto posizionamento del ribosoma sull’mRNA è necessario che questo sito di legame per il ribosoma si trovi 3-9 nucleotidi a monte dell’AUG di inizio) e che quindi producono un rallentamento nel processo di traduzione oppure, addirittura, ci sono degli mRNA procariotici privi di questo RBS e quindi vengono a reclutare il ribosoma con altri meccanismi; però, comunque, il meccanismo d’inizio della traduzione più frequente nei procarioti è quello con RBS. Questo appaiamento tra la sequenza RBS e l’rRNA 16S è molto importante sia per reclutare e portare il ribosoma sull’mRNA, ma anche per posizionare correttamente l’AUG di inizio, perché vediamo che, attraverso questa interazione, l’AUG di inizio si trova nel sito P à quindi ci permette di allineare il ribosoma sull’AUG di inizio in maniera corretta per dare poi avvio alla traduzione. Il primo amminoacil-tRNA deve entrare nel sito P L’inizio della traduzione è l’unico momento in cui un amminoacil-tRNA (tRNA iniziatore carico) entra direttamente nel sito P senza passare dal sito A. tRNA iniziatore carico = un tRNA caricato con una metionina modificata (fMet à una metionina che vede addizionata alla sua estremità N-terminale un gruppo formilico) e si lega direttamente alla subunità minore del ribosoma procariotico mediante la regione del sito P à questo tRNA si associa all’AUG, che è il codone di inizio più frequente, sia nei procarioti che negli eucarioti (nei procarioti possiamo avere molto spesso anche GUG, che però specifica per la valina; negli eucarioti si ha invece solo AUG come codone d’inizio). Quindi, il tRNA iniziatore viene caricato/addizionato inizialmente con la metionina e poi un altro enzima, che si chiama metionina-tRNA-transformilasi, aggiunge all’estremità N-terminale della metionina questo gruppo formilico. Questo tRNA iniziatore verrà poi ad essere addizionato come primo amminoacido nella traduzione. C’è però da aggiungere che l’estremità ammino-terminale della mia catena polipeptidica non inizia con questo amminoacido modificato, perché successivamente la porzione ammino-terminale delle proteine procariotiche vene modificata à infatti, il gruppo formilico viene proprio rimosso da una deformilasi, la quale ripristina la metionina iniziale appunto. Questo avviene durante o dopo la sintesi della catena polipeptidica. Tra l’altro, ci sono diverse proteine nei procarioti che non iniziano con la metionina, ma, addirittura, intervengono degli altri enzimi, delle peptidasi, che rimuovono la metionina e in più 1 o 2 amminoacidi diversi. INIZIO DELLA TRADUZIONE NEI PROCARIOTI L’inizio della traduzione nei procarioti comincia dalla subunità minore del ribosoma ed è catalizzata nei suoi step chiave da 3 fattori di inizio della traduzione che vengono ad essere specifici per i procarioti e che vengono indicati con l’acronimo “IF” (come riportato in tabella, proprio perché sono dei fattori coinvolti nell’inizio della traduzione). I tre fattori sono IF-1 IF-2 IF-3. (Si ricorda che le GTPasi sono enzimi in grado di legare e idrolizzare il GTP) Per iniziare un nuovo ciclo di traduzione le subunità maggiore e minore devono rimanere dissociate e questa dissociazione è assicurata grazie al legame di IF-3 alla subunità 30S. FORMAZIONE DEL COMPLESSO DI INIZIO DEI PROCARIOTI In questa immagine viene indicato come si forma il complesso di inizio dei procarioti. TAPPA 1: Tutto parte dalla subunità minore 30S, che deve rimanere dissociata dalla subunità maggiore 50S. In particolare, la subunità 30S viene riconosciuta da IF-3 e IF1, che si lega al sito A. Questo legame è particolarmente importante perché in questo modo la subunità non va ad associarsi alla subunità maggiore per la presenza di IF3 nel sito E ed il tRNA iniziatore non entra nel sito A, perché è impegnato nel legame con IF1. In questa prima tappa quello che avviene è un legame della subunità ribosomiale 30S a questi primi fattori di inizio. Nella fase successiva si lega mRNA, che viene posizionato a livello del sito P, grazie al fatto che è presente sull’mRNA la sequenza di Shine Dalgarno o sequenza RBS, che va a interagire con rRNA 16S, una delle componenti del ribosoma. Questa interazione tra basi complementari consente all’mRNA di posizionare correttamente l’AUG di inizio nel sito P, quindi, allinea correttamente il ribosoma sull’AUG di inizio, consentendo di creare quella cornice di lettura utile per leggere l’ORF correttamente. Quindi, la sequenza di Shine Dalgarno viene legata al ribosoma grazie ad un appaiamento con le basi del rRNA 16S, che si trovano sull’estremità 3’ del rRNA stesso. Questa interazione permette di fare interagire l’mRNA con il ribosoma e di posizionare e immobilizzare l’AUG nel sito P, quindi di creare una condizione ottimale per iniziare la traduzione. TAPPA 2: il secondo step è l’arrivo del tRNA. In questo caso l’inizio della traduzione è l’unico momento in cui il tRNA carico entra direttamente nel sito P, senza passare per A perché il sito A è occupato da IF1. Questo ha una logica, perché l’AUG di inizio è posizionato a livello del sito P, quindi, va da sé che il tRNA iniziatore deve essere direzionato sull’AUG, che si trova nel sito P. In questa seconda tappa, a questo complesso costituito dall’mRNA, dalla subunità minore e da IF1 e IF3 arriva il tRNA carico, con la metionina formilata. Il tRNA è accompagnato e diretto al sito P dal fattore IF2, che è legato al GTP. Il complesso va ad addizionare il tRNA, che entra nel sito P e si appaia con il suo anticodone all’AUG di inizio. TAPPA 3: questo complesso viene a combinarsi con la subunità maggiore 50S e simultaneamente IF2 idrolizza il GTP. Nella subunità maggiore esiste un sito di legame per IF2, che va a stimolare l’attività GTPasica e quando IF2 idrolizza il GTP non ha più affinità per il complesso e si dissocia. Quindi l’entrata della subunità ribosomiale 50S, che si lega al complesso, porta simultaneamente la molecola di GTP, che è legata a IF2, a venire idrolizzata a GDP, dove a questo punto vengono rilasciati. Entra la subunità 50S e esce IF2, che ha idrolizzato GTP. Questo perché IF2, interagendo con la subunità 50S, viene ad essere stimolata la sua attività GTPasica, quindi idrolizza il GTP, ma IF2- GDP non ha più affinità per il ribosoma e si dissocia. A questo punto vengono rilasciati gli altri fattori, quali IF3 e IF1, consentendo quindi di formare il complesso di inizio totale, formato dalla subunità 50S, dalla subunità 30S, dall’mRNA e dal tRNA iniziatore appaiato con l’anticodone al codone AUG di inizio nel sito P. Il complesso totale che si forma è un ribosoma 70S e il tutto, quello appena descritto, viene chiamato complesso di inizio. Questo complesso è pronto per intraprendere la fase di allungamento. Riepilogando, la subunità 30S si lega ai fattori IF1 e IF3. IF1 occupa il sito A e impedisce al tRNA iniziatore di entrare in questo sito e IF3 si lega al sito E, impedendo alla subunità maggiore di legarsi con quella minore in queste primissime fasi dell'inizio della traduzione. A questo punto arriva l’mRNA, che viene correttamente posizionato sul ribosoma, o meglio sulla subunità minore, attraverso il posizionamento dell’AUG di inizio, nel sito P, mediante un'interazione della sequenza di Shine Dalgarno a monte dell’AUG di inizio dell’mRNA con l’estremità 3’ del rRNA 16S. L’appaiamento tra basi permette all’mRNA di andare ad ancorarsi e posizionarsi con la sua AUG a livello del sito P. A seguire arriva il tRNA iniziatore carico con la metionina formilata, associata al fattore IF2, legato al GTP. Questo complesso è pronto a reclutare la subunità 50S, dove l’arrivo della subunità 50S porta al rilascio degli altri fattori, quindi IF1e IF3, consentendo alla subunità maggiore di associarsi alla subunità minore. L’arrivo della subunità 50S promuove l’attività GTPasica di IF2, che idrolizza il GTP a GDP, ma legando il GDP non ha più affinità per il ribosoma e quindi si dissocia insieme agli altri fattori. Quello che rimane è il complesso di inizio, costituito dalla subunità maggiore 50S con la subunità minore 30S, con l’mRNA posizionato nel sito P mediante l’AUG di inizio e il tRNA iniziatore associato alla metionina formilata. Il complesso di inizio è ora pronto per iniziare la fase di allungamento. INIZIO DELLA TRADUZIONE NEGLI EUCARIOTI Negli eucarioti i fattori proteici che servono per avviare l’inizio della traduzione sono molti di più. Le cellule eucariotiche hanno almeno 12 fattori di inizio, che catalizzano e supportano i diversi step della traduzione. Quindi, la prima differenza tra eucarioti e procarioti è che negli eucarioti l’inizio della traduzione richiede un numero maggiore di fattori proteici. Un’altra differenza è che nell’inizio della traduzione degli eucarioti il legame del tRNA iniziatore alla subunità minore precede sempre il legame all’mRNA. Mentre prima è stato visto che la subunità minore prima si associa all’mRNA e poi arriva il tRNA iniziatore. In certi testi viene riportato che nei procarioti può essere anche l’inverso, quindi, che alla subunità minore si associa prima il tRNA iniziatore e poi l’mRNA. Nei procarioti l’ordine di chi arriva prima, se il tRNA iniziatore o l’mRNA, al ribosoma non è rilevante, mentre è molto importante questo aspetto negli eucarioti, dove il tRNA iniziatore si lega alla subunità minore sempre prima del legame con l’mRNA. I fattori proteici utili per l'inizio della traduzione degli eucarioti vengono sempre riportati con il nome IF e con un numero, ma per distinguerli da quelli procariotici vengono indicati con la lettera “e”. Quindi eIF sta a indicare fattori che agiscono a livello degli eucarioti. Negli eucarioti le principali differenze sono: ● Si hanno più fattori utili per l’inizio della traduzione, che vengono indicati con l’acronimo IF, preceduti dalla lettera “e” ● Il legame del tRNA iniziatore alla subunità minore precede SEMPRE il legame con l’mRNA L’immagine descrive l’inizio della traduzione negli eucarioti. I diversi step, per aiutarci, sono indicati con i numeri. TAPPA 1: I fattori eIF1 e eIF1A si legano alla subunità minore, che anche in questo caso deve essere dissociata dalla subunità maggiore. eIF1 si associa al sito E, impedendo così alla subunità maggiore di associarsi e invece eIF1A al sito A, impedendo al tRNA iniziatore di entrare in questa posizione. Questi due fattori sono degli omologhi funzionali, quindi hanno la stessa funzione dei fattori IF1 e IF3 batterici. Dal punto di vista funzionale eIF1 corrisponde a IF3 e eIF1A a IF1. eIF3, poi, è un fattore che si lega alla subunità minore e serve a stabilizzare tutta la struttura. TAPPA 2: A questo punto il tRNA iniziatore carico va a essere associato all’eIF2-GTP e viene scortato da eIF2-GTP al sito P. In questo complesso si legano alla subunità 40S anche altre due proteine, ovvero eIF5B-GTP (è una GTPasi) e eIF5, che però non è riportata nell’immagine. Tutto questo pool di proteine, ribosoma e tRNA viene chiamato complesso di preinizio 43S. Ricapitolando, nella prima fase alla subunità minore si legano i due corrispondenti funzionali di IF1 e IF3 dei procarioti. A questo punto viene reclutato il tRNA iniziatore associato con la metionina, che non viene formilata come nei procarioti. Per arrivarci viene scortato dalla GTPasi, che è la IF2GTP procariotica. A completare il tutto intervengono anche altre due proteine, che saranno utili nelle tappe successive, che sono eIF5B-GTP e eIF5. TAPPA 3: una volta che si è formato il complesso di preinizio 43S, questo poi è pronto per reclutare l’mRNA, che però arriva “non nudo” in quanto è associato al suo CAP con un complesso che si chiama eIF4F. Questi due attori, ovvero il complesso di preinizio e l’mRNA associato al complesso eIF4F, formano il complesso 48S. Da notare che per formare il complesso 48S, l’mRNA si prepara per il legame con la la subunità minore attraverso il legame con il complesso. Il complesso è costituito da 3 componenti, che si chiamano eIF4E, eIF4A e eIF4G: ● eIF4E è deputata a legare il CAP al 5’, quindi riconosce il CAP al 5’ ● eIF4A è molto importante perché ha un’attività ATPasica ed è una elicasi, infatti provvede, consumando ATP, a far sì che l’mRNA sia a singolo filamento, quindi rimuove le eventuali strutture secondarie. ● eIF4G è una proteina che fa da ponte tra la 4A e la E La struttura di questo complesso è formata come si vede in figura: Al 5’ vi è la componente eIF4E che è legata al CAP, poi la eIF4A, con funzione elicasica, che rimuove le strutture secondarie al livello del CAP e poi vi è la eIF4G che fa da ponte tra le due proteine. TAPPA 4: il complesso scansiona l’mRNA legato, tenendolo continuamente legato come se fosse una mano che afferra l’estremità 5’ e inizia a scansionare, come se tirasse dentro di sé per la lettura a livello del sito P l’mRNA. Scansiona l’mRNA legato, partendo dal CAP in 5’ fino a che non va a incontrare l’AUG di inizio. Questo processo di scansione è favorito dall’azione della componente 4A del complesso eIF4F. La componente 4A ha un'attività RNA-elicasica e quindi aiuta la scansione, rimuovendo le strutture secondarie che ci possono essere a livello dell'RNA. TAPPA 5: Una volta che viene incontrato l’AUG di inizio, la subunità ribosomiale 60S, quindi quella maggiore, si associa al complesso e la sua associazione è accompagnata dal rilascio di alcuni fattori di inizio e infatti tutto questo è coadiuvato dai fattori eIF5B e dal fattore eIF5. Il rilascio dei fattori di inizio prevede che eIF5 vada a stimolare l’attività GTPasica di eIF2, quindi, l’attività viene stimolata e si produce un eIF2-GDP, che ha una ridotta affinità per l’iniziatore e quindi viene rilasciato. La proteina eIF5B idrolizza il GTP, che è a lei legato e promuove il rilascio di eIF2-GDP e di tutti gli altri fattori di inizio, quindi eIF1, eIF1A, eIF3 e la stessa eIF5B-GDP. In generale questi fattori, quando idrolizzano il GTP a GDP diventano poco affini per la struttura che legano e si dissociano. In seguito al rilascio di questi fattori, avviene il legame con la subunità maggiore e si ottiene il ribosoma completo 80S, che ha, come nei procarioti, l’mRNA posizionato con l’AUG di inizio nel sito P, con legato il tRNA iniziatore associato alla metionina e l’mRNA rimane al 5’ legato al complesso eIF4F, che è importante che rimanga legato all’mRNA stesso. Riepilogando: questo processo comincia con la subunità 40S, che si lega ai fattori eIF1 e eIF1A, rispettivamente nel sito E, impedendo il legame con la subunità maggiore, e nel sito A, impedendo l’entrata del tRNA iniziatore nel sito A. eIF3 ha una funzione stabilizzatrice. A questo punto entra nel sito P il tRNA iniziatore scortato dal fattore eIF2-GTP, che si inserisce nel sito P. A completare il complesso del preinizio 43S si ha il reclutamento di altri due fattori eIF5 (non riportato nel disegno) e eIF5B-GTP. Questi due fattori saranno utili nelle tappe successive. Nel complesso del preinizio, si associa l’mRNA, che arriva ad associarsi a questo complesso non da solo ma associato alla sua estremità 5’ con un complesso proteico che viene chiamato eIF4F, che è costituito da 3 componenti, ovvero la componente 4E, devota a legare il CAP 5’, la componente 4A, che ha un'attività RNA elicasica ATP dipendente e una proteina di collegamento tra queste due, che è la 4G. L’entrata dell’mRNA associato a questo complesso crea in totale il complesso 48S, che inizia il processo di scansione, che tra l’altro è favorito dalla componente 4A, che rimuove le strutture secondarie e quindi in questo processo di scansione l’mRNA legato viene scansionato alla ricerca dell’AUG di inizio. Quando l’AUG di inizio arriva nel sito P e si associa al tRNA con il suo codone si ha che la subunità ribosomiale 60S può entrare nel complesso, ma questo è accompagnato dal rilascio di diversi fattori che si trovano alla tappa 5. Questo rilascio è coadiuvato dai fattori eIF5 e eIF5B, in particolare eIF5 stimola l’attività GTPasica di eIF2, che diventa eIF2-GDP che ha una ridotta affinità per il tRNA iniziatore. La proteina eIF5B GTP idrolizza anche lei il GTP che lega, promuovendo il rilascio di eIF2-GDP e di altri fattori, quali eIF1, eIF1A, eIF3 e di lei stessa, che non ha affinità per il complesso, avendo idrolizzato il GTP a GDP. Tutti questi fattori escono ed entra la subunità maggiore, in quanto il sito E è libero. Si crea così il complesso di inizio, che è pronto per la fase di allungamento. Il complesso di inizio è costituito: ● dal ribosoma completo 80S ● dal tRNA iniziatore associato alla metionina legato all’AUG di inizio, a livello del sito P ● dall’mRNA che ha ancora ancorato al 5’ il complesso eIF4F E’ importante che rimanga legato il complesso eIF4F a livello del CAP 5’ perché permette all’mRNA eucariotico di creare una struttura circolare dell’mRNA. La struttura circolare è importante perché promuove e facilita l’inizio della traduzione da parte dei ribosomi. Il complesso eIF4F è costituito dalle 3 componenti EGA. eIF4G, che è la proteina di collegamento, non ha solo la funzione di collegare E con A, ma interagisce con la coda poliA e con le proteine legate alla coda poliA, creando un mRNA circolare. Questo è molto importante perché quando un ribosoma termina di tradurre la ORF, quindi arriva sul codone di stop, la subunità maggiore e minore si dissociano e, grazie alla circolarizzazione, hanno già vicino l’estremità 5. La subunità minore può essere prontamente reclutata per formare il complesso di pre-inizio e associarsi all’estremità 5’ dell’mRNA. La circolarizzazione ha la funzione che terminando la traduzione al 3’ dell’mRNA, i ribosomi vengono rilasciati immediatamente in prossimità delle estremità 5’ del messaggero e quindi vengono subito reclutati per un nuovo ciclo di traduzione. In altre parole, la circolarizzazione è fondamentale perché in questo modo, attraverso questa struttura, facilmente i ribosomi vengono rilasciati e reclutati dai fattori di inizio e dalle proteine, così che poi vengano recuperati a livello dell'mRNA al suo 5’ per iniziare un nuovo ciclo di traduzione. FASE DI ALLUNGAMENTO La fase di allungamento è pressoché identica nei procarioti e negli eucarioti. La fase di allungamento è costituita da 3 tappe, qui riportate in tabella: ● La prima tappa consiste nel caricamento dell’amminoacil tRNA al sito A. ● La seconda tappa è la formazione del legame peptidico tra l’aa portato dall’amminoacil tRNA al sito A e la catena polipeptidica che si trova associata al tRNA nel sito P ● La terza tappa consiste nella traslocazione, ovvero nel fatto che il ribosoma si sposta per una lunghezza pari a 1 codone verso l’estremità 3’ dell’mRNA. Quindi shifta, si sposta di una tripletta per leggere un nuovo codone, andando a dirigersi verso l’estremità 3’ dell’mRNA stesso. Per fare queste tre tappe ci sono degli aiutanti: Per la prima e la terza tappa ci sono dei fattori di allungamento, che vanno a coadiuvare e supportare il caricamento dell’amminoacil tRNA al sito A o la traslocazione. In particolare, questi fattori sono chiamati fattori di allungamento, in modo da distinguerli da quelli che invece lavorano nella fase iniziale della traduzione. Vengono chiamati EF (E = Elongation) e questo ci aiuta a distinguerli dagli IF. I fattori sono per i procarioti le EF-TU, che si occupano della prima tappa e le EF-G che intervengono nella terza tappa. Negli eucarioti ci sono gli analoghi funzionali, che si chiamano rispettivamente: eEF1 e eEF2. La “e” indica che questi fattori sono i fattori corrispondenti a quelli procariotici però a livello eucariotico. Tutti questi fattori di allungamento sono in grado di legare il GTP, infatti, sono delle GTPasi e anche in questo caso la loro attività GTPasica viene attivata dall’interazione di questi fattori con un sito di legame specifico con la subunità maggiore e a seguito di questa attività vanno a legare il GTP idrolizzato, quindi il GDP. Quando questi fattori hanno idrolizzato il GTP a GDP vanno a ridurre la loro affinità per le molecole e per la stessa subunità maggiore a cui sono associati o con la quale hanno interagito. Il meccanismo è analogo alle altre GTPasi, viste nella fase di inizio della traduzione. TAPPA 1: Caricamento dell’amminoacil tRNA al sito A a) Si è formato il complesso di inizio (nella slide è spiegata la tappa nei procarioti ma negli eucarioti la situazione è analoga, ma al posto di avere il fattore EF-TU si avrebbe il fattore eEF1). Il complesso di inizio è costituito dalla subunità maggiore (nei procarioti è la 50S) e la subunità minore 30S, che sono associati all’mRNA, con il codone di inizio AUG, posizionato nel sito P e riconosciuto dal tRNA iniziatore carico con la formilmetionina. Nel sito A è già stato posizionato il codone successivo che deve essere letto dal nuovo amminoacil tRNA. La tappa successiva è l’entrata nel sito A dell’amminoacil tRNA. L’amminoacil tRNA arriva al sito A non da solo, ma scortato dal fattore di allungamento EF-TU. b) Per leggere la parte in B il punto di partenza è quando TU-GTP lega l’amminoacil tRNA. L’aa legato a questo secondo tRNA è indicato con AA II proprio perché è il secondo aminoacido ad essere addizionato. Il fattore di allungamento TU legato al GTP lega l'amminoacil tRNA, che deve entrare nel sito A e quindi si portano insieme nel sito A. Nel sito A il TU-GTP interagisce con la subunità maggiore, in un sito specifico per questi fattori, che stimolano la loro attività GTPasica e quindi il TU, entrando, va a interagire con questo sito, la sua attività GTPasica viene attivata e il GTP viene idrolizzato a GDP. Il TU-GDP non è più affine al tRNA e alla subunità maggiore e viene rilasciato. Contemporaneamente il tRNA che è entrato, oltre a legarsi, con il suo anticodone, con il codone che si trova nel sito A, va a spostarsi e avvicinarsi a livello della formilmetionina, quindi, si posiziona a livello del centro peptidil transferasico e in questo modo i due aa sono vicini, così che sono pronti per la seconda tappa dell’allungamento, ovvero la formazione del legame peptidico. Quando entra l'amminoacil tRNA scortato da TU-GTP, da una parte il TU-GTP interagisce con il sito di legame nella subunità maggiore a lui dedicato e viene stimolata la sua attività GTPasica, perciò idrolizza il GTP a GDP. Ma il TU-GDP non ha più affinità né per il tRNA, né per la subunità maggiore e per questo viene rilasciato. Nel frattempo, il tRNA caricato si appaia con il suo anticodone con il codone posizionato nel sito A e la sua estremità 3’, recante l’aa da aggiungere, va a spostarsi e ad avvicinarsi al centro peptidil transferasico e all’altra estremità 3’ del tRNA iniziatore, in modo tale che tutto sia pronto per far avvenire la formazione del legame peptidico tra la formilmetionina e il secondo aa appena portato. Il TU-GDP che è stato rilasciato per poter essere riutilizzato nella sua forma TU-GTP, in modo tale che possa legare un altro aminoacil tRNA, deve riassociarsi al GTP. Non riesce a farlo da solo ma ha bisogno di una moneta di scambio. Questa moneta di scambio è un altro fattore, TS, il quale scambia il GDP con sé stesso al legame con il TU. In altre parole, il TU-GDP interagisce con il TS, andando a rilasciare il GDP. Si forma quindi questo complesso proteico tra il TU e il TS. Successivamente il TS è ancora la moneta di scambio e questa volta con la molecola di GTP, infatti, arriva GTP che scalza TS e si associa al TU, ricreando TU-GTP che può essere riutilizzato per un terzo amminoacil tRNA entrante e ricominciare il ciclo. Il TS viene ad essere una moneta di scambio tra il legame del TU con il GTP e con il GDP, in particolare il TS all’inizio serve prima per rilasciare il GDP dal TU e successivamente per far acquisire al TU il GTP al suo posto. Alla fine di questa prima tappa si ha che nel sito A vi è il nuovo aminoacil tRNA entrante già posizionato con l’aa nel centro peptidil transferasico e vicino al tRNA iniziatore con la formilmetionina. TAPPA 2: formazione del legame peptidico (ora viene descritta la formazione del primo legame peptidico e tale reazione descritta si ripete per tutti gli aa successivi che devono essere addizionati alla catena polipeptidica che si sta posizionando via via che il ribosoma si sposta sui diversi codoni della ORF sull’mRNA) Nel ribosoma nel sito P vi è il tRNA iniziatore mentre nel sito A vi è il secondo aa da legare. Nell’immagine è ingrandita una regione che corrisponde al centro peptidil transferasico: in viola sono raffigurate le estremità 3’ del tRNA iniziatore e dell'amminoacil tRNA appena caricato nel sito A. Nella formazione del legame peptidico il gruppo amminico va a fare un attacco nucleofilo sul gruppo carbonilico dell’aa formilmetionina. Questo determina la rottura del legame acilico tra la formilmetionina e l’estremità 3’ del tRNA iniziatore. Il risultato è che il tRNA che si trova nel sito P si è scaricato, perché la formilmetionina è stata legata al secondo aa. Si è formato quindi il legame peptidico e, nel momento in cui si forma il legame peptidico, le estremità 3’ dei due tRNA, presenti nel sito A e nel sito P, vanno a spostarsi verso i siti dove il tRNA deve andare. L’estremità del tRNA iniziatore scarico, in quanto si è formato il legame peptidico, va già a spostarsi verso il sito E, mentre l’estremità 3’ del tRNA che ha addizionato l’aa iniziale con il secondo aa è spostata verso il sito P. Una volta che si è formato il legame le estremità 3’ già si distribuiscono verso i siti P ed E dove il tRNA in toto dovrà spostarsi nella tappa successiva. Gli anticodoni rimango ancora in questa fase di formazione del legame peptidico nel sito P e nel sito A rispettivamente. TAPPA 3: Traslocazione In questa fase il ribosoma si sposta per una lunghezza corrispondente a una tripletta o codone dell’mRNA. Lo fa attraverso una modifica conformazionale all’interno del ribosoma stesso. Anche in questo caso si è formato il legame peptidico, quindi la catena peptidica rimane attaccata al tRNA dell’ultimo aa che è stato inserito e le estremità 3’ di questi tRNA posizionati nel sito P e nel sito A sono già spostate verso il sito di legame successivo. L’estremità 3’ del tRNA nel sito P si trova verso il sito E, mentre l’estremità 3’ del tRNA nel sito A è spostata verso il sito P. Occorre che il ribosoma si sposti in toto sul nuovo codone e quindi che nel sito A arrivi un nuovo codone da leggere. Questo prevede una modifica conformazionale all’interno del ribosoma, che aiuta lo spostamento ma anche i tRNA si devono spostare. Per aiutare questa traslocazione vi è una nuova GTPasi, che si chiama EF-G nei procarioti, mentre negli eucarioti si chiama eEF2 (il meccanismo tra le due è identico). EF-G promuove la traslocazione andando a portarsi nel sito A, quindi EF-G-GTP entra nel sito A e come si vede dalle frecce forza lo spostamento e la traslocazione dei tRNA nei siti adiacenti. In particolare, il tRNA con il peptide dal sito A passa al sito P, perché al suo posto è entrato EF-G-GTP e il tRNA scarico nel sito P si porta nel sito E. Quindi l’entrata delle EF-G-GTP promuove la traslocazione dei diversi tRNA, in particolare il neo peptidil tRNA dal sito A si porta al sito P e il tRNA scarico passa dal sito P al sito E. Questa traslocazione prevede che i tRNA mentre traslocano si portino dietro anche l’mRNA perché rimangono in questa traslocazione associati con il loro anticodone al codone corrispondente. Infatti, se si confrontano le due immagini, l’AUG di inizio che si trova nel sito P si porta nel sito E e il codone che era stato letto nel sito A si porta nel sito P. EF-G-GTP si va ad inserire nel sito A perché ha un mimetismo molecolare. Nel box, se si vanno a confrontare le EF-G con le EF-TU (fattore che va a scortare l’amminoacil tRNA nel sito A), si vede proprio come hanno la stessa struttura molecolare e questa familiarità prende il nome di mimetismo molecolare. EF-G-GTP entra nel sito A perché viene scambiato come una EF-TU associata a un tRNA proprio grazie a questo motivo, promuovendo la traslocazione. Quando EF-G-GTP entra nel sito A interagisce con il sito di legame specifico per le GTPasi. Il GTP viene idrolizzato e EF-GGDP in questa forma non ha più affinità per il ribosoma e si dissocia. Il risultato è che nel sito A vi è un nuovo codone da leggere e quindi quello che accadrà è che le tre tappe si ripetono tante volte per ogni codone su cui il ribosoma si viene a spostare fino alla fine dell’ORF stessa. Il risultato finale è che dopo la traslocazione, il peptidil-tRNA e mRNA sono ancora legati al ribosoma ed è tutto pronto per un altro ciclo di allungamento, che porterà il terzo aa seguendo le tre tappe. Queste 3 tappe dell’allungamento si ripetono n volte per ciascun codone che viene letto sull’mRNA. La catena polipeptidica rimane sempre attaccata al tRNA dell’ultimo aa che è stato inserito, quindi questo è un requisito che avviene ogni volta che la catena polipeptidica sia bene addizionata di un nuovo aa. Il ciclo di allungamento negli eucarioti è molto simile anche nei procarioti, con l’unica differenza che cambiano i nomi dei fattori, ma il processo è identico. TERMINAZIONE DELLA TRADUZIONE E RICICLO DEL RIBOSOMA Nell’immagine più avanti viene riportato un riassunto in procarioti ed eucarioti. Anche in questo caso, come per la fase di allungamento, la terminazione della traduzione avviene con modalità analoghe, cambiano solo i fattori che vengono coinvolti. In particolare, l'allungamento da parte del ribosoma prosegue fino a quando il ribosoma non raggiunge l’ultimo aa codificato dall’mRNA. Il segnale di terminazione è dato quando uno dei tre codoni di terminazione dell’mRNA vanno a finire nel sito A. (l’immagine si riferisce ai procarioti ma vale la stessa cosa per gli eucarioti) Nell’immagine si vede la subunità maggiore, la subunità minore, l’mRNA in verde; nel sito P vi è la catena polipeptidica che si sta allungando e nel sito A arriva un codone di terminazione a cui non corrisponde alcun tRNA. Quando il segnale della sintesi proteica o traduzione è terminata si hanno questi codoni di terminazione o di stop e nel momento in cui questi vengono ad essere posizionati nel sito A, questo rappresenta il segnale della terminazione della sintesi proteica. In particolare, i codoni di terminazione sia per i procarioti che per gli eucarioti sono 3: UAA, UAG e UGA. Nel momento in cui nel sito A si posiziona uno di questi 3, questo rappresenta il segnale di terminazione della traduzione stessa. A questi codoni non corrisponde un tRNA ma piuttosto quando il ribosoma arriva su questi codoni di stop, nel sito A va a legarsi quello che viene chiamato RF (= fattore di rilascio). Il codone di terminazione non ha un corrispondente tRNA e quando viene a posizionarsi nel sito A, questo fa sì che nel sito A venga reclutato un fattore di rilascio, che viene chiamato RF. I fattori di rilascio sono per i procarioti 2: RF1, che riconosce i codoni di terminazione UAG e UAA mentre RF2 riconosce i codoni di terminazione UGA o UAA. Negli eucarioti vi è un unico fattore di rilascio, eRF1, che entra in gioco per tutti e 3 i codoni di terminazione. La funzione di RF è quella di riconoscere il codone di stop nel sito A e innescare la reazione di idrolisi, quindi di rilascio, della catena polipeptidica dal tRNA posizionato nel sito P. I fattori di rilascio sono molto importanti perché sono coloro che si inseriscono nel sito A quando arriva il codone di stop e una volta legati vengono a favorire l’idrolisi, promuovendo l’azione di una peptidil transferasi che va a idrolizzare il legame tra il tRNA e la catena polipeptidica neosintetizzata a livello del sito P. Quello che avviene è che ci si ritrova nel sito P il tRNA scarico e nel sito A vi è il fattore di rilascio RF. Nel sito E vi è il tRNA scarico che deve essere rilasciato dal ribosoma. A questo punto bisogna dissociare i vari componenti. Si ha bisogno di un ulteriore fattore che si chiama RF3 nei procarioti e eRF3 negli eucarioti. È un fattore che lega il GTP e che è importante perché ha la funzione di favorire e stimolare la dissociazione dei fattori RF precedenti, quindi, RF1 e RF2 o eRF1 (per gli eucarioti) dal ribosoma dopo che la catena è stata rilasciata. Per farlo lega il GTP. I fattori di rilascio sono quindi suddivisi in due classi: ● La prima classe (RF1, RF2, eRF1) è formata dai fattori di rilascio che si inseriscono nel sito A, riconoscendo il codone di terminazione e promuovendo il rilascio della catena polipeptidica dal tRNA ● La seconda classe (RF3, eRF3) è formata da quelli che promuovono il rilascio dei fattori precedenti dopo che la catena polipeptidica è stata rilasciata I fattori RF, RF1 e RF2, hanno dei domini la cui funzione riproduce quella del tRNA, ovvero funzionano, come quanto visto per le EF-G, con una capacità di riprodurre la struttura del tRNA. Quindi lavorano tramite un mimetismo molecolare e in virtù di questo mimetismo, consente agli RF1-2 di essere scambiati per dei tRNA e per questo motivo di andare nel loro posto nel sito A, quando in esso vi è un codone di stop. RF3 interagisce direttamente con il ribosoma e promuove il rilascio degli RF precedenti e nel caso degli eucarioti eRF3 promuove il rilascio di eRF1. Li fa rilasciare dal sito A grazie alla sua attività GTPasica. Il ribosoma però è ancora assemblato con l’mRNA e il tRNA, mentre i fattori RF1-2 sono stati rilasciati grazie a RF3. Rimane da dissociare la subunità minore, maggiore e l’mRNA e si ha quindi bisogno di altri fattori: EF-G-GTP e RRF (= fattore di riciclo del ribosoma). Questi due fattori cooperano insieme per poter consentire la dissociazione di tutto l’apparato coinvolto nella sintesi proteica che è rimasto, ovvero la subunità maggiore, la subunità minore, l’mRNA e i tRNA che si trovano nel sito P e nel sito E. L’obiettivo, quindi, è rilasciare tutti i vari componenti e poterli poi riciclare per un nuovo ciclo di traduzione. RRF insieme a EF-G-GTP entrano nel sito A che è stato liberato grazie ai fattori di rilascio e grazie all’intervento di RF3. Una volta entrati, nella subunità maggiore vi è il sito di legame per i fattori GTPasici, come EF-G. EF-G interagisce con il sito di legame della subunità maggiore e viene stimolata la sua attività GTPasica, questo fa sì che EF-G-GTP idrolizzi GTP a GDP promuovendo in questo modo il rilascio dei tRNA dal sito P e dal sito E e che questi vengano sostituiti da IF3, uno dei fattori di inizio della traduzione, che quando entra nel sito E permette la dissociazione della subunità maggiore da quella minore e il rilascio del messaggero. Riepilogando, il sito A è libero dai fattori di rilascio e viene occupato dai fattori EF-G-GTP e RRF. Una volta entrate le EF-G-GTP, queste attivano la loro attività GTPasica in virtù dell’interazione con il legame nella subunità maggiore. Le EF-G-GTP diventano EF-G-GDP e questo promuove il rilascio sia dei tRNA, che si trovano nel sito E e nel sito P che di sé stesso, perché queste molecole una volta legate al GDP non sono più affini per il fattore a cui erano legate. EF-G-GDP viene rilasciato insieme a RRF e promuovono il rilascio dei tRNA, che vengono sostituiti, in particolare nel sito E, da IF3. IF3 promuove la dissociazione della subunità maggiore 50S dalla subunità minore 30S, oltre a consentire il rilascio dell’mRNA. Tutti i vari attori sono dissociati ed è possibile quindi ricominciare un nuovo ciclo di traduzione. Ricapitolando tutto: il ribosoma arriva sul codone di STOP, a questo codone di STOP sul sito A non corrisponde alcun tRNA carico e quindi al suo posto lega un fattore di rilascio, chiamato RF, che può essere di un numero diverso in base al fatto se si è nei procarioti o eucarioti. Il fattore di rilascio, che agisce con un mimetismo molecolare con una struttura simile a quella del tRNA, entra nel sito A e va a promuovere il rilascio della catena polipeptidica dal tRNA. A questo punto il fattore che entra nel sito A viene rimosso e la sua dissociazione è stimolata da un fattore RF3-GTP, che interagisce con il ribosoma, con il sito di legame nella subunità maggiore, idrolizza il GTP a GDP e promuove il rilascio del fattore RF precedentemente legato al sito P e di sé stesso. A questo punto il sito A è libero e vuoto e accoglie altri due fattori che sono utili per dissociare tutti gli altri attori rimasti: le due subunità, l’mRNA e i tRNA scarichi al sito P e al sito E. A questo punto il sito A è libero, entrano EF-G-GTP e RRF. EF-G-GTP quando entra, la sua attività GTPasica è sempre stimolata dal sito di legame sulla subunità maggiore del ribosoma e idrolizza GTP a GDP, promuovendo il rilascio dei tRNA dal sito E e dal sito P e la sostituzione di sé stesso e di RRF con un fattore che è IF3. IF3 è un fattore che lega il sito E e promuove la dissociazione della subunità maggiore da quella minore e il rilascio dell’mRNA. Tutti questi attori possono essere riciclati per un nuovo ciclo di traduzione. REGOLAZIONE DELLA TRADUZIONE REGOLAZIONE DELLA TRADUZIONE NEI PROCARIOTI La regolazione della traduzione nei procarioti avviene con due particolari meccanismi. Anche in questo caso è da sottolineare che la regolazione avviene nelle fasi iniziali della traduzione. In particolare, nei procarioti sono riportati due possibili meccanismi di repressione dell’inizio della traduzione: a) Vi è l’mRNA (riportato per semplicità con un solo ORF, quindi, vi è un solo codone di inizio e un codone di termine. A monte della ORF vi è la RBS). L’inizio della traduzione nei procarioti passa attraverso un riconoscimento, un legame tra l’RBS e la subunità ribosomiale minore 30S, in particolare con la sua componente rRNA 16S, che si appaia con le basi di RBS, la quale si trova a monte della AUG di inizio. Una volta che la subunità si lega, si avvia la traduzione della ORF portando alla sintesi della proteina (indicata in giallo nell’immagine). Questa proteina è una proteina in grado di legare il suo stesso mRNA da cui è stata codificata; nello specifico, la proteina va a legarsi in parte all’RBS, coprendo l’AUG di inizio. Quando questa proteina interagisce con l’mRNA, va creare un vero e proprio ingombro sterico, quindi, inibisce fisicamente l'interazione tra la subunità minore e l’RBS, andando così in questo modo a bloccare la traduzione ulteriore dell’mRNA, da cui lei stessa è derivata. Queste proteine non si legano completamente e direttamente con l’RBS ma sono sufficientemente grandi per coprire in parte l’RBS impedendo l’accesso della subunità all’RBS stesso. b) Vi è il caso in cui un mRNA si appaia con sé stesso nascondendo uno o più RBS. In questo esempio vi è l’mRNA indicato in verde che ha due ORF: una indicata con il numero 1, dove si trovano l'RBS 1, codone di inizio e codone di stop, e la seconda indicata con il numero 2, che ha la RBS 2, il codone di inizio e stop. Quello che si vede è che la fase iniziale della ORF su RBS è libero, ed è la prima ORF ed è quindi accessibile per il legame con la subunità minore. La seconda ORF ha il suo RBS nascosto, perché si è creata la struttura secondaria in seguito a un appaiamento intramolecolare dell’mRNA stesso tra una parte della ORF 1 e dell’ORF2, o meglio l’inizio dell’ORF2. Quello che succede è che si ha che l’RBS 1 viene riconosciuto dalla subunità minore, quindi, la prima ORF inizia ad essere tradotta. All’inizio l’RBS 2 non è accessibile, quindi, la seconda ORF non viene tradotta e quindi nella prima fase viene riconosciuta dalla subunità minore solo l’RBS 1 che è libera mentre l’RBS 2, che è nascosta, non viene ad essere legata dalla subunità minore. L’RBS 1 riconosciuta può essere coinvolta nella traduzione, infatti si vede che la traduzione della ORF1 parte ma quello che avviene in particolare è che la struttura secondaria (in rosso) viene distrutta durante la traduzione della ORF1, quindi, il ribosoma che scorre lungo l’mRNA distrugge l’appaiamento e va a rimuovere il self annealing, consentendo così la traduzione anche della seconda ORF. Quindi, in seguito alla traduzione dell'ORF1, l'appaiamento tra le basi dell’altra ORF viene rimosso, permettendo a un altro ribosoma il riconoscimento dell’RBS 2, precedentemente bloccata. In questo caso si ha la regolazione della traduzione, dove un RBS viene riconosciuto, quindi la prima ORF parte con la traduzione mentre l’altra no. La seconda può essere tradotta in un secondo momento, in seguito alla traduzione della prima. La regolazione è più che altro non un’inibizione permanente ma un’inibizione temporanea, in cui c’è un ORF che parte con la traduzione prima e in seguito alla traduzione della prima, la seconda viene tradotta successivamente, perché il ribosoma scorrendo sulla prima ORF, rimuove i self annealing che impegnavano la ORF1 con la ORF2 e permette, quindi, all’RBS di ORF2 di diventare accessibile alla subunità minore e quindi di essere tradotta in un secondo momento. Un esempio di questo tipo di regolazione della traduzione è realizzato ad opera degli operoni che si trovano in E. coli per le proteine ribosomiali. Nell’immagine vi sono 6 operoni, con cui sono organizzati gli mRNA che codificano le proteine ribosomiali. In viola è indicato il promotore e tutti i segmenti colorati sono per le diverse proteine ribosomiali. Ad esempio, la L24 indica la proteina “large” ribosomiale 24, oppure la S7 la “small 7”. a) Questo è un mRNA che codifica per le proteine ribosomiali: quindi, questo è un esempio di un operone di un L11 con le due ORF. Nell’immagine si vede che si ha un mRNA con un RBS e un secondo RBS, mentre in verde chiaro il codone di inizio. Le proteine ribosomiali, una volta tradotte, si devono associare con l’rRNA per creare la subunità maggiore e minore. Si ha che l’rRNA è libero e quello che succede è che l’mRNA per le proteine ribosomiali viene tradotto. Le proteine ribosomiali 1 e 2, le quali hanno un'alta affinità nel legare l’rRNA libero, si associano e sono importanti perché aiutano, in quanto hanno un ruolo strutturale, l’RNA ad assumere la struttura corretta che gli serve per creare la struttura del ribosoma stesso. L’mRNA che codifica, con le due ORF, per le proteine ribosomiali viene tradotto e in presenza di rRNA libero, queste proteine prontamente si associano con esso per creare la struttura corretta dell’rRNA per creare il ribosoma. Questo, quindi, avviene quando si ha rRNA libero. b) In questo secondo caso l’rRNA libero viene a mancare. Quello che succede è che le proteine ribosomiali vengono comunque tradotte, però non c’è dell’rRNA da legare. Queste proteine adottano il meccanismo di regolazione visto poco fa, ovvero la proteina 2 interagisce con il suo stesso mRNA, posizionandosi parzialmente sull’RBS, creando quell’impedimento fisico che impedisce al ribosoma, alla subunità minore, di riconoscere l’RBS 1. In questo modo la proteina 2 ribosomiale si associa al suo stesso mRNA che l’ha tradotta e impedisce la traduzione della prima ORF, quindi la proteina ribosomiale 1. L’mRNA fa inoltre del self annealing, l’ORF della proteina 1 si appaia, infatti, con l’inizio della ORF 2 e perciò impedisce che la RBS della proteina 2, o meglio l’ORF che codifica per la proteina 2, sia accessibile. I due meccanismi, visti poco fa, ovvero quello che usa una proteina che crea un impedimento sterico sull’RBS e il secondo meccanismo dove si hanno delle strutture secondarie sull’mRNA che impediscono l’accesso a un RBS, impediscono che l’mRNA per le proteine ribosomiali venga tradotto, perché non si ha rRNA ribosomiale disponibile e quindi non ha senso tradurre altre proteine ribosomiali. Quindi, quando manca l’rRNA libero, le proteine ribosomiali mettono in atto, sul loro stesso mRNA, una serie di meccanismi per consentire all’rRNA mancante di inibire la traduzione stessa. La proteina 1 non viene più tradotta perché l’ORF viene ad essere bloccata dalla proteina 2 perché si lega all’RBS 1 dell’mRNA stesso. Inoltre, l’ORF della proteina 1 si appaia con l’inizio dell’ORF della proteina 2 e in questo modo si impedisce che la proteina 2 venga tradotta proprio perché l’ORF specifico non è libero, perché è nascosto dal self annealing. In questo modo, quando la proteina ribosomiale è in eccesso rispetto all’rRNA bersaglio, si lega al suo stesso mRNA, che può formare delle strutture di self annealing e attraverso questi due meccanismi di regolazione si impedisce la traduzione ulteriore dell’mRNA stesso delle proteine ribosomiali. REGOLAZIONE DELLA TRADUZIONE NEGLI EUCARIOTI La regolazione viene finemente regolata attraverso diversi meccanismi: (questi sono alcuni esempi perché la traduzione negli eucarioti prevede il coinvolgimento di molti più fattori di inizio) 1. Fosforilazione: I fattori di inizio possono essere fosforilati ad opera di protein-chinasi e fosforilandoli possono risultare negativi, inattivi (es. eIF-2, uno dei tanti fattori di inizio coinvolti nella fase iniziale). La fosforilazione reversibile dei fattori di inizio ha un ruolo fondamentale nella regolazione dell’inizio della traduzione a livello degli eucarioti. La fosforilazione viene innescata, attivando le protein-chinasi specifiche, da tantissimi stimoli e condizioni cellulari e varia in base al tipo cellulare e alla funzione. Per esempio, un'elevata temperatura può essere uno stimolo, o una mancanza di aa, o un'infezione virale. Quindi, la fosforilazione viene attivata dalle cellule da una varietà di condizioni e stimoli cellulari che variano in base alla funzione cellulare a all’istotipo cellulare. Nell'esempio è riportato eIF2, che è legato al GTP nella fase di inizio e scorta il tRNA iniziatore al sito P del ribosoma, legandolo con sé. eIF2 nel momento in cui idrolizza il GTP e diventa eIF2GDP, si dissocia dal tRNA iniziatore. Affinché eIF2-GDP possa di nuovo legare un nuovo tRNA iniziatore, ha bisogno di essere di nuovo legato al GTP. Come succedeva anche nei procarioti, per scambiare il GDP con il GTP interviene una proteina o “moneta” di scambio, che nel caso specifico si chiama eIF2B. eIF2B si associa con eIF2, legato al GDP, promuovendo il rilascio del GDP e questo dimero permette di reclutare il GTP, per cui entra il GTP e eIF2 ritorna nella sua forma con il GTP e può legare un nuovo tRNA iniziatore e portarlo al sito P, mentre eIF2B viene rilasciato. Questo è il flusso canonico però l’azione di eIF2 può essere bloccata e quindi di conseguenza il ciclo può essere bloccato se eIF2-GDP viene fosforilato. Se viene fosforilato, quando è associato a GDP, il legame tra eIF2 e eIF2B è irreversibile e il GDP non viene spostato. Si deve considerare che all’interno della cellula vi è meno eIF2B rispetto a eIF2, quindi, è sufficiente una piccola parte di eIF2 fosforilata per sequestrare tutto eIF2B, inibendo in questo modo la traduzione e quindi la sintesi proteica. Quindi, un modo per bloccare eIF2 e il ciclo è quello che eIF2 venga fosforilata quando è legata al GDP e a eIF2B; in questo modo l’interazione tra eIF2 e eIF2B è irreversibile e il GDP non viene rilasciato. Il complesso (GDP-eIF2-eIF2B) è come se fosse congelato. 2. Repressione: Un altro meccanismo di regolazione della traduzione negli eucarioti è l’intervento di repressori che legano direttamente l’mRNA andando a inibire la traduzione. In particolare, questi repressori possono legare dei siti specifici che si trovano nella regione non tradotta al 3’, il così detto 3’ UTR e interagiscono con altri fattori di inizio legati all’mRNA (ad esempio quelli che si trovano all’estremità 5’), oppure interagiscono con la subunità minore per impedire l’inizio della traduzione. 3. Il terzo meccanismo coinvolge proteine di legame che impediscono l’interazione tra due fattori di inizio: eIF4E e eIF4G, che agiscono a livello del CAP 5’. Queste proteine di legame sono quelle che vengono chiamate 4E-BP. Infatti, era già stato visto che le eIF4E fanno parte insieme al 4G e al 4A di quel complesso eIF4F, che si va a legare al CAP 5’. Questo complesso ha 3 subunità: 4E (lega il CAP al 5’), la 4A (ha un’attività di RNA elicasi) e la 4G fa da ponte di collegamento tra la 4E e la 4A, nonché permette la circolarizzazione dell’mRNA eucariotico, quando interagisce con la coda poliA e le proteine legate alla coda poliA, rendendo più efficace il processo di inizio della traduzione. La proteina 4E-BP interagisce con la componente 4E e le impedisce di legare il 4G, in questo modo si va a limitare la traduzione del messaggero. Se la 4E-BP è fosforilata non può più funzionare e non riesce a legare la componente 4E e quindi il processo di inibizione della traduzione viene a saltare. Se 4E-BP (in arancione) si lega alla componente 4E e impedisce che la componente 4G si associ, quindi tutto il percorso descritto viene a saltare e di conseguenza l’inizio della traduzione viene bloccata. Se 4E-BP viene fosforilata, in particolare da una chinasi specifica, MTOR (attivata da fattori di crescita), non è in grado di legare 4E, associato al CAP, e può quindi ricominciare il ciclo e di conseguenza l’inizio della traduzione può essere avviata completamente. Riepilogando, 4E-BP è una proteina regolatrice che riconosce la proteina 4E e impedisce la formazione del complesso eIF4F, poiché 4E non si lega a 4G e quindi tutto il percorso viene inibito e si sa che la formazione del complesso è fondamentale per avviare l’inizio della traduzione sull’mRNA eucariotico. Se 4E-BP viene fosforilata, in questa forma non riesce più a legare 4E, che è quindi libera per completare il complesso multiproteico (con 4G e 4A) e permettere l’avvio dell’inizio della traduzione e riconoscimento da parte delle estremità 5’ del complesso di preinizio 43S e la circolarizzazione dell’mRNA mediata da 4G, permettendo di rendere molto più efficiente l’inizio della traduzione. MECCANISMI DI CONTROLLO QUALITA’ DELL’mRNA Esistono dei meccanismi di controllo di qualità dell’mRNA, infatti si possono avere degli mRNA difettosi che vanno ad essere rimossi mediante degli opportuni meccanismi di controllo qualità. Gli mRNA possono contenere dei codoni di STOP prematuri causati dalle mutazioni non senso, che hanno creato dei codoni di stop all’interno della ORF e non alla fine oppure ci possono essere degli mRNA privi del tutto di codoni di STOP e quindi in questo caso si parla di mRNA NON STOP. Gli mRNA NON STOP sono causati da errori di replicazione del DNA o della trascrizione, oppure dal fatto che l’mRNA viene degradato ad opera di nucleasi e quindi perdono il codone di stop. Tutti questi mRNA difettosi possono potenzialmente produrre delle proteine, che però sono tronche, che non funzionano e che delle volte possono anche essere tossiche. Questi mRNA possono impedire dei meccanismi di traduzione che terminano in maniera efficiente, quindi, non c’è nemmeno un riciclo efficiente dell’intero sistema dell’apparato coinvolto nella sintesi proteica. In questi casi intervengono dei meccanismi che provvedono a riconoscere questi mRNA difettosi e a eliminarli. Aiutano a superare questa problematica. Questi mRNA, che vengono detti mRNA aberranti, devono essere controllati, identificati ed eliminati. Nei procarioti gli mRNA tronchi o non stop, quelli privi di un codone di stop, trovano una soluzione attraverso una particolare molecola che si chiama tmRNA. Il tmRNA è un RNA lungo 457 nucleotidi e viene chiamato con il nome SsrA, ed è un ibrido, ovvero è una molecola batterica (presente nei batteri) che contiene e combina proprietà strutturali e funzionali dell’mRNA e del tRNA. Quindi ha una parte a tRNA e una parte a mRNA. a) Vi è il ribosoma con il sito A, P ed E e in verde, nel canale, vi è un mRNA. Questo mRNA è tronco o è un mRNA non stop, perché si vede che ha un'estremità 3’ rotta ed è privo del codone di stop e per questo motivo viene chiamato mRNA terminato prematuramente o tronco o mRNA di non stop. Questi si formano quando la trascrizione del DNA termina in maniera prematura o quando a causa di una mutazione, l’mRNA è privo di un codone di stop. Le proteine che derivano da questo mRNA sono tronche e quindi inattive. Quando il ribosoma traduce questo mRNA, una volta che arriva alla sua estremità 3’ rotta, il ribosoma entra in stallo e infatti si vede che quando arriva alla fine, nel sito non c’è alcun codone di stop. Quindi il ribosoma raggiunge l’estremità 3’ ma si blocca perché, mancando il codone di stop o un altro codone che specifica per un aa, non riesce a reclutare nessun altro aminoacil-tRNA o fattore di rilascio. b) Per uscire da questo stallo i batteri utilizzano un meccanismo di controllo che si basa su questa molecola ibrida tmRNA (in verde nell’immagine). L’estremità 5’ di questa molecola imita la struttura di un tRNA legato all’alanina. Il tmRNA, grazie a questa sua similitudine, viene caricato con l’alanina dalla sintetasi specifica. Questo tmRNA ha all’estremità 5’ il tRNA caricato opportunamente dalla sintetasi specifica con un’alanina e poi il resto, di mRNA, con un codone di stop. Il tmRNA, caricato con l’alanina, va a finire nel sito A e viene scortato da EF-Tu-GTP, che quando arriva nel sito A interagisce con il suo sito di legame, si attiva l’attività GTPasica e in questo modo EF-Tu-GDP viene rilasciato. Nel sito A rimane il tmRNA con l’alanina, che verrà con una reazione peptidil transferasica addizionata alla catena polipeptidica nascente, o meglio che si sta sintetizzando. c) In questa fase avviene la formazione del nuovo legame peptidico tra l’alanina portata dal tmRNA nel sito A e la catena polipeptidica che si sta sintetizzando, associata al tRNA nel sito P d) La catena viene legata dall’alanina, il tRNA diventa scarico e quindi esce dal ribosoma e il tmRNA (con l’alanina attaccata a tutta la catena polipeptidica) trasloca dal sito A al sito P. Il meccanismo è quindi quello solito dell’allungamento, ovvero arriva il tmRNA con attaccato l’alanina all’estremità 5’ al sito A, si forma il legame peptidico tra l'alanina e la catena polipeptidica sintetizzata e legata al peptidil tRNA nel sito P e si completa così con la traslocazione à il tRNA scarico va dal sito P al sito E, dove poi verrà rilasciato e il tmRNA (con l’alanina e tutta la catena legata) trasloca dal sito A al sito P. Nel canale dell’mRNA e quindi nel sito A si ha che la componente a mRNA del tmRNA va a posizionarsi nel canale stesso e quindi diventa il nuovo messaggero da tradurre. Nel sito A arriva un nuovo tRNA che leggerà il codone specifico su questa componente. Il tmRNA prende il posto dell’mRNA, che era troncato e quindi aveva lasciato vuoto il canale. Traslocando il tmRNA posiziona la sua componente a mRNA all’interno del canale. e) La componente a mRNA del tmRNA va a fungere da sostituto e quindi allontana la molecola di mRNA tronca e dirige su di esso la sintesi di una sequenza di ben 10 aa. Questo mRNA sostitutivo, portato dal tmRNA, viene ad essere letto di codone in codone in modo tale che la sua lunghezza è tale di essere a 10 codoni, dove ogni codone specifica per un aa. La traduzione continua fino a che si arriva al codone di stop, che permetterà di terminare la traduzione e di far rilasciare tutto l’apparato coinvolto nella sintesi proteica, quindi il tmRNA verrà rilasciato, come anche le subunità maggiore e minore, la catena polipeptidica e i vari tRNA. Il vantaggio di questo tmRNA è quello di far uscire il ribosoma dallo stato di stallo perché porta, con la sua parte simil-tRNA, un nuovo aa nel sito A, permettendo di allungare, con l’alanina, la catena polipeptidica e in più, con la sua componente ad mRNA, sostituisce l’mRNA tronco, si mette al suo posto dove non c’era e a questo punto arrivano i vari tRNA che leggono i 10 codoni, fino al codone di stop. Al codone di stop la traduzione termina, tutta la macchina traduzionale viene rilasciata e quindi i ribosomi possono essere riciclati, il tmRNA può essere riutilizzato, come anche i tRNA scarichi. La proteina può essere quindi rilasciata. Questa stringa di 11 aa (10 + il primo aa iniziale) che vengono addizionati all’estremità carbossiterminale della proteina che risultava tronca, costituisce una sequenza segnale e cellulare che porta la proteina ad essere degradata ad opera delle proteasi. Gli aa codificati dal tmRNA sono il segnale di una marcatura o etichetta che viene riconosciuta dalle proteasi cellulari, che provvedono a denaturare e degradare le proteine bersaglio che hanno questa etichetta. Negli eucarioti questo meccanismo non può avvenire, infatti, di fronte agli mRNA NON STOP mettono in atto un meccanismo differente, proprio perché negli eucarioti un mRNA che ha un'estremità 3’ rotta significa un mRNA privo di coda poliA. Un mRNA privo di coda poliA non viene proprio tradotto, ma degradato subito dalle nucleasi. Infatti, la coda poliA serve proprio per proteggere l’mRNA dall'azione delle nucleasi. Quindi, un mRNA con un'estremità 3’ rotta di questo tipo non ha sopravvivenza. Esistono però negli eucarioti degli mRNA NON STOP, che però vengono riconosciuti e rimossi con un meccanismo diverso. EUCARIOTI: DECADIMENTO DELL’ mRNA NON-STOP Per quanto riguarda gli eucarioti abbiamo altri tipi di meccanismi per andare a rilevare gli mRNA difettosi. Negli eucarioti non è possibile avere un mRNA tronco al 3’ da tradurre perché negli eucarioti un mRNA privo di coda poli-A viene immediatamente degradato dalle nucleasi. Negli eucarioti, però, possiamo avere degli mRNA NON-STOP, i quali vengono ad essere caratterizzati da un CAP al 5’ e una coda poli-A ma la parte a mRNA codificante manca di un codone di stop e quindi si parla in questo caso di mRNA NON-STOP. Di fronte a questi mRNA non-stop, quindi gli mRNA che sono completi perché hanno l’estremità 5’ CAP e al 3’ la coda poli-A ma che vengono ad essere privi di un codone di stop, gli eucarioti mettono in atto un meccanismo chiamato DECADIMENTO DELL’mRNA NON-STOP. Come si può vedere nell’immagine, di fronte all’mRNA non-stop, il ribosoma lo riconosce, lo traduce e continua la traduzione anche della coda poli-A, formando una serie di residui di lisina sulla proteina che sta sintetizzando il ribosoma. Questo perché la tripletta o codone a tripla A (AAA) è un codone che codifica per la lisina, quindi, il ribosoma viene praticamente a tradurre questo mRNA non-stop in tutta la sua lunghezza, compresa la coda poli-A, non comprendendo il codone di stop. Dunque, quello che otteniamo è una proteina tronca, perché non è presente il codone di stop, a cui è stato aggiunto questo tratto di polilisina alla sua estremità carbossi-terminale. A questo punto, una volta che il ribosoma viene a tradurre la coda poli-A in polilisina, il ribosoma si trova bloccato all’estremità di questo mRNA non-stop e l’mRNA bloccato in questa situazione recluta una proteina che si chiama Ski7, la quale lega il ribosoma e promuove il decadimento dell’mRNA non-stop. In particolare, Ski7 promuove la dissociazione della subunità maggiore e della subunità minore, liberando così l’mRNA che viene degradato grazie al reclutamento di un complesso che viene detto esosoma. L’esosoma viene quindi a degradare l’mRNA partendo dall’estremità 3’, gli esosomi infatti sono dei complessi di esonucleasi che lavorano in questa direzione, 3’-5’. Ski7 viene ad essere reclutato dal ribosoma che si trova in stallo sull’mRNA non-stop e a questo punto promuove la dissociazione della subunità maggiore e minore e recluta sull’mRNA rilasciato un esosoma, cioè un complesso di esonucleasi che lavorano in direzione 3’-5’, quindi iniziano a degradare dalla coda del messaggero. Il messaggero viene così degradato, anche la proteina viene degradata perché il tratto di poli-lisine rappresenta una “etichetta” sulla proteina affinché possa essere riconosciuta dalle proteasi. Quindi, negli eucarioti, il meccanismo di sorveglianza verso gli mRNA difettosi si esplica in diversi modi, uno di questi è il decadimento che si realizza sugli mRNA non-stop. Un altro meccanismo che troviamo negli eucarioti è il DECADIMENTO “NO-GO”. In questo caso, questo tipo di decadimento si viene a realizzare nel momento in cui il ribosoma si trova in stallo a causa di strutture secondarie stabili che si sono create sul messaggero a livello della sequenza codificante, oppure quando il ribosoma è in stallo perché siamo di fronte a tRNA carichi che sono poco rappresentati, quindi scarseggiano. Questo meccanismo di decadimento NO-GO si viene a realizzare quando i ribosomi sono in stallo su un mRNA che stiamo già traducendo, quindi una traduzione in questo caso già avviata e lo stallo del ribosoma può essere dovuto dal fatto che, come dicevamo precedentemente, l’mRNA abbia prodotto una struttura secondaria stabile che blocca quindi il percorso del ribosoma e che avviene a livello di una regione codificante oppure perché c’è una carenza di tRNA carichi in grado di riconoscere i codoni sull’mRNA, quindi tRNA carichi che dovrebbero codificare per i codoni su cui è posizionato il ribosoma sono scarsi. Quest’ultimo caso si verifica per quei codoni che vengono chiamati CODONI RARI ovvero codoni i cui corrispondenti tRNA sono poco concentrati, in quantità ridotta. Ma perché esistono questi codoni rari? I diversi aa sono specificati da codoni sinonimi ma i codoni sinonimi non sono utilizzati in maniera uniforme, infatti, vi è una preferenza nell’uso di certi codoni rispetto ad altri nel codificare un certo aa. Il fatto, quindi, che io abbia codoni più rari (vengono usati meno frequentemente) fa sì, di conseguenza, che ci siano meno corrispondenti tRNA carichi (scarseggiano). In questo modo, perciò, il ribosoma, o perché si tratta di una struttura secondaria nella regione codificante dell’mRNA o perché si trova a riconoscere nel suo sito A un codone raro per il quale il tRNA corrispondente scarseggia, entra in stallo ed entra in gioco il meccanismo che si chiama decadimento no-go. Come vediamo nell’immagine, il ribosoma in stallo viene a reclutare due proteine: Dom34 e Hbs1-GTP. Quest’ultima è una GTPasi e insieme queste due proteine si posizionano nel sito A. Nella subunità maggiore del ribosoma abbiamo il sito di legame a cui Hbs1 con il suo GTP interagisce, promuovendo l’idrolisi di GTP a GDP e promuovendo il suo rilascio. Quindi dopo aver portato Dom34 al ribosoma, Hbs1 va a idrolizzare il GTP a GDP e viene rilasciata. A questo punto abbiamo che Dom34, insieme a Ril1 (un’ATPasi), vengono a disassemblare il ribosoma in subunità maggiore e minore, viene anche reclutata una endonucleasi che provvede a tagliare in mezzo l’mRNA, creando un’estremità 3’ libera e un’estremità 5’ libera (sappiamo che il CAP al 5’ e la coda poli-A al 3’, finché ci sono, proteggono l’mRNA dall’azione delle esonucleasi ma non dall’azione delle endonucleasi) che vengono riconosciute rispettivamente dall’esosoma (complesso di esonucleasi che lavora in direzione 3’-5’) e da una endonucleasi chiamata Xrn1 che lavora in direzione 5’-3’. In questo modo l’mRNA viene degradato e viene rilasciata la proteina che sarà tronca e verrà degradata. Un ultimo meccanismo con cui gli eucarioti si difendono dagli mRNA difettosi è quello che viene chiamato NMD (NON SENSE MEDIATED mRNA DECAY, o per dirlo in italiano decadimento dell’mRNA mediato da codoni non senso). I codoni non senso sono un sinonimo di codoni di stop prematuri. L’mRNA, quando viene sottoposto a splicing, viene legato da dei complessi di giunzione a degli esoni che si trovano a monte di ciascuna giunzione esone-esone. Nel momento in cui l’mRNA viene sottoposto a splicing a monte di ciascuna giunzione esone-esone viene legato il complesso di giunzione degli esoni o EJC costituito da un pool di 4 proteine. EJC rappresentano un controllo di qualità dell’mRNA, infatti indicano che l’mRNA è stato sottoposto a splicing correttamente e che l’mRNA è pronto per essere trasportato dal nucleo al citoplasma. L’mRNA nel citoplasma rimane legato a queste EJC, che rappresentano proprio un controllo di qualità. Ma hanno anche un’altra funzione. Come si vede nell’immagine in alto, normale sta ad indicare un mRNA che non ha all’interno dell’ORF dei codoni di non senso, in questo caso l’mRNA ne è privo. Quelle in giallo indicano le EJC, mentre gli esoni sono indicati in verde scuro e in verde chiaro la AUG d’inizio e in rosso il codone di stop canonico alla fine della ORF. Questo meccanismo di controllo si realizza quando ho dei codoni di stop all’interno della regione codificante, quindi codoni di stop prematuri. L’mRNA normale arriva al citoplasma legato alle EJC pronto per la traduzione, arriva il ribosoma che riconosce l’mRNA e inizia a tradurre e man mano elimina le EJC. In condizioni in cui è presente invece un codone di stop prematuro, il ribosoma inizia a tradurre ma quando arriva e riconosce lo stop prematuro si blocca ed entra in stallo e la EJC a valle non viene rimossa ma rimane ancorata all’mRNA; questo rappresenta un segnale alla cellula che sta ad indicare che il ribosoma è entrato in stallo su un codone di stop prematuro e queste EJC a valle sul ribosoma in stallo sul codone di stop aiutano a reclutare 3 proteine che si chiamano Upf 1, Upf 2 e Upf3. Queste proteine, che vengono reclutate sul ribosoma, vengono a loro volta a reclutare e ad attivare due enzimi che aiutano a promuovere la degradazione dell’mRNA. In particolare, queste proteine Upf, una volta legate, reclutano e attivano un enzima che toglie il CAP al 5’ e un enzima chiamato deadenilante che rimuove la coda poli-A all’estremità 3’. L’mRNA, a questo punto, è rimasto senza CAP e senza la coda ed inizia così ad essere degradato dall’esosoma 3’-5’ e dalla endonucleasi 5’-3’. Inoltre, le Upf promuovono la dissociazione della subunità maggiore e minore del ribosoma dall’mRNA. SILENZIAMENTO GENICO MEDIANTE PICCOLI RNA Esistono anche delle modalità di silenziamento genico che prevedono l’utilizzo di piccoli RNA. In natura esistono diverse tipologie di questi piccoli RNA, noi parleremo di 2 di queste tipologie: 1. siRNA (short interfering RNA): possono essere prodotti artificialmente (in esperimenti di laboratorio) o sintetizzati in vivo, partendo in entrambi i casi da precursori di dsRNA 2. microRNA (miRNA o miR): derivano da precursori a RNA codificati da geni espressi nelle cellule in cui gli stessi miRNA svolgono specifiche funzioni regolatrici Quindi, il silenziamento genico e di conseguenza la regolazione dell’espressione genica può avvenire attraverso diversi meccanismi che utilizzano dei piccoli RNA, i quali possono essere ad esempio i siRNA o microRNA. I microRNA Sono codificati dai genomi eucariotici e agiscono sugli mRNA stessi, andando a produrre quello che viene chiamato silenziamento genico. Da dove derivano questi microRNA? Negli eucarioti superiori sono centinaia e centinaia diversi che vengono ad essere coinvolti nella regolazione dell’espressione genica in tantissimi mRNA bersaglio. Come si vede nell’immagine, questi microRNA vengono ad essere trascritti dall’RNApol II, che va a trascrivere innanzitutto dei trascritti primari dei miRNA indicati come pri-miRNA. Quindi i pri-mRNA derivano inizialmente dalla trascrizione di geni del genoma eucariotico che codificano per questi lunghi trascritti primari dell’mRNA chiamati primiRNA. Questi ultimi vengono ad avere una serie o più serie di sequenze complementari al loro interno, che determina la formazione di strutture tipiche a forcina. Sono tra l’altro dei pri-miRNA con coda poli-A e vengono ad essere lunghi anche parecchie migliaia di nt. Sempre a livello del nucleo, poi, questi pri-miRNA vengono processati da Drosha, un’endonucleasi nucleare che, come tale, taglia queste strutture a forcina creando dei precursori di miRNA di lunghezza inferiore (60-70 nt). Drosha fa parte della famiglia delle ribonucleasi della classe III, che sono per l’appunto endonucleasi che sono specifiche per l’RNA a doppio filamento, tagliando i primiRNA e creando delle forcine più corte, aventi all’estremità 3’ una sporgenza di due nt (sono a singolo filamento, non sono appaiati). Ricapitolando quello che avviene nel nucleo: l’RNApol II trascrive dei geni specifici per i trascritti primari dei miRNA, i pri-miRNA, che hanno delle sequenze complementari che li consentono di formare strutture secondarie a forcina e hanno una coda poli-A e sono lunghi parecchie migliaia di nt. Prima di passare nel citoplasma, questi pri-miRNA vengono ulteriormente processati da Drosha, una endonucleasi nucleare appartenente alla famiglia delle ribonucleasi di classe III, specifiche per riconoscere e tagliare RNA a doppio filamento. Drosha quindi taglia queste strutture a forcina, creando dei precursori dei miRNA o semplicemente pre-miRNA di 60-70 nt, aventi l’estremità 3’ di-nucleotidica sporgente. A questo punto questi pre-miRNA vengono esportati dal nucleo al citoplasma grazie a dei recettori specifici, tra cui uno dei più famosi è chiamata esportina 5 (proteina recettoriale), la quale permette di trasportare questi pre-miRNA attraverso i pori nucleari. Quando il pre-miRNA arriva nel citoplasma, non rimane da solo ma viene riconosciuto da un complesso che si chiama RISC (complesso del silenziamento indotto dall’RNA), un complesso di diverse proteine, tra cui troviamo Dicer. Dicer è un’altra ribonucleasi di classe III, che processa ulteriormente i pre-miRNA, producendo miRNA a doppia elica. Quindi, quando il pre-miRNA arriva nel citoplasma, viene caricato su questo complesso di proteine chiamato RISC che contiene tra le varie proteine dicer, un altro enzima delle ribonucleasi III che va a tagliare ulteriormente i pre-miRNA, producendo una molecola più corta, detta questa volta miRNA duplex (a doppia elica) di 20-22 nt. Il RISC contiene anche altre proteine, tra cui una proteina argonauta, anche lei un’endonucleasi ed interviene nel silenziamento del micro-RNA. Il miRNA duplex non è ancora nella sua forma matura, occorre che venga denaturato, infatti, c’è un RNA-elicasi che svolge, quindi separa, i due filamenti e rimane associato sul RISC solo uno dei due, che viene chiamato RNA guida. L’RNA guida è dunque il filamento che rimane associato a RISC e che determina la sua specificità verso un certo mRNA bersaglio. L’altro RNA viene chiamato RNA passeggero e viene generalmente eliminato. Quindi, dopo l’azione dell’RNA elicasi rimane associato al RISC solo un microRNA di 20-22 nt a singolo filamento, che sarà poi l’RNA che guiderà RISC sul messaggero che si vuole bloccare. Quando parliamo di micro-RNA maturi, parliamo di microRNA a singolo filamento di 20-22 nt. A questo punto RISC associato al microRNA maturo è pronto per essere guidato verso mRNA specifici; l’interazione del microRNA può essere di 2 tipologie: ● A complementarietà quasi perfetta: le basi del microRNA si appaiano quasi completamente con quelle dell’mRNA bersaglio. In questo caso abbiamo quindi che RISC viene a tagliare questo mRNA grazie alla sua componente argonauta. Quindi, quando l’RNA guida porta il RISC su un mRNA, con il quale questo microRNA guida si va ad appaiare in maniera quasi perfetta, è attivata la componente endonucleasica, che si chiama argonauta, di RISC e in questo modo l’mRNA viene tagliato e poi degradato. Questo tipo di silenziamento, in cui il microRNA è quasi perfettamente complementare all’mRNA citoplasmatico bersaglio, avviene più spesso nelle piante ● A complementarietà parziale, imperfetta: avviene molto spesso negli animali. In questo caso il microRNA guida porta RISC sull’mRNA bersaglio ma a questo mRNA si appaia parzialmente. Si hanno dei loop che corrispondono a delle regioni del microRNA le cui basi non sono complementari con quelle dell’mRNA bersaglio. Dunque, il silenziamento genico avviene attraverso una traduzione che viene praticamente bloccata, ovvero il RISC associato a questo mRNA va a produrre una inibizione della traduzione dell’mRNA legato tramite un processo che probabilmente impedisce l’inizio della traduzione stessa. Successivamente alla traduzione repressa, il complesso viene dissociato e l’mRNA viene degradato ad opera delle varie nucleasi Quindi, i nostri microRNA maturi che funzionano da guida portano RISC andando ad appaiarsi o in maniera quasi perfetta o in maniera parziale con l’mRNA bersaglio. Per gli animali l’evento più frequente è quello in cui c’è una complementarietà parziale, mentre per le piante è l’evento con complementarietà quasi perfetta. Nel caso in cui la complementarietà sia quasi perfetta, l’mRNA citoplasmatico viene immediatamente degradato ad opera di RISC e in particolare dalla sua componente argonauta; mentre, invece, nel caso della complementarietà parziale, il complesso RISC porta a un blocco della traduzione, impedendo l'inizio stesso di essa e successivamente tutte le componenti verranno dissociate e l’mRNA viene degradato. siRNA Il secondo meccanismo, invece, sono i siRNA, i quali derivano da precursori più lunghi, ossia degli RNA a doppia elica che devono essere lunghi almeno 30 nt perché altrimenti questo meccanismo non viene attivato. Quindi, il punto di partenza dei siRNA sono dei lunghi RNA a doppia filamento che hanno una lunghezza superiore ai 30 nt altrimenti il processo non viene attivato. Da dove derivano? O vengono introdotti dal ricercatore sperimentalmente all’interno delle cellule, oppure sono prodotti dalla cellula in seguito ad una infezione virale. Questo lungo RNA introdotto nella cellula (siamo nel citoplasma), viene tagliato da Dicer, quindi, anche lui viene riconosciuto dal complesso RISC, e produce RNA corti di circa 21-27 bp aventi estremità 3’ di-nucleotidiche sporgenti. I siRNA sono corti RNA costituiti circa da 21-27 paia di basi e hanno 2 nt sporgenti all’estremità 3’. Anche in questo caso i siRNA vengono riconosciuti da RISC, vengono legati e viene selezionato il filamento guida mentre l’altro viene eliminato. Il filamento guida porta RISC sull’mRNA bersaglio, in cui siRNA va ad appaiarsi con una complementarietà perfetta o una imperfetta. Nel caso dei siRNA è più frequente la complementarietà perfetta. I siRNA sono presenti in tutti gli eucarioti eccetto nei lieviti e rappresentano un meccanismo di difesa dei virus e dei trasposoni. Oppure vengono usati nei laboratori per silenziare gli mRNA bersaglio, come ad esempio mRNA che possono essere oggetto di proteine difettose o tossiche. Può essere anche usato se si ha una proteina di cui non si sa la funzione e si vuole bloccare la traduzione della proteina stessa. Un altro aspetto molto importante dei siRNA è quello che è stato osservato nei nematodi dove si è vista un'amplificazione della regolazione genica mediata dai siRNA. Abbiamo detto che da lungo RNA a doppio filamento, Dicer taglia e crea i siRNA che vengono riconosciuti da RISC. Questi siRNA vengono poi a denaturarsi in modo che rimanga unito a RISC solo il filamento guida che lo porterà a legare l’mRNA bersaglio. Se notiamo, quando il nostro siRNA a singolo filamento si appaia con le basi complementari ad una sequenza specifica dell’mRNA bersaglio, crea a tutti gli effetti una sorta di giunzione innesco-stampo. Quest’ultima che ha un’estremità 3’ libera, viene infatti riconosciuta da una RNA pol che viene chiamata RdRP ed inizia ad allungare il filamento, allungandolo e produce un RNA a doppio filamento, il quale viene di nuovo riconosciuto da Dicer e tagliato in nuovi siRNA, i quali possono essere di nuovo reclutati da RISC e possono amplificare tutto questo processo. Introduzione alle tecniche di base di Biologia Molecolare ESTRAZIONE DEL DNA MATERIALE DI PARTENZA Il DNA lo si può estrarre da: ● cellule animali: hanno membrana e citoscheletro molto deboli, quindi per l’estrazione del DNA è sufficiente utilizzare delle tecniche di estrazione blande. ● cellule vegetali: hanno una dimensione maggiore e presentano una parete spessa, costituita da cellulosa, più l’eventuale presenza di immina e cere. Per l’estrazione del DNA a partire da cellule vegetali sono richieste grandi forze meccaniche e quindi sono necessari metodi di rottura più drastici. ● cellule batteriche: con dimensioni molto più piccole e una parete spessa, formata da peptidoglicano. Nello specifico nel caso dei batteri GRAM-, la membrana esterna è costituita da lipoproteine e lipopolisaccaridi, che permettono al batterio di proteggersi dalla degradazione. In questo caso, per distruggere la membrana di questi batteri, viene utilizzato l’EDTA (sostanza chimica chelante, che va a destabilizzare la membrana; è un metodo di rottura un po’ più drastico). Nel caso dei batteri GRAM+, per andare a degradare il peptidoglicano viene utilizzato un enzima, chiamato lisozima, il quale è un enzima battericida, che si trova comunemente nei fluidi corporei, come la saliva (ci protegge quindi dall’ingresso dei batteri). ● funghi e lieviti: hanno una parete spessa costituita da polisaccaridi, quindi, anche in questo caso per l’estrazione sono richieste delle tecniche con elevata forza meccanica, si ha bisogno di metodi di rottura più drastici. PASSAGGI nell’immagine vi è l’esempio di una coltura batterica 1. Raccolta delle cellule: le cellule vengono fatte crescere, queste poi vengono raccolte per centrifugazione, dove le cellule più pesanti si posizionano in basso, andando a formare quello che viene chiamato PELLET (= massa biancastra costituita da cellule che si formano sul fondo della provetta). Nella parte alta si ha il SURNATANTE o SOPRANATANTE, che è costituito da tutte quelle componenti che sono state secrete dalle cellule. Quindi, in questa fase vengono separate le cellule da tutto il resto. 2. Lisi delle cellule: si ha bisogno di rompere le cellule per poter avere l’estratto cellulare, che contiene il DNA (ovvero quello che noi vogliamo ottenere). Per evitare la degradazione del campione da parte di enzimi presenti fisiologicamente negli estratti, il materiale o l’estratto cellulare, deve essere o subito utilizzato oppure congelato, quindi messo in freezer fino all’utilizzo. 3. Purificazione del DNA: l’estratto cellulare contiene varie componenti ma l’obiettivo è isolare/purificare solo il DNA e quindi vengono rimossi tutti gli altri contaminanti che non sono altro che gli altri componenti cellulari. 4. Concentrazione del DNA: molto spesso, nel momento in cui il DNA è purificato, proprio per i metodi che si utilizzano e proprio perché il DNA si trova all’interno di solventi, è molto diluito e quindi quest’ultima fase serve per aumentare la concentrazione del DNA. 2. LISI DELLE CELLULE Per poter lisare le cellule si possono utilizzare metodi meccanici e metodi non meccanici, in presenza di un opportuno tampone o buffer di estrazione. La scelta tra i due metodi viene effettuata in base alla natura del materiale di partenza e in base a dove è localizzata la molecola che si vuole estrarre. ● METODI MECCANICI ○ Omogeneizzatore (sono frullatori normali o a immersione): vanno a sfruttare le forze taglienti di una lama; le cellule vengono tagliate e frullate con il tampone di estrazione. Le lame vanno quindi a disgregare e a rompere le membrane, proprio perché ruotano ad altissima velocità. Nello specifico l’omogeneizzatore viene utilizzato per tessuti animali e vegetali. ○ Frantumazione con aggiunta di molecole abrasive: viene fatta una vera e propria disgregazione fisica, ad esempio può essere utilizzato un mortaio e un pestello dove, all’interno del mortaio, viene inserito il tampone di estrazione e le cellule che, nella maggior parte dei casi, sono addizionati a delle particelle abrasive, come la sabbia o l’allumina (= l’ossido dell’alluminio). Con il pestello vengono frizionate a mano in modo da determinarne la rottura. Per lisare queste cellule sono necessarie forze frizionarie. Per una riuscita ottimale di questa metodica è necessario che gli abrasivi abbiano circa la stessa dimensione cellulare. Possono essere anche utilizzati dei pestelli che vanno a frantumare il DNA all’interno di provette lunghe di vetro, che sono quelle raffigurate dietro il mortaio e il pestello (in questo caso il pestello è o in teflon o in vetro e ha un diametro leggermente più piccolo del tubo di vetro, che contiene la sospensione delle cellule). Andando a frizionare con il pestello si ha la rottura delle membrane, proprio perché il pestello esercita delle forze frizionarie contro le pareti del tubo. Nello specifico viene utilizzata questa tecnica per cellule batteriche e vegetali. Nel caso delle cellule di lievito, queste sono rotte tramite l’aggiunta di sferette di vetro, con dimensioni simili alle cellule, in egual volume. Dopo l’aggiunta delle sferette si effettua una “vortexata” (= mescolata molto vigorosa) e l’azione abrasiva delle sferette di vetro causa la rottura delle cellule; questo è un metodo molto drastico, proprio per la difficoltà di rompere le membrane dei lieviti. ● Sonicazione: avviene tramite sonicoltori, che sono degli strumenti che emettono ultrasuoni ad alta frequenza; le onde d’urto degli ultrasuoni vanno a rompere le membrane delle cellule proprio per le elevate pressioni locali, che sono indotte dalle onde. Nella sospensione cellulare, dove sono stati inseriti tampone e cellule, viene immersa una sonda metallica del sonicatore, che viene acceso e le membrane vengono disgregate. Il sonicatore ha lo svantaggio di una elevata produzione di calore, si ha un surriscaldamento che non è positivo per l’estratto di sonicazione, proprio perché il DNA viene denaturato con le alte temperature. È necessario che il contenitore, dove vi è l’estratto cellulare, venga inserito all’interno del ghiaccio, proprio per evitare il surriscaldamento dell'estratto cellulare che si dovrà produrre. Gli ultrasuoni sono pericolosi per l’operatore e possono dare problemi di udito, infatti, quando si usa il sonicatore, vengono utilizzate delle cuffie antirumore. La sonicazione è utilizzata generalmente per tutti i tipi di cellule. ● Presse: ad esempio la “french press” fa sì che la sospensione cellulare, quindi le cellule, siano poste in una camera di compressione in acciaio inox, la quale è dotata di un pistone e chiusa da una valvola a spillo. Tramite il pistone, si rimuove tutta l’aria dalla camera e in questo modo sulla sospensione cellulare viene applicata una pressione idraulica elevata fino al raggiungimento di 1000 atm, sottoponendo le cellule a una compressione notevole; poi lentamente si apre la valvola a spillo, così che le cellule possano fuoriuscire da essa. A causa della repentina variazione dei valori di pressione, cui sono sottoposte, uscendo dalla valvola, le cellule scoppiano e si frantumano. Essendo un metodo abbastanza drastico, viene indicato per cellule batteriche e cellule dei lieviti. In generale, tutti i metodi meccanici generano calore, quindi è sempre meglio pre-refrigerare il materiale di partenza e quindi il tampone (all’interno del quale le cellule sono sospese) e anche lo strumento, in modo tale da evitare il surriscaldamento e far sì che non ci sia degradazione delle molecole presenti nell’estratto e nel nostro caso specifico la denaturazione del DNA. ● METODI NON MECCANICI o Enzimi litici: la lisi viene fatta per digestione enzimatica, che avviene grazie all’utilizzo di enzimi litici, che vanno a danneggiare la membrana e la parete. Un esempio è rappresentato dal lisozima, come già stato detto. Un altro esempio è rappresentato dalle zimolasi e liticasi: enzimi che hanno la stessa funzione del lisozima ma per i funghi, quindi vanno a ledere la parete fungina. Questi enzimi litici vanno ad essere sciolti e addizionati nel tampone, con cui verranno risospese le cellule. o Aggiunta di detergente e proteasi: i detergenti, come ad esempio SDS (Sodio dodecil solfato), vanno a rimuovere la componente lipidica delle membrane e in questo modo ne provocano la lisi. Nello specifico, questo non è un metodo drastico e quindi solitamente viene utilizzato per andare a lisare le cellule animali, che hanno bisogno di lisi blande. Può essere utilizzato anche EDTA (etilendiamminotetraacetico), che è un composto chimico chelante che va a rimuovere gli ioni magnesio, essenziali per il mantenimento dell’involucro esterno dei batteri. L’EDTA ha la stessa funzione dei detergenti ma per le cellule batteriche. o Congelamento e scongelamento: metodo abbastanza blando, che prevede il congelamento della sospensione cellulare e nel momento in cui le cellule vengono congelate, si formano dei cristalli di ghiaccio, che vanno a danneggiare la membrana cellulare, con conseguente fuoriuscita di materiale intracellulare. Questa tecnica viene utilizzata per lisare le cellule animali. o Shock osmotico: le cellule sono lisate per osmosi. Viene utilizzato prevalentemente per cellule che non hanno parete, quindi come quelle eucariotiche, soprattutto quelle molto fragili. Ad esempio, è un metodo molto utilizzato per andare a lisare gli eritrociti (ossia i globuli rossi). Per andare a lisare gli eritrociti, questi vanno inseriti o meglio vanno risospesi in acqua distillata. L’acqua distillata è un ambiente ipotonico rispetto alle cellule e per questo motivo si crea una differenza di pressione osmotica fra l’ambiente intracellulare e quello extracellulare e per questo motivo l’acqua entra all’interno del globulo rosso, che si rigonfia fino ad esplodere. In questo modo viene rilasciato l’estratto cellulare, costituito da tutte le componenti cellulari. In alternativa, oltre ad utilizzare direttamente una soluzione ipotonica, si può aggiungere una soluzione ipertonica (come una soluzione di saccarosio concentrata al 20% peso/volume), così che l’acqua tende a fuoriuscire dalle cellule; le cellule poi sono subito trasferite in una soluzione ipotonica (quindi in acqua distillata) e in questo modo l’acqua entra nelle cellule, che subiscono la lisi. In generale, come per i metodi meccanici, alla fine si ottiene un estratto cellulare. TAMPONE DI ESTRAZIONE Sia che si utilizzino metodi meccanici, che non, il campione con le cellule è risospeso all’interno di un tampone di estrazione, chiamato anche soluzione tampone. Questo serve sicuramente da: ● solvente: quindi per risospendere le cellule ● mezzo di raffreddamento: in quanto per evitare il surriscaldamento, sia gli strumenti, che anche il campione devono essere refrigerati. Questo mezzo nel momento in cui viene refrigerato, serve per abbassare la T. ● principalmente serve a preservare l’integrità biologica dei componenti cellulari: il tampone va a sostituire i tamponi intracellulari, che sono fisiologicamente presenti nella cellula, e impedisce che ci siano variazioni di pH e forza ionica. Mantiene la forza ionica fra 0,1 e 0,2 M e mantiene il pH fra 7-8. I tamponi sono costituiti da tris o fosfato e da sali inorganici (come KCl o NaCl). Sono in grado di neutralizzare gli ioni, i quali andrebbero a modificare il pH della soluzione. DETERGENTI Quando si va ad estrarre il DNA, a questi tamponi di estrazione sono aggiunti i detergenti, come ad esempio il triton X-100 e SDS, che vanno a rimuovere la componente lipidica delle membrane, causando la rottura e il rilascio dei componenti sia di membrana che intracellulari. Nel caso di cellule animali è sufficiente, nelle condizioni meno drastiche, l’utilizzo di blandi detergenti. 3. PURIFICAZIONE DEL DNA Nel momento in cui le cellule sono state lisate, prima di tutto bisogna separare la frazione solubile, quindi quella costituita da proteine, acidi nucleici, metaboliti cellulari, da quella insolubile, costituita da frammenti di membrana o di parete cellulare e proteine che precipitano, come corpi di inclusione/nucleosione. Per fare questa prima separazione, si può effettuare una centrifugata, dove la parte insolubile viene portata in basso sotto forma di pellet, mentre la parte solubile rimane in alto. Questo però non è sufficiente se si vuole ottenere alla fine solo il DNA, bisogna rimuovere tutti gli altri componenti che non sono DNA e che sono presenti nella parte solubile dell’estratto cellulare, come ad esempio le proteine, perché alcune proteine potrebbero andare a degradare il DNA, come le DNAsi. Bisogna eliminare anche tutti gli altri interferenti, che possono andare a interferire con le procedure successive. I metodi utilizzati per la purificazione del DNA sono: ● la digestione enzimatica ● estrazione organica ● tecniche cromatografiche ESTRAZIONE ORGANICA Prevede l’aggiunta o di fenolo o di una miscela, costituita da fenolo e cloroformio, in rapporto 1:1. L’estratto cellulare, ottenuto mediante la lisi, viene miscelato con il fenolo o con la miscela; a quel punto viene fatta una centrifugazione, che permette la separazione delle fasi. Il fenolo e il cloroformio sono dei solventi organici, che causano la precipitazione delle proteine, che vengono quindi denaturate e di conseguenza precipitano. In seguito alla centrifugazione e in presenza di solventi organici si vanno a formare 3 fasi: 1. Fase acquosa: contiene sia il DNA che RNA, quindi gli acidi nucleici 2. L’interfaccia: massa biancastra molto sottile, presente tra le due fasi, che contiene le proteine precipitate 3. Fenolo: che è stato utilizzato per l’estrazione ➢ Se si utilizza del fenolo equilibrato, con un tampone neutro o basico, nella fase acquosa si ottiene solo DNA. ➢ Se invece si utilizza fenolo acido, si ha solo RNA nella fase acquosa e il DNA si trova nella fase organica, ovvero l’interfaccia, mentre le proteine sono insieme al fenolo. A volte una estrazione fatta in questo modo non è sufficiente a purificare completamente il DNA, quindi, è possibile fare più estrazioni in sequenza, ma non è consigliato eccedere, perché ripetute estrazioni potrebbero andare a rompere parte delle molecole di DNA, che è ciò che noi vogliamo preservare. METODO DI DIGESTIONE ENZIMATICA Il trattamento con fenolo è in grado di rimuovere anche molecole di RNA, come mRNA, ma la maggior parte di RNA rimane nella fase acquosa, insieme al DNA, quindi, per poter andare a purificare il DNA e quindi eliminare RNA, si può utilizzare una RNAsi, ovvero un enzima che permette di eliminare, o meglio tagliare e rimuovere l’RNA, che viene aggiunto alla fase acquosa. Si possono anche utilizzare le proteasi, che sono enzimi che vanno a rimuovere le proteine. Le proteasi digeriscono le proteine in peptidi più piccoli, che vengono facilmente rimossi. Solitamente le proteasi vengono aggiunte prima dell’estrazione fenolica e successivamente si procede con l’estrazione organica per permettere di purificare il DNA. TECNICHE CROMATOGRAFICHE Le tecniche cromatografiche permettono di separare la miscela nei suoi vari componenti. Nel nostro caso, la cromatografia ci aiuta a separare il DNA dagli altri componenti cellulari, come l’RNA e le proteine. Per purificare il DNA sono usati principalmente due metodi cromatografici, che sfruttano le differenze di carica elettrica per separare i vari componenti: ● Cromatografia a scambio ionico ● Silica technology CROMATOGRAFIA = tecnica per separare una miscela di composto nei relativi componenti per poterli analizzare separatamente. La miscela è nel nostro caso l’estratto cellulare e i vari componenti sono l’RNA, il DNA e le proteine. Le tecniche cromatografiche permettono la separazione della miscela perché i suoi diversi componenti si distribuiscono diversamente tra due fasi immiscibili. La distribuzione è descritta dal coefficiente di distribuzione, detto anche coefficiente di ripartizione. Coefficiente di distribuzione (Kd) o coefficiente di ripartizione Le due fasi vengono rappresentate nei due colori: rosa (A) e giallo (B). Il campione, a seconda dell’affinità con le due basi, si distribuisce in maniera diversa. Il coefficiente di distribuzione (Kd) è: Kd rimane costante ad una data temperatura, perché T può variare l’affinità del composto. Le due fasi immiscibili sono: ● FASE FISSA: quella immobile, detta anche stazionaria, può essere solida o liquida ● FASE MOBILE: che può essere liquida o gassosa, che scorre sopra la fase fissa Le due fasi immiscibili sono scelte in modo tale che l’affinità dei vari composti da separare sia diversa. È necessario che i composti da separare abbiano diversa Kd. L’analita attraversa la fase fissa mediante il flusso della fase mobile, si muove perciò continuamente fra le due fasi; maggiore è l’affinità per la fase fissa, maggiormente viene trattenuto e di conseguenza la sua eluizione è ritardata. Se l’analita ha bassa affinità con la fase fissa, non viene trattenuto e perciò viene eluito in fretta. Come avviene la separazione/quali sono i passaggi della cromatografia: 1. Preparazione del sistema cromatografico con fase fissa 2. Applicazione del campione, in cui i componenti vanno a interagire con la fase stazionaria con affinità diverse 3. Applicazione della fase mobile e il movimento degli analiti, che si distribuiscono in base alla loro affinità per le due fasi 4. Sviluppo o separazione degli analiti 5. Eluizione degli analiti Le due principali tecniche cromatografiche per purificare il DNA sono la cromatografia a scambio ionico e la silica technology Cromatografia a scambio ionico Le molecole vengono separate in base ai gruppi funzionali dotati di carica elettrica. La cromatografia a scambio ionico si basa sulla formazione di un legame IONICO fra la molecola da purificare e le molecole cariche di segno opposto sulla matrice della fase fissa, associate a controioni (= ioni di carica opposta). Nel momento in cui viene ingerito il campione, che presenta la molecola da purificare, si ha COMPETIZIONE fra la molecola d’interesse e i controioni della fase fissa e l’interazione con i gruppi carichi elettricamente. A questo punto i controioni vengono scalzati dalla fase fissa e si legano le molecole di interesse. La separazione avviene quindi in base alla forza di legame con le particelle di carica opposta. ● Si parla di cromatografia a scambio anionico quando la matrice è carica positivamente e interagisce con molecole di interesse cariche negativamente ● Si parla di cromatografia a scambio cationico quando la matrice presenta molecole cariche negativamente e va a interagire con molecole di interesse cariche positivamente La cromatografia può essere a scambio cationico o anionico, a seconda del segno delle cariche presenti sulla fase fissa. La fase fissa, quella stazionaria, è costituita da resine scambiatrici di ioni e questi possono essere: ● scambiatori anionici: resine con gruppi funzionali carichi positivamente che interagiscono con ioni carichi negativamente (come nell’esempio gli ioni cloro, che funzionano da controioni). Inizialmente le resine sono equilibrate con un tampone in grado di fornire un controione, che hanno una carica opposta a quella della resina. Quando i componenti della miscela vengono eluiti lungo la colonna, quelli carichi negativamente spiazzano i controioni e si legano alla matrice. ● scambiatori cationici: funzionano nello stesso modo ma sono matrici che possiedono gruppi funzionali carichi negativamente, che vanno a interagire con molecole cariche positivamente; in questo caso i controioni sono ioni sodio che sono spiazzati da molecole cariche positivamente. Un esempio di scambiatore anionico è l’DEAE (Diethylaminoethyl cellulose): la resina formata da DEAE è carica positivamente, a cui viene aggiunta un estratto costituito da varie molecole che hanno sia carica positiva che negativa. Quelle con carica positiva vengono eluite immediatamente, mentre quelle con carica negativa si vanno a legare con la DEAE. A questo punto le molecole più affini sono quelle che vengono eluite alla fine, mentre quelle legate con una forza minore vengono eluite per prime. Come applicare la cromatografia a scambio ionico per la purificazione del DNA Il DNA è carico negativamente, quindi si lega a una resina carica positivamente. I legami elettrici vengono distrutti dai sali, quindi la rimozione delle molecole legate più saldamente richiede concentrazioni più elevate di sali; aumentando la concentrazione salina, le varie molecole si staccano dalla resina, a seconda della forza di interazione che hanno con la resina stessa. In condizioni di bassa salinità, tutte le molecole che non hanno carica negativa, passano attraverso la colonna e vengono eluite; invece, le molecole cariche negativamente, come il DNA, si legano alla resina. Aumentando gradualmente la concentrazione dei sali, vengono prima eluite le proteine cariche negativamente e poi l’RNA, anch’esso carico negativamente. Il passaggio di una soluzione a salinità molto alta permette l’eluizione del DNA privo di RNA e proteine. Il distacco della molecola di interesse dallo scambiatore avviene modificando la forza ionica del tampone di eluizione. Si usano quindi ingredienti di forza ionica. Kit commerciali Questi kit sono ottimizzati per purificare il DNA. La procedura è basata su buffer ottimizzati per lisare le cellule, che contengono proteasi. A quel punto il lisato è legato/caricato sulla colonnina che contiene la resina e il DNA si va a legare alla resina carica positivamente alle opportune condizioni di basso sale e pH. L’RNA, le proteine e le impurità a basso peso molecolare sono rimosse con un lavaggio a medio sale mentre il DNA è eluito in condizioni di alte concentrazioni di sali e successivamente viene concentrato e desalato (= il sale viene eluito), grazie alla precipitazione in etanolo, condotta a T ambiente per minimizzare la co-precipitazione dei sali. Silica technology Tecnologia che sfrutta l’utilizzo di particelle di silice. Il DNA si lega alle particelle di silice con forza in presenza di sali caotropici. Tra questi il più utilizzato a questo scopo è il guanidinio tiocianato. Gli agenti caotropici, come il guanidinio tiocianato, sono composti che vanno a interferire con i legami H, responsabili dell’interazione con l’acqua, permettendo l’interazione del DNA carico negativamente, con la silice, carica positivamente. Nel momento in cui la concentrazione dei sali è bassa, l’aggiunta di acqua va a destabilizzare il legame tra DNA e silice e quindi il DNA viene eluito. PASSAGGI CHE SI HANNO QUANDO SI UTILIZZA UNA COLONNINA CON MEMBRANA DI SILICE L’estratto viene caricato sulla colonnina, la cui matrice è fatta di particelle di silice e all’estratto viene aggiunto il guanidinio tiocianato. Polisaccaridi e proteine non si legano alla membrana e vengono rimossi. Gli acidi nucleici legano la membrana e a quel punto viene fatto un lavaggio con un buffer contenente alcool per eliminare i sali; l’RNA è eliminato lavandolo con un buffer contenente RNAsi (enzima che va a distruggere l’RNA). Il DNA viene purificato, ovvero viene eluito aggiungendo acqua, la quale va a destabilizzare le interazioni tra DNA e silice, permettendone così la dissociazione, eluizione nonché purificazione. Esistono anche in questo caso dei kit commerciali, che si basano sulla silica technology; uno di questi kit è quello che verrà utilizzato durante l’esperienza in laboratorio per purificare il DNA, che viene chiamato DNAse, della ditta Qiagen. Il kit va a combinare le proprietà di legame della silice con la tecnologia micro-spin, ovvero la centrifugazione. Le cellule vengono lisate, si ottiene un estratto cellulare, al quale viene aggiunto il guanidino tiocianato e il tutto viene caricato su una membrana di silice. Tutti i contaminanti vengono eluiti e rimane legato solo il DNA. Vengono eliminati i sali caotropici con un buffer su base alcolica e a quel punto per poter eluire il DNA viene aggiunta acqua. CONCENTRAZIONE DEL DNA Come è possibile concentrare il DNA? Prima di rispondere a questa domanda, ci si deve chiedere come mai è importante concentrare il DNA. Molto spesso nel momento in cui una soluzione di DNA viene purificata dall’estratto, si ottiene una soluzione molto diluita. Per gli esperimenti che vengono fatti successivamente alla purificazione è necessario andare a concentrarlo. La concentrazione avviene solitamente facendo precipitare il DNA con alcool, che può essere isopropanolo o etanolo, in presenza di cationi monovalenti. Tutto questo deve avvenire a una T = 20° o inferiore. In presenza di cationi monovalenti e a una T di -20° o inferiore, l'alcool, quindi isopropanolo o etanolo, ma in particolare l’etanolo, è in grado di far precipitare efficacemente i polimeri di acido nucleico. Se la soluzione è satura di DNA, l’etanolo viene posto sul menisco superiore del campione (come si può vedere nell'immagine di sx, (a)). A questo punto si ha l’accumulo del DNA precipitato a livello dell'interfaccia fra le due fasi, quindi etanolo e la soluzione concentrata di DNA. Un trucco consiste nell’immergere una asticella di vetro attraverso l’etanolo, nella soluzione di DNA e quando l’asticella viene estratta, le molecole di DNA aderiscono all’asticella e nel momento in cui l’asticella viene tirata su si formano proprio dei lunghi filamenti, che non sono altro che le fibre di DNA. In questo modo è possibile, avendo solo le molecole o meglio le fibre di DNA, trasferirle in un altro solvente che è presente in minor quantità e quindi è possibile concentrarlo. In alternativa miscelando l’etanolo con la soluzione di DNA diluita, questo va a precipitare e quindi può essere recuperato, sotto forma di pellet, che si ottiene per centrifugazione. Eliminando la parte del surnatante, il pellet può essere risospeso e si ha un volume di acqua più basso. La precipitazione in etanolo ha il vantaggio di lasciare gli acidi nucleici a catena corta e le loro componenti monomeriche in soluzione. Così è possibile eliminare in questa fase i ribonucleotidi generati dal trattamento con le ribonucleasi. Dopo che si ha fatto precipitare il DNA, per poterlo concentrare, è necessario rimuovere i cationi monovalenti, che possono interferire con le successive analisi molecolari. A questo scopo, viene effettuato un lavaggio con etanolo, concentrato al 70%; in seguito al lavaggio i cationi monovalenti vengono eliminati. Si può così eliminare anche l’etanolo e risospendere il DNA in acqua, per utilizzarlo negli esperimenti successivi. QUANTIFICAZIONE DEL DNA Quantificare il DNA significa misurare la concentrazione del DNA estratto. Questa informazione è necessaria per tutti gli esperimenti che verranno fatti a partire dal DNA estratto. La concentrazione del DNA può essere misurata accuratamente, tramite SPETTROFOTOMETRIA UV. SPETTROFOTOMETRIA = tecnica ottica di analisi basata sull’interazione delle radiazioni elettromagnetiche, come quelle ultraviolette o visibili, con la materia. Quando la tecnica spettroscopica si basa sull’assorbimento della radiazione elettromagnetica da parte della materia, si parla di spettroscopia di assorbimento. Quando le radiazioni, comprese nel visibile e ultravioletto, vengono assorbite dalla materia, provocano una redistribuzione degli elettroni di valenza, ossia una loro transizione. Nel momento in cui le molecole assorbono una radiazione di lunghezza d'onda compresa tra 200800 nm, quindi nello spettro del visibile, si verifica la promozione o transizione di un elettrone della molecola dallo stato fondamentale allo stato eccitato. Per far avvenire la transizione è necessaria una certa quantità di energia, chiamata energia di attivazione, fornita dalla radiazione elettromagnetica incidente, che colpisce la materia. Quando l’elettrone ritorna dallo stato eccitato allo stato fondamentale, la molecola cede energia sotto forma di radiazioni elettromagnetiche; si parla quindi di luce trasmessa. Non tutte le molecole assorbono nel visibile, ma solo quelle che hanno degli elettroni delocalizzati, che in presenza dell’energia di attivazione passano da uno stato a un altro. Queste molecole sono quelle che hanno: ● Doppi legami ● Doppietti liberi ● Doppi legami coniugati ● Anelli aromatici Un esempio è la molecola di DNA. PARAMETRI RELATIVI ALL’ASSORBIMENTO La trasmittanza e l’assorbanza sono due parametri relativi alla spettrofotometria di assorbimento. La trasmittanza misura la frazione di luce incidente che viene trasmessa. Quando la luce incidente (I0), che altro non è che la fonte di energia, passa attraverso un campione, a quel punto questa viene assorbita e di conseguenza l'intensità della luce diminuisce. L’intensità della luce trasmessa attraverso il campione (I) è minore di quella incidente (I < I0). Per misurare la trasmittanza (T): T = I/I0 L’assorbanza misura quanta parte di luce incidente viene assorbita quando passa attraverso il campione. L’assorbanza (A) è facilmente misurabile partendo dalla trasmittanza, è quindi: STRUMENTAZIONE SPETTROFOTOMETRO L’assorbanza è possibile misurarla tramite lo SPETTROFOTOMETRO. Lo spettrofotometro presenta una sorgente di luce rappresentata da una lampada che genera un fascio di luce. La lampada è a filamento di tungsteno per il visibile e a deuterio o idrogeno per l’ultravioletto. Il fascio di luce passa attraverso un filtro monocromatore, che lascia passare solo una determinata lunghezza d’onda, che sarà poi la luce incidente. La luce incidente attraversa il campione da analizzare, presente in soluzione, posto all’interno di una cuvetta (= contenitore dalla forma di un parallelepipedo di lunghezza variabile). La lunghezza della cuvetta viene chiamata cammino ottico e solitamente misura 1 cm. La luce trasmessa dal campione raggiunge il rivelatore, chiamato anche detector, che trasforma l’intensità della radiazione elettromagnetica emessa in un segnale elettrico. Il registratore fornisce il valore di assorbanza. Gli spettrofotometri possono essere: ● A singolo raggio: vi è una sola cella di alloggiamento del campione, quindi, tutta la luce monocromatica selezionata attraversa il campione; essendoci una sola cella, la lettura del bianco avviene prima della lettura del campione. Cos’è il bianco? Come già detto, le molecole da analizzare come il DNA, sono in soluzione, quindi in un reagente o buffer. Anche il reagente può assorbire la luce monocromatica incidente e questa assorbanza andrebbe a sommarsi all’assorbanza del campione, determinando una sovrastima della quantità di molecole di interesse presenti. Per questo motivo si fa la lettura allo spettrofotometro del bianco, ossia si va a leggere e determinare l’assorbanza del singolo buffer, privo degli analiti di interesse, e poi tale valore lo si va a sottrarre all’assorbanza misurata in seguito alla lettura del campione in soluzione. Questa operazione viene chiamata sottrazione del bianco e generalmente viene fatta in automatico dallo strumento. ● A doppio raggio: ci sono due celle di alloggiamento, una per il bianco e una per il campione. Considerando che entrambe le celle devono essere colpite dalla luce monocromatica incidente, questa viene sdoppiata, grazie all’utilizzo di specchi, in due raggi uguali per intensità e frequenza. Un raggio colpisce il campione, mentre l’altro il bianco. Esempi di spettrofotometro a cuvetta Dopo aver impostato la lunghezza d’onda d’interesse, la cuvetta con il campione viene posizionata dall’operatore nell’alloggiamento e si procede con la lettura dell’assorbanza. Esempio di nanodrop Esistono degli spettrofotometri che sono in grado di misurare microvolumi di campioni in GOCCIA, per questo motivo sono chiamati nanodrop. Per questi spettrofotometri è sufficiente un volume di 0,5-1 uL (microlitri), che è utile quando si ha poco materiale di partenza. La goccia di campione viene posizionata con una micropipetta direttamente sulla superficie ottica inferiore (come si vede nella prima immagine). Viene poi tirato giù il braccio di leva, in modo che la goccia sia compressa tra le due superfici. Un liquido, quando si trova tra due superfici vicine, esercita tensione superficiale; in questo modo si forma una colonna di liquido tra le due superfici ottiche, che può essere analizzata in modo semplice e veloce. Anche in questo caso il bianco viene misurato prima di procedere con la misurazione del campione. LEGGE DI LAMBERT-BEER Per ricavare la concentrazione del campione dall’assorbanza, lo si fa grazie all’applicazione della legge di Lambert-Beer. 𝜖 = assorbanza specifica di una soluzione a concentrazione molare unitaria a una data lunghezza d'onda attraverso una cella di lunghezza ottica unitaria. È costante per la stessa soluzione. Il cammino ottico è il cammino percorso dalla luce attraverso il campione. In altre parole, è lo spessore della cuvetta. Poiché il cammino ottico è pari a un centimetro, per calcolare la concentrazione, sarà sufficiente dividere il valore di assorbanza per il coefficiente di estinzione molare. Se ne deduce che l’assorbanza è direttamente proporzionale alla concentrazione della soluzione analizzata. Maggiore è l’assorbanza misurata, maggiore è la concentrazione della soluzione che è stata misurata tramite lo spettrofotometro. Perché si utilizza la spettrofotometria per quantificare il DNA? Le tecniche spettrofotometriche possono essere applicate a tutte le molecole in grado di assorbire le radiazioni elettromagnetiche, quindi ovviamente anche al DNA. Nello specifico, il DNA, data la sua struttura molecolare, assorbe nell’UV, in quanto in esso sono presenti sistemi aromatici delle basi azotate che fanno sì che abbia un picco di assorbimento a una lunghezza di 260 nm. SPETTRO DI ASSORBIMENTO del DNA Il grafico in nero rappresenta il tipico assorbimento del DNA: ● In ascissa viene riportata la lunghezza d’onda ● In ordinata è riportata l’assorbanza (OD = unità di densità ottica) Lo spettro di assorbimento non è altro che un grafico che mostra come cambia l’assorbanza alle varie lunghezze d’onda. Come si legge dal grafico il picco di assorbanza del DNA è a 260 nm, come è stato precedentemente detto. Lo spettro di assorbimento in rosso è relativo invece alle proteine, composte da aa con sistemi aromatici, che assorbono a 280 nm. QUANTIFICAZIONE DEL DNA Quando si misura un campione di DNA allo spettrofotometro, impostando la lunghezza d’onda a 260 nm, si ottiene l’assorbanza di quel campione (in OD). Per il DNA vale la seguente relazione: (1 OD misurata a 260 nm corrisponde a 50 microgrammi/ml) Quindi, per calcolare la concentrazione del DNA analizzato, bisogna impostare la seguente proporzione: Anche X sarà espressa in microgrammi/ml e la si ottiene risolvendo la proporzione: Il tutto è stato moltiplicato anche per il fattore di diluizione, solo che questa operazione deve essere fatta solo se il DNA è stato diluito in un opportuno solvente prima di essere analizzato. COME SI VALUTA LA PUREZZA DEL DNA Utilizzando lo spettrofotometro è possibile anche misurare la purezza del campione di DNA per capire se sono o meno presenti dei contaminanti derivati da una non corretta estrazione del DNA. 1. A questo scopo si va a valutare il rapporto tra l'assorbanza misurata a 260 nm e l’assorbanza misurata a 280 nm. Se il valore è: ● compreso tra 1.8 e 2: il DNA è puro ● < 1,8 (più piccolo di 1,8): il DNA è contaminato da proteine o da fenolo, i quali non sono stati correttamente eliminati durante i vari passaggi dell’estrazione del DNA ● > 2 (maggiore di 2): il campione di DNA è contaminato da RNA o altri composti, che assorbono a 260 nm 2. Il secondo parametro che viene valutato per definire se il DNA estratto è puro, è il rapporto dell’assorbanza misurata a 260 nm e quella misurata a 230 nm. Se il rapporto risulta: ● Compreso tra 2-2.2: il DNA è puro ● < 2: il DNA è contaminato con EDTA o fenolo o carboidrati o cloruro di guanidinio, che sono tutti contaminanti derivati da una non corretta estrazione del DNA ESERCIZIO 1 (esercizi relativi alla quantificazione del DNA) Se noi volessimo il risultato in ng/𝜇l, il risultato sarebbe comunque 10 ng/𝜇l, perché se si passa da 𝜇g a ng, si hanno 3 cifre di differenza e stessa cosa passando da ml a 𝜇l, quindi in sostanza non cambia dire 10 𝜇g/ml o dire 10 ng/𝜇l. ESERCIZIO 2 Bisogna ricordare che alcuni campioni di DNA, prima di essere misurati, vengono diluiti in un opportuno solvente, come nel caso di questo esercizio, infatti, per poter andare a misurare questo DNA, si prendono 10 𝜇l di DNA e lo si diluisce al solvente (con un volume di 990 𝜇l) per un volume finale di 1000 𝜇l, quindi 1 ml. Questo 1 ml viene trasferito nella cuvetta. La concentrazione che è stata ottenuta non è quella del campione, quindi la concentrazione iniziale, ma la concentrazione che si ha di DNA all’interno della cuvetta. È la concentrazione dopo aver diluito il campione, mentre l’obiettivo è sapere qual è la concentrazione iniziale del campione non diluito. Ci sono due metodi per calcolare la concentrazione iniziale del campione: 1. Utilizzo del FATTORE DI DILUIZIONE: Da quanto è stato ricavato nella prima parte dell’esercizio, sono stati diluiti 10 𝜇l di campione in un 1 ml finale. 1 ml = 1000 𝜇l, questo vuol dire che il campione è 100 volte in meno rispetto al volume totale. Il fattore di diluizione è 100, di conseguenza per capire qual è la concentrazione del DNA, quindi la concentrazione iniziale, bisogna moltiplicare la concentrazione del DNA, che si ha ottenuto con la proporzione, per il fattore di diluizione, quindi 100: Quello che si ottiene è 2000 microgrammi/ml o 2 𝜇g/𝜇l 2. Utilizzo della FORMULA della DILUIZIONE: C1 x V1 = C2 x V2, dove C sta per concentrazione, mentre V per volume. Solitamente il C1 è la concentrazione iniziale e il V1 è il volume iniziale. La C2 è la concentrazione finale mente V2 è il volume finale. ● L’incognita è C1. ● V1 è 10 𝜇l ed è il volume iniziale perchè è il volume del campione che noi preleviamo per andare a diluirlo. ● C2 è quella misurata nella cuvetta (20 𝜇g/𝜇l) ● V2 = 1 ml Risolvendo l'equazione si ottiene che C1 = 2 𝜇g/𝜇l. Come si può vedere, nonostante l’utilizzo di due metodi differenti, il risultato non è cambiato, quindi, si può decidere quale dei due usare. ESERCIZIO 3: Il campione di DNA è concentrato 500 ng/𝜇l. La domanda è: quanto volume si deve prelevare per avere 1,5 microgrammi? IMPORTANTE: quando si va a fare una proporzione, è necessario che le unità di misura a destra e a sinistra siano le stesse. Quindi 1,5 𝜇g diventa 1500 ng. Per avere quindi una quantità di 1,5 𝜇g, partendo da DNA concentrato a 500 ng/𝜇l, bisogna prelevare 3 𝜇l. ELETTROFORESI DEL DNA ELETTROFORESI = tecnica di separazione che sfrutta la diversa velocità di migrazione di particelle cariche sotto l’influenza di un campo elettrico. Per far sì che avvenga la separazione è necessario che le particelle siano cariche, ossia che possiedano gruppi o residui ionizzabili. Quando una molecola dotata di una carica elettrica viene posta in un campo elettrico, essa migra verso l’elettrodo dotato di carica opposta: ➢ Le particelle cariche positivamente migrano verso il polo negativo ➢ Le particelle cariche negativamente, come il DNA, migrano verso il polo positivo Aa, proteine, nucleotidi e acidi nucleici sono molecole che possono essere separate per elettroforesi. In figura si vede una schematizzazione dell’elettroforesi. Nelle posizioni 1, 2, 3 e 4 sono presenti 4 campioni costituiti da particelle cariche (in questo esempio cariche negativamente, come il DNA). I campioni vengono caricati su un supporto e per far sì che le particelle si muovano attraverso di esso e si separino è necessario che venga applicato un campo elettrico. Nel momento in cui si genera il campo elettrico, le particelle cariche negativamente, che costituiscono il campione, migrano dal polo negativo al polo positivo. Durante la migrazione sono costrette ad attraversare il supporto e in questo modo vengono separate posizionandosi in punti diversi del supporto. Affinché la corrente venga condotta fra gli elettrodi, è necessario che il supporto sia immerso in un opportuno tampone. La corrente viene condotta grazie agli ioni presenti nel tampone, che viene chiamato tampone di liberazione o corsa e ha la funzione di mantenere le molecole del campione in uno stato ionizzato, senza legarsi ai composti da separare. La concentrazione del tampone oscilla tipicamente tra 0,05 e 0,10 M e il pH può variare da tampone a tampone e viene scelto in base alle molecole da separare, proprio perché l’opportuno pH determina, influenza e stabilizza la migrazione della specifica molecola. Solitamente il tampone di corsa scelto viene utilizzato anche per preparare il supporto di liberazione SUPPORTO DI LIBERAZIONE SUPPORTO DI LIBERAZIONE = materiale poroso, che funge da setaccio molecolare. Quando, in seguito all’applicazione di corrente, le particelle che costituiscono il campione vengono forzate a passare attraverso di esso, queste si posizioneranno e quindi separeranno principalmente in base alla loro dimensione: ➢ Le particelle più grandi (in giallo nell’immagine) fanno più fatica a passare attraverso i pori del supporto perché ostacolate, quindi migrano più lentamente. ➢ Le particelle più piccole (in fucsia) attraversano con più facilità i pori del supporto e non essendo ostacolate, o comunque poco ostacolate, migrano più velocemente e si posizionano nella parte più bassa del gel. Caratteristiche di un buon supporto: ● Resistente per poter essere maneggiato ● Idrofilo per impedire interazioni idrofobiche ● Privo di carica propria ● Stabile in un'ampia gamma di pH, forza ionica, temperatura ecc. ● Con porosità definita per controllare l’effetto setaccio, infatti il grado di porosità è scelto dall’operatore/ricercatore in base alla dimensione delle molecole che si vogliono separare In generale i materiali utilizzati devono essere relativamente inerti I principali materiali di supporto sono: ● Cellulosa ● Acetato di cellulosa ● Silice ● Amido Queste molecole servono a separare piccole molecole (aa, peptidi, carboidrati) ● Agarosio à ha una capacità di risoluzione bassa e separa molecole di DNA lunghe (decinecentinaia Kb) Per separare molecole di DNA ● Gel di poliacrilammide Per separare molecole di DNA di ridotte dimensioni (max 1000kb); il gel di poliacrilammide ha una elevata risoluzione e viene utilizzato per separare le proteine Quindi per il DNA possono essere utilizzate due matrici: ● AGAROSIO: Zucchero solubile ottenuto dalle alghe, che forma una matrice attraverso i legami H fra le sue catene laterali. La dimensione dei pori nel reticolo di agarosio è più grande, per questo ha una inferiore capacità di risoluzione, infatti viene utilizzato per separare molecole di DNA lunghe (decine-centinaia Kb) ● POLIACRILAMMIDE: Si forma dalla polimerizzazione dell’acrilammide e bisacrilammide, con formazione di legami trasversali che formano il reticolo tridimensionale. In questo caso le dimensioni dei pori sono più piccole, quindi, la capacità di risoluzione è elevata perché possono essere separate molecole di dimensioni limitate. Come già detto, le particelle cariche vengono separate principalmente in base alla loro dimensione ma non solo; la velocità di migrazione e la separazione dipendono anche da: ● Massa ● Carica ● Forma Maggiore sarà la massa e la quantità di carica, maggiore sarà la velocità di migrazione. Particelle uguali per dimensione e quantità di carica migrano diversamente in base alla loro forma. STRUMENTAZIONE Per far avvenire un’elettroforesi, nello specifico un’elettroforesi del DNA, è necessario un alimentatore, detto anche “power”, che fornisce la corrente e la tensione adeguata. Questo è collegato ad un apparato dell’elettroforesi, chiamato cella elettroforetica. Si tratta di un contenitore di plastica, che presenta i due elettrodi, positivo e negativo, all’interno del quale viene messo il tampone per condurre la corrente. L’apparato può essere orizzontale, come quello utilizzato per il gel di agarosio, o verticale, come quello utilizzato per il gel di acrilammide. GEL DI AGAROSIO Agarosio L’agarosio è un polisaccaride lineare, costituito da ripetizioni di unità del disaccaride agarobiosio. Una molecola di agaorobiosio è costituita da una molecola di galattosio e una molecola di 3,6-anidro-galattosio. L’agarobiosio è il costituente principale dell’agar, ossia una miscela di polisaccaridi derivati da alcune specie di alghe marine L’agarosio si presenta come polvere, la quale viene solubilizzata in un tampone acquoso. È solubile solo a T di ebollizione e diventa solido quando si raffredda. La formazione dei legami H intra- ed intermolecolari fanno sì che il gel si solidifichi in una matrice costituita da pori. La dimensione dei pori dipende dalla concentrazione dell‘agarosio (maggiore è la concentrazione dell’agarosio, più sono fitte le maglie del gel e più piccoli sono i pori; minore è la concentrazione del gel, più le maglie sono larghe e più lo sono anche i pori. Il range di concentrazione di agarosio usato va da 0,8 al 3%. PASSAGGI PER LA PREPARAZIONE DI UN GEL DI AGAROSIO: 1. Preparazione del vassoio con il pettine: Il vassoio è parte del supporto per far solidificare il gel dopo averlo sciolto. Il vassoio è chiuso da due lati, mentre in altri due lati è aperto. Quando si va a colare il gel, in quanto è liquido, si ha bisogno di un supporto chiuso da tutte e quattro le pareti; il vassoio ci serve come contenitore del gel. Si ha bisogno poi del pettine, che viene inserito nel vassoio e serve per creare gli alloggiamenti o pozzetti, dove caricare il campione. Il campione verrà caricato negli alloggiamenti che si formeranno in corrispondenza dei dentini del pettine. In corrispondenza del dentino del pettine non si formerà il gel e quindi ci sarà una piccola cavità, che servirà da alloggiamento del campione. 2. Pesata dell’agarosio Dopo aver preparato il supporto, si pesa l’agarosio (l’agarosio è la polvere bianca che si vede nell’immagine) e si utilizza una bilancia, dove viene posizionato un becher. Con una spatola viene prelevato dell’agarosio, che viene posizionato all'interno del becher e successivamente pesato. Quanto se ne pesa dipende dalla concentrazione del gel che si vuole ottenere (se ne pesa di più se la concentrazione è alta e meno se la concentrazione è bassa). 3. Addizione del tampone All’interno del becher, dove è stato pesato l’agarosio, si va ad addizionare il tampone, che non è altro che lo stesso tampone di corsa che è stato utilizzato per riempire la cella elettroforetica, il quale è un tampone su base acquosa, che viene utilizzato per sciogliere l’agarosio e formare il gel. I tamponi maggiormente utilizzati per il gel di agarosio, quindi tamponi che servono sia per la corsa sia per andare a sciogliere il gel sono: ● TAE buffer: (in assoluto il più utilizzato) il nome deriva dalle componenti presenti all’interno, in quanto è presente 0,04 M Tris-Acetato, 0,001 M EDTA. Ha un pH di 8,0. ● TBE buffer: anche in questo caso il nome deriva dalle componenti, infatti è presente 0,089 M Tris base, 0,089 M acido borico e 0,002 M di EDTA. Ha un pH di 8,3 4. Ebollizione La polvere di agarosio, alla quale è stato aggiunto il tampone, deve essere sciolta perché, come già detto, l’agarosio si scioglie solo se portato ad ebollizione, infatti, nel momento in cui viene aggiunto il tampone alla polvere di agarosio, questo non si scioglierà, ma rimarrà molto torbido con la polvere di tampone. Per portare ad ebollizione si mette il becher all’interno di un microonde o si utilizza una piastra riscaldante (come si vede nell’immagine). Quando è pronto il gel, ovvero quando si è sciolto completamente? Il gel è pronto quando appare completamente trasparente. Nel momento in cui si va a sciogliere il gel non si deve utilizzare una T troppo alta, perché l’agarosio può degradarsi ma non si deve nemmeno utilizzare una T troppo bassa, perché anche in questo caso a sciogliersi ci metterebbe molto. Si deve utilizzare una T intermedia, in modo che l’agarosio si sciolga senza degradarsi ma in tempi abbastanza brevi. 5. Colatura Bisogna colare il gel, ovvero lo bisogna posizionare, ancora liquido, all’interno del supporto per farlo solidificare. Quello che si vede nell’immagine è il vassoio, che ha le estremità in alto e in basso libere. Per poter creare una cameretta chiusa è inserito all’interno un supporto bianco che serve per creare le due pareti mancanti e quindi creare una camera chiusa. Nel momento in cui si cola il gel, i pettini devono essere già posizionati. 6. Solidificazione Dopo che il gel è stato colato dovrà essere raffreddato e nel momento in cui si è raffreddato si solidificherà. Per la solidificazione ci vorranno almeno 15 minuti. 7. Rimozione di pettine e cornice di plastica Dopo che il gel si è solidificato, si va a rimuovere il pettine e, andandolo a rimuovere, lì dove era presente il pettine non si sarà formato il gel, ma si saranno formati dei piccoli alloggiamenti per il campione. Viene rimossa pure la cornice di plastica, ovvero la parte esterna bianca che serviva per formare la camera chiusa. 8. Si ottiene un gel rigido e solido, all’interno del vassoio, con i pozzetti, che sono gli alloggiamenti del campione 9. Trasferimento in cella elettroforetica, immerso nel tampone, e caricamento dei campioni, iniettandoli nei pozzetti Il gel con tutto il vassoio viene posizionato all'interno della cella elettroforetica. La cella elettroforetica, come già detto, è formata dai due poli: il polo negativo è solitamente rappresentato con il nero, invece, in rosso è colorato il polo positivo. Nella cella elettroforetica avverrà l’elettroforesi, ovvero la migrazione dei campioni. Viene posizionato il vassoio con il gel in maniera corretta, ovvero i pozzetti devono essere più vicini al polo negativo, perché il DNA è carico negativamente, quindi, nel momento in cui verrà applicato il campo elettrico, tenderà a migrare dal polo negativo a quello positivo e attraverserà così il gel di agarosio. Se viene posizionato in maniera opposta, nel momento in cui migra dal polo negativo al polo positivo, invece di attraversare il gel, fuoriuscirà all’interno della cella elettroforetica e non si riesce così a fare la migrazione. Dopo aver posizionato il vassoio con il gel, si deve ovviamente, per fare in modo che la corrente passi, riempire la cella elettroforetica di tampone di corsa completamente, fino a sovrastare di qualche mm il gel, quindi, tutto il gel deve essere immerso e deve andare all’interno dei pozzetti. Si è pronti così a caricare il campione, che deve essere caricato all’interno di un pozzetto e a quel punto si può far partire la corsa elettroforetica. CAMPIONI I campioni non possono essere caricati così come vengono estratti ma, prima di essere caricati nel gel, devono essere preparati, ovvero devono essere addizionati glicerolo o saccarosio, che ne aumentano la densità. Questo serve perché all’interno dei pozzetti vi è un tampone, quindi è presente già un liquido. Se si mettesse direttamente il campione, proprio perché si inserisce un liquido all’interno di un altro liquido, i due si mescolerebbero e il campione tenderebbe ad uscire o comunque a non essere ben compattato nel pozzetto. Utilizzando il glicerolo o il saccarosio, il DNA diventa leggermente più pesante, proprio perché il glicerolo o saccarosio sono di una densità maggiore e quindi il campione viene tirato giù sul fondo del pozzetto, senza disperdersi nel liquido. Oltre al glicerolo o saccarosio, viene addizionato anche un colorante, che ha due funzioni: 1. Colorare il campione, perché il DNA è trasparente e per questo motivo, per riuscire a capire se il campione è stato caricato correttamente all’interno del pozzetto e non è fuoriuscito, è sempre meglio utilizzare il colorante per colorare il campione. 2. È la sua funzione principale, ovvero quella di capire quando fermare la corsa elettroforetica, perché permette di visualizzare l’andamento della corsa elettroforetica. I coloranti utilizzati possono essere diversi, ma solitamente si tratta di molecole piccole, che corrono più velocemente del campione. Quando queste molecole arrivano alla fine del gel, allora si va a stoppare la corsa elettroforetica. Uno dei coloranti maggiormente utilizzati è l’orange G, che è di colore arancione ed è una molecola leggerissima, che quindi corre molto velocemente davanti al campione. Possono essere utilizzati anche altri coloranti: ● BPB (Blu di bromofenolo), di colore blu ● XC (xilene cianolo), di colore azzurro ● Tartrazina, di colore giallo Questi coloranti, avendo dimensioni diverse, si posizionano nel gel in posizioni diverse; ad esempio, lo xilene cianolo essendo il più pesante, corre meno velocemente e si trova in alto nel gel. Il BPB è una molecola con una dimensione intermedia e quindi corre più velocemente dello xilene cianolo e si posiziona circa a metà del gel. L’orange G, con un peso molecolare molto piccolo, migra molto velocemente e si trova in fondo al gel. Questo serve a capire come sta migrando il campione ed essendo il DNA trasparente, questo permette di essere sicuri che il tempo di corsa sia sufficiente per separare le molecole, ma non eccessivo, perché il DNA, facendolo correre per troppo tempo, potrebbe anche fuoriuscire dal gel. Questi coloranti possono essere utilizzati da soli o essere messi in combinazione. 10. Collegamento ad un alimentatore e migrazione elettroforetica La cella elettroforetica viene chiusa con un coperchio, il quale è collegato agli elettrodi, che vengono inseriti all’interno del power. A questo punto viene impostata una velocità di 100V, quindi viene applicato un campo elettrico e la corrente passa attraverso il campione e il gel di agarosio e le molecole di DNA migrano dal polo negativo a quello positivo attraverso il gel. Si imposta l’alimentatore a 100V perché in realtà non ci deve essere un'intensità troppo alta, perché solitamente quando viene applicato il campo elettrico, quindi quando vi è della corrente, si sprigiona calore per effetto Joule, quindi, nel momento in cui noi surriscaldiamo troppo il gel, si ritorna alla situazione in cui il gel è sulla piastra riscaldante, quindi, lo si va a sciogliere e di conseguenza, proprio perché il gel è leggermente sciolto, i campioni non migrano in maniera corretta. Non deve essere nemmeno a una velocità troppo bassa altrimenti le molecole andranno troppo poco velocemente e quindi oltre ad allungare i tempi dell’analisi, si rischia che le bande non essendo forzate a passare più velocemente attraverso il gel, inizino a diffondere, formando così una macchia allargata. Nell’immagine sottostante vi è un esempio di quello che si dovrebbe ottenere, cioè quello che si va a visualizzare alla fine della corsa elettroforetica. Non si vede il DNA, ma quello che noi vediamo sono i coloranti e in questo caso ne sono stati usati due, ossia lo xilene cianolo e il BPB. Come è avvenuta la corsa? I frammenti lineari più piccoli migrano più velocemente di quelli più grandi. A parità di peso molecolare, il DNA circolare migra più velocemente di un DNA lineare, perché il DNA circolare si va a compattare maggiormente e quindi migra più velocemente rispetto a quello lineare. Grazie ai coloranti è possibile valutare in ogni istante l’andamento della migrazione. È riportata una rappresentazione che riassume l’elettroforesi del DNA sul gel di agarosio: È rappresentata la cameretta, con il catodo che è l’elettrodo negativo e l’anodo che è l’elettrodo positivo; è stato inserito il tampone che va a ricoprire di qualche ml il gel di agarosio e quello che si vede è un pozzetto, dove all’interno sono presenti dei frammenti di DNA e nel momento in cui viene applicata corrente elettrica, il DNA fuoriesce dal pozzetto e attraversa il gel; le molecole più piccole migrano verso l’anodo più velocemente, mentre quelle più pesanti migrano meno velocemente e si ritrovano così più vicine al pozzetto. RIVELAZIONE Come si fa a rilevare il DNA, come si fa a visualizzare il campione? Il DNA, come già detto, è trasparente e quello che si vede durante la migrazione è il colorante. Per poter visualizzare il DNA, bisogna posizionare il gel, con il campione, che sono stati separati durante la migrazione, sopra una lampada UV. I transilluminatori sono strumenti che presentano delle lampade UV. Queste lampade vanno a irradiare il gel e di conseguenza le bande relative al DNA possono essere visualizzate. Ovviamente, considerando che vengono utilizzati degli UV, bisogna fare attenzione agli occhi, ecco perché nel momento in cui si va ad accendere la lampada, è necessario proteggersi, posizionando sul transilluminatore uno schermo in plexiglass. L’immagine può essere acquisita sia fotografandola su un film come se fosse una foto, o acquisita con fotocamere digitali. Il risultato che si ottiene è quello mostrato in figura: ci sono delle molecole di DNA diverse, che sono state caricate nei vari pozzetti e all’interno di ciascun pozzetto, le varie molecole di DNA si posizionano e si separano nel gel, a seconda delle loro dimensioni. Come si fa a visualizzare le bande di DNA sotto la luce UV? Quello che si visualizza non è il DNA, ma un intercalante, ovvero una molecola fluorescente in grado di intercalare fra le coppie di basi del DNA e quindi rendere visibile il DNA. Uno dei coloranti intercalanti, che veniva utilizzato fino a poco fa, era l’etidio bromuro. Questa sostanza, essendo mutagena, è andata in disuso, quindi, nei laboratori non viene più utilizzata o comunque nei pochi laboratori in cui viene ancora usata, bisogna fare particolare attenzione, per non entrare in contatto con la molecola. Per questa ragione vengono utilizzate delle sostanze intercalanti non mutagene, che colorano in rosso, in verde o in blu. Ad esempio, questo rappresentato viene chiamato GreenGel proprio perché le bande di DNA che sono visualizzate sono di colore verde; la fluorescenza è quindi di colore verde. Le bande più in alto sono a peso molecolare più alto rispetto a quelle più in basso che lo hanno minore. Quando si aggiunge il GreenGel? Lo si aggiunge dopo aver sciolto il gel di agarosio, prima che si solidifichi, quindi subito prima di colarlo. MARCATORE DI PESO MOLECOLARE Si possono misurare le dimensioni dei vari frammenti di DNA. Un sistema approssimativo per fare ciò può essere fatto utilizzando un marcatore di peso molecolare. MARCATORE DI PESO MOLECOLARE = miscela di frammenti di DNA diversi, che hanno lunghezza diversa e nota. Di marcatori di peso molecolare ce ne sono tanti (nell’immagine ne sono riportati 4) e ovviamente vengono comprati da delle ditte. Le differenze tra i vari marcatori sono i vari range di dimensioni diverse; ad esempio, il primo ha una banda più in alto di 10.000 pb e la banda più in basso di 1000, nel secondo vi è una dimensione più grande e un range più ampio, proprio perché si va da 15.000 pb, quindi, la banda più in alto è più grande rispetto al primo esempio, fino a 100 pb. A seconda dell’applicazione viene scelto il rispettivo marcatore di peso molecolare e per applicazione si intende che tipo di DNA dobbiamo caricare e separare (se si tratta di un DNA a peso molecolare più basso, allora si preferisce l’ultimo esempio sulla destra nell’immagine; se invece si deve separare un campione di DNA che presenta tanti frammenti di dimensioni diverse, allora si preferisce il secondo, che ha un range molto ampio, in quanto va da un peso molecolare molto alto a un peso molecolare molto basso). A cosa serve: Il marcatore di peso molecolare viene caricato, insieme ai campioni, in un pozzetto del gel, solitamente lo si carica in un pozzetto laterale e i frammenti del marker si separano in base alle loro dimensioni. I frammenti del marker sono frammenti che vengono comprati e quindi si conoscono bene le loro dimensioni, quindi, andando a confrontare la posizione della banda del DNA incognito con la banda del marker che si posiziona circa vicina al DNA incognito, è possibile stimare la dimensione del frammento presente sul gel. Ad esempio, il frammento corrispondente al campione numero 3 ha una dimensione intermedia tra il terzo e quarto frammento del marker e quindi si sa indicativamente la stima, o meglio facendo una stima approssimativa, si capisce qual è la dimensione del frammento che si ha caricato sul gel di agarosio. Se si vuole determinare la dimensione dei frammenti in maniera più accurata è necessario farlo graficamente: Sulla sinistra vi è la stima approssimativa tramite ispezione visiva. Sulla destra vi è invece il grafico. Lo si riesce a costruire grazie a una formula matematica che correla la distanza di migrazione in cm con le dimensioni dei frammenti di DNA in kb. In un gel di agarosio la mobilità relativa di una specie molecolare è proporzionale al logaritmo delle dimensioni in kb. Viene così costruita la curva standard di calibrazione, partendo da un marcatore di peso molecolare: si carica insieme ai campioni, di cui si vuole conoscere la dimensione, un marcatore di peso molecolare. Ciascun frammento del marcatore del peso molecolare, migra in modo diverso e andando a misurare con un righello la distanza di migrazione in cm di ciascuna banda e mettendo questa in relazione alle dimensioni di quel frammento, che risulta noto, viene costruita una curva standard di calibrazione. A questo punto se si va a misurare con il righello la distanza di migrazione del campione incognito e per interpolazione o estrapolazione si riuscirà a capire con precisione di che dimensione è il frammento. Si fa appunto così un metodo grafico, che è più preciso. Esempio: ● DNA genomico Quello rappresentato è un esempio di migrazione di DNA genomico. Il DNA genomico è molto grande e quindi si posiziona in alto nel gel, il che vuol dire che migra molto lentamente e infatti è poco al di fuori del pozzetto, proprio perché incontra l’ostacolo dei pori del gel di agarosio e quindi viene bloccato durante la migrazione. ● Prodotto di PCR In questa immagine è rappresentato un esempio di gel di agarosio, nel quale è stato caricato un prodotto di PCR (= metodo di amplificazione, permette di amplificare solo una porzione di DNA, solo un pezzetto di DNA e solitamente un prodotto di PCR può essere di 600-700 pb o anche più piccolo, ma comunque più piccolo del DNA genomico e quindi va a correre più velocemente e si posiziona più avanti nel gel). ● Nel pozzetto zero, quello non indicato, è presente il marcatore di peso molecolare. ● Nel pozzetto 1 è stato caricato un campione che è la banda corretta, ovvero la banda che si vuole relativa a quel prodotto di PCR, perché quando si fa la PCR si sa esattamente la dimensione dell'amplificato, perché siamo stati noi a decidere che porzione del DNA si vuole andare ad amplificare, questo vuol dire che una volta che lo si va a caricare nel gel, si riesce a capire se quello che è stato amplificato è esattamente la dimensione attesa o se è stato amplificato qualcos’altro e quindi automaticamente non si troverà in quella posizione ma in un’altra. Quella presente è la banda corretta, che si trova tra il quarto e quinto frammento del marker. ● Nel pozzetto 2 non vi è alcuna banda, questo vuol dire che non si è formato il prodotto di PCR e quindi non si è formato il duplicato di DNA. ● Nel pozzetto 3 si ha una banda, ma che non è della dimensione corretta, proprio perché non si trova tra la quarta e la quinta banda del marker ma si trova più in alto e questo significa che non è stato amplificato quello che si voleva ma qualcosa di diverso e quello non è il frammento atteso. Ciò vuol dire che in laboratorio non è avvenuto l’esperimento correttamente. ● Nel pozzetto 4 vi è una miscela, ovvero che oltre alla banda di interesse vi sono altri frammenti di cui uno ha PM più alto e l’altro ha PM più basso, questo vuol dire che si è ottenuto l’amplificato di interesse, quindi il prodotto di PCR, ma oltre ad esso è stato amplificato anche qualcos’altro. Questi proposti sono quindi degli ipotetici scenari che si possono avere in laboratorio e che si devono interpretare. In questa immagine a lato, infine, è riassunto quanto detto relativamente all’elettroforesi del DNA su gel di agarosio. ENZIMI DI RESTRIZIONE Le nucleasi sono enzimi che degradano le molecole di DNA rompendo il legame fosfodiesterico che unisce due nucleotidi adiacenti lungo la catena di DNA. Esistono due tipi di nucleasi: esonucleasi ed endonucleasi. Le esonucleasi rimuovono un nucleotide per volta a partire da un’estremità della molecola di DNA. Le endonucleasi sono in grado di rompere i legami fosfodiesterici tra nucleotidi posizionati all’interno della molecola di DNA. Ci sono diverse classi di endonucleasi, tra cui le endonucleasi di restrizione. Endonucleasi di restrizione: vanno a riconoscere brevi sequenze bersaglio di 4-8 pb (siti di riconoscimento), di solito palindromiche, e tagliano in posizioni definite all’interno di esse (sito di riconoscimento a doppio filamento). Una sequenza palindromica è una sequenza a doppia elica in cui i due filamenti opposti letti in direzione 5’-3’ hanno la stessa sequenza di basi. Questi enzimi sono stati scoperti nei batteri dove hanno la funzione di tagliare il DNA dei batteriofagi. In questa tabella sono mostrati alcuni esempi di enzimi di restrizione. Per ciascun enzima è indicato il nome e il sito di riconoscimento su uno solo dei due filamenti. La barra all’interno della sequenza indica la posizione esatta del sito di taglio. Sono poi indicati il numero di basi che costituiscono il sito di riconoscimento, le estremità prodotte e l’origine dell’enzima, cioè la specie batterica nella quale sono stati isolati per la prima volta. Ad esempio, l’enzima EcoRI è stato isolato in Escherichia coli RY13, il sito di riconoscimento è costituito da 6 basi ed è palindromo. Questo vuol dire che la sequenza di entrambi i filamenti letta in direzione 5’-3’ è identica, cioè G/AATTC. L’enzima taglierà entrambi i filamenti dopo aver riconosciuto il sito di restrizione fra la guanina e l’adenina. Le estremità prodotte dal taglio saranno 5’ coesive. Quali possono essere le estremità prodotte in seguito al taglio con l’enzima di restrizione? Estremità piatta o liscia: quando la endonucleasi di restrizione introduce un semplice taglio a doppia elica nel mezzo della sequenza bersaglio. Ad esempio, SmaI è un enzima di restrizione che in seguito al taglio produce estremità piatte. Estremità coesive 5’o 3’: le due eliche di DNA non sono tagliate precisamente nello stesso punto, ma il taglio è sfalsato, solitamente di 2-4 nucleotidi, così che i frammenti di DNA risultanti presentano corte estremità sporgenti a singola elica, chiamate estremità coesive o appiccicose. Vengono chiamate così perché l’appaiamento fra le basi complementari di ciascuna estremità è in grado di riattaccare insieme la molecola. Le estremità coesive possono essere 5’ o 3’ a seconda che le estremità protrudenti a singola elica siano in 5’ o in 3’. EcoRI in seguito al taglio produce estremità coesive 5’, invece PstI è un esempio di enzima che in seguito al taglio origina estremità coesive 3’. Come si rappresenta un sito di riconoscimento ed un sito di taglio? Si vanno a scrivere entrambe le sequenze dei due filamenti che costituiscono il sito di riconoscimento, che sono complementari e invertite. Ad esempio, il sito di riconoscimento di EcoRI viene indicato con 5’ GAATTC 3’ e 3’ CTTAAG 5’. Entrambe le sequenze lette in direzione 5’-3’ sono costituite dalla sequenza: GAATTC. Il sito di taglio, convenzionalmente, è indicato da due frecce, una sul filamento 5’-3’ e l’altra sul filamento complementare. In seguito al taglio alcuni enzimi di restrizione producono estremità piatte, altri invece estremità sporgenti e coesive chiamate anche sticky hands, che letteralmente vuol dire estremità appiccicose proprio perché queste possono riunirsi facilmente tramite l’appaiamento delle basi complementari sulla stessa molecola o su molecole diverse tagliate con lo stesso enzima. Vedremo che questa è una proprietà importantissima per il clonaggio del DNA. Alcuni enzimi, quindi, producono estremità coesive 5’ ed altri estremità coesive 3’. Frequenza di taglio È possibile calcolare matematicamente la frequenza di taglio di ciascuna endonucleasi di restrizione, ossia ogni quante paia di basi l’enzima taglia le molecole di DNA. La frequenza di taglio è legata alla lunghezza della sequenza riconosciuta. Ad esempio, qualsiasi sequenza di 6 nt si ritrova mediamente ogni 4 kb. Ciò è dovuto alla possibilità di trovare una qualsiasi delle 4 basi in ogni posizione di una sequenza di DNA. Pertanto, la probabilità di trovare una specifica sequenza di 6 basi è di (¼)6, cioè 1 volta ogni 4096 pb. Allo stesso modo, qualsiasi sequenza di quattro nucleotidi si trova (¼)4, cioè 1 volta su 256 nucleotidi. La frequenza si calcola quindi come ¼ elevato alla n, dove n è il numero di coppie di basi nella sequenza di riconoscimento. Tuttavia, non è detto che due enzimi di restrizione diversi che riconoscono entrambi una sequenza esamerica su una molecola di DNA a lunghezza nota determinino lo stesso numero di frammenti. Questo perché i siti di restrizione non sono generalmente distribuiti con regolarità lungo tutta la molecola di DNA. Come facciamo allora a determinare con precisione il numero di frammenti che si ottengono in seguito alla digestione con un enzima di restrizione e di conseguenza il numero dei siti di taglio all’interno della molecola di DNA? Lo si determina sperimentalmente. Il DNA viene tagliato dall’enzima di restrizione e poi viene sottoposto ad elettroforesi su gel di agarosio. La molecola di DNA rappresentata in grigio nella figura è sottoposta a digestione con l’enzima EcoRI. Successivamente, i frammenti ottenuti vengono sottoposti ad elettroforesi su gel. I vari frammenti che hanno diverse dimensioni che dipendono dalla distribuzione dei siti di taglio nella sequenza si separano nel DNA. In questo caso si ottengono 7 frammenti, che vuol dire che EcoRI taglia in 6 posizioni. Sono quindi presenti 6 siti di restrizione. Sulla stessa molecola di DNA, un secondo enzima che riconosce sempre una sequenza esamerica potrebbe dare origine ad un numero di frammenti differenti. Nel calcolo matematico, quindi, posso avere un’idea di quanti siti di restrizione sono presenti ma solo l’analisi sperimentale ci dà una risposta esatta. Come eseguire una digestione di una molecola di DNA con un enzima di restrizione in laboratorio: in questo esempio consideriamo di voler digerire il DNA plasmidico con l’enzima di restrizione BglII in una reazione che ha come volume finale 20 microlitri. Per prima cosa dobbiamo calcolare la quantità in microlitri di DNA da aggiungere alla reazione, corrispondenti alla quantità di DNA che abbiamo deciso di digerire. Successivamente aggiungere il tampone per BglII dopo aver calcolato la quantità da aggiungere per avere una specifica concentrazione. Si tratta di un buffer che contiene i cofattori necessari ad assicurare all’enzima un’attività ottimale. Ci deve essere una quantità sufficiente di NaCl che è responsabile del mantenimento della forza ionica ottimale. La maggior parte degli enzimi di restrizione funzionano al meglio quando il pH è di 7,4. un’altra componente fondamentale è il Mg in quanto è necessario al funzionamento degli enzimi di restrizione. Il buffer contiene anche un agente riducente come il DTT che stabilizza l’enzima e ne previene l’inattivazione. L’impiego di condizioni ottimali raggiunte grazie al buffer è essenziale per la funzionalità e specificità dell’enzima. Infine, si aggiunge una specifica quantità in microlitri di enzima, un volume calcolato in base alla concentrazione di enzima necessario a far avvenire la reazione. Si aggiunge, inoltre, dell’acqua q.b. (quanto basta) per arrivare al volume di 20 microlitri, cioè il volume finale della reazione. La reazione è allestita all’interno di una provetta e per far avvenire la digestione è necessario incubare la provetta per 1h a 37°C, poiché a questa temperatura l’enzima di restrizione funziona in maniera ottimale, fattore importante per ottenere la massima efficienza. Al termine della reazione di digestione è necessario inattivare l’enzima al fine di evitare che questo digerisca altre molecole di DNA che possono essere eventualmente aggiunte nei passaggi successivi, come avviene ad esempio per il clonaggio. Ci sono svariati modi per inattivare un enzima: Si può incubare la miscela a 70 °C per 15 min. oppure per enzimi più resistenti è necessario ricorrere all’aggiunta di fenolo per estrarre direttamente il DNA o all’utilizzo di EDTA. L’EDTA chela gli ioni Mg bloccando l’azione dell’enzima di restrizione che in assenza di Mg non funziona. Vediamo come calcolare le quantità, cioè il volume in microlitri di DNA, tampone ed enzima da aggiungere alla reazione: In un volume totale (finale) di reazione di 20 microlitri, aggiungere: -2 microgrammi di DNA plasmidico (che ha una concentrazione iniziale di 125 microgrammi/mL determinata sperimentalmente con lo spettrofotometro) -tampone specifico per l’enzima concentrato 1x a partire da una soluzione concentrata 10x; (solitamente quando un reagente contiene più componenti e si tratta quindi di una miscela dove ogni componente ha una concentrazione precisa, per indicare la concentrazione del componente si usa, convenzionalmente, il x; quindi una concentrazione 10x vuol dire che è concentrata 10 volte più della concentrazione che noi vogliamo nella miscela, e bisogna diluirla perciò 10 volte per ottenere una concentrazione 1x) -2 U (unità) di enzima BglII che ha una concentrazione di 4U/microlitro; (U viene usata per gli enzimi e vuol dire: “unità di attività”; Essa è per convenzione la quantità di enzima necessaria a digerire un microgrammo di DNA in 1h a 37°C) -acqua q.b. (a volume) All’interno di 1 ml che corrisponde a 1000 microlitri abbiamo 125 microgrammi di DNA plasmidico. Per risolvere il quesito impostare una proporzione: NB: è importante che, nella proporzione, da un lato e dall’altro ci siano le stesse unità di misura; Concentrazione iniziale: 10x Concentrazione finale: 1x Volume finale: 20 microlitri Volume iniziale: ? Poteva bastare anche solo dividere 20 per 10 per ottenere la quantità in microlitri, proprio perché essendo concentrato 10 volte in più per sapere quanti microlitri di tampone servono dovrò diluirlo 10 volte e quindi 2 microlitri. Ricordiamo innanzitutto che 1 unità di attività (1U) è la quantità di enzima necessaria a digerire 1 microgrammo di DNA in 1h a 37°C. Nello stock dell’enzima in 1 microlitro abbiamo 4 unità ma ne vogliamo 2 da aggiungere nel nostro tubo di reazione, quindi impostiamo la proporzione: Otteniamo, quindi, che per avere 2 unità di enzima dobbiamo aggiungerne 0,5 microlitri. Solitamente, le ditte che vendono gli enzimi indicano esattamente quant’è la quantità da utilizzare. In questo caso sappiamo che 1 microgrammo di DNA è digerito in 1h a 37°C con 1 unità. Considerando che noi vogliamo digerire 2 microgrammi di DNA va da sé che abbiamo bisogno di 2 unità nel tubo di reazione. Volendo riassumere, i reagenti che dobbiamo aggiungere all’interno del tubo di reazione sono: NB: per calcolare l’acqua non dobbiamo far altro che sottrarre a 20, che è il volume totale, 16, 2 e 0,5, ottenendo così la restante parte. PROCEDIMENTO COMPLETO: CLONAGGIO GENICO Tecnologia del DNA ricombinante/Ingegneria genetica: insieme delle tecniche di laboratorio che consentono di tagliare e isolare brevi sequenze di DNA per trascriverle e inserirle nel genoma di altre cellule in modo da modificare uno o più geni; quindi, in generale, si tratta di tecniche di manipolazione del DNA. Le molecole di DNA prodotte dall’unione di due o più frammenti sono chiamate molecole di DNA ricombinante. Uno degli scopi della tecnologia del DNA ricombinante è il clonaggio di una sequenza di DNA, ossia l’amplificazione selettiva, cioè la produzione di molte copie di un particolare gene o di un segmento di DNA, mediante costruzione di molecole di DNA ricombinante e mantenimento nelle cellule. Il clonaggio del DNA avviene in 3 step: 1. inserimento del DNA da clonare in un vettore: DNA RICOMBINANTE 2. trasferimento ad una cellula ospite (di solito un batterio) 3. moltiplicazione nella e/o della cellula ospite (batterio): amplificazione della sequenza 1. PRODUZIONE DEL DNA RICOMBINANTE Il DNA bersaglio che si vuole clonare è tagliato in frammenti da endonucleasi di restrizione in modo tale che il frammento di DNA da inserire, o meglio, che il frammento di DNA di interesse possa essere inserito in un vettore, ossia in una seconda molecola di DNA per poi essere replicato in un organismo ospite. Per far si che il frammento di DNA di interesse venga inserito nel vettore è necessario che il vettore sia linearizzato. Per avere due estremità libere anche il vettore viene tagliato con enzimi di restrizione. Per unire i due DNA e formare, quindi, il DNA ricombinante, viene effettuata una ligazione tramite un enzima che viene chiamato DNA ligasi. CARATTERISTICHE DEI VETTORI PER DNA: -origine di replicazione: permette loro di replicarsi indipendentemente dal cromosoma dell’ospite e quindi propagare il DNA nella cellula ospite; -marcatore di selezione: permette alla cellula che contiene il vettore ricombinante di essere facilmente identificata; -siti unici di taglio: uno o più enzimi di restrizione, permette di inserire i frammenti di DNA in posizioni definite all’interno del vettore in modo tale che l’inserzione non interferisca con le altre due funzioni; I vettori più comunemente utilizzati sono: plasmidi: sono piccole molecole circolari di circa 3kb che hanno geni che codificano per un marcatore di selezione e possono propagarsi in un utente dall’ospite. Sono di piccole dimensioni e possono accogliere inserti per un massimo di 15 kb. Le piccole dimensioni permettono che l’ingresso nelle cellule e la loro manipolazione sia facilitata. BAC: cromosoma artificiale batterico che può accogliere inserti da 10 a 30 kb. YAC: cromosoma artificiale di lievito che può accogliere inserti fino a 2000 kb. La scelta del vettore è determinata, in primis, dalla grandezza dell’inserto, cioè la sequenza che si deve inserire all’interno del vettore. Un esempio di plasmide è il pBR322, grande 4361 bp. Presenta un’origine di replicazione, un gene che codifica per la resistenza alla ampicillina ed un gene che codifica per la resistenza alla tetraciclina. Questi geni che codificano per la resistenza agli antibiotici fungono da marcatori di selezione per far sì che le cellule che hanno internalizzato il plasmide siano facilmente identificate. Inoltre, il plasmide presenta diversi siti unici di restrizione che consentono di utilizzare una varietà molto alta di enzimi di restrizione. In questo caso specifico gli enzimi di restrizione che possono essere usati sono cinque: si ha un sito per EcoRI, uno per PstI, uno per BamHI, uno per SalI ed uno per PvuII. Nell’immagine sottostante è raffigurato un altro plasmide, ossia il pUC18 bla sta per beta-lattamasi, ossia è un gene che codifica per la resistenza all’ampicillina; ori sta per origine di replicazione. Il sito multiplo di clonaggio presente nei plasmidi iberni modificati non è altro che una regione relativamente piccola che contiene più siti unici di restrizione che consentono di utilizzare una varietà maggiore di enzimi di restrizione. Il sito multiplo va ad interrompere la sequenza del gene che codifica per la beta-galattosidasi. Questo è un modo che viene utilizzato nell’ingegneria genetica per capire se il batterio ha incorporato con successo il plasmide ricombinante. Il clonaggio richiede che sia il vettore che il gene di interesse da clonare siano tagliati con enzimi di restrizione. È necessario che le molecole di DNA vengano tagliate in maniera precisa e riproducibile. Ogni molecola di vettore deve essere tagliata in un’unica posizione aprendo la molecola circolare per inserire il nuovo frammento di DNA. Una molecola tagliata più di una volta risulterà in più frammenti e non potrà essere utilizzata come vettore di clonaggio. Inoltre, ogni vettore deve essere esattamente tagliato nella stessa posizione per evitare una digestione casuale. Anche il DNA da clonare deve essere tagliato in primo luogo per clonare il singolo gene di interesse e in secondo luogo per ridurre le dimensioni ottenendo frammenti piccoli che vengono più facilmente clonati. I DNA si uniscono per formare il DNA ricombinante grazie ad un enzima chiamato DNA ligasi che catalizza il processo di ligazione. Questo enzima svolge un ruolo fondamentale nelle cellule. Va a riparare le discontinuità di un filamento a doppia elica, ossia quando incontra un nick, cioè un punto in cui il legame fosfodiesterico tra i due nucleotidi adiacenti è interrotto, lo ripara. La ligasi è, quindi, sfruttata nel clonaggio per mettere insieme molecole diverse di DNA a doppia elica ripristinando i legami fosfodiesterici uno per ogni filamento. La ligasi che si utilizza in ingegneria genetica è di norma purificata da un ceppo di Escherichia coli infettato con il fago T4. L’ultima reazione, sebbene sia possibile ottenerla, ha un’efficienza molto bassa in quanto la ligasi non è in grado di afferrare le due estremità da saldare e deve quindi attendere un evento di associazione molecolare casuale, attendere cioè che le molecole casualmente si avvicinino. Per questo motivo la ligazione delle estremità piatte dovrebbe essere eseguita in presenza di elevate concentrazioni di DNA per aumentare la probabilità che le estremità si avvicinino con il corretto orientamento, ma non è sempre possibile. Invece, la ligazione di molecole dotate di estremità coesive complementari è molto più efficiente, questo poiché le estremità coesive complementari si appaiano tra loro grazie ai legami H tra le basi complementari formando, in questo modo, una struttura abbastanza stabile che consente l’azione dell’enzima. Come dotare di estremità coesive una molecola di DNA con estremità piatte? A. LINKER B. ADATTATORI I linker sono delle corte molecole di DNA a doppia elica di sequenza nota che vengono sintetizzate in provetta (chimicamente). Un linker tipico è mostrato nella figura (a). Ha estremità piatte e contiene un sito di restrizione. In questo caso specifico è un sito di restrizione per l’enzima BamHI. La DNA ligasi è in grado di attaccare il linker alle estremità piatte di molecole di DNA più lunghe e l’efficienza di reazione può essere notevolmente aumentata ponendo nella reazione elevate concentrazioni di linker in quanto questi si possono tranquillamente sintetizzare chimicamente anche in grandi quantità in modo tale che nella reazione le molecole siano in quantità sufficiente da poter aumentare l’efficienza. Solitamente, però, più di una molecola linker si attacca alle estremità piatte. Tuttavia, la digestione con l’enzima di restrizione, in questo caso BamHI, taglia il DNA in corrispondenza di ciascuna sequenza bersaglio (di riconoscimento) creando un numero elevato di linker liberi e lasciando a ciascuna estremità della molecola di partenza un’estremità visiva per BamHI, in questo caso. Il frammento, così modificato, è pronto per essere ligato in un vettore di clonaggio precedentemente digerito anch’esso con una BamHI. È scontato che la molecola di partenza non deve contenere siti di taglio per BamHI. Se così fosse, il frammento da clonare verrebbe tagliato anche all’interno. Quello appena nominato potrebbe quindi essere un possibile problema nell’utilizzo dei linker… Al fine di evitare questo problema posso utilizzare degli ADATTATORI: Un adattatore è una corta sequenza di DNA sintetica (sintetizzata chimicamente) che viene preparata in modo tale da avere già una estremità coesiva. L’idea è quella di ligare l’estremità piatta del frammento da clonare all’adattatore in modo da ottenere una molecola dotata di estremità coesive. Le estremità coesive di ciascun adattatore, però, possono appaiarsi formando dei dimeri con estremità piatte, così anche dopo una ligazione la molecola di DNA presenta ancora delle estremità piatte. La soluzione a questo problema risiede nella struttura chimica delle estremità delle molecole adattatrici. Le due estremità di un polinucleotide, che sono raffigurate nella figura (a), sono chimicamente differenti. Al 5’ è presente un gruppo fosfato (P) mentre al 3’ è presente un gruppo idrossile (OH). Se andiamo a vedere l’immagine (b), nella doppia elica i due filamenti corrono antiparalleli, ogni estremità ha, perciò, un 5’ ed un 3’. La ligazione avviene andando ad unire le estremità 5’P con le estremità 3’OH. Gli adattatori sono sintetizzati in modo tale che la estremità piatta presente su un lato abbia il 5’P e il 3’OH, mentre l’estremità coesiva sul lato opposto è modificata in modo tale che l’estremità in 5’ presenti un OH come quella in 3’, proprio perché manca del P. La DNA ligasi non è in grado di formare un legame fosfodiesterico dalle terminazioni 5’OH e 3’OH, perciò, il risultato è che le molecole adattatrici non vengono ligate insieme. Una volta, però, che gli adattatori sono attaccati alla molecola da clonare, il 5’ OH viene riconvertito in un gruppo P grazie all’azione di un enzima chiamato polinucleotide chinasi. Alla fine, viene generato un frammento con estremità coesive pronto per essere inserito nel vettore appropriato. RIASSUMENDO: l’adattatore possiede le estremità piatte con terminazioni canoniche del DNA, ma le estremità coesive sono modificate al 5’ con un gruppo -OH. Questo fa sì che gli adattatori non possano legarsi fra di loro. VETTORI DI ESPRESSIONE Alcuni vettori non solo permettono l’isolamento e la purificazione di specifici DNA ma sono anche in grado di dirigere l’espressione di geni all’interno del DNA inserito, quindi nell’inserto. Tali plasmidi vengono detti vettori di espressione e possiedono, oltre alle componenti base di un plasmide, dei promotori trascrizionali derivati dalla cellula ospite e completamente adiacenti al sito di inserzione. Solitamente il gene da clonare è di una specie diversa rispetto a quella dell’ospite. I vettori di espressione sono spesso usati per produrre grandi quantità di proteine da purificare, quindi per produrre proteine ricombinanti. Il promotore, invece, deve essere della stessa specie dell’ospite. Se la regione codificante di un gene è posizionata nel sito di inserzione nell’orientamento corretto, il gene inserito verrà trascritto in mRNA e tradotto in proteina all’interno della cellula ospite. I segnali di inizio e terminazione della traduzione presenti nel vettore di espressione verranno incorporati nell’mRNA prodotto dalla trascrizione dell’ospite affinché questo mRNA possa essere tradotto in proteina. 2. TRASFERIMENTO DEL VETTORE ALLA CELLULA OSPITE Il trasferimento avviene mediante trasformazione, processo mediante il quale un organismo ospite può prendere del DNA dall’ambiente circostante. Anche se il meccanismo mediante il quale il DNA viene catturato non è del tutto noto, è noto che gli ioni Ca schermano le cariche negative del DNA permettendogli di passare attraverso la membrana cellulare. Si dice che quelle cellule trattate con Ca diventino competenti per la trasformazione, cioè che siano maggiormente in grado di internalizzare il DNA che è presente nell’ambiente circostante. Per selezionare le cellule trasformate, ossia quelle che hanno incorporato il vettore, cioè il plasmide ricombinante che abbiamo creato, queste cellule vengono piastrate su un terreno di coltura contenente l’antibiotico la cui resistenza è codificata dal plasmide, ad esempio la resistenza per la tetraciclina. Le cellule che ospitano il plasmide, quindi, sono in grado di crescere in presenza dell’antibiotico. Le cellule prive di plasmide, invece, non saranno in grado di crescere in presenza di antibiotico. Le colonie che sopravvivono alla selezione antibiotica sono dette trasformanti. Il passaggio della selezione è fondamentale poiché la trasformazione è un processo inefficiente. Per questo motivo, infatti, solo poche cellule cattureranno il plasmide. In ogni caso, l’inefficienza della trasformazione almeno assicura che venga incorporata una sola molecola di DNA in ciascuna cellula. Questa capacità rende ogni cellula e quindi anche la sua progenie portatrice di una singola molecola di DNA. Pertanto, la trasformazione purifica e amplifica una singola molecola di DNA da tutti gli altri DNA presenti nella miscela di trasformazione. 3. MOLTIPLICAZIONE La moltiplicazione è l’amplificazione della sequenza di interesse. Nel momento in cui la cellula che ha incorporato il plasmide si divide in due cellule figlie si ha la propagazione delle cellule trasformate e la produzione del doppio delle copie del DNA ricombinante. Generalmente, l’ospite più utilizzato è E. coli, il quale si divide circa ogni 20 minuti; quindi, si può ben capire che in pochissimo tempo si ottengono moltissime copie del DNA ricombinante. RICAPITOLANDO I VARI STEP: In primis un frammento di DNA contenente un gene da clonare viene inserito in una molecola di DNA circolare detta vettore e quello che si origina è una molecola di DNA detta ricombinante. Il vettore serve a trasportare il gene all’interno di una cellula ospite, di solito batterica. Poi, all’interno della cellula ospite il vettore si moltiplica producendo molte copie identiche, non solo di sé stesso ma anche del gene in esso contenuto. Quando invece la cellula ospite si divide le copie del vettore vengono distribuite alle cellule figlie al cui interno il vettore si replica producendo altre copie. Questa non è altro che la propagazione del DNA ricombinante. Dopo una serie di divisioni cellulari si genera una colonia o clone di cellule identiche. Ogni cellula del clone contiene una o più copie del DNA ricombinante. Quindi si dice che il gene portato dal vettore all’interno della molecola di DNA ricombinante è stato clonato. PCR (Polymerase Chain Reaction) A cosa serve? La PCR è una delle tecniche fondamentali di biologia molecolare. Permette di amplificare, ossia creare molte copie di una specifica sequenza di DNA, una specifica porzione di interesse che in questa immagine è rappresentata in verde. È possibile amplificare qualsiasi regione di qualsiasi molecola di DNA se si conoscono le sequenze che ne delimitano le estremità. Che cosa occorre? È una tecnica estremamente semplice alla quale prendono parte due attori fondamentali: i primer e la DNA polimerasi. I primer sono due corti oligonucleotidi che vanno a legarsi, quindi ibridizzarsi uno alla porzione complementare sul filamento 5’-3’ e l’altro sulla porzione complementare sul filamento 3’-5’. Questi primer sono disegnati e sintetizzati per ibridarsi per complementarità alle regioni fiancheggianti la porzione della molecola di DNA di interesse. Ecco perché è necessario conoscere le sequenze che vanno a delimitare le estremità delle molecole di interesse. Questi oligonucleotidi fungono da innesco per la reazione di sintesi del DNA che viene eseguita dalla DNA polimerasi in direzione 5’-3’. PCR: la reazione Per poter eseguire una reazione di PCR il templato che può essere DNA o cDNA (DNA sintetizzato a partire da uno stampo) viene miscelato ad una DNA polimerasi termoresistente, a due oligonucleotidi primer e ad una miscela di quattro dNTPs, ossia deossinucleotiditrifosfato. Il templato è sufficiente anche in piccole quantità dato che la PCR è una tecnica abbastanza sensibile. Il primo step della reazione dopo l’allestimento è la denaturazione. Questa fase avviene riscaldando la miscela tra 94-96°C. A questa temperatura il DNA si denatura, cioè i due filamenti di DNA si separano; accade perché, ad alte temperature, i legami H che tengono uniti i due filamenti della doppia elica si spezzano. Al termine di questo step otteniamo DNA denaturato a singola elica. È necessario che sia a singola elica perché lo step successivo prevede l’annealing, ossia il legame, ibridazione dei primer alle loro sequenze complementari fiancheggianti la sequenza da amplificare. La temperatura di annealing va da 50 a 65 °C. Una volta che i primer si sono legati fungono da innesco per la DNA polimerasi che nella fase di extension, detta anche allungamento, catalizza la sintesi del DNA complementare alla regione di interesse, aggiungendo un nucleotide per volta in direzione 5’-3’. L’allungamento, generalmente, avviene a 72°C, temperatura ottimale per la reazione della DNA polimerasi. La temperatura di annealing è la più importante perché determina la specificità della reazione. Se la temperatura è troppo elevata non si ha l’ibridazione e quindi, di conseguenza, non viene amplificata la porzione di DNA. Se invece è troppo bassa i primer si legano in maniera aspecifica al DNA e quindi, di conseguenza, vengono amplificati anche frammenti che sono diversi da quello di interesse. L’intero ciclo di denaturazione, ibridazione e sintesi viene ripetuto n volte per permettere l’amplificazione esponenziale della molecola di interesse. Infatti, nel primo ciclo da una molecola a doppia elica se ne ottengono due, nel secondo ciclo da due molecole se ne ottengono quattro e così via. Il risultato è, quindi, un’AMPLIFICAZIONE ESPONENZIALE DELLA MOLECOLA DI INTERESSE: I prodotti di PCR ottenuti possono essere analizzati tramite elettroforesi su gel di agarosio o tramite il sequenziamento del DNA. Come si esegue? I vari componenti della reazione vengono addizionati all’interno di provette a pareti sottili per permettere il passaggio di calore dall’esterno all’interno delle provette. Per far avvenire i vari cicli termici della reazione le provette vengono alloggiate in strumenti chiamati termociclatori. Questi strumenti presentano un blocco porta provette che viene scaldato in maniera automatizzata. Essendo una tecnica di amplificazione bisogna fare attenzione alle contaminazioni proprio perché in presenza di contaminazioni possono essere amplificati degli aspecifici ma possono anche essere introdotte nella reazione molecole come le DNAsi che vanno a degradare il DNA. Per questo motivo bisogna lavorare in ambiente pulito e inserire nella reazione dei controlli negativi. I controlli negativi sono delle reazioni dove manca il templato ma abbiamo tutto il resto. Ci aspettiamo che in questa reazione non si abbia amplificazione e in caso contrario vuol dire che la reazione è contaminata. Inoltre, bisogna prendere qualche precauzione. Bisogna indossare dei guanti puliti, utilizzare puntali con il filtro, i quali devono essere DNAsi-free, cioè non devono contenere delle DNAsi. Infine, bisogna stare in silenzio perché DNAsi ed RNAsi sono presenti nel nostro cavo orale. VANTAGGI: Velocità e facilità d’uso: in poche ore si possono ottenere milioni di copie della sequenza di DNA target. Sensibilità: virtualmente è possibile analizzare il DNA di una singola cellula come templato. SVANTAGGI: Solo sequenze note: è necessario conoscere la sequenza del DNA da amplificare per sintetizzare i primer. Dimensioni limitate: dimensioni medie dell’amplicone di 0.1-5kb; l’amplicone è il prodotto di PCR, quindi la regione di interesse tra i due primer; deve avere questa dimensione perché quanto più è lungo il frammento minore è l’efficienza di amplificazione. Proofreading: è il processo di correzione di bozze; tutte le DNA polimerasi a volte commettono degli errori e possono quindi incorporare un nucleotide sbagliato nella catena di DNA nascente. Molte polimerasi, però, sono in grado di ovviare a questi errori rimuovendo il nucleotide sbagliato e risintetizzando la sequenza corretta. Questa azione è detta azione esonucleasica, digeriscono quindi il DNA in direzione 3’-5’ per rimediare all’errore. Ma attenzione, le polimerasi utilizzate in PCR non hanno questa attività, quindi il DNA sintetizzato può contenere degli errori. La taq polimerasi manca dell’attività 3’-5’ esonucleasica: 1 errore ogni 9000 nucleotidi, 1 errore ogni 300 bp dopo 30 cicli di amplificazione. SEQUENZIAMENTO DEL DNA Metodo a terminazione di catena di SANGER (1977) Sequenziare il DNA è possibile da circa 50 anni, da quando Fred Sanger, un chimico britannico, ha ideato un metodo a terminazione di catena che prende il suo nome. Questo gli ha anche permesso di vincere un Nobel. Cosa significa sequenziare il DNA? Vuol dire determinare la sequenza nucleotidica del DNA, ossia determinare l’ordine esatto della successione delle basi azotate nel filamento del DNA. Il sequenziamento si basa sulla possibilità di separare tra loro molecole di DNA a singolo filamento che differiscono in lunghezza per un singolo nucleotide (tante elettroforesi su gel di poliacrillammide). Nello specifico, vengono generati frammenti di DNA che differiscono tra loro per una base, i quali vengono separati per elettroforesi alla quale segue la rilevazione. Sintesi di nuovi filamenti di DNA, complementari ad uno stampo a singolo filamento Come la PCR, il sequenziamento richiede: -uno stampo a singola elica; -un innesco stampo, cioè primer; -una DNA polimerasi (elevata processività, bassa attività esonucleasica); -dNTPs; Il primer ibridizza, cioè si lega allo stampo a singola elica e la DNA polimerasi, a partire dall’innesco, sintetizza il filamento complementare aggiungendo dNTPs in direzione 5’-3’. A differenza della PCR, oltre agli elementi sopra elencati, nella reazione vengono inseriti anche dei ddNTPs cioè dideossiribonucleotidi. Che differenza c’è tra i dNTPs e i ddNTPs? Questi ultimi presentano lo zucchero deossiribosio privo di gruppo -OH in posizione 3’. La mancanza di questo gruppo comporta che dopo che un ddNTPs è aggiunto alla polimerasi non possono essere aggiunti ulteriori nucleotidi determinando, quindi, la terminazione della catena. Ma perché non possono essere aggiunti altri nucleotidi? Perché nessun legame fosfodiesterico può essere formato. Il legame fra due nucleotidi avviene attraverso una reazione di condensazione fra il gruppo -P in 5’ del nucleotide da aggiungere e il gruppo -OH in 3’ del nucleotide precedente. Nel caso dei ddNTPs, in assenza del gruppo -OH in 3’, il legame fosfodiesterico non si forma. Non possono, quindi, essere aggiunti ulteriori nucleotidi con conseguente terminazione della catena. I ddNTPs aggiunti alla reazione sono di tipo diverso, ognuno contraddistinto da una base azotata diversa e sono in bassa percentuale. Ad ogni reazione si aggiungono tanti dNTPs e pochi ddNTPs. Dato che nella reazione i ddNTPs sono presenti in basse concentrazioni la sintesi non si ferma ogni volta in prossimità dell’innesco ma possono essere aggiunti centinaia di nucleotidi prima che un ddNTP venga incorporato. Il risultato è la produzione di una serie di frammenti di lunghezza differenti interrotti ciascuno in corrispondenza di un ddNTP. Per determinare la sequenza del filamento di DNA i frammenti vengono separati tramite elettroforesi. La separazione elettroforetica, per risalire al DNA stampo identificando i ddNTPs affianco a ciascuna catena terminata, può avvenire in due modi diversi: a) Sequenziamento MANUALE Vengono allestite quattro reazioni di sequenziamento, in ognuna delle quali è presente un solo tipo di ddNTPs. Sono quattro perché sono quattro le basi azotate. I vari frammenti di lunghezza differente di ciascuna reazione vengono caricati e separati per elettroforesi su un grande gel di poliacrillammide. L’elettroforesi è una tecnica che permettere di separare le molecole di DNA in base alla loro dimensione. I frammenti avranno dimensioni diverse e si posizioneranno nel gel dispersi a seconda del numero di pb di cui sono costituiti. In alto nel gel si avranno i frammenti di lunghezza maggiore invece in basso i frammenti più piccoli. Saranno separati in maniera decrescente, quindi, in alto i più lunghi ed in basso i più piccoli. In questo modo è possibile risalire alla sequenza. RICAPITOLANDO: Allestiamo quattro reazioni differenti dove in una reazione aggiungiamo i ddTTP, in una ddCTP, in una ddATP, e nell’ultima ddGTP. Vengono tutte caricate ognuna in un singolo pozzetto del gel di poliacrillammide e poi facendo partire la corsa elettroforetica i vari frammenti terminati con quattro ddNTPs diversi si separeranno all’interno del gel. In base alla posizione del frammento si riuscirà a determinare la sequenza esatta di quel filamento di DNA. b) Sequenziamento AUTOMATICO Oltre al metodo originale, è possibile eseguire un sequenziamento automatico. In questo caso si utilizza un gel capillare. Non vengono fatte quattro reazioni differenti ma un’unica reazione. Ma quindi come è possibile distinguere un ddNTPs dall’altro? Nel sequenziamento automatico, i ddNTPs hanno la caratteristica di essere marcati con un gruppo fluorescente e ciascuna categoria di ddNTPs è marcata con un gruppo fluorescente diverso per poterli distinguere tra loro. Viene allestita, quindi, un'unica reazione dove viene aggiunta la miscela dei quattro ddNTPs marcati diversamente e il tutto viene fatto correre su di un gel all’interno di un capillare. Questo metodo ha due vantaggi: Il primo è che per elettroforesi capillare la reazione è estremamente più veloce e il secondo vantaggio è che, appunto, non si fanno quattro reazioni separate ma un’unica e la rilevazione non è manuale ma avviene tramite un rilevatore. È un rivelatore di fluorescenza che, nel momento in cui una molecola passa, riesce a distinguere i diversi gruppi, marcatori, attaccati ai diversi ddNTPs. Ovviamente, il rilevatore darà l’input al software e quest’ultimo ci creerà il file con la sequenza. Facciamo una miscela unica con i quattro ddNTPs marcati, carichiamo il campione sul capillare e all’interno del capillare avviene una veloce elettroforesi. Il principio è sempre quello dell’elettroforesi, perciò le molecole più piccoline saranno quelle che verranno fuori per prime, cioè saranno rilevate dal software per prime. I frammenti più lunghi, invece, arriveranno a livello del detector in un secondo momento. In questo modo, sarà possibile determinare la sequenza del DNA. Nel momento in cui il frammento passa a livello del detector, questo va a rilevare la fluorescenza e a seconda della fluorescenza rilevata si riesce a capire di che ddNTPs si tratta. In questo modo si riesce poi a risalire direttamente alla base azotata che ha determinato la terminazione della reazione in quel determinato filamento. Nel momento in cui facciamo un sequenziamento automatico, quindi, non dobbiamo manualmente scrivere e determinare la sequenza ma è il software che in automatico permette di determinare la sequenza. Ogni picco è relativo alla base azotata corrispondente. I picchi in azzurro rappresentano la citosina, quelli in arancione la guanina, in verde l’adenina e in fucsia la timina. Un esempio di grafico che viene fuori: l’ELETTROFEROGRAMMA Questo metodo è il primo ad essere stato ideato e viene, attualmente, ancora molto utilizzato. Permette di sequenziare piccole porzioni di geni ma anche porzioni più grandi, ma con un impiego maggiore di tempo. Per abbreviare i tempi, è stato ideato un nuovo metodo che prende il nome di “Next Generation Sequencing” che permette di sequenziare varie molecole in parallelo, risparmiando tempo e denaro. Finisce qui il programma di questo corso di Biologia Molecolare!