GENERAL VIEW OF THE HUMAN GENOME Gene landscape • In prokaryotes, genes are often tandemly arranged, with little or no spacer sequences in between • In eukaryotes, there is considerable spacer DNA between genes – some is repetitive DNA: identical or nearly identical repeated units (much is derived from mobile genetic elements) – …but also are unique sequences GENERAL VIEW OF THE HUMAN GENOME Segmental duplications (low-copy repeats) •Large block (1 >200Kb) •Highly Similar (>97%) •Without characteristic sequences A A’ 3) Segmental duplications Closely related sequence blocks at different genomic loci Transfer of 1-200kb blocks of genomic sequence Segmental duplications can occur on homologous chromosomes (intrachromosomal) or non homologous chromosomes (interchromosomal) Not always tandemly arranged Relatively recent (population polymorphisms) Found especially around centromeres and telomeres Segmental duplications Interchromosomal segments duplicated among non-homologous chromosomes Intrachromosomal duplications occur within a chromosome / arm Nature Reviews Genetics 2, 791-800 (2001); Duplications (and rearrangements) are very common: intrachromosomal SEGMENTAL DUPLICATIONS ON CHROMOSOME 9: IINTERCHROMOSOMAL DUPLICATIONS LARGE DUPLICATIONS (GREATER THAN 10 kb) ARE SHOWN WITH CHROMOSOME 9 MAGNIFIED; OTHER CHROMOSOMES ARE ARRANGED IN THE ORDER IN WHICH THEY MATCH CHROMOSOME (GRAY RECTANGLE IS HETEROCHROMATIN) HUMPHRAY et al. (2004), Nature 429, 369-374 CNVs IN POPULATIONS Recent segmental duplications are polymorphic CNVs AND DISEASE GENERAL VIEW OF THE HUMAN GENOME Tandemly repetitive DNA Class size of repeat locations satellite DNA (100 kb to several Mb) 5bp - 5 kb heterochromatin particularly at centromeres Minisatellite DNA 0.1 - 20kb 6 - 64 bp scattered but concentrated near telomeres Microsatellite DNA <100bp 1 - 4 bp dispersed throughout genome (SSRs) (about 3% of Human Genome) Variable Nucleotide Tandem Repeats (VNTRs) • VNTRs are short segments of DNA that repeat a few to hundreds of times • These unusual repeats occurs many different spots on human chromosomes • Each individual will have different numbers of these VNTRs at each of these spots • Each of these spots, or loci, are given different names (MSRs, STRs, AmpFLPs, etc) • VNTRs are inheritable – the numbers of repeats at each location in you are a random combination of the VNTRs in your parents Practical Applications with VNTR’s 1. Genetic Identification Services (GIS) was established in 1994 to serve the agriculture, aquaculture, and wildlife ecology communities through the development and use of custom genetic markers for a wide variety of applications. GIS has developed libraries for academic, commercial, and government entities. GIS has also developed a data base of loci in studies involving a wide range of plant and animal species. EXAMPLES OF GIS APPLICATIONS Identification of economically important genetic traits Selective breeding Population structure and dynamics Monitoring genetic diversity Wildlife forensics Proprietary stock and strain protection Parent-offspring identification Sexing PROBLEMS with determining a reasonable VNTR “match” VNTRs, are not distributed evenly across all of human population. A given VNTR cannot, therefore, have a stable probability of occurrence; it will vary depending on an individual's genetic background. The difference in probabilities is particularly visible across racial lines. Some VNTRs that occur very frequently among Hispanics will occur very rarely among Caucasians or African-Americans. Additionally, the heterogeneous genetic composition of interracial individuals, who are growing in number, presents an entirely new set of questions. This type of population genetics has been hindered by controversy, because the idea of identifying people through genetic anomalies along racial lines comes alarmingly close to the eugenics and ethnic purification movements and, some argue, could provide a scientific basis for racial discrimination. GENERAL VIEW OF THE HUMAN GENOME Tandemly repetitive DNA Class size of repeat locations satellite DNA (100 kb to several Mb) 5bp - 5 kb heterochromatin particularly at centromeres Minisatellite DNA 0.1 - 20kb 6 - 64 bp scattered but concentrated near telomeres Microsatellite DNA <100bp 1 - 4 bp dispersed throughout genome Human telomeres: (TTAGGG)n / variable total length Satellite DNA Chromosomal location of tandemly repetitive DNA GENERAL VIEW OF THE HUMAN GENOME Repetitive DNA TEs are like that! I interspersed in tandem 32 Transposable elements in the human genome R N A or D N A interm ediate • T ran sp o so n m o v es u sin g D N A in term ed iate • R etro tran sp o so n m o v es u sin g R N A in term ed iate In 100,000 b p of h u m an G enes S im ple S atellite M ini S atellite M icro S atellite DNA: 1 30 1 10 D N A transposons V iral retroposons L ines (L 1) S ines (A lu) 10 15 25 50 R e p e a ts a n d E vo lu tio n • R e c o m b in a tio n H o t sp o t s • U n e q u a l C r o sso v e r • T r a n sp o sitio n • E vo lu tio n a r y H is to r y • E x o n S h u f f lin g Transposons and Transposition Transposable element (transposon) A discrete segment of DNA able to move to a new site in the genome (without any homology to the target locus) Transposition Movement of a transposable element to a new site in the genome 2 C o n s e q u e n c e s o f T ra n s p o s itio n . P a rt 1 g e n e d is ru p tio n TE w ild -typ e g e n e p ro d u c t n o g e n e p ro d u c t c h a n g e s in g e n e e x p re s s io n REG w ild -typ e g e n e e x p re s s io n REG TE a lte re d g e n e e x p re s s io n 3 C o n s e q u e n c e s o f T ra n s p o s itio n . P a rt 2 a TE b c TE abc TE p a irin g p a irin g b TE abc TE a TE c TE TE c ro s s in g o v e r c ro s s in g o v e r TE d e le tio n TE cba TE in ve rs io n 4 C o n s e q u e n c e s o f T ra n s p o s itio n . P a rt 3 TE TE TE TE c ro s s in g o ve r c ro s s in g o ve r TE TE TE TE re c ip ro c a l c h ro m o s o m e tra n s lo c a tio n a c e n tric a n d d ic e n tric c h ro m o s o m e s 5 Repeats and Evolution • • • • • Recombination Hotspots Unequal Crossover Transposition Evolutionary History Exon Shuffling transposase gene IR IR DNA TE transposition DNA break repair of double-strand break, using sister chromatid Transposable elements in the human genome RNA R e v e rse tra n scryp ta s e DNA In te g ra se RNA R N A p o lym e ra se II S h o rt in te rs p e rs e d re p e titiv e e le m e n ts : S IN E s • E xa m p le : A lu re p e a ts – M o st a b u n d a n t re p e a te d D N A in p rim a te s – S h o rt, a b o u t 3 0 0 b p – A b o u t 1 m illio n co p ie s – L ik e ly d e rive d from th e g e n e fo r 7 S L R N A – C a u se n e w m u ta tio n s in h u m a n s • T h e y a re re tro tra n p o s o n s – D N A se g m e n ts th a t m o v e via a n R N A in te rm e d ia te . • M IR s : M a m m a lia n in te rs p e rse d re p e a ts – S IN E S fo u n d in a ll m am m a ls • A n a lo g o u s sh o rt re tro tra n s p o s o n s fo u n d in g e n o m e s o f a ll ve rte b ra te s. Alu elements Length = ~300 bp Repetitive: > 1,000,000 times in the human genome Constitute >10% of the human genome Derive from 7SL RNA Found mostly in intergenic regions and introns Propagate in the genome through retroposition (RNA intermediates). 31 הפרומוטר שלו " קופץ " יחד עםA lu R N A pol III R N A pol III prom oter RNA DNA A lu in se rtio n s C a n ca u s e d is e a s e w he n th e y in s e rt in to a n e s se n tia l g e n e . E x a m p le s : N e u rof ib rom a tos is H u n tin g to n ’s D is e a se S om e f orm s of in h e rite d b re a s t ca n ce r LDL receptor gene Alu repeats present within introns 4 5 6 Alu repeats in exons unequal crossing over 4 Alu 5 Alu 6 X 4 Alu 5 Alu 6 one product has a deleted exon 5 4 (the other product is not shown) Alu 6 BRCA1 Alu repeats present within introns (40%) 5’UTR Alu repeats in exons Normal tissue Breast cancer tissue Alu (10 times lower efficiency of translation) Other SINEs: SVA elements Long interspersed repetitive elements: LINEs • Moderately abundant, long repeats – L1 family: most abundant – Up to 7000 bp long • Retrotransposons – Encode reverse transcriptase and other enzymes required for transposition – No long terminal repeats (LTRs) • Homologous repeats found in all mammals and many other animals • Some actively transposing (cause new mutations in humans) • Containing pol II promoter and two ORFs retrotransposon in DNA reverse transcription DNA:RNA hybrid DNA “2nd strand” synthesis integration at new position in DNA original copy still there E v e n ts in L 1 tra n sp o sitio n p ro m o te r ORF1 ORF2 R T ’a s e 3’ U TR e n d o n u c le a s e tra n s c rib e S ta g g e re d b re a k a t ta rg e t P rim in g o f s yn th e s is b y R T ’a s e a t s ta g g e re d b re a k 2 n d s tra n d s yn th e s is a n d re p a ir o f s ta g g e re d b re a k FDR R T ’a s e w o rk s p re fe re n tia lly o n L 1 m R N A FDR G en e A G en e B . Relative positions of the apolipoprotein(a) [apo(a)] gene and its enhancer element. The long interspersed nuclear element (LINE) (green) is located approximately 20 kilobases upstream from the start of transcription of the apo(a) gene (blue). The enhancer element (red) is located entirely within the LINE element and is competent to enhance expression levels of apo(a). Tissue specificity is provided by the core promoter element (yellow). Modified, with permission, from [28]. AUMENTO DE LA CAPACIDAD INFORMACIONAL GENOMA DUPLICACIONES GÉNICAS SEGMENTALES POLIPLOIDÍA CAMBIOS EN REGIONES REGULADORAS IMPORTACIÓN DE GENES DE OTROS ORGANISMOS PROTEOMA DISTINTOS PROMOTORES SEÑALES DE poli(A) SPLICING ALTERNATIVO EDITING MODIFICACIONES POSTRADUCCIONALES … (SÓLO SE MUESTRAN ALGUNOS MECANISMOS) TRANSFERENCIA HORIZONTAL TRANSFERENCIA PARCIAL (COMÚN EN PROCARIONTES) EL SISTEMA FOTOSINTÉTICO EL SISTEMA INMUNE (COMBINATORIO) ENDOSIMBIOSIS BACTERIANA RETROVIRAL TRANSFERENCIA HORIZONTAL DE GENOMAS COMPLETOS (ENDOSIMBIOSIS) BACTERIANA (EL/LOS ORIGEN/ES DE LA CÉLULA EUCARIONTE) RETROVIRAL (TODOS LOS GENOMAS MULTICELULARES) RNA (diploide) Membrana lipídica Env Superficie (SU) Transmembrana (TM) Pol -proteasa (PR) -Integrasa (IN) -Transcriptasa Inversa (RT) Gag - cápsida (CA) -matriz (MA) - Nucleocápsida (NC) RNA (PARTÍCULA VIRAL) R U5 gag pol env U3 R Retrotranscripción U3 R U5 gag pol env U3 R U5 LTR LTR Enzimas Proteínas estructurales Proteínas de cubierta DNA (PROVIRUS INTEGRADO) RNA (diploide) Membrana lipídica Env Superficie (SU) Transmembrana (TM) Pol -proteasa (PR) -Integrasa (IN) -Transcriptasa Inversa (RT) Gag - cápsida (CA) -matriz (MA) - Nucleocápsida (NC) Retrotranscripción RECEPTOR CELULAR INTEGRACIÓN EN EL GENOMA ssRNA dsDNA ? Proteínas virales mRNAs + RNA viral no procesado R-U5-gag-pol-env-U3-R TRANSCRIPCIÓN PARTÍCULA VIRAL (INFECTIVA) CÉLULAS SOMÁTICAS INTEGRACIÓN VIRAL (ENDOGENIZACIÓN) INTEGRACIÓN VIRAL DIVISIONES MITÓTICAS ¿? CÉLULAS GERMINALES REPLICACIÓN VIRAL INFECCIÓN A OTROS INDIVIDUOS (TRANSMISIÓN HORIZONTAL) RETROVIRUS EXÓGENOS TRANSMISIÓN A LA DESCENDENCIA (HERENCIA MENDELIANA) RETROVIRUS ENDÓGENOS ¿POR QUÉ SE MANTIENEN EN LOS GENOMAS? PARASITISMO: SU ÚNICA FUNCIÓN ES AUTOPERPETUARSE EN COMPETENCIA CON LAS SECUENCIAS CELULARES (DNA EGOÍSTA O DNA BASURA) SIMBIONTES: UNA VEZ INTEGRADOS, ALGUNAS DE SUS FUNCIONES SON APROVECHADAS POR LA CÉLULA (EXAPTACIÓN O DOMESTICACIÓN) ALTERNATIVA: CONFORMAN LOS GENOMAS Y FUNCIONAN EN COORDINACIÓN CON EL RESTO DE LAS SECUENCIAS (SON NECESARIAS PARA LOS ORGANISMOS) SON UN MECANISMO PRINCIPAL DE CAMBIO GENÓMICO SENSIBLE A LOS CAMBIOS AMBIENTALES (SON NECESARIOS PARA LA EVOLUCIÓN ORGÁNICA) ¿SON NECESARIOS PARA LOS ORGANISMOS? LOS RETROVIRUS ENDÓGENOS ESTÁN PRESENTES EN (CASI) TODOS LOS ORGANISMOS EUCARIONTES SON SECUENCIAS ACTIVAS Y PARTICIPAN EN LAS FUNCIONES CELULARES NORMALES SUS FUNCIONES ESTÁN INTEGRADAS EN LOS PROCESOS FISIOLÓGICOS COMPLEJOS DE LOS ORGANISMOS UNIVERSALIDAD Y ESPECIFICIDAD INSERCIÓN EN LÍNEA GERMINAL TRANSMISIÓN VERTICAL MUTACIÓN RETROTRANSPOSICIÓN RECOMBINACIÓN NUEVAS COMBINACIONES NUEVOS PROVIRUS TRANSMISIÓN VERTICAL NUEVAS CARACTERÍSTICAS INFECTIVAS TRANSMISIÓN HORIZONTAL A NUEVOS INDIVIDUOS Y/O ESPECIES DESCENDENCIA FUNCIONES CELULARES DE LOS RETROVIRUS ENDÓGENOS PROTEÍNAS gag GENES ESTRUCTURALES env Pro GENES DE ENZIMAS pol LTRs Funciones Reguladoras Estructurales Unión específica a DNA/RNA Inmunomoduladoras fusogénicas Retrotranscriptasa Rnasa H Integrasa dUTPasa* Promotores/Enhancers Procesamiento de RNAs (Señales de splicing y poliadenilación) FACTORES DE TRANSCRIPCIÓN HORMONAS (y otros…) LTRs RNA polimerasa II PROMOTORES ESPECÍFICOS DE TIPO CELULAR QUE RESPONDEN A SEÑALES INTERNAS Y EXTERNAS A LA CÉLULA GENES PROVIRALES OTROS GENES (MILES DE LTRs SOLITARIAS DISPERSAS POR EL GENOMA) LTRs SEÑALES DE SPLICING SPLICEOSOME •SPLICING ALTERNATIVO •SPLICING INTERGÉNICO SEÑALES DE POLIADENILACIÓN POLI-A-POLIMERASA mRNAs QUIMÉRICOS MÚLTIPLES PRODUCTOS PROTEICOS CON DISTINTOS DOMINIOS Y CON FUNCIONES DIFERENTES LOS RETROVIRUS ENDÓGENOS EN LOS PROCESOS FISIOLÓGICOS COMPLEJOS: LA PLACENTACIÓN PROBLEMAS GENÉTICOS DE LA PLACENTACIÓN: •EL SISTEMA INMUNOLÓGICO DE LA MADRE DEBERÍA RECHAZAR UN EMBRIÓN “MEDIO EXTRAÑO” •LA MADRE DEBE CONTROLAR LA INVASIÓN Y EL CRECIMIENTO DEL FETO •EL SISTEMA INMUNOLÓGICO DE LA MADRE DEBERÍA RECHAZAR UN EMBRIÓN “MEDIO EXTRAÑO” •LA MADRE DEBE CONTROLAR LA INVASIÓN Y EL CRECIMIENTO DEL FETO INMUNOSUPRESOR PARTÍCULAS VIRALES env FUSOGÉNICO INMUNOSUPRESIÓN INFECCIÓN LOCAL DE MACRÓFAGOS MATERNOS PARTÍCULAS VIRALES SINCITINA (HERV-W) SINCITIOTROFOBLASTO VARIOS HERVs DIFERENCIACIÓN TERMINAL DEL TROFOBLASTO INVASIVO CONTROL DEL CRECIMIENTO FETAL INMUNOSUPRESIÓN INFECCIÓN LOCAL DE MACRÓFAGOS MATERNOS PARTÍCULAS VIRALES SINCITINA (HERV-W) SINCITIOTROFOBLASTO VARIOS HERVs DIFERENCIACIÓN TERMINAL DEL TROFOBLASTO INVASIVO CONTROL DEL CRECIMIENTO FETAL LA PLACENTACIÓN ES UN PROCESO COMPLEJO QUE INTEGRA MÚLTIPLES FACTORES INTERLEUKINAS LOS VIRUS ACTIVAN LOS GENES DE INTERLEUKINAS FACTORES DE CRECIMIENTO HERV-E-PTN ESPECÍFICO DE PLACENTA BALANCE ENERGÉTICO MATERNO-FETAL LA LEPTINA PLACENTARIA Y SU RECEPTOR SON ISOFORMAS CONTROLADAS POR HERVs OTROS MUCHOS GENES... LAS LTRs SON PROMOTORES ALTERNATIVOS ESPECÍFICOS DE PLACENTA PARA ALGUNOS GENES (APO-C-I; EBR...) Nature. 2012 Jul 5;487(7405):57-63. Embryonic stem cell potency fluctuates with endogenous retrovirus activity. Macfarlan TS, Gifford WD, Driscoll S, Lettieri K, Rowe HM, Bonanomi D, Firth A, Singer O, Trono D, Pfaff SL. Embryonic stem (ES) cells are derived from blastocyst-stage embryos and are thought to be functionally equivalent to the inner cell mass, which lacks the ability to produce all extraembryonic tissues. Here we identify a rare transient cell population within mouse ES and induced pluripotent stem (iPS) cell cultures that expresses high levels of transcripts found in two-cell (2C) embryos in which the blastomeres are totipotent. We genetically tagged these 2C-like ES cells and show that they lack the inner cell mass pluripotency proteins Oct4 (also known as Pou5f1), Sox2 and Nanog, and have acquired the ability to contribute to both embryonic and extraembryonic tissues. We show that nearly all ES cells cycle in and out of this privileged state, which is partially controlled by histone-modifying enzymes. Transcriptome sequencing and bioinformatic analyses showed that many 2C transcripts are initiated from long terminal repeats derived from endogenous retroviruses, suggesting this foreign sequence has helped to drive cell-fate regulation in placental mammals. LOS RETROVIRUS ENDÓGENOS COMO MECANISMOS DEL CAMBIO GENÓMICO: PLASTICIDAD GENÓMICA RETROVIRUS ENDÓGENOS RECOMBINACIÓN RETROTRANSPOSICIÓN RETROTRANSFECCIÓN EFECTOS DE LA RECOMBINACIÓN ENTRE DISTINTAS SECUENCIAS RETROVIRALES ENDÓGENAS: •DUPLICACIÓN GÉNICA (ESTRUCTURAL) •GANANCIA / PÉRDIDA DE EXONES (i.e. DE DOMINIOS PROTEICOS FUNCIONALES) •REORDENACIONES CROMOSÓMICAS (i.e. REORGANIZACIONES GENÓMICAS MASIVAS) EFECTOS DERIVADOS DE LA RETROTRANSPOSICIÓN AMPLIFICACIÓN MOVILIDAD •ADQUISICIÓN DE NUEVAS FUNCIONES •CONFERIR DISTINTA REGULACIÓN A OTRAS SECUENCIAS •PRODUCCIÓN DE NUEVOS RNAs QUIMÉRICOS •DIVERSIDAD ALÉLICA EN LAS POBLACIONES (MHC) •MUTAGÉNESIS INSERCIONAL INCREMENTO DE LA CAPACIDAD COMBINATORIA CAPACIDAD DE RETROTRANSFECCIÓN CODIFICANTES RNAs ESTRUCTURALES O ENZIMÁTICOS mRNAs tRNAs snRNAs snoRNAs stRNAs ... •GERMINALES •SOMÁTICOS ENCAPSULAMIENTO EN LA PARTÍCULA RETROVIRAL INFECCIÓN DE LA LÍNEA GERMINAL RETROGENES RETROPSEUDOGENES mRNAs •GERMINALES •SOMÁTICOS WEISSMAN tRNAs snRNAs snoRNAs stRNAs ... INFECCIÓN DE LA LÍNEA GERMINAL RETROGENES RETROPSEUDOGENES MULTIPLICACIÓN FUNCIONAL DE SECUENCIAS CON CAMBIO DE ENTORNO REGULADOR INCREMENTO DE LA CAPACIDAD INFORMACIONAL INCREMENTO DE LA CAPACIDAD COMBINATORIA + INCREMENTO DE LA CAPACIDAD INFORMACIONAL GENERACIÓN DE DIVERSIDAD ESTRUCTURAL Y FUNCIONAL REMODELACIÓN GLOBAL DE LOS GENOMAS LAS REORGANIZACIONES GENÓMICAS MEDIADAS POR LOS RETROVIRUS ENDÓGENOS DEPENDEN DE LAS CONDICIONES AMBIENTALES CONDICIONES EXTERNAS CRÍTICAS SITUACIONES DE SHOCK GENÓMICO TRANSPOSICIÓN CONCERTADA DE ELEMENTOS MÓVILES (ALGUNAS) SITUACIONES DE STRESS AMBIENTAL •ENDOGAMIA FORZADA •HIBRIDACIÓN INTERESPECÍFICA •CULTIVOS CELULARES PROLONGADOS •AGENTES MUTAGÉNICOS EXTERNOS -RAYOS UVB -ANÁLOGOS DE BASES •INFECCIONES VIRALES Y BACTERIANAS •FALLO CELULAR GENERALIZADO (p.e. NEOPLASIA) DESREGULACIÓN CUANTITATIVA Y ESPACIO-TEMPORAL DE LOS RETROVIRUS ENDÓGENOS LOS RETROVIRUS ENDÓGENOS FORMAN PARTE DE LA RESPUESTA CELULAR ANTE SITUACIONES CRÍTICAS DE STRESS INDUCIDO CONDICIONES AMBIENTALES ADVERSAS AUMENTO DE ACTIVIDAD CAMBIOS GENÓMICOS EXTENSIVOS FORMACIÓN DE PARTÍCULAS VIRALES EXTENSIÓN A LA POBLACIÓN DE NUEVAS COMBINACIONES O SALTO DE ESPECIE CAMBIO GENÓMICO INDUCIDO POR LAS CONDICIONES AMBIENTALES Y MEDIADA POR LOS RETROVIRUS ENDÓGENOS ANTE SITUACIONES AMBIENTALES CRÍTICAS SE PRODUCEN EXPLOSIONES RETROTRANSPOSICIONALES QUE IMPLICAN REORGANIZACIONES GENÓMICAS GLOBALES LAS TASAS DE CAMBIO GENÓMICO NO SON CONSTANTES APARECEN NUEVAS ORGANIZACIONES MORFO-FISIOLÓGICAS DISCONTINUIDADES EVOLUTIVAS LOS CAMBIOS GENÓMICOS PROVOCADOS POR LOS RETROVIRUS ENDÓGENOS: NO SON GRADUALES: NO TIENEN UNA TASA CONSTANTE SINO QUE SE ALTERNAN ETAPAS DE REMODELACIÓN EXTENSIVA CON OTRAS DE (RELATIVA) ESTABILIDAD NO SUCEDEN AL AZAR, SINO DE MANERA COORDINADA Y EN RESPUESTA A LAS CONDICIONES AMBIENTALES ALGUNAS IMPLICACIONES PRÁCTICAS: •TRATAMIENTOS ANTI-SIDA •LOS RETROVIRUS COMO VECTORES DE TERAPIA GÉNICA •XENOTRASPLANTES