Repetitive DNA sequences in rodentia genomes: its involvement in chromosome architecture reshuffling and in genome functionality

Data
2014
Título da revista
ISSN da revista
Título do Volume
Editora
Projetos de investigação
Unidades organizacionais
Fascículo
Resumo
Uma das evidências mais claras revelada pelos projetos de sequenciação de genomas eucariotas, foi o seu elevado nível em sequências repetitivas de DNA, sendo a extraordinária variação no tamanho do genoma encontrada entre taxa atribuída à amplificação e eliminação diferencial destas famílias de sequências. No entanto, apesar da sua abundância, a(s) função(ões) que as sequências repetitivas desempenham nos genomas sempre esteve envolta em grande mistério, pois ao contrário dos genes, nunca foi atribuída a estas sequências a capacidade de codificar proteínas (pelo menos proteínas que não estejam envolvidas na sua própria replicação e integração no genoma, como é o caso dos Elementos Transponíveis). Por esta razão, estas sequências foram inicialmente designadas como “DNA lixo”, às quais nenhuma função era atribuída. Atualmente, as sequências repetitivas ganharam a merecida atenção e são agora consideradas como uma fração essencial dos genomas eucariotas, sendo reconhecidas como elementos reguladores importantes e também sendo implicadas na ocorrência de rearranjos cromossómicos, tendo assim uma função importante na evolução de genomas. Este foi precisamente o objetivo principal deste trabalho, contribuir para a compreensão da importância que as sequências repetitivas têm na evolução de genomas eucariotas. Com este propósito, aqui foi analisada a fração repetitiva de cinco espécies de roedores Cricetidae/Muridae, que apresentam cariótipos muito distintos, sendo nomeadamente estudadas sequências em tandem e dispersas: sequências DNA satélite (SatDNAs), Sequências Teloméricas Intersticiais (ITS) e Retrotransposões LINE-1. Uma análise detalhada sobre a distribuição e a natureza molecular da Heterocromatina Constitutiva (HC) foi também realizada para estes genomas de roedores. A integração de todos os dados obtidos permitiu entender como os cinco genomas estudados evoluíram, bem como reconstruir os rearranjos cromossómicas ocorridos, nos quais as sequências repetitivas estão inquestionavelmente implicadas. De facto, todos os resultados obtidos aqui convergem para esta mesma conclusão. Nomeadamente, foi observada uma forte associação entre a distribuição e heterogeneidade da HC com o percurso evolutivo seguido por estes cariótipos. Uma análise detalhada feita neste trabalho, para duas das espécies estudadas, incidindo sobre a localização de regiões de “breakpoint” evolutivo e HC, revelou uma elevada coincidência entre estas regiões. Outros trabalhos, também focados na evolução cromossómica das restantes três espécies em análise aqui, relataram uma relação semelhante entre regiões de “breakpoint” e HC. Portanto, as sequências repetitivas localizadas na heterocromatina parecem estar intimamente envolvidas na ocorrência de rearranjos, quer promovendo diretamente reorganizações cromossómicas e/ou porque correspondem a regiões frágeis propensas à quebra. A análise de sequências repetitivas localizadas em regiões HC, especificamente satDNAs (sequências exclusivamente heterocromáticas), ITS (sequências localizadas principalmente nas regiões de HC) e LINE-1 (sequências frequentemente localizadas na HC), sugere realmente as sequências repetitivas como uma força motriz para a ocorrência de rearranjos cromossómicos. A natureza repetitiva das diferentes classes de sequências repetidas estudadas, por si só, favorece eventos de recombinação entre sequências homólogas em regiões não-homólogas, que podem culminar em rearranjos cromossómicos. No entanto, o papel na origem de reorganizações cromossómicas é particularmente sugerido para satDNAs, devido ao seu modo de evolução (evolução concertada), geralmente caracterizado por rápidas alterações na sua sequência de nucleótidos, variações no número de cópias e/ou movimentos intragenómicos, que resultam da ocorrência de diferentes eventos de recombinação (como “unequal crossing-over” ou “rolling circle replication/reinsertion”), podendo induzir quebras cromossómicas. Adicionalmente, para além de sua importante função na reestruturação dos genomas, os resultados obtidos neste trabalho atribuem também outras funções às sequências repetitivas. Uma análise mais relacionada com a atividade transcricional de alguns satDNAs estudados, suporta o papel destas sequências em muitas outras funções, como no controlo da expressão génica, na remodelação da cromatina, na resposta celular ao stress e na função centromérica. As sequências LINE-1 têm também importantes funções no controlo da expressão génica, estando envolvidas no “imprinting” de genes e na inativação do cromossoma X. Assim, apesar de inicialmente consideradas sequências inertes, à luz de todos estes dados, é impossível negar que sequências repetitivas são cruciais para o bom funcionamento e evolução dos genomas eucariotas, destronando aos nossos olhos a importância dada no passado apenas a sequências codificantes. É agora realmente difícil de entender como estas sequências, tão abundantes nos genomas eucariotas, podem ter sido consideradas desnecessárias, só porque não lhes foi atribuída uma capacidade em codificar proteínas. Afinal, as sequências que codificam proteínas representam apenas uma pequena parte dos genomas (~ 1,5 % do genoma humano). A presente tese resultou na elaboração de sete artigos que estão publicados, submetidos ou em preparação para submissão em revistas científicas internacionais indexadas.
One of the clearest evidences that emerged from the eukaryotic genome sequencing projects was the high content in repetitive DNA sequences that these genomes harbour, being the extraordinary genome size variation found between taxa attributed to the differential amplification and deletion of these sequence families. However, despite its abundance, the role(s) that these sequences play in the genomes has always been shrouded in great mystery, as unlike genes, it was never assigned to them the ability to code proteins (at least proteins that are not involved in their own replication and genomic integration, as is the case of Transposable Elements). For this reason, these sequences were initially designated as “junk” DNA, with no function assigned. Presently, these sequences have won the deserved respect and are now regarded as a crucial fraction of eukaryotic genomes, recognized as important regulatory elements and also as being implicated in the occurrence of chromosomal rearrangements, with an important role in genome evolution. This was, precisely, the main goal of this work: to contribute to the understanding of the repetitive sequences significance in the evolution of eukaryotic genomes. For this purpose, it was analysed the repetitive genomic fraction of five Cricetidae/Muridae Rodentia species, with very distinct karyotypes, regarding tandem and dispersed repeats: Satellite DNAs (satDNAs), Interstitial Telomeric Sequences (ITSs) and LINE-1 Retrotransposons. A detailed analysis about the distribution and molecular nature of the Constitutive Heterochromatin (CH) of these rodent genomes was also performed. The integration of all data allowed to understand how the five studied genomes evolved and to reconstruct the chromosomal evolutionary events elapsed, where the repetitive sequences were unquestionably involved. Indeed, all the results obtained here converge to this same conclusion. Namely, a strong association was observed between both the distribution and the level of CH heterogeneity with the evolutionary pathway that these karyotypes followed. In fact, for two of these species, a detailed analysis on the location of evolutionary breakpoint and CH regions revealed a very high coincidence between them. Other works focused on the evolution of the other three species, reported a similar relationship. Therefore, the repeats located in heterochromatin seem to be highly involved in the occurrence of chromosomal rearrangements, either by promoting directly chromosome reorganizations and/or because correspond to fragile regions prone to chromosome breakage. The analysis of the repeats located in CH regions performed here, namely satDNAs (exclusively heterochromatic), ITSs (mainly located in CH regions) and LINE-1 (frequently located in CH), really suggest the repetitive sequences as a driving force in the occurrence of chromosomal rearrangements. The repetitive nature per se of the different classes of repeats studied favours recombinational events between homologous sequences in non-homologous regions, which may culminate in chromosomal restructurings. Nevertheless the role in the origin of chromosomal reorganizations is particularly proposed for satDNAs, due to its characteristic evolutionary mode (concerted evolution) generally marked by rapid sequence mutations, copy number variations and/or intragenomic movements, driven by different recombinational events (as unequal crossing-over or rolling circle replication/reinsertion), that may induce chromosome breakage. Additionally, beyond its important function in genome restructuring, the data obtained in this work also suggest other roles to repetitive sequences. An analysis devoted to the transcriptional activity of some of the studied satDNAs supports the role of these sequences in many other functions, as in control of gene expression, chromatin remodelation, cellular response to stress and centromeric function. LINE-1 sequences as well have important functions in control of gene expression, acting in gene imprinting and in X-chromosome inactivation. Thereby, despite initially considered useless genomic elements, in the light of all this data, it is impossible to deny that repetitive sequences are crucial for proper functioning and evolution of eukaryotic genomes, dethroning to our view the importance given in the past just to the protein-coding sequences. It is really now difficult to understand how these sequences, so abundant in eukaryotic genomes, may have been considered unnecessary, just because a coding capacity was not reported. After all, the protein-coding sequences only account for a tiny part of genomes (~1,5% of the human genome). The present thesis resulted in the elaboration of seven articles that are published, submitted or in preparation for submission to indexed international scientific journals.
Descrição
Tese de Doutoramento em Genética Molecular Comparativa e Tecnológica
Palavras-chave
Sequências repetitivas do ácido nucleico , Cromossoma , Evolução , Marcadores moleculares , Roedores
Citação