How satellite dna comes into play in genomes? A rodentia cell-model approach

Data
2020-01-06
Título da revista
ISSN da revista
Título do Volume
Editora
Projetos de investigação
Unidades organizacionais
Fascículo
Resumo
Satellite DNA (satDNA) sequences constitute the major component of constitutive heterochromatin (CH) and have been considered one of the most fascinating and intriguing repetitive DNA elements of eukaryotic genomes. For many years, satDNA was considered “junk” and a transcriptional inert fraction of eukaryotic genomes. Today is generally accepted that satDNAs play important structural and functional roles in genomes, such as genome architecture, chromosomal reorganization during evolution, or genome regulation, mainly driven by satellite transcripts or satellite non-coding RNAs (satncRNAs). Centromeric satncRNAs have been highlighted as crucial players in remodeling/CENP-A deposition and correct kinetochore assembly, essential for proper chromosome segregation. The advent of Next Generation Sequencing (NGS) strategies and the overwhelming advances in genome sequencing technologies have provided a massive amount of sequencing data from hundreds of model and non-model species. Similarly, a growing in bioinformatics tools and strategies have been established towards genome-wide identification and characterization of the repetitive genome elements, namely satDNAs – the Satellitome. In the last decades, rodents belonging to the Peromyscus genus have emerged as model systems across a variety of scientific disciplines, including chromosomal evolution, and the release of the first Peromyscus representative genome sequence (from P. maniculatus) was the gateway to further dissect the repetitive content of this genome. A bioinformatics pipeline was thus defined in this work, based on the Tandem Repeats Finder algorithm and an integrated analysis of sequence similarity allowed the identification of 21 distinct families of large tandem repeats in Peromyscus maniculatus genome (array length larger than 2 kb) being the majority of these satellite- or transposable elements-related families, presenting a tandem organization. Two orthologous satDNA families of the rat and mouse genomes were recognized for the first time in P. maniculatus genome: RNSAT1 and MMSAT4, respectively. The most prevalent satDNA family of the P. maniculatus satellitome corresponded to the previously described Peromyscus satDNA – PMSat –, an AT-rich satDNA displaying a 345 bp monomeric size. Physical mapping of PMSat conducted in four Peromyscus species (P. eremicus, P. maniculatus, P. leucopus and P. californicus) revealed that PMSat is mainly located at the active centromeres and pericentromeric regions of all chromosomes, and at other constitutive heterochromatin rich regions as telomeres and p-arms of some chromosomes. In all the studied species, PMSat showed a high degree of nucleotide conservation, despite the different number of PMSat copies per genome. Our results strongly suggest that the evolution of PMSat was driven by copy number fluctuations and the high similarity among Peromyscus and non-Peromyscus species may reflect non-concerted evolutionary events. Also, in light of the karyotype differences of these species, as well as many of the chromosome polymorphisms found in Peromyscus species, the distinct pattern of CH, and PMSat locations, we hypothesized that PMSat evolutionary molecular events may have promoted Peromyscus karyotype variations and genome evolution. Furthermore, the PMSat copy number fluctuations, promoted by molecular mechanisms such as unequal crossing-over and rolling circle amplification are clearly observed in the heterochromatin additions found in some of the genus species, namely on P. eremicus genome. The transcriptional analysis of PMSat in proliferative cells from all the studied Peromyscus species uncovered a positive correlation between PMSat expression and DNA copy number in each genome. Despite the pronounced variation levels of transcripts, the analysis of specific cell cycle phases revealed a similar transcriptional cellular profile throughout the cell cycle: PMSat satncRNA accumulates mostly at G2/M transition and at the mitosis onset and are restricted to the nucleus. To gain more insights on the putative function(s) of PMsat transcripts, a functional assay based on PMSat RNA knockdown on P. eremicus proliferative cells anticipated its potential role as key players on kinetochore assembly and centromeric function. Moreover, according to the putative transcription factors’ binding sites on PMSat monomer sequence found, RNA polymerase II may be the enzyme conducting the transcription of this satellite family in a variety of cell conditions, namely in response to cellular stresses. The work presented on this thesis uncovered PMSat not only as the trigger of Peromyscus karyotype evolution but also as a crucial element of the centromeric function and chromosome segregation fidelity, that seems to be conducted by their derived satncRNAs.
As sequências de DNA satélite (satDNA) constituem o principal componente da heterocromatina constitutiva (HC) e têm sido consideradas como um dos elementos repetitivos mais fascinantes e intrigantes dos genomas eucariotas. Durante muitos anos, estas sequências de DNA foram consideradas “lixo” e uma fração genómica trancricionalmente inerte. Atualmente, é reconhecida a importante função das sequências de satDNA na arquitetura dos genomas, na reorganização cromossómica durante a evolução, ou na regulação dos genomas, maioritariamente conduzida pelos seus transcritos ou RNAs satélite não codificantes (satncRNAs). Os transcritos centroméricos têm sido destacados como importantes reguladores na remodelação/deposição da CENP-A e no correto “assembly” do cinetocóro, fatores determinantes para a correta segregação cromossómica. O advento de novas estratégias de sequenciação dos genomas (“Next Generation Sequencing - NGS”) e os avanços impressionantes das tecnologias de sequenciação têm fornecido uma enorme quantidade de dados de sequenciação de centenas de espécies. Da mesma forma, um crescente número de ferramentas e estratégias bioinformáticas têm sido desenvolvidas para identificar e caracterizar a fracção repetitiva de todo um genoma, nomeadamente as sequências de satDNAs - o “Satellitome”. Nas últimas décadas, os roedores pertencentes ao género Peromyscus emergiram como animal modelo em várias áreas científicas, incluindo a evolução cromossómica. A disponibilidade do primeiro genoma sequenciado representativo de uma espécie Peromyscus (o P. maniculatus), representou a oportunidade para uma perceção global do conteúdo em sequências repetitivas deste genoma. Neste trabalho, foi definido um “pipeline” bioinformático com base no algoritmo “Tandem Repeats Finder” e uma análise integrada baseada na similaridade entre sequências que permitiu a identificação de 21 famílias repetitivas em “tandem” (tamanho de “array” maior que 2 kb), sendo a maioria correspondente a sequências relacionadas com sequências de satDNA ou elementos transponíveis, que se apresentam em “tandem”. Duas sequências ortólogas de satDNA de ratazana e ratinho foram identificadas pela primeira vez no genoma de P.maniculatus: RNSAT1 e MMSAT4, respetivamente. A família mais predominante encontrada no genoma de P. maniculatus foi uma sequência de satDNA previamente descrita no genoma de P. eremicus – PMSat –, uma sequência rica em AT com um monómero de 345 bp. Esta sequência foi mapeada fisicamente em quatro espécies de Peromyscus (P. eremicus, P. maniculatus, P. leucopus e P. californicus) e revelaram que o PMSat está localizado principalmente nos centrómeros e regiões pericentroméricas de todos os cromossomas, para além de outras regiões ricas em HC, como os telómeros e os braços curtos de alguns cromossomas. Em todas as espécies estudadas, o PMSat apresenta uma elevada conservação da sequência nucleotídica, apesar da grande variação no número de cópias encontrado em cada genoma. Assim, os nossos resultados sugerem que a evolução do PMSat foi impulsionada por flutuações no número de cópias, sendo que a elevada similaridade da sequência entre espécies Peromyscus e não-Peromyscus podem refletir eventos evolutivos que ocorreram de forma não-concertada. Para além disto, e de acordo com as diferenças nos cariótipos, bem como muitos dos polimorfismos cromossómicos encontrados nas espécies de Peromyscus, o padrão distinto de HC e a localização cromossómica do PMSat, hipotetizamos que os eventos moleculares evolutivos do PMSat podem ter promovido as variações de cariótipo em Peromyscus e a evolução destes genomas. Mais ainda, as flutuações no número de cópias de PMSat, promovidas por mecanismos moleculares como “crossing-over” desigual e amplificação por círculo-rolante, são claramente observadas nas adições de HC encontradas em algumas espécies, principalmente no genoma de P. eremicus. A atividade transcricional do PMSat em células proliferativas de espécies Peromyscus revelou uma correlação positiva entre a expressão do PMSat e o número de cópias em cada genoma. Apesar da variação pronunciada no nível de transcritos detetados, a análise transcricional ao longo do ciclo celular revelou um perfil semelhante: o PMSat satncRNA acumula-se preferencialmente na transição G2/M e no início da mitose e está confinado ao núcleo. De forma a obter mais informações sobre a(s) função(ões) putativa(s) dos transcritos de PMSat, foi realizado um ensaio funcional de silenciamento dos transcritos de PMSat em células proliferativas de P. eremicus que revelou uma possível intervenção dos transcritos de PMSat no “assembling” do cinetocóro e na função centromérica. De acordo com os possíveis locais de ligação a fatores de transcrição na sequência de PMSat, a transcrição desta família de satDNA parece ser realizada pela RNA polimerase II em diversas condições celulares, nomeadamente em resposta a stress celular. O trabalho aqui apresentado revelou que o PMSat, não só foi um “motor” na evolução do cariótipo do género Peromyscus, como também é um elemento crucial na função centromérica e fidelidade da segregação cromossômica, tarefa que parece ser desempenhada pelos seus transcritos.
Descrição
PhD Thesis in Technologic, Comparative and Molecular Genetics
Palavras-chave
Peromyscus , satellitome
Citação