Variation detection in organelle genomes of Quercus species

Projetos de investigação
Unidades organizacionais
Fascículo
Resumo
The use of next-generation sequencing (NGS) technologies has been revolutionizing the study of genetics. The big amount of generated data by these technologies allows the characterization of species genomes and genomic variation between species and within the same one. The present dissertation focused on the study of single nucleotide polymorphisms (SNPs) in organelle genomes of two well-known species of Quercus: Quercus suber and Quercus ilex rotundifolia, commonly named cork oak and holm oak respectively. Chloroplasts and mitochondria are organelles present in plant cells and play a crucial role in photosynthesis and energy metabolism, respectively, among other important physiological functions. Each of these organelles has its own genome, distinct from the nuclear genome. Within the Quercus genus, the chloroplast genome sequences have been determined for over 20 species, including cork oak which was assembled by the Genosuber consortium, and only the cork oak mitochondrial genome has been determined to date. Moreover, the amount of information on genomic variation is very scarce in chloroplast genomes, or non-existent in mitochondrial genomes. Therefore, there is a clear need to increase our knowledge in this field, given the importance of these species in the ecosystem and their socio-economic impact especially in the south region of the Iberic Peninsula. The pipeline of this study involves the use of high-throughput sequencing data of 47 individuals (39 cork oaks and 8 holm oaks) using NGS techniques and tools to perform quality control, preprocessing, read mapping, variant calling and annotation. Additionally, to achieve the best performance on preprocessing and variant calling the used tools were tested using different parameters on a smaller group of individuals. As it was expected given the higher conservation of chloroplast genomes, the presented results show a higher variation on mitochondrial genomes, especially when comparing cork oak with holm oak trees. These variations suggest a different capacity in both species and some studies have been reporting that holm oak is more resistant than cork oak and these variations may be the reason for that. With this in mind, it is possible to say that holm oak trees have greater ability to withstand climate change and therefore be a good model for selection of important molecular markers.
A utilização de tecnologias de next-generation sequencing (NGS) tem vindo a revolucionar os estudos genéticos. A grande quantidade de dados gerados por estas tecnologias permite a caracterização dos genomas das espécies e a variação genómica entre espécies e dentro da mesma. A presente dissertação focou-se no estudo de polimorfismos de nucleótidos únicos (SNPs) em genomas de organelos de duas espécies bem conhecidas de Quercus: Quercus suber e Quercus ilex rotundifolia, vulgarmente designadas por sobreiro e azinheira, respetivamente. Os cloroplastos e mitocôndrias são organelos presentes nas células vegetais e desempenham um papel crucial na fotossíntese e no metabolismo energético, respetivamente, entre outras importantes funções fisiológicas. Cada um destes organelos tem o seu próprio genoma, distinto do genoma nuclear e pouco se sabe sobre eles em espécies de Quercus. No entanto, as sequências do genoma do cloroplasto foram determinadas em mais de 20 espécies, incluindo o sobreiro cujo assembly foi feito pelo consórcio Genosuber. Por outro lado, apenas o genoma mitocondrial do sobreiro foi determinado até à data. Além disso, a quantidade de informação sobre a variação genómica é muito escassa nos genomas dos cloroplastos, ou inexistente nos genomas mitocondriais. Portanto, existe uma clara necessidade de aumentar os nossos conhecimentos neste campo, dada a importância destas espécies no ecossistema e o seu impacto socioeconómico, especialmente na região sul da Península Ibérica. A estrutura deste estudo envolve a utilização de dados de sequenciação de alto rendimento de 47 indivíduos (39 sobreiros e 8 azinheiras) utilizando técnicas e ferramentas de NGS para realizar o controlo de qualidade, pré-processamento, mapeamento, determinação de variantes e anotação. Para além disso, para alcançar o melhor desempenho no pré-processamento e na determinação de variantes, as ferramentas utilizadas foram testadas utilizando diferentes parâmetros num grupo mais pequeno de indivíduos. Como era de esperar dada a maior conservação dos genomas dos cloroplastos, os resultados apresentados mostram uma maior variação nos genomas mitocondriais, especialmente quando se compara o sobreiro com a azinheira. Estas variações sugerem uma capacidade diferente em ambas as espécies e alguns estudos têm relatado que a azinheira é mais resistente do que o sobreiro e estas variações podem ser a razão para isso. Com isto em mente, é possível dizer que as azinheiras têm maior capacidade de resistir às alterações climáticas e, portanto, ser um bom modelo para a seleção de marcadores moleculares importantes.
Descrição
Master’s degree in Bioinformatics and Applications to the Life Sciences at the University of Trás-os-Montes and Alto Douro
Palavras-chave
Quercus genus , Organelle genomes
Citação