Predicting oenological attributes using machine learning models

Data
2017-11-27
Título da revista
ISSN da revista
Título do Volume
Editora
Projetos de investigação
Unidades organizacionais
Fascículo
Resumo
The potential of hyperspectral images combined with machine learning algorithms to predict anthocyanin concentration, pH index and sugar content in grapes is presented as a starting point do develop flexible models with large generalization capacity to estimate oenological parameters. In this context, in order to evaluate the generalization capacity of the machine learning procedures, a comparison with current state of the art approaches and between three different methods, Neural Networks (NNs), Decision Trees (DTs) and Support Vector Regression (SVR), when combined with hyperspectral images, was performed to predict the anthocyanin concentration, pH index and sugar content and support the adequate monitoring of wine quality. The models were trained with six whole grape berries for each sample, using different approaches of cross-validation and data pre-processing. The oenological parameters were estimated using models trained with the spectra of 2012, 2013 and 2014 samples from the Touriga Franca variety, and the generalization capacity was tested using 2013 samples of the Tinta Barroca and Touriga Nacional varieties. The results suggest that combining hyperspectral images with appropriate data analysis tools achieve accurate predictions. The machine learning methods were able to predict the values of oenological parameters without significant differences, improving the state of the art results. Good indicators were obtained in the generalization capacity of the models, suggesting that a robust model capable of predicting oenological parameters on different varieties and harvest years of wine grapes can be obtained without additional training. An environmentallyfriendly, fast and low-cost approach is therefore achievable and should be the subject of future testing.
O potencial das imagens hiperespectrais combinado com algoritmos de aprendizagem máquina para prever a concentração de antocianinas, o índice pH e o teor de açúcar em uvas é apresentado, como um ponto de partida para desenvolver modelos de estimação flexíveis e com grande capacidade de generalização para estimar parâmetros enológicos. Neste contexto, para avaliar a capacidade de generalização dos procedimentos de aprendizagem máquina, uma comparação com a literatura atual e entre três diferentes métodos, Neural Networks (NNs), Decision Trees (DTs) e Support Vector Regression (SVR), quando combinados com imagens hiperespectrais, foi feita para prever a concentração de antocianinas, o índice pH e o teor de açúcar e suportar a monitorização adequada da qualidade do vinho. Os modelos foram treinados com seis bagos de uva para cada amostra, utilizando diferentes abordagens de validação cruzada e de pré-processamento dos dados. Os parâmetros enológicos foram estimados utilizando modelos treinados com espectros de amostras de 2012, 2013 e 2014, da variedade de Touriga Franca, e a capacidade de generalização foi testada com recurso a amostras de 2013 das variedades de Tinta Barroca e Touriga Nacional. Os resultados obtidos sugerem que combinar imagens hiperespectrais com ferramentas de análise de dados apropriadas permite atingir predições precisas, sendo os métodos de aprendizagem máquina capazes de prever os valores dos parâmetros enológicos sem diferenças significativas, melhorando os resultados da literatura atual. Foram obtidos bons indicadores sobre a capacidade de generalização dos modelos, sugerindo que um modelo robusto capaz de prever parâmetros enológicos sobre diferentes variedades e anos de colheita das uvas pode ser obtido sem treino adicional. Uma abordagem amiga do ambiente, rápida e de baixos custos é assim passível de atingir e deverá ser objeto de testes futuros.
Descrição
Master’s Thesis in Computer Engineering
Palavras-chave
Hyperspectral Imaging , Neural Networks
Citação