Em vez de usar os tradicionais modelos físico-matemáticos, um novo modelo da Google DeepMind, chamado GraphCast, faz uso de inteligência artificial para fazer a previsão de tempo. Descrito em um artigo publicado na revista Science em 14 de novembro de 2023, ele promete superar a precisão de ferramentas usadas atualmente e usando menos recursos (tanto de dados quanto computacionais).
Tradicionalmente, parte da previsão do tempo é feita usando um método conhecido como previsão numérica do tempo. Nele, são utilizados modelos matemáticos baseados em equações da Física alimentados por dados (como valores de temperatura, umidade, vento, etc) vindos de satélite, estações meteorológicas e outras fontes que descrevam a atmosfera presente. Veja mais informações no post Previsão de tempo.
Apesar de terem uma boa previsão sobre o estado futuro do ar, do vapor d’água, do calor e de outras variáveis, eles são caros e precisam de muito poder de processamento, o que eleva os custos de infraestrutura e energia. Para contornar isso, empresas como Nvidia e Huawei começaram a desenvolver sistemas de inteligência artificial treinados com dados históricos meteorológicos para prever o tempo.
Pesquisadores da DeepMind, uma divisão do Google desde abril de 2023, criaram o GraphCast: um sistema de previsão do tempo baseado em aprendizado de máquina e redes neurais de grafos (GNNs), que são uma arquitetura particularmente útil para o processamento de dados espacialmente estruturados. Os simuladores aprendidos anteriores baseados em GNN têm sido muito eficazes na aprendizagem da dinâmica complexa de fluidos e outros sistemas modelados por equações diferenciais parciais, o que apoia a sua adequação para modelar a dinâmica climática.
O GraphCast faz a previsão em pontos de 0,25 graus de latitude/longitude (28 x 28 km próximo ao equador). Em cada ponto de grade, o modelo prevê cinco variáveis da superfície terrestre e seis variáveis atmosféricas em cada um dos 37 níveis de altitude:
- Variáveis de superfície: Temperatura de 2 m, Componente U do vento de 10 m, Componente V do vento de 10 m, Pressão média ao nível do mar e Precipitação total;
- Variáveis atmosféricas: Temperatura, Componente U do vento, Componente V do vento, Geopotencial, Umidade específica e Velocidade vertical do vento.
O modelo foi treinado com dados de reanálise de 1979 a 2017 do ERA5 do ECMWF (European Centre for Medium-Range Weather Forecasts). Com isso, ele foi capaz de criar correlações entre as variáveis meteorológicas, como se aprendesse as relações de causa e efeito que governam a atmosfera. Seu treinamento levou aproximadamente quatro semanas em 32 dispositivos Cloud TPU v4 usando paralelismo em lote.
Embora o treinamento do GraphCast tenha sido computacionalmente intensivo, o modelo de previsão resultante é altamente eficiente. Para fazer a previsão, o modelo usa apenas duas entradas: como o tempo está agora e como ele estava há seis horas. Assim, ele faz uma previsão para daqui a seis horas. Esse processo pode ser repetido, usando o tempo atual e a previsão para daqui a seis horas para chegar a 12 horas; a de seis e 12 horas para chegar a 18 horas; e assim sucessivamente. Dessa forma, ele pode prever até dez dias levando menos de um minuto em uma única máquina Google TPU v4 – o processamento de um modelo tradicional pode levar horas em um supercomputador com centenas de máquinas. Com 36,7 milhões de parâmetros, o GraphCast é um modelo relativamente pequeno para os padrões modernos de Aprendizado de Máquina.
Segundo o artigo da Science, o GraphCast superou os modelos atuais mais avançados em 90% de 1.380 verificações, além de prever eventos extremos como trajetórias dos ciclones e rios voadores (regiões que transportam vapor d’água para fora dos trópicos) associados ao risco de inundação. Quando limitado a avaliação à troposfera, o modelo superou o modelo HRES (High Resolution Forecast, produzido pelo ECMWF) em 99,7% das variáveis de teste para condições meteorológicas futuras.
Embora o desempenho do GraphCast quando treinado até antes de 2018 ainda seja competitivo com o HRES em 2021, treinando-o até antes 2021 melhora ainda mais suas pontuações de habilidades. Os autores especulam que esse efeito de atualidade permite que tendências climáticas recentes sejam capturadas para melhorar a precisão – ou seja, o modelo pode ser melhorado com um novo treinamento em dados mais recentes.
Em setembro, uma versão ao vivo do GraphCast disponível publicamente, implantado no site do ECMWF, previu com precisão, com cerca de nove dias de antecedência, que o furacão Lee atingiria a Nova Escócia. Por outro lado, as previsões tradicionais apresentavam maior variabilidade em relação a onde e quando ocorreria o desembarque e só se fixavam na Nova Escócia com cerca de seis dias de antecedência.
O código do GraphCast está aberto (veja no Github) e o ECMWF já o utiliza em experiências. O modelo se junta a outros sistemas de previsão meteorológica do Google DeepMind e Google Research, incluindo um modelo regional de Nowcasting que produz previsões com até 90 minutos de antecedência, e MetNet-3, um modelo regional de previsão meteorológica já em operação nos EUA e a Europa que produz previsões de 24 horas.
O modelo de Precipitation Nowcasting (Ravuri et al., 2021) concentra-se em previsões imediatas de chuva, buscando antecipar eventos até 2 horas no futuro, considerando quantidade, intensidade e localização da precipitação. Ele utiliza um método de modelagem generativa para criar previsões detalhadas e plausíveis do radar futuro com base em dados do radar passado, além de gerar diversas possibilidades de cenários de chuva (chamadas de previsões em conjunto), explorando a incerteza na precipitação. Uma avaliação cognitiva foi realizada com mais de 50 meteorologistas especialistas no Met Office, o serviço meteorológico nacional do Reino Unido, os quais classificaram a abordagem como a preferida em 89% dos casos, em comparação com métodos amplamente utilizados.
Sobre o MetNet-3, ele fornece previsões de alta resolução com até 24 horas de antecedência para variáveis como precipitação, temperatura da superfície, velocidade e direção do vento e ponto de orvalho. Sua principal inovação é a “densificação”, que combina o processo de assimilação de dados e simulação em um único passo através de uma rede neural. Isso permite previsões densas de 24 horas com resolução temporal de 2 minutos, aprendendo com apenas 1.000 pontos da rede de estações meteorológicas. Além disso, o modelo produz distribuições probabilísticas para cada variável de saída e localização, indo além das simples médias de previsão. Ele supera modelos baseados em física para previsões de 24 horas e oferece informações hiperlocais, operando em tempo real e sendo integrado aos produtos do Google.
Fontes
- DeepMind – GraphCast: AI model for faster and more accurate global weather forecasting e Nowcasting the next hour of rain
- Remi Lam et al., Learning skillful medium-range global weather forecasting. Science 0, eadi2336 (2023). DOI:10.1126/science.adi2336
- Ravuri, S., Lenc, K., Willson, M. et al. Skilful precipitation nowcasting using deep generative models of radar. Nature 597, 672–677 (2021). https://doi.org/10.1038/s41586-021-03854-z