Desafio 1
Big Data: análise e previsão de poluição do ar urbano
Título do desafio e factos gerais
A grande ideia: Sensibilização das populações urbanas
para os poluentes atmosféricos urbanas
Tipo de desafio: Mini (4 semanas)
Responsável pelo desafio: Centro de informação turística local
Facilitador: Evaldas Vaiciukynas
Dados de contacto do facilitador: Evaldas.Vaiciukynas@ktu.lt
O desafio está relacionado com o tema ”Big Data”
Contexto e relevância: em geral relacionado com os ODS / específico de um domínio de aplicação profissional
A Organização Mundial de Saúde tem trabalhado para garantir que os indicadores relevantes para a saúde, da exposição à poluição doméstica e ambiental, e do peso das doenças sejam incluídos no sistema formal de indicadores dos ODS.
Os objectivos dos ODS relevantes para a poluição atmosférica ambiente e doméstica incluem
ODS 3 - uma redução substancial das mortes e doenças causadas pela poluição do ar;
ODS 11 - reduzir o impacto ambiental das cidades através da melhoria da qualidade do ar.
O relatório sobre o ODS 11 contém dados sobre a poluição atmosférica anual nas cidades. No entanto, dados mais granulares (por exemplo, estatísticas diárias) seriam úteis para os cidadãos urbanos para efeitos de monitorização da situação local, bem como para o planeamento de atividades ou viagens.
Variantes do desafio
O projeto World Air Quality Index publica um novo conjunto de dados específico "Worldwide COVID-19 dataset", atualizado 3 vezes por dia e abrangendo cerca de 380 grandes cidades do mundo, desde janeiro de 2022 até agora. Os dados contêm estatísticas diárias sobre as principais espécies de poluentes atmosféricos (so2, pm25, pm10, co, o3), bem como fatores meteorológicos (temperatura, humidade, pressão, velocidade do vento, precipitação).
Variante 1: Encontrar padrões de poluição perigosos. Painel de controlo analítico, resumindo visualmente as tendências históricas da poluição atmosférica numa cidade selecionada. A solução deve ajudar a responder quais os meses do ano e quais os dias da semana com maiores níveis de poluentes
Variante 2: Previsão da poluição com uma semana de antecedência. Painel de controlo analítico que permite obter uma previsão da poluição atmosférica numa cidade selecionada. A solução deve permitir treinar um modelo multivariado de séries temporais (rede neuronal, ARIMAX, Prophet) em dados históricos. Uma vez que os níveis de poluição dependem também de fatores meteorológicos, é importante incorporar previsões destes fatores.
Parceiros industriais ou num domínio de investigação
Centros locais de informação turística, agências de viagens, várias organizações ambientais.
Pré-requisitos dos alunos
Requisitos funcionais
Software: Software de análise de dados
Hardware: N/A
Espaço de trabalho: Laboratórios de investigação
Impacto
O relatório sobre o ODS11 contém dados sobre a poluição atmosférica anual nas cidades. No entanto, dados mais granulares (por exemplo, estatísticas diárias) seriam úteis para os cidadãos urbanos para efeitos de monitorização da situação local, bem como para o planeamento de atividades ou viagens.
Questões em aberto e perguntas
A descarga de dados pode demorar vários minutos, pelo que uma solução deve ter em conta o compromisso entre ter os dados mais recentes e tentar descarregá-los com demasiada frequência. Para resolver este problema, pode considerar-se a utilização de cache, o registo da hora do último descarregamento e o descarregamento assíncrono em segundo plano. Podem surgir problemas semelhantes no que respeita ao tempo de execução lento quando se utilizam métodos de previsão de séries temporais na Variante 2 do desafio.
Outra questão é o âmbito da solução para o desafio - deve ser efetuada apenas para um país/cidade específico ou para todos os países/cidades disponíveis nos dados? A solução deve utilizar apenas o Índice de Qualidade do Ar composto ou também os seus constituintes?