AP2 – Relatório Lucas Henrique e Gustavo Sinkevicius O trabalho foi feito a partir de uma base de dados em formato ‘.csv’ extraída do site (dadosgov.br). A base possuía dados relacionados a uma pesquisa feita nas 5 regiões do Brasil sobre os preço de 6 tipos diferentes de combustível: Diesel, Diesel S10, Gasolina, Gasolina Aditivada, Etanol e GNV. A base estava dividida em diversas variáveis, porém as mais importantes, que foram necessárias para análise de dados eram: Região, Tipo de Produto, Data de Coleta, Valor de Venda e Unidade de Medida Foram feitas algumas separações e adicionado novas variáveis para ser possível fazer uma análise mais objetiva desses dados, para assim ser possível chegar a conclusões mais claras relacionadas as variações do preço do combustível em diversas situações As principais alterações feitas para melhor interpretação dos dados foram: - Inserida uma nova coluna chamada “Estado – Município” a partir da junção da coluna “Estado – Sigla” com a coluna “Município” - Criado as variáveis “MaxCombustivel, MinCombustivel, MeanCombustivel, CountCombustivel” a partir de um GROUPBY da coluna “Produto” com a coluna ‘Valor de Venda” e criado gráficos “Subplots” para melhor comparação dessas novas variáveis - Criado um Gráfico utilizando um GROUPBY do Produto com a média do Valor de Venda e separando por regiões - Criado mais um gráfico para analisar a média dos preços do combustível separadamente por mês (Foram criadas variáveis para separar os tipos de combustíveis para ser possível fazer um GROUPBY do mês com a média do valor do Combustível Após a análise dos gráficos foi escolhido analisar os preços do Etanol nos meses 03 e 06 para fazer uma regressão Linear e tentar prever os preços desse combustível no mês de Junho a partir dos preços no mês de Março Conclusões - Foi possível perceber que a Gasolina Aditivada tende a ser sempre o combustível mais caro e que o GNV tende a ser sempre mais barato - Analisando separadamente por estado é possível perceber que a região Norte tende a possuir sempre os preços mais caros de combustível e a região Sudeste possui majoritariamente os preços mais baratos - Se analisar os combustíveis separadamente por mês percebe-se que existe um aumento dos preços em cada mês, porém em março o aumento foi mais significativo do Etanol, Gasolina Aditivada e da Gasolina - Com a regressão linear foi possível prever os preços do Etanol no mês 06, porém comparando com os dados reais percebemos que esse método utilizado não é o melhor para prever esses tipos de preços e que talvez o melhor método para prever seria uma regressão separando por áreas de preços