Uploaded by Lucas Henrique B. da Silva

PML - Relatório - Database

advertisement
AP2 – Relatório
Lucas Henrique e Gustavo Sinkevicius
O trabalho foi feito a partir de uma base de dados em formato ‘.csv’ extraída do site
(dadosgov.br). A base possuía dados relacionados a uma pesquisa feita nas 5 regiões do Brasil
sobre os preço de 6 tipos diferentes de combustível: Diesel, Diesel S10, Gasolina, Gasolina
Aditivada, Etanol e GNV.
A base estava dividida em diversas variáveis, porém as mais importantes, que foram
necessárias para análise de dados eram: Região, Tipo de Produto, Data de Coleta, Valor de
Venda e Unidade de Medida
Foram feitas algumas separações e adicionado novas variáveis para ser possível fazer
uma análise mais objetiva desses dados, para assim ser possível chegar a conclusões mais claras
relacionadas as variações do preço do combustível em diversas situações
As principais alterações feitas para melhor interpretação dos dados foram:
- Inserida uma nova coluna chamada “Estado – Município” a partir da junção da coluna
“Estado – Sigla” com a coluna “Município”
- Criado as variáveis “MaxCombustivel, MinCombustivel, MeanCombustivel,
CountCombustivel” a partir de um GROUPBY da coluna “Produto” com a coluna ‘Valor de
Venda” e criado gráficos “Subplots” para melhor comparação dessas novas variáveis
- Criado um Gráfico utilizando um GROUPBY do Produto com a média do Valor de Venda
e separando por regiões
- Criado mais um gráfico para analisar a média dos preços do combustível
separadamente por mês (Foram criadas variáveis para separar os tipos de combustíveis para ser
possível fazer um GROUPBY do mês com a média do valor do Combustível
Após a análise dos gráficos foi escolhido analisar os preços do Etanol nos meses 03 e 06
para fazer uma regressão Linear e tentar prever os preços desse combustível no mês de Junho a
partir dos preços no mês de Março
Conclusões
- Foi possível perceber que a Gasolina Aditivada tende a ser sempre o combustível mais
caro e que o GNV tende a ser sempre mais barato
- Analisando separadamente por estado é possível perceber que a região Norte tende a
possuir sempre os preços mais caros de combustível e a região Sudeste possui majoritariamente
os preços mais baratos
- Se analisar os combustíveis separadamente por mês percebe-se que existe um
aumento dos preços em cada mês, porém em março o aumento foi mais significativo do Etanol,
Gasolina Aditivada e da Gasolina
- Com a regressão linear foi possível prever os preços do Etanol no mês 06, porém
comparando com os dados reais percebemos que esse método utilizado não é o melhor para
prever esses tipos de preços e que talvez o melhor método para prever seria uma regressão
separando por áreas de preços
Download