Importação e tratamento de dados de multiplas planilhas Excel no Power BI
Disclaimer: Esse artigo é uma documentação feita por mim enquanto estudante iniciante da ferramenta. Possivelmente informações apresentadas aqui poderão estar distorcidas ou não tão precisas quando comparadas ao ambiente empresarial e profissionais da área.
Planilhas de relatórios do tipo mensal ou anual podem gerar alguns problemas quando são importadas no Power BI. Aqui neste artigo vou exemplificar uma forma de importar e tratar esse padrão de planilha.
Esse tipo de planilha é comumente encontrado em relatórios cíclicos de dados de determinado setor. Para exemplificar a importação vamos trabalhar com 4 arquivos diferentes com essa formatação de tabela:
Vamos importar para o Power BI e tratar utilizando o Power Query. Após iniciar um novo projeto, selecionamos o botão de Obter Dados, na aba Página Inicial, e em seguida selecionamos a opção Pasta:
Após selecionar a pasta em que estão localizado os arquivos, você pode se deparar com um elemento diferente:
Esse arquivo com um ‘~’ na frente é um temporário que o excel cria enquanto está com o arquivo aberto. Mas não se desespere, é uma boa prática garantirmos que ele seja ignorado através de filtros.
Então vamos tratar esses dados no Power Query clicando em Transformar Dados
Com a janela do Power Query podemos facilmente aplicar um filtro para manter apenas as linhas em que a coluna name não comece com ‘~’. Clicamos na setinha de filtro no final da caixa da coluna e selecionamos um filtro de texto excluindo esse símbolo:
Nesta etapa podemos remover outros arquivos não interessantes, passando filtros de forma similar.
Então, somente com os arquivos de interesse, podemos remover todas as outras colunas e combinar os arquivos pelo botão da coluna Content:
Como estamos carregando arquivos do excel, uma janela pede pra selecionarmos qual planilha vamos trabalhar:
Nesse caso vamos utilizar a Planilha1 mesmo.
Se tudo deu certo, nesta etapa estamos com a janela do Power Query parecida com essa:
Vamos utilizar bem os as 3 colunas do editor: A esquerda temos as Consultas, ao centro temos uma visão dos dados que estão sendo manipulados e ao lado direito temos as etapas aplicadas na consulta selecionada.
Essa janela é aberta com os dados das planilhas postos uma abaixo do outra, porém como temos cabeçalhos para cada arquivo, vamos trabalhar utilizando a consulta de Arquivo de Exemplo (campo de consultas — direita). Onde toda a manipulação feita nela é aplicada em todas as outras.
A consulta do Arquivo de Exemplo nos mostra que temos colunas de cabeçalho com dados específicos de cada tabela. Nesse ponto devemos tomar muito cuidado, pois se utilizarmos alguma função que faça referência direta à esses dados, irá quebrar o fluxo na consulta aplicada ao grupo.
Primeiramente vamos remover tudo que não será utilizado. Removemos a ultima linha e a ultima coluna, onde no excel são os dados do somatório:
Na coluna região e estado vamos preencher os dados faltantes com a opção de Preenchimento:
Tratando esses dados a consulta geral acusou um erro. “ A coluna ‘Total Anual’ da tabela não foi encontrada”. Esse erro ocorreu por conta de uma etapa aplicada automaticamente tentando tipar os dados. O erro quer dizer que não está encontrando a coluna referida para executar a etapa.
Nesse caso podemos remover a referência da coluna direto no código ou remover a etapa por completo, vamos trabalhar com a segunda opção pois vamos fazer essa tipagem no final.
Após remover essa etapa, os dados agrupados devem voltar a aparecer. Enquanto tratamos os dados desse tipo de base, devemos ficar atentos se cada etapa aplicada não está quebrando o fluxo da consulta do grupo.
Vamos voltar para o Arquivo de Exemplo.
Continuando o tratamento, iremos definir a primeira linha como cabeçalho, e em seguida transformaremos todas as colunas de meses em linhas, saindo de uma base larga para uma base comprida:
Após aplicar essa etapa, foi adicionado uma tipagem automática, que na nossa tabela cria um conflito com o grupo. Então vamos remover:
Agora transformaremos todas as colunas de meses em linhas, saindo de uma base larga para uma base comprida, que é o ideal para fazer análises:
Estamos quase no final, agora devemos fazer o processo inverso com os elementos da coluna Fato. Fazemos isso selecionando a coluna e transformando em Coluna Dinâmica.
Na janela de opções, passamos os valores que serão dispostos nessas colunas e nesse caso devemos selecionar o tipo de função de valor:
Nossa base está quase pronta:
Após tipar as colunas utilizei a opção de adicionar nova coluna de data selecionando apenas o mes e apenas o ano referente aos valores da coluna de data:
Finalizando, temos uma base tratada pronta para fazer análises e gerar relatórios. Podemos então fechar a janela do Power Query e aplicar alterações.
E como importamos uma pasta, qualquer arquivo novo adicionado a ela, será incluído e tratado automaticamente quando for utilizado a função de atualizar consulta:
Conclusão
Em resumo, o Power BI se destaca como uma ferramenta completa, possibilitando realizar o tratamento e modelagem de dados até análises profundas e significativas. Este artigo, embora tenha explorado apenas uma forma específica para o tratamento de planilhas excel, representa apenas uma forma de lidar com esse tipo de padrão de base de dados dentre muitos outros.