Power BI Column Quality

Como vocês sabem, eu estou fazendo uns testes pela internet afora pra testar meus conhecimentos em Power BI e vou aproveitar pra escrever um pouco sobre algumas perguntas que me chamaram atenção.

Link para os testes: https://www.learndatainsights.com/power-bi-quiz-da-100/power-bi-da100-exam-quiz-prepare-the-data-da-100/

A Pergunta

A pergunta foi a seguinte: “você quer garantir que não existam registros duplicados na sua dimensão. Como você pode fazer isso?”. A resposta está na imagem abaixo.

Minhas considerações

Essa é uma pergunta é meio que uma pegadinha. A segunda resposta, que eu marquei e está errada diz o seguinte “usar o column quality no query editor pra ver o número de duplicates na coluna”.

Como eu sei que column quality faz parte do conjunto de recursos de data quality do Power BI, já fui logo e marquei. Só que acontece que, esse conjunto de data quality, que eles chamam de Data Profiling, tem 3 recursos: column quality, column distributio e column profile.

O que vai realmente ajudar a identificar se a coluna tem, ou não, registros duplicados é a opção de Column Distribution, como na imagem abaixo.

column distribution

Column quality, que foi uma das opções que eu incorretamente marquei, serve na verdade para exibir a qualidade dos dados da coluna, mostrar sem tem valores em branco ou algum erro nas células daquela coluna.

column quality

Referências

https://docs.microsoft.com/en-us/power-query/data-profiling-tools

Publicado por Pedro Carvalho

Apaixonado por análise de dados e Power BI.

Deixe uma resposta

%d blogueiros gostam disto: