Programa
Uma distribuição de frequência, geralmente visualizada com um histograma de frequência, organiza os pontos de dados em intervalos especificados, permitindo que você entenda facilmente a frequência com que cada valor ocorre. Essa técnica é essencial para identificar padrões, tendências e possíveis discrepâncias, fornecendo insights mais profundos sobre os dados.
Este tutorial explorará as distribuições de frequência, sua importância na análise de dados e como criá-las. Com o Microsoft Excel, você verá um guia passo a passo para gerar uma distribuição de frequência para um conjunto de dados do mundo real e interpretar os resultados para obter insights significativos.
A resposta rápida: Como criar uma distribuição de frequência no Excel
Para criar uma distribuição de frequência no Excel, use a função FREQUENCY(). A função calcula a frequência com que os valores ocorrem em intervalos especificados, conhecidos como compartimentos.
Siga estas etapas:
- Comece inserindo seus dados em uma coluna.
- Defina seus compartimentos em outra coluna.
- Em uma nova célula, digite
=FREQUENCY(data_array, bins_array), em quedata_arrayé o intervalo das células de dados ebins_arrayé o intervalo dos compartimentos. - Exemplo:
=FREQUENCY(A2:A16, B2:B6). - Pressione Enter para obter a distribuição de frequência.
Cálculo da distribuição de frequência com a função FREQUENCY() . Imagem do autor
Por que as distribuições de frequência são importantes
Uma distribuição de frequência é uma técnica estatística que organiza os dados em categorias ou intervalos. Geralmente, o resultado é uma tabela que exibe o número de observações para um intervalo fornecido dos dados subjacentes.
As distribuições de frequência são úteis de várias maneiras:
- Resumo dos dados: As distribuições de frequência resumem grandes conjuntos de dados de forma organizada e compreensível. Isso nos permite ter uma visão geral rápida da distribuição de valores.
- Representação visual: A distribuição de frequência pode ser facilmente representada como histogramas e gráficos de pizza, proporcionando uma compreensão visual dos dados.
- Identificação de padrões, tendências e exceções: Eles revelam padrões nos dados, como picos, clusters e outliers. Ele pode ser usado na análise estatística para explorar ainda mais a forma e as características dos dados.
- Comparação de dados: A distribuição de valores permite que você compare diferentes conjuntos de dados e entenda as semelhanças e diferenças.
- Comunicação: As distribuições de frequência podem ser usadas como uma ferramenta simples e eficaz para comunicar as percepções dos dados a um público mais amplo, incluindo os tomadores de decisão.
- Tomada de decisões: Uma compreensão clara da distribuição e de seus padrões ajuda na tomada de decisões. Por exemplo, entender o fornecimento de produtos por estação ajudará você a decidir quando fazer compras.
Agora que você já entendeu as distribuições de frequência e sua importância, vamos nos aprofundar em vários métodos para criá-las no Microsoft Excel.
Métodos para criar uma distribuição de frequência no Excel
Imagine que você trabalha em uma empresa de cosméticos que oferece produtos para uma ampla gama de faixas etárias. Agora, eles estão procurando se especializar em alguns produtos voltados para uma faixa etária específica que tenha mais clientes. Para entender isso, você tem a tarefa de analisar os clientes por faixa etária.
Para resolver isso, eles coletaram dados sobre a idade do cliente no banco de dados de clientes. A tabela a seguir foi fornecida a você:
de dados de idade do clienteConjunto de dados de idade do cliente. Imagem do autor
Como parte da análise da demanda por faixa etária do cliente, você percebeu que calcular a distribuição de frequência será um bom ponto de partida. Aqui estão quatro métodos para calcular a distribuição de frequência usando o Microsoft Excel.
Método 1: Usando o FREQUENCY() função
A função FREQUENCY() calcula a distribuição de frequência dos dados fornecidos e retorna uma lista que mostra a frequência dos valores em determinados intervalos.
Aqui está a sintaxe da função FREQUENCY():
=FREQUENCY(data_array, bins_array)
A função recebe dois parâmetros:
data_array: Uma matriz ou referência a um conjunto de valores para os quais você deseja contar as frequências. Se data_array não contiver valores,FREQUENCY()retornará uma matriz de zeros.bins_array: Uma matriz ou referência a intervalos nos quais você deseja agrupar os valores em data_array. Se bins_array não contiver valores,FREQUENCY()retornará o número de elementos em data_array.
Ambos os parâmetros são necessários para calcular a distribuição de frequência. Você só recebe o endereço data_array, que é a idade do cliente. Portanto, você deve definir o bins_array por conta própria.
Para esse caso de uso, podemos definir os compartimentos como <20, 20-30, 30-40, 40-50, 50-60 e >60. Preencha a coluna B em sua planilha, conforme mostrado abaixo.
A A fórmula para distribuição de frequência usando a função FREQUENCY(). Imagem do autor
Depois de preparar os sites data_array e bins_array, escreva a fórmula para calcular a distribuição de frequência na célula C2.
=FREQUENCY(A2:A16, B2:B6)
O resultado da execução da fórmula acima será parecido com o seguinte:

Distribuição de frequência usando a função FREQUENCY() . Imagem do autor
Observando a distribuição de frequência acima, você verá:
- A empresa tem apenas um cliente com menos de 20 anos de idade.
- Cinco clientes estão na faixa etária de 20 a 30 anos e de 30 a 40 anos.
- Três clientes estão na faixa etária de 40 a 50 anos.
- Um cliente está na faixa etária de 50 a 60 anos.
- Nenhum cliente tem mais de 60 anos.
Com base na distribuição de frequência, você entende que a maioria dos clientes tem entre 20 e 40 anos de idade.
Método 2: Usando tabelas dinâmicas
As tabelas dinâmicas são uma maneira rápida e fácil de resumir e analisar grandes quantidades de dados. As tabelas dinâmicas oferecem recursos como agregação, agrupamento e segmentação, para citar alguns.
Para calcular a distribuição de frequência usando tabelas dinâmicas, clique em Inserir no menu e selecione Tabela dinâmica.
Inserir tabela dinâmica. Imagem do autor
Especifique o intervalo de dados para o qual você deseja criar a tabela dinâmica. No seu caso, o intervalo de dados é A2:A16. Selecione New Worksheet para obter o resultado em uma nova planilha.
Depois de especificar o intervalo de dados, pressione OK.
Especificação dos parâmetros da tabela dinâmica. Imagem do autor
Ao clicar em OK, você verá o painel Campos da tabela dinâmica no lado direito da janela. Para criar uma tabela dinâmica para a idade do cliente, arraste e solte a idade do cliente em Linhas e valores.

Personalize a tabela dinâmica. Imagem do autor
Depois que você arrastar e soltar o campo Customer Age, o painel direito terá a aparência abaixo:

Tabela pivotante personalizada. Imagem do autor
A tabela dinâmica gerada terá a seguinte aparência:

Tabela dinâmica da idade do cliente. Imagem do autor
Se você observar a tabela dinâmica acima, isso é diferente do que você está procurando. O caso de uso é analisar o número de clientes por faixa etária.
Faltam-nos duas coisas:
- A coluna Idade do cliente não está agrupada.
- Estamos interessados no número de clientes em cada grupo, não na soma de suas idades.
Vamos consertar isso.
Clique com o botão direito do mouse em um valor de linha e selecione Group (Agrupar).

Agrupe os valores das linhas na tabela dinâmica. Imagem do autor
Preencha os parâmetros de agrupamento. Em nosso exemplo, escolhemos os compartimentos como 20, 30, 40, 50 e 60. Portanto, começamos em 20 e terminamos em 60 com um incremento de 10.

Agrupamento da tabela dinâmica. Imagem do autor
Após o agrupamento, o resultado terá a seguinte aparência:

Tabela dinâmica agrupada. Imagem do autor
Em seguida, precisamos alterar Sum para Count. Para alterar isso, clique com o botão direito do mouse na célula Soma da idade do cliente e selecione Configurações do campo de valor.
dinâmicaConfigurações do campo de valor na tabela dinâmica. Imagem do autor
Na caixa de diálogo pop-up, em Summarize Values By (Resumir valores por), altere Sum (Soma) para Count (Contar ) e pressione OK.
de valorConfigurações do campo de valor. Imagem do autor
Quando você o atualizar, o resultado será semelhante:

Distribuição de frequência usando uma tabela dinâmica. Imagem do autor
Você estava procurando esse resultado - você tem a distribuição de frequência por idade do cliente.
Método 3: Usando o Data Analysis ToolPak
O Data Analysis Toolpak é um suplemento adicional para o Microsoft Excel que ajuda a calcular métricas comumente usadas em tarefas de análise de dados.
Esse suplemento não é ativado por padrão. Portanto, verifique no canto superior direito o ícone Análise de dados na guia Dados da pasta de trabalho do Excel.
Data Analysis Data Analysis ToolPak no Excel. Imagem do autor
Se você não vir o ícone como mostrado acima, o suplemento não foi ativado. Para ativá-lo, clique em File (Arquivo ) no menu e selecione Options (Opções).
Seleção de opções na guia File. Imagem do autor
Selecione Suplementos quando a caixa de diálogo Opções do Excel for aberta.
Selecione Add-ins na caixa de diálogo Opções do Excel. Imagem do autor
Em seguida, selecione Suplementos do Excel na caixa Gerenciar na parte inferior e clique em Ir.
Gerenciando os do ExcelGerenciando os suplementos do Excel. Imagem do autor
Marque Analysis ToolPak quando a caixa de diálogo Add-Ins for aberta e clique em OK.

Habilitando o Data Analysis ToolPak. Imagem do autor
O ícone Análise de dados estará visível na guia Dados agora, e você não precisará repetir esse processo, pois a ativação do suplemento é uma tarefa única.
Selecione o intervalo de dados, incluindo o cabeçalho da coluna, para calcular a distribuição de frequência. Clique no ícone Análise de dados. Uma caixa de diálogo será exibida. Escolha o histograma e clique em OK.
Invocando o Data Analysis ToolpakInvocando o suplemento Data Analysis Toolpak. Imagem do autor
Você será solicitado a abrir uma caixa de diálogo, conforme mostrado abaixo.
Personalização dos parâmetros do histograma. Imagem do autor
Preencha o intervalo de entrada com o intervalo de dados de idade do cliente e o intervalo de compartimentos com compartimentos.
- Você tem os dados de idade do cliente nas células
A2:A16. - Você tem os dados Bins nas células
B2:B6. - Nas opções de Saída, selecione Nova planilha para obter a saída em uma nova planilha.
- Clique em OK.
Você verá a distribuição de frequência em uma nova planilha, como a que está abaixo.

Distribuição de frequência usando o Data Analysis Toolpak. Imagem do autor
Voila! Você tem a distribuição de frequência por faixa etária criada usando o Data Analysis ToolPak.
Método 4: Usando as funções COUNTIF() e COUNTIFS()
A função COUNTIF() conta o número de vezes que um único critério é atendido. A função COUNTIFS() conta o número de células que atendem a vários critérios.
Para calcular a frequência para cada faixa etária, insira as fórmulas abaixo nas células D2 a D7, respectivamente.
# In cell D2
=COUNTIF(A2:A16, "<=20")
# In cell D3
=COUNTIFS(A2:A16, ">20", A2:A16, "<=30")
# In cell D4
=COUNTIFS(A2:A16, ">30", A2:A16, "<=40")
# In cell D5
=COUNTIFS(A2:A16, ">40", A2:A16, "<=50")
# In cell D6
=COUNTIFS(A2:A16, ">50", A2:A16, "<=60")
# In cell D7
=COUNTIF(A2:A16, ">60")
Aqui está um exemplo de como você pode adicionar a fórmula às células. Depois que você calcular todos eles, o resultado será semelhante:
Calcule a distribuição de frequência usando a Calcule a distribuição de frequência usando a função COUNTIF() . Imagem do autor
Em comparação com outros métodos discutidos, uma limitação do uso do site COUNTIF() é que ele exige intervalos de compartimentos predefinidos na equação.
O método mais comum para criar a tabela de distribuição de frequência é usar a função FREQUENCY().
No entanto, sinta-se à vontade para usar o método que você achar mais confortável. Por exemplo, o uso do Data Analysis Toolpak pode ser mais adequado se você também estiver calculando outras medidas estatísticas, como skewness, ANOVA ou matriz de correlação, como parte da análise.
Considerações finais
Neste tutorial, aprendemos a importância da distribuição de frequência e como calculá-la usando o Microsoft Excel. Ao trabalhar com um exemplo do mundo real, aprendemos a usar a função FREQUENCY() e a interpretar a distribuição resultante para obter insights sobre nossos dados. Exploramos três maneiras alternativas de calcular a distribuição de frequência.
O aprendizado não precisa parar por aqui, e incentivamos você a continuar aprendendo e expandindo suas habilidades em Excel. Considere a possibilidade de cursar o programa Excel Fundamentals para que você possa construir sua base com o Excel. Os cursos Preparação de dados no Excel e Visualização de dados no Excel podem ajudar você a ampliar seu conhecimento sobre esses tópicos. Dê uma olhada na Planilha de Manipulação de Dados no Excel, que pode servir como uma referência rápida.
Feliz aprendizado!!!
Perguntas frequentes
O que são compartimentos em uma distribuição de frequência?
Bins são intervalos que agrupam pontos de dados em uma distribuição de frequência. Cada compartimento representa um intervalo de valores, e a frequência é a contagem de pontos de dados em cada compartimento.
Como faço para criar compartimentos personalizados para minha distribuição de frequência?
A criação de compartimentos personalizados difere de acordo com o método que você usa. As opções incluem o uso da função FREQUENCY(), o uso de tabelas dinâmicas, o uso do Data Analysis Toolpak e o uso da função COUNTIF().
Qual é a diferença entre COUNTIF() e COUNTIFS()?
COUNTIF() conta o número de ocorrências que atendem a uma única condição. COUNTIFS() conta o número de ocorrências que atendem a várias condições.
Como você cria uma distribuição de frequência com tamanhos de compartimento desiguais?
Modificar os valores dos compartimentos. Por exemplo, se você tinha 20, 30, 40, 50 e 60 como compartimentos anteriormente, pode alterá-los para 20, 30, 50 e 60, onde o intervalo de 30-50 torna os tamanhos dos compartimentos desiguais. Depois disso, a função FREQUENCY() é usada como de costume para calcular a distribuição de frequência.
Quais são algumas das limitações do uso de COUNTIF() no cálculo da distribuição de frequência?
COUNTIF() requer intervalos de compartimentos predefinidos. A alteração do intervalo de compartimentos exige uma atualização manual de cada fórmula do site COUNTIF().

