Distribuição de frequências por intervalo e pontos

Distribuição de Frequência

A coleta de dados para pesquisa gera informações que precisam ser adequadamente tratadas, a fim de que seja possível realizar uma análise estatística adequada. Um destes mecanismos é a separação dos dados coletados por intervalos, agrupando dados com as mesmas características dentro de um determinado grupo.

Uma pesquisa estabelece uma hipótese, uma pergunta, que gera uma variável, que consiste em um conjunto de possíveis resultados de um fenômeno estatístico (CRESPO, 2005). A partir desta variável, coletam-se os dados pertinentes à análise pretendida.

Para esta aula, adotaremos um exemplo de aplicação. Suponha que foram coletados dados relacionados ao peso (nossa variável de estudo) de quarenta funcionários de uma empresa, de maneira aleatória. Os dados foram computados sem organização inicial, gerando a chamada tabela primitiva.

Tabela 1 – Peso dos funcionários

Peso dos funcionários
72 60 89 80 87
61 90 74 80 76
63 82 98 65 56
86 82 89 64 59
83 67 72 85 77
74 73 76 68 75
79 68 74 73 96
71 68 78 89 60

Organizando os dados de maneira simples, ou seja, em função de algum critério específico, teremos o rol. Neste caso, os pesos dos funcionários foram organizados em ordem crescente. Acompanhe!

Tabela 2 – Rol de peso dos funcionários

Rol de peso dos funcionários
56 67 73 78 86
59 68 74 79 87
60 68 74 80 89
60 68 74 80 89
61 71 75 82 89
63 72 76 82 90
64 72 76 83 96
65 73 77 85 98

Em um rol, os dados estão organizados para facilitar sua visualização e permitir algumas considerações iniciais. Esta organização pode ser por ordem crescente ou decrescente, por exemplo.

Assim, é possível estabelecer alguns referenciais a respeito dos dados coletados. Por exemplo, podemos observar que o funcionário de menor peso tem 50 kg e o de maior peso, 98 kg. A diferença, em quilos, do funcionário de maior peso para o de menor é 98-50 = 48kg. Percebemos, ainda, que há oito funcionários pesando entre 50 e 59kg, outros oito pesando entre 60 e 69 kg, oito pesando entre 70 e 79kg, oito com 80 a 89 kg e mais oito com 90 a 99 kg.

A nossa variável de pesquisa, no exemplo, é o peso dos funcionários. Neste sentido, podemos estabelecer as frequências associadas aos dados, ou seja, o número de vezes que um dado (ou uma série deles) é observada em função de uma variável. Por exemplo, a frequência de funcioná- rios com o peso de 50 kg tem valor 2, enquanto que o peso de 85 kg tem valor 1. Vejamos, na tabela a seguir, a distribuição de frequências do peso dos funcionários.

Tabela 3 – Distribuição de frequências de peso

Rol de peso dos funcionários
Peso Freq Peso Freq Peso Freq Peso Freq
56 1 67 1 76 2 85 1
59 1 68 3 77 1 86 1
60 2 71 1 78 1 87 1
60 2 71 1 78 1 87 1
61 1 72 2 79 1 89 3
63 1 73 2 80 2 90 1
64 1 74 3 82 2 96 1
65 1 75 1 83 1 98 1

Há distribuições em que as frequências se associam aos valores observados na variável de estudo. A tabela anterior demonstra o conceito de distribuição de frequências por pontos. Neste caso, cada frequência, um número inteiro, está ligada a uma das observações da variável de estudo (por exemplo, há frequência 3 para o peso de 68 kg, e 2 para o peso de 80 kg).

Na figura a seguir, podemos verificar a distribuição de frequência por pontos dos dados da tabela anterior.

Figura 1 – Distribuição de frequências por pontos dos dados

Gráfico 1

Pode-se também agrupar os dados por intervalos, sobretudo em situações nas quais as amostras são grandes. No exemplo, podemos agrupar os funcionários por faixas de peso, como entre 50 e 59 kg, 60 e 69 kg e assim por diante, até o maior valor visualizado em nossa amostra.

Tabela 4 – Frequência por intervalos

Frequência por intervalos
Peso Frequência
50 a 59 2
60 a 69 10
70 a 79 14
80 a 89 11
90 a 99 3

Em algumas situações, torna-se conveniente estabelecer intervalos relacionados às frequências para a melhor visualização do comportamento dos dados relacionados a uma variável. Por exemplo, identificar que há um funcionário com 51 kg e um com 54 kg é importante, mas, para o pesquisador, pode ser mais útil saber que oito funcionários pesam de 50 a 59 kg. Este julgamento é feito pelo pesquisador na análise estatística.

A tabela anterior, portanto, mostra uma distribuição de frequências por intervalos, associada a uma variável contínua: o peso dos funcionários. No intervalo “60 a 69 kg”, há infinitas possibilidades de resultados que podem ser incluídos. Assim, as frequências podem ser divididas em absolutas e relativas. As frequências absolutas dizem respeito aos dados brutos relacionados à variável de estudo, como na tabela anterior, que apresenta o número de observações associadas a cada intervalo de classe: a frequência de funcionários com peso entre “70 a 79 kg” é igual a 14, por exemplo.

Já as frequências relativas consistem na divisão percentual dos dados de cada classe em relação ao total de observações/frequências. Na tabela anterior, podemos verificar as frequências relativas, uma vez que, na primeira classe, há uma frequência no valor 2 em relação ao total de 40. Logo, a frequência relativa da primeira classe é de 2/40 = 5%. A segunda classe, por sua vez, tem frequência relativa de 25%, e a terceira, quarta e quinta classes, respectivamente, têm frequências relativas de 35%, 27,5% e 7,5%, totalizando 100% das observações.

Classe

Quando separamos os dados coletados para uma pesquisa, definimos a variável (como no exemplo dos pesos dos funcionários) por intervalos e verificamos as frequências, assim, encontramos as classes de frequência (ou classes), que são os intervalos de variação da variável analisada. No caso do exemplo estudado, observamos que o intervalo ‘50 a 59 kg’ é uma classe, e assim por diante.

A notação para a classe é a letra i, sendo que i = 1,2,3…k (com k representando a última classe de uma variável) (CRESPO, 2005). No exemplo, temos 5 classes, logo, a última classe é dada por i = 5.

Uma pesquisa salarial da população de uma cidade do interior teve os dados separados, pelo pesquisador, por classes, da seguinte forma: trabalhadores que ganham ‘de um a dois salários mínimos (SM)’; ‘de dois a três SM’, ‘de três a cinco SM’; ‘de cinco a dez SM’; ‘de dez a 50 SM’; e uma classe ‘de 50a 200SM’; Neste caso, temos seis classes, sendo a última classe representada por i = 6.

Limites de classe

Os limites de classe podem ser entendidos como os pontos extremos de cada classe de uma variável (CRESPO, 2005). Assim, são definidos pelos pontos mínimo e máximo, respectivamente, li e Li, para uma classe i. No exemplo que estamos trabalhando no decorrer da aula, que analisa o peso de um grupo de pessoas (tabelas 1 a 4), a terceira classe da distribuição de frequências tem o valor l3 = 70 e L3 = 79.

Obs: Infelizmente não posso representar de forma correta os valores pois não é possível usar tais caracteres em html.

Dependendo da variável, o limite superior pode tender ao infinito. Se a última classe do exemplo mencionado nas tabelas 1 a 4, fosse ‘mais de 90 kg’, o limite superior da classe tenderia ao infinito, pois não haveria um limite superior da classe. Assim, caberiam funcionários que pesassem 100 kg, 130 kg, 180kg, 454 kg, ou até o limite da resistência humana.

Determinando a amplitude de um intervalo de classe

A amplitude de um intervalo de classe pode ser compreendida pela diferença entre os pontos
máximo e mínimo de um intervalo de classe. Assim, hi = Li – li; em que hi representa a amplitude de intervalo da classe i.

Recorrendo ao exemplo da tabela de frequências por intervalos, vemos que a segunda classe tem amplitude igual a 9(69 – 60 = 9). O mesmo ocorre, neste exemplo, para as demais classes, pois como elas foram divididas de maneira igual, todas com a mesma distribuição de faixas de peso (50 a 59kg, 60 a 69 kg…), terão amplitude igual a 9.

Nem sempre as classes de dados possuem a mesma amplitude. É comum que pesquisas tragam classes com amplitudes diferenciadas, de acordo com o comportamento da amostra. Por exemplo, se analisarmos a renda per capita dos brasileiros, algumas classes terão amplitude maior que outras, para que se observe melhor a dinâmica dos dados. Convém, por exemplo, usar classes como ‘de zero a meio salário mínimo (SM)’, ‘de meio a um SM’, ‘de um a dois SM’, ‘de dois a cinco SM’, ‘de cinco a 10 SM’ e assim por diante. Como boa parte da população estará na categoria ‘entre zero e dois SM’, os dados serão melhor visualizados, ainda que as classes não possuam igual amplitude. A PNAD de 2015 mostra que 76,57% da população em condições de trabalhar, a chamada População Economicamente Ativa, recebe de zero a dois salários mínimos, ou não possui rendimentos, incluindo-se nesta base aqueles que recebem algum tipo de auxílio do governo, como o Programa Bolsa Família (IBGE, 2016).

Calculando a amplitude total da frequência de dados

Podemos verificar a amplitude total de uma distribuição de frequência observando o ponto mínimo da primeira classe e o ponto máximo da última classe. Neste caso, a amplitude total (AT) obedece à seguinte equação:

AT = Lmáx k – lmin1

Assim, a amplitude total é obtida quando subtraímos do limite máximo da última classe, k, o limite mínimo da primeira classe. Para o nosso exemplo, temos: AT = 99 – 50 = 49.

Exemplo:

Com base em uma situação hipotética, na qual o pesquisador coletou dados relacionados à renda dos habitantes de uma cidade do interior, e verificou que poderia estabelecer uma distribuição de frequências baseadas em seis classes: ‘de um a dois salários mínimos (SM)’; ‘de dois a três SM’, ‘de três a cinco SM’; ‘de cinco a dez SM’; ‘de dez a 50 SM’; e uma classe, com frequência igual a 1, ‘de 50 a 200SM’,
observaremos que a Amplitude Total da frequência de dados é dada por:

AT = Lmáx 6 – lmin1 = 200 – 1 – 199

Agora, passaremos ao cálculo do ponto médio do intervalo de classe.

Ponto médio do intervalo de classe

É possível definir o ponto médio (xi) de um intervalo de classe no ponto onde a classe é dividida em duas partes iguais, como se segue:

xi = Li + li / 2

Retomando o exemplo da pesquisa sobre o peso dos funcionários de uma empresa, vamos calcular o ponto médio da quarta classe, que contém as frequências dos trabalhadores que possuem entre 80 e 89 kg. Assim, temos que: x4 = (80 + 89) / 2 = 169 / 2 = 84,5.

Compartilhar