Apresentação de dados estatísticos

Assim, cabe ao pesquisador identificar se os dados são variáveis quantitativas, variáveis “numéricas”, ou seja, que expressam grandezas matemáticas (que podem ser contínuas ou discretas) ou variáveis qualitativas, que descrevem classificações, atributos ou qualidades (divididas em ordinal ou nominal) (MARTINEZ, 2015).

Os dados estatísticos podem ser classificados em variáveis quantitativas contínuas ou discretas e em variáveis qualitativas ordinal ou nominal.

Para classificar as variáveis quantitativas em discretas ou contínuas, basta identificar se o valor que pode ser contado (variável quantitativa discreta) ou medido (variável quantitativa contínua). Por exemplo, a quantidade de livros em uma estante é uma variável quantitativa discreta; já a medição dos níveis de colesterol em dado grupo de pessoas será uma variável quantitativa contínua.

Já para diferenciar as variáveis qualitativas em nominal ou ordinal, é necessário identificar se a ordem dos dados faz diferença. Por exemplo, ao classificar um grupo em fumantes ou não fumantes, ou se são do sexo masculino ou feminino, ou, ainda, no caso de peças de uma fábrica, em defeituosas ou não defeituosas chamamos de variável qualitativa nominal; porém, quando classificamos as pessoas de determinada cidade em classe A, B ou C, ou quanto ao salário que ganham podemos chamar de variável qualitativa ordinal.

Depois de identificar a natureza dos dados, cabe ao pesquisador organizar os dados brutos.

Dados brutos

Os dados brutos são aqueles que acabaram de ser coletados, porém, ainda não passaram por nenhum tratamento estatístico, nem foram organizados para serem apresentados de uma maneira mais didática, ou seja, de uma forma que facilite a interpretação do leitor das características mais marcantes dos dados.

Por exemplo, a quantidade de pessoas que moram nas casas de uma determinada rua foram assim coletadas:

Quadro 1 – Dados brutos

4 3 2 4 6 2 1 0 4 5
2 3 6 4 3 6 2 1 0 3
1 2 3 4 0 5 0 2 1 0

Assim, poderíamos representar os dados brutos em forma de rol (dados apresentados seguindo uma ordem do menor para o maior – crescente – ou do maior para o menor – decrescente). O rol facilita que o menor e maior valor e a amplitude do intervalo dos dados (amplitude é a diferença do maior para o menor valor do intervalo de dados) seja visualizado na tabela.

Quadro 2 – Dados na forma de rol

0 0 0 0 0 1 1 1 1 2
2 2 2 2 2 3 3 3 3 3
4 4 4 4 4 5 5 6 6 6

Depois de identificar a natureza e computar os dados brutos, cabe ao pesquisador organizá-los em uma tabela.

Organização em tabelas

Na tabela, os dados podem ser inseridos em ordem crescente ou decrescente, o que for mais conveniente para o pesquisador. Quando se trata de uma série de dados em que sua ordem é definida pelo tempo, como a quantidade de chuva mensal em uma cidade ao longo do ano, a organização deve seguir uma ordem cronológica. Além disso, os dados podem ser trabalhados por porcentagens.

Algumas vezes, é útil conhecer a proporção dos valores situados em um determinado intervalo de uma distribuição de frequências em vez do número absoluto. A frequência relativa para um intervalo é a proporção do número total de observações que nele aparece. Ela é calculada ao dividir-se o número de valores dentro de um intervalo pelo número total de valores na tabela (PAGANO; GAUVREAU, 2012). Assim, em uma tabela, os dados podem ser apresentados com a frequência absoluta e a frequência relativa. No exemplo da pesquisa da quantidade de pessoas que moram em casas de uma determinada rua, os dados seriam apresentados conforme tabela a seguir.

Tabela 1 – Quantidade de moradores nas casas da rua x

Número de
pessoas
Frequências
absolutas
Frequências
relativas
0  5  16,7%
1  4  13,3%
2  6  20%
3  5 16,7%
4  5  16,7%
5  2  6,6%
6  3  10%
Total  30  100%

Dados na forma relativa são as variáveis apresentadas na forma de porcentagem, muito utilizada em tabelas e gráficos.

Além disso, podemos ter uma tabela de dupla entrada, com duas variáveis sendo apresentadas. Com a organização dos dados em uma tabela, podemos ter a dimensão de como representar em um gráfico.
Exemplo:

Na autoavaliação do estado de saúde de pessoas que praticam atividade física (esportistas) e de pessoas que não praticam nenhum esporte (sedentários), temos uma variável qualitativa nominal (esportista, sedentário) e uma variável qualitativa ordinal (bom, regular e ruim). Assim, os dados seriam apresentados conforme tabela a seguir.

Tabela 2 – Autoavalição do estado de saúde

Bom Regular Ruim Total
Condição Número % Número % Número % Número %
Esportista  20  80%  9  90% 0  0%  29  71%
Sedentário  5  20%  1  10%  6  100%  12  29%
Total  25  100%  10  100%  6  100%  41  100%

Gráficos estatísticos

Os gráficos estatísticos são ferramentas poderosas para descrição de dados, uma vez que possuem a capacidade de transmitir várias informações ao leitor, em apenas uma figura. Além disso, quando o gráfico é bem construído, o leitor entenderá as principais características dos dados com rapidez.

Os gráficos mais utilizados são:

  • Linhas e curvas
    São indicados para representar variáveis ao longo do tempo. Para exemplificar, observe a figura a seguir, que apresenta a quantidade da venda de um carro em cada mês do ano.

Linhas e curvas

Com os gráficos de linhas, o pesquisador observa os períodos de crescimento e decrescimento da série de dados ao longo do tempo, fato que pode ser importante para sua pesquisa.

  • Barras, colunas e de setores
    Os gráficos de barras são usados para exibir uma distribuição de frequências para os dados nominais e ordinais. Neles, as várias “categorias”, nas quais as observações são classificadas, estão apresentadas ao longo de um eixo horizontal. Além disso, a barra vertical represente a frequência, ou a frequência relativa, das observações dentro daquela classe. As barras devem ser de igual largura e separadas uma da outra de modo a não implicar continuidade (PAGANO; GAUVREAU, 2012).

Barras, colunas e de setores

Há, ainda, uma variação do gráfico de barras, no qual o eixo é das categorias aparece na vertical,
conforme figura a seguir.

Variação do Gráfico em barras

O gráfico de setores descreve uma variável qualitativa, de preferência nominal. Ele tem a forma de um círculo dividido em setores, sendo que cada área representa uma classe da variável de interesse. A área de cada setor é proporcional à frequência relativa da classe que ele representa (MARTINEZ, 2015).

gráfico pizza

Para um mesmo conjunto de dados, podemos construir gráficos de colunas, barras ou setores. Porém, para uma variável qualitativa ordinal, o mais indicado é o gráfico de barras, pois possibilita observar a ordem das categorias.

Nos gráficos há, ainda, a possibilidade do pesquisador trabalhar com os valores relativos, ou seja, em porcentagem. Para a transformação dos dados reais em valores relativos, basta fazer uma regra de três simples.

Nos valores reais representados nos gráficos da classificação do peso (subpeso, peso normal, sobrepeso e obesidade) de 960 alunos de uma escola, vimos: subpeso (130); peso normal (430); sobrepeso (330); obesidade (70); e total (960). Assim, para encontrar a porcentagem dos dados, como “subpeso (130)” do total (960), basta dividir. Veja:

subpeso = 130/960 = 14%
peso normal = 430/960 = 45%
sobrepeso = 330/960 = 34%
obesidade = 70/960 = 7%

Os gráficos podem, ainda, serem feitos em 3D. Há vários programas, gratuitos e pagos, que constroem os gráficos a partir da inserção de dados. Uma das opções é o Excel, da Microsoft Office (que também funciona como uma planilha de cálculo). Como opções gratuitas, há o Calc da Open Office, que funciona em plataforma Linux e Windows, e o R, modelo mais complexo que os outros, porém mais completo.

Compartilhar