Hoje vamos falar dos histogramas de uma maneira fácil de entender. Suponha que vamos sair e medir a altura das pessoas. E a cada altura que obtemos, registramos esta altura em uma reta. Cada ponto verde é a altura de alguém. Então medimos a altura de um monte de gente. Mas devido ao grande número de pessoas sendo medidas, os pontos que representam a altura estão sobrepostos.
Podemos empilhar pontos sobrepostos representando a mesma altura, o que é mais intuitivo Mas ter os mesmos pontos de altura exatamente é raro de acontecer, ainda existam muitos pontos de altura que estão ocultos. Portanto, em vez de apenas empilhar pontos com o mesmo valor de altura, dividimos o valor de altura em diferentes compartimentos e empilhamos os pontos de valor de altura nesses segmentos.
Este é um belo histograma, não é? Quanto maior o acúmulo de pontos, mais elevados são os valores neste segmento. Com este histograma de altura, podemos prever a probabilidade de obter um determinado valor de altura nas futuras medidas. Podemos apostar que há uma boa chance de a altura do próximo sujeito a ser medido, cair nos segmentos do centro. A probabilidade do valor da altura cair nas faixas da direita ou da esquerda é relativamente baixa.
Se você deseja aproximar seus dados com um gráfico de distribuição ou prever medições futuras, um histograma é uma boa opção. Podemos aproximar os dados medidos e possíveis valores futuros com uma distribuição normal.
Se o histograma for assim, podemos aproximar os dados coletados e possíveis valores futuros com uma distribuição exponencial.
Entenda que, dividir em seções é muito particular. Depende dos dados e do pesquisador. Da mesma forma que não é útil um segmento muito pequeno, também não é bom um segmento muito grande.
As caixas aqui são tão pequenas que quase todas as medidas têm sua própria caixa. Então não há tendência sem uso.
Aqui, os segmentos são muito grandes e todas as observações são divididas em duas caixas. Só podemos saber quantas medições estão acima ou abaixo da média.
Às vezes temos que tentar valores de tamanho dos segmento diferentes, até obtermos um histograma satisfatório. Em outras palavras, não confie apenas nos segmentos padrão fornecidos pelo programa para desenhar o histograma. O ideal é ajustar as configurações e fazer testes para que o histograma seja mais útil possível.
Crédito: esse conteúdo foi retirado com base no vídeo que você poderá acessar pelo link do YouTube Aqui