Estatística com R

Estatística com R
Sobre o R


R é uma linguagem de programação especialmente voltada para o tratamento de dados e estatística. É um software livre e de código aberto (free and open source), desenvolvido pelos estatísticos Ross Ilaka e Robert Gentleman a partir de 1993, inicialmente como um subconjunto da linguagem S. Em sua instalação básica R contém um grande número de funções estatísticas (modelagem linear e não linear, testes estatísticos clássicos, análise de séries temporais, classificação, agrupamento e muitos outros) e voltadas para a geração gráficos amplamente customizáveis. Além disso sua funcionalidade pode ser estendida por meio da instalação de pacotes (packages) muitos deles criados e disponibilizados por usuários.

O R é particularmente útil para:

  • Data wrangling: importação, formatação, remodelagem, mescla e filtragem de dado,
  • Análise exploratória de dados, incluindo visualizações e técnicas multivariadas na exploração de dados,
  • Inferência estatística: métodos para teste de hipóteses e cálculo de intervalos de confiança,
  • Modelagem preditiva: modelos de regressão, aprendizado de máquina para previsão,
  • Simulação: técnicas de simulação e avaliação com métodos estatísticos,
  • Programação em R: código rápido e legível.