Estatística com R
Sobre o R
R é uma linguagem de programação especialmente voltada para o tratamento de dados e estatística. É um software livre e de código aberto (free and open source), desenvolvido pelos estatísticos Ross Ilaka e Robert Gentleman a partir de 1993, inicialmente como um subconjunto da linguagem S. Em sua instalação básica R contém um grande número de funções estatísticas (modelagem linear e não linear, testes estatísticos clássicos, análise de séries temporais, classificação, agrupamento e muitos outros) e voltadas para a geração gráficos amplamente customizáveis. Além disso sua funcionalidade pode ser estendida por meio da instalação de pacotes (packages) muitos deles criados e disponibilizados por usuários.
O R é particularmente útil para:
- Data wrangling: importação, formatação, remodelagem, mescla e filtragem de dado,
- Análise exploratória de dados, incluindo visualizações e técnicas multivariadas na exploração de dados,
- Inferência estatística: métodos para teste de hipóteses e cálculo de intervalos de confiança,
- Modelagem preditiva: modelos de regressão, aprendizado de máquina para previsão,
- Simulação: técnicas de simulação e avaliação com métodos estatísticos,
- Programação em R: código rápido e legível.
Software R
Artigos
- Introdução ao R
- Tipos de dados, variáveis e vetores
- Matrizes e Arrays
- Listas e Fatores
- Data Frames
- Operadores e Funções Internas
- Controle de Fluxo e Funções do Usuário
- Programação com R
- Aquisição de Dados
- Gráficos
- Aprofundando as técnicas sobre gráficos