wq_pca: Analise de Componentes Principais (PCA) de parametros de qualidade da agua
Description
Wrapper simplificado sobre stats::prcomp() para dados de qualidade
da agua. Retorna o objeto PCA, scores por amostra, contribuicao das
variaveis (loadings), variancia explicada e dois graficos prontos
(biplot e screeplot).
Tibble com scores (PC1...PCn) por amostra, mais
as colunas de agrupamento (color_by, label_by).
loadings
Tibble com loadings das variaveis.
variance
Tibble com variancia explicada e acumulada por componente.
Os atributos "biplot", "screeplot" e "loadings_plot"
contem objetos ggplot.
Arguments
df
Data frame com os parametros a incluir na analise.
params
Character vector; nomes das colunas a usar. Se NULL
(default), todas as colunas numericas sao usadas (excluindo lat,
lon, e colunas com sufixo _ok, _status,
_delta).
color_by
Character ou NULL; coluna para colorir as amostras
no biplot (ex.: "ponto", "season").
label_by
Character ou NULL; coluna para rotular as amostras
no biplot (ex.: "ponto").
n_components
Integer; numero de componentes a reter. Default 4.
Details
Apenas colunas numericas sao consideradas. Linhas com qualquer NA
nos parametros selecionados sao removidas (com aviso). O PCA e
sempre realizado sobre dados centrados e escalonados
(scale. = TRUE, center = TRUE).
Os graficos sao retornados como atributos do resultado:
attr(resultado, "biplot") -- dispersao das amostras nos
eixos PC1 x PC2, coloridas por color_by.
attr(resultado, "screeplot") -- variancia explicada
por componente.
attr(resultado, "loadings_plot") -- contribuicao das
variaveis no plano PC1 x PC2.