group

an atomic vector or data frame / list of equal-length atomic vectors.

logical. If <code>TRUE</code>, an additional attribute 'starts' is attached giving a vector of group starts (index of first-occurrence of unique rows).

starts

logical. If <code>TRUE</code>, an additional attribute 'group.sizes' is attached giving the size of each group.

group.sizes

<code>group()</code> scans the rows of a data frame (or atomic vector / list of atomic vectors), assigning to each unique row an integer id - starting with 1 and proceeding in first-appearance order of the rows. The function is written in C and optimized for R's data structures. It is the workhorse behind functions like <code><a rd-options="" href="/link/GRP?package=collapse&version=1.7.6" data-mini-rdoc="collapse::GRP">GRP</a></code> / <code><a rd-options="" href="/link/fgroup_by?package=collapse&version=1.7.6" data-mini-rdoc="collapse::fgroup_by">fgroup_by</a></code>, <code><a rd-options="" href="/link/collap?package=collapse&version=1.7.6" data-mini-rdoc="collapse::collap">collap</a></code>, <code><a rd-options="" href="/link/qF?package=collapse&version=1.7.6" data-mini-rdoc="collapse::qF">qF</a></code>, <code><a rd-options="" href="/link/qG?package=collapse&version=1.7.6" data-mini-rdoc="collapse::qG">qG</a></code>, <code><a rd-options="" href="/link/finteraction?package=collapse&version=1.7.6" data-mini-rdoc="collapse::finteraction">finteraction</a></code> and <code><a rd-options="" href="/link/funique?package=collapse&version=1.7.6" data-mini-rdoc="collapse::funique">funique</a></code>, when called with argument <code>sort = FALSE</code>.

A C/C++ based package for advanced data transformation and
statistical computing in R that is extremely fast, flexible and
parsimonious to code with, class-agnostic and programmer friendly.
It is well integrated with base R, 'dplyr' / (grouped) 'tibble',
'data.table', 'plm' (panel-series and data frames), 'sf' data frames, and
non-destructively handles other matrix or data frame based classes (such as
'ts', 'xts' / 'zoo', 'timeSeries', 'tsibble', 'tibbletime' etc.)
--- Key Features: ---
(1) Advanced statistical programming: A full set of fast statistical functions
supporting grouped and weighted computations on vectors, matrices and
data frames. Fast and programmable grouping, ordering, unique values / rows,
factor generation and interactions. Fast and flexible functions for data
manipulation, data object conversions, and memory efficient R programming.
(2) Advanced aggregation: Fast and easy multi-data-type, multi-function,
weighted, parallelized and fully custom data aggregation.
(3) Advanced transformations: Fast row / column arithmetic, (grouped) replacing
and sweeping out of statistics, (grouped, weighted) scaling / standardizing,
between (averaging) and (quasi-)within (demeaning) transformations,
higher-dimensional centering (i.e. multiple fixed effects or polynomials),
linear prediction, model fitting and testing exclusion restrictions.
(4) Advanced time-computations: Fast (sequences of) lags / leads, and
(lagged / leaded, iterated, quasi-, log-) differences and (compounded)
growth rates on (irregular) time series and panel data.
Multivariate auto-, partial- and cross-correlation functions for panel data.
Panel data to (ts-)array conversions.
(5) List processing: (Recursive) list search, splitting,
extraction / subsetting, data-apply, and generalized recursive
row-binding / unlisting in 2D.
(6) Advanced data exploration: Fast (grouped, weighted, panel-decomposed)
summary statistics for complex multilevel / panel data.

Sebastian Krantz

collapse

Advanced and Fast Data Transformation

Matt Dowle

Arun Srinivasan

Morgan Jacob

Dirk Eddelbuettel

Laurent Berge

Kevin Tappe

R Core Team and contributors worldwide 

Martyn Plummer

1999-2016 The R Core Team 

group function

<code>group()</code> scans the rows of a data frame (or atomic vector / list of atomic vectors), assigning to each unique row an integer id - starting with 1 and proceeding in first-appearance order of the rows. The function is written in C and optimized for R's data structures. It is the workhorse behind functions like <code><a rd-options='' href='GRP'>GRP</a></code> / <code><a rd-options='' href='fgroup_by'>fgroup_by</a></code>, <code><a rd-options='' href='collap'>collap</a></code>, <code><a rd-options='' href='qF'>qF</a></code>, <code><a rd-options='' href='qG'>qG</a></code>, <code><a rd-options='' href='finteraction'>finteraction</a></code> and <code><a rd-options='' href='funique'>funique</a></code>, when called with argument <code>sort = FALSE</code>.

group: Fast Hash-Based Grouping

Description

Usage

Arguments

Value

Details

See Also

Examples