calculate_tv_distance_empirical

This function calculates the Total Variation (TV) distance between the empirical cumulative distribution
functions (ECDFs) of two datasets: original data and generated data. The TV distance is defined as half the sum of
the absolute differences between the two CDFs at each point in the domain.

Synthesizing joint distributions from marginal densities, focusing on controlling key statistical properties such as correlation for continuous data, mutual information for categorical data, and inducing Simpson's Paradox. Generate datasets with specified correlation structures for continuous variables, adjust mutual information between categorical variables, and manipulate subgroup correlations to intentionally create Simpson's Paradox.
Joe (1997) <doi:10.1201/b13150>
Sklar (1959) <https://en.wikipedia.org/wiki/Sklar%27s_theorem>.

Naman Agrawal

covalchemy

Constructing Joint Distributions with Control Over Statistical
Properties

calculate_tv_distance_empirical function

<dl><dt>original_data</dt>
<dd>A numeric vector of the original data.</dd>
<dt>generated_data</dt>
<dd>A numeric vector of the generated data.</dd></dl>

Arguments

Calculate Total Variation (TV) Distance Empirically — calculate_tv_distance_empirical

<dl>

<dt>original_data</dt>
<dd>A numeric vector of the original data.</dd>


<dt>generated_data</dt>
<dd>A numeric vector of the generated data.</dd>

</dl>

calculate_tv_distance_empirical: Calculate Total Variation (TV) Distance Empirically

Description

Usage

Value

Arguments

Examples