BrownStats

This data set provides some basic quantiative measures for all texts
 in the Brown corpus of written American English (Francis &amp; Kucera 1964),

datasets

Utility functions for the statistical analysis of corpus frequency data.
This package is a companion to the open-source course "Statistical Inference:
A Gentle Introduction for Computational Linguists and Similar Creatures" ('SIGIL').

Stephanie Evert

corpora

Statistics and Data Sets for Corpus Frequency Data

BrownStats function

A data frame with 500 rows and the following columns:
<dl>
 <dt><code>ty</code>:</dt>
<dd>number of distinct types</dd> <dt><code>to</code>:</dt>
<dd>number of tokens (including punctuation)</dd> <dt><code>se</code>:</dt>
<dd>number of sentences</dd> <dt><code>towl</code>:</dt>
<dd>mean word length in characters, averaged over tokens</dd> <dt><code>tywl</code>:</dt>
<dd>mean word length in characters, averaged over types</dd> 
</dl>

Format

Marco Baroni &lt;<a href="/link/baroni%40sslmit.unibo.it?package=corpora&version=0.7" data-mini-rdoc="corpora::baroni@sslmit.unibo.it">baroni@sslmit.unibo.it</a>&gt;

Author

This data set provides some basic quantiative measures for all texts
 in the Brown corpus of written American English (Francis &amp; Kucera 1964),

Basic statistics of texts in the Brown corpus — BrownStats

A data frame with 500 rows and the following columns:
<dl>
 <dt><code>ty</code>:</dt>
<dd>number of distinct types</dd>

 <dt><code>to</code>:</dt>
<dd>number of tokens (including punctuation)</dd>

 <dt><code>se</code>:</dt>
<dd>number of sentences</dd>

 <dt><code>towl</code>:</dt>
<dd>mean word length in characters, averaged over tokens</dd>

 <dt><code>tywl</code>:</dt>
<dd>mean word length in characters, averaged over types</dd>

 
</dl>

Marco Baroni &lt;<a href='mailto:baroni@sslmit.unibo.it'>baroni@sslmit.unibo.it</a>&gt;

BrownStats: Basic statistics of texts in the Brown corpus

Description

Usage

Arguments

Format

Author

References

See Also