split_segments

split_segments.character

split_segments.Corpus

split_segments.corpus

character string, quanteda or tm corpus object

segment_size

window around segment size to look for best splitting point

segment_size_window

don't use multithreading even on large corpus

force_single_core

Split a character string or corpus into segments, taking into account punctuation where possible

An R implementation of the Reinert text clustering method. For more
details about the algorithm see the included vignettes or Reinert (1990)
<doi:10.1177/075910639002600103>.

split_segments: Split a character string or corpus into segments

Description

Usage

Arguments

Value

Details

Examples