AlphabeticTokenizer

NGramTokenizer

WordTokenizer

a character vector with strings to be tokenized.

an object of class <code><a href="/link/Weka_control?package=RWeka&version=0.4-3" rd-options="" data-mini-rdoc="RWeka::Weka_control">Weka_control</a></code>, or a
    character vector of control options, or <code>NULL</code> (default).
    Available options can be obtained on-line using the Weka Option
    Wizard <code></code>

control

character

Weka_tokenizers

An R interface to Weka (Version 3.7.2). Weka is a
        collection of machine learning algorithms for data mining tasks
        written in Java, containing tools for data pre-processing,
        classification, regression, clustering, association rules, and
        visualization.  Package RWeka contains the interface code, the
        Weka jar is in a separate package RWekajars.  For more
        information on Weka see http://www.cs.waikato.ac.nz/~ml/weka/.

Weka_tokenizers: R/Weka Tokenizers

Description

Usage

Arguments

Value

Details