AlphabeticTokenizer

NGramTokenizer

WordTokenizer

a character vector with strings to be tokenized.

an object of class <code><a rd-options="" href="/link/Weka_control?package=RWeka&version=0.4-43" data-mini-rdoc="RWeka::Weka_control">Weka_control</a></code>, or a
 character vector of control options, or <code>NULL</code> (default).
 Available options can be obtained on-line using the Weka Option
 Wizard <code><a rd-options="" href="/link/WOW?package=RWeka&version=0.4-43" data-mini-rdoc="RWeka::WOW">WOW</a></code>, or the Weka documentation.

control

character

Weka_tokenizers

An R interface to Weka (Version 3.9.3).
Weka is a collection of machine learning algorithms for data mining
tasks written in Java, containing tools for data pre-processing,
classification, regression, clustering, association rules, and
visualization. Package 'RWeka' contains the interface code, the
Weka jar is in a separate package 'RWekajars'. For more information
on Weka see <http://www.cs.waikato.ac.nz/ml/weka/>.

Kurt Hornik

RWeka

R/Weka Interface

Christian Buchta

Torsten Hothorn

Alexandros Karatzoglou

David Meyer

Achim Zeileis

Weka_tokenizers function

an object of class <code><a rd-options='' href='Weka_control'>Weka_control</a></code>, or a
 character vector of control options, or <code>NULL</code> (default).
 Available options can be obtained on-line using the Weka Option
 Wizard <code><a rd-options='' href='WOW'>WOW</a></code>, or the Weka documentation.

R/Weka Tokenizers — Weka_tokenizers

R/Weka Tokenizers

Weka_tokenizers: R/Weka Tokenizers

Description

Usage

Arguments

Value

Details