get_dtm

HashCorpus or VocabCorpus object.
See <a href="/link/create_vocab_corpus?package=text2vec&version=0.2.0" rd-options="" data-mini-rdoc="text2vec::create_vocab_corpus">create_vocab_corpus</a>, <a href="/link/create_hash_corpus?package=text2vec&version=0.2.0" rd-options="" data-mini-rdoc="text2vec::create_hash_corpus">create_hash_corpus</a> for details.

corpus

character, one of <code>c("dgCMatrix", "dgTMatrix", "lda_c")</code>.
"lda_c" - Blei's lda-c format (list of 2*doc_terms_size),
see <url>https://www.cs.princeton.edu/~blei/lda-c/readme.txt</url>

type

Creates Document-Term matrix from Corpus object.

Very fast and memory-friendly tools for text vectorization and
    learning word embeddings (GloVe). Also package provides source-agnostic
    streaming API, which allows to perform analysis of collections
    of documents, which are much larger the available RAM.

get_dtm: Creates Document-Term matrix

Description

Usage

Arguments

Examples