get_dtm

<code>HashCorpus</code> or <code>VocabCorpus</code> object. See
<a rd-options="" href="/link/create_corpus?package=text2vec&version=0.4.0" data-mini-rdoc="text2vec::create_corpus">create_corpus</a> for details.

corpus

character, one of <code>c("dgCMatrix", "dgTMatrix", "lda_c")</code>.
<code>"lda_c"</code> is Blei's lda-c format (a list of 2 * doc_terms_size); see
<a href="https://www.cs.princeton.edu/~blei/lda-c/readme.txt">https://www.cs.princeton.edu/~blei/lda-c/readme.txt</a>

type

This function extracts a document-term matrix from a
 <code>Corpus</code> object.

Fast and memory-friendly tools for text vectorization,
topic modeling (LDA, LSA), word embeddings (GloVe), similarities.
This package provides a source-agnostic streaming API, which allows researchers
to perform analysis of collections of documents which are larger than available RAM.
All core functions are parallelized to benefit from multicore machines.

Dmitriy Selivanov

text2vec

Modern Text Mining Framework for R

Lincoln Mullen

get_dtm function

<code>HashCorpus</code> or <code>VocabCorpus</code> object. See
<a rd-options='' href='create_corpus'>create_corpus</a> for details.

character, one of <code>c("dgCMatrix", "dgTMatrix", "lda_c")</code>.
<code>"lda_c"</code> is Blei's lda-c format (a list of 2 * doc_terms_size); see
<a href='https://www.cs.princeton.edu/~blei/lda-c/readme.txt'>https://www.cs.princeton.edu/~blei/lda-c/readme.txt</a>

get_dtm: Extract document-term matrix

Description

Usage

Arguments

Examples