Learn R Programming

⚠️There's a newer version (0.7-17) of this package.Take me there.

tm (version 0.7-1)

Text Mining Package

Description

A framework for text mining applications within R.

Copy Link

Version

Install

install.packages('tm')

Monthly Downloads

40,028

Version

0.7-1

License

GPL-3

Maintainer

Ingo Feinerer

Last Published

March 2nd, 2017

Functions in tm (0.7-1)

Directory Source

Access Document IDs and Terms

DataframeSource

Data Frame Source

Permanent Corpora

PlainTextDocument

Plain Text Documents

Weighting Function

findMostFreqTerms

Find Most Frequent Terms

ZIP File Source

Explore Corpus Term Frequency Characteristics

Parallelized ‘lapply’

Inspect Objects

Visualize a Term-Document Matrix

Read In a MS Word Document

Read In an XML Document

50 Exemplary News Articles from the Reuters-21578 Data Set of Topic acq

Combine Corpora, Documents, Term-Document Matrices, and Term Frequency Vectors

content_transformer

Content Transformers

Read Document-Term Matrices

Read In a PDF Document

Read In a Text Document

stripWhitespace

Strip Whitespace from a Text Document

XMLTextDocument

XML Text Documents

Find Associations in a Term-Document Matrix

Find Frequent Terms

TermDocumentMatrix

Term-Document Matrix

Metadata Management

removePunctuation

Remove Punctuation Marks from a Text Document

Term Frequency Vector

Filter and Index Functions on Corpora

Transformations on Corpora

removeSparseTerms

Remove Sparse Terms from a Term-Document Matrix

Weight by Term Frequency - Inverse Document Frequency

Write a Corpus to Disk

Uniform Resource Identifier Source

Volatile Corpora

getTransformations

Transformations

Read In a Text Document

20 Exemplary News Articles from the Reuters-21578 Data Set of Topic crude

Read In a Reuters Corpus Volume 1 Document

readReut21578XML

Read In a Reuters-21578 XML Document

Remove Numbers from a Text Document

Remove Words from a Text Document

Combine Transformations

Compute Score for Matching Terms

Read In a POS-Tagged Word Text Document

SMART Weightings

Weight by Term Frequency