Learn R Programming

⚠️There's a newer version (0.7-18) of this package.Take me there.

tm (version 0.7-2)

Text Mining Package

Description

A framework for text mining applications within R.

Copy Link

Version

Install

install.packages('tm')

Monthly Downloads

39,756

Version

0.7-2

License

GPL-3

Maintainer

Ingo Feinerer

Last Published

November 18th, 2017

Functions in tm (0.7-2)

DataframeSource

Data Frame Source

PlainTextDocument

Plain Text Documents

Directory Source

Access Document IDs and Terms

ZIP File Source

Permanent Corpora

Volatile Corpora

Weighting Function

20 Exemplary News Articles from the Reuters-21578 Data Set of Topic crude

Uniform Resource Identifier Source

50 Exemplary News Articles from the Reuters-21578 Data Set of Topic acq

Find Associations in a Term-Document Matrix

findMostFreqTerms

Find Most Frequent Terms

Combine Corpora, Documents, Term-Document Matrices, and Term Frequency Vectors

Read Document-Term Matrices

content_transformer

Content Transformers

Explore Corpus Term Frequency Characteristics

Read In a Text Document from a Data Frame

Read In a PDF Document

getTransformations

Transformations

readReut21578XML

Read In a Reuters-21578 XML Document

removePunctuation

Remove Punctuation Marks from a Text Document

Read In a POS-Tagged Word Text Document

removeSparseTerms

Remove Sparse Terms from a Term-Document Matrix

stripWhitespace

Strip Whitespace from a Text Document

Term Frequency Vector

Find Frequent Terms

Weight by Term Frequency - Inverse Document Frequency

Visualize a Term-Document Matrix

Write a Corpus to Disk

Read In a MS Word Document

SMART Weightings

Read In an XML Document

Weight by Term Frequency

Remove Numbers from a Text Document

Combine Transformations

Compute Score for Matching Terms

XMLTextDocument

XML Text Documents

Parallelized ‘lapply’

Read In a Text Document

Inspect Objects

Read In a Reuters Corpus Volume 1 Document

TermDocumentMatrix

Term-Document Matrix

Metadata Management

Remove Words from a Text Document

Filter and Index Functions on Corpora

Transformations on Corpora