Learn R Programming

⚠️There's a newer version (0.7-18) of this package.Take me there.

tm (version 0.7-8)

Text Mining Package

Description

A framework for text mining applications within R.

Copy Link

Version

Install

install.packages('tm')

Monthly Downloads

33,289

Version

0.7-8

License

GPL-3

Maintainer

Ingo Feinerer

Last Published

November 18th, 2020

Functions in tm (0.7-8)

removePunctuation

Remove Punctuation Marks from a Text Document

Directory Source

Access Document IDs and Terms

ZIP File Source

Explore Corpus Term Frequency Characteristics

Parallelized ‘lapply’

Inspect Objects

Permanent Corpora

content_transformer

Content Transformers

50 Exemplary News Articles from the Reuters-21578 Data Set of Topic acq

PlainTextDocument

Plain Text Documents

Weighting Function

SMART Weightings

TermDocumentMatrix

Term-Document Matrix

Metadata Management

Weight by Term Frequency

Read In a Reuters Corpus Volume 1 Document

stripWhitespace

Strip Whitespace from a Text Document

Read In an XML Document

Remove Numbers from a Text Document

DataframeSource

Data Frame Source

Read In a POS-Tagged Word Text Document

20 Exemplary News Articles from the Reuters-21578 Data Set of Topic crude

readReut21578XML

Read In a Reuters-21578 XML Document

Combine Corpora, Documents, Term-Document Matrices, and Term Frequency Vectors

Read In a Text Document

findMostFreqTerms

Find Most Frequent Terms

XMLTextDocument

XML Text Documents

removeSparseTerms

Remove Sparse Terms from a Term-Document Matrix

Weight by Term Frequency - Inverse Document Frequency

Write a Corpus to Disk

getTransformations

Transformations

Term Frequency Vector

Transformations on Corpora

Visualize a Term-Document Matrix

Filter and Index Functions on Corpora

Read In a MS Word Document

Read Document-Term Matrices

Find Associations in a Term-Document Matrix

Combine Transformations

Compute Score for Matching Terms

Find Frequent Terms

Read In a PDF Document

Uniform Resource Identifier Source

Remove Words from a Text Document

Volatile Corpora

Read In a Text Document from a Data Frame