Learn R Programming

⚠️There's a newer version (0.7-17) of this package.Take me there.

tm (version 0.7-10)

Text Mining Package

Description

A framework for text mining applications within R.

Copy Link

Version

Install

install.packages('tm')

Monthly Downloads

40,028

Version

0.7-10

License

GPL-3

Maintainer

Ingo Feinerer

Last Published

December 14th, 2022

Functions in tm (0.7-10)

Access Document IDs and Terms

DataframeSource

Data Frame Source

Directory Source

Permanent Corpora

PlainTextDocument

Plain Text Documents

ZIP File Source

Explore Corpus Term Frequency Characteristics

50 Exemplary News Articles from the Reuters-21578 Data Set of Topic acq

Combine Corpora, Documents, Term-Document Matrices, and Term Frequency Vectors

Weighting Function

Volatile Corpora

Uniform Resource Identifier Source

20 Exemplary News Articles from the Reuters-21578 Data Set of Topic crude

XMLTextDocument

XML Text Documents

content_transformer

Content Transformers

Find Associations in a Term-Document Matrix

Parallelized ‘lapply’

Find Frequent Terms

getTransformations

Transformations

findMostFreqTerms

Find Most Frequent Terms

Inspect Objects

Read In a POS-Tagged Word Text Document

Read Document-Term Matrices

readReut21578XML

Read In a Reuters-21578 XML Document

Read In a Text Document from a Data Frame

Read In a PDF Document

Visualize a Term-Document Matrix

Read In a MS Word Document

Read In a Reuters Corpus Volume 1 Document

Read In a Text Document

stripWhitespace

Strip Whitespace from a Text Document

Term Frequency Vector

removePunctuation

Remove Punctuation Marks from a Text Document

removeSparseTerms

Remove Sparse Terms from a Term-Document Matrix

Write a Corpus to Disk

Weight by Term Frequency - Inverse Document Frequency

Filter and Index Functions on Corpora

Transformations on Corpora

TermDocumentMatrix

Term-Document Matrix

Metadata Management

Weight by Term Frequency

SMART Weightings

Remove Words from a Text Document

Read In an XML Document

Combine Transformations

Compute Score for Matching Terms

Remove Numbers from a Text Document