Learn R Programming

⚠️There's a newer version (1.7-5) of this package.Take me there.

protr (version 0.3-1)

Protein Sequence Descriptor Calculation and Similarity Computation with R

Description

The protr package focus on offering a unique and comprehensive toolkit for protein sequence descriptor calculation and similarity computation. The descriptors included in the protr package are extensively utilized in Bioinformatics and Chemogenomics research. The qualitative descriptors listed in protr include Amino Acid Composition (Amino Acid Composition/Dipeptide Composition/Tripeptide Composition) descriptor, Autocorrelation (Normalized Moreau-Broto Autocorrelation/Moran Autocorrelation/Geary Autocorrelation) descriptor, CTD (Composition/Transition/Distribution) descriptor, Conjoint Traid descriptor, Quasi-sequence Order (Sequence Order Coupling Number/Quasi-sequence Order Descriptors) descriptor and Pseudo Amino Acid Composition (Pseudo Amino Acid Composition/Amphiphilic Pseudo Amino Acid Composition) descriptor. The quantitative descriptors, for Proteochemometric (PCM) Modeling, includes the Generalized Scales-Based Descriptors derived by Principal Components Analysis, Generalized Scales-Based Descriptors derived by AA-Properties (AAindex), Generalized Scales-Based Descriptors derived by 20+ classes of 2D and 3D Molecular Descriptors (Topological, WHIM, VHSE, etc.), Generalized Scales-Based Descriptors derived by Factor Analysis, Generalized Scales-Based Descriptors derived by Multidimensional Scaling, and Generalized BLOSUM/PAM Matrix-Derived Descriptors. The protr package also integrates the functionality of parallellized similarity computation derived by protein sequence alignment and Gene Ontology (GO) semantic similarity measures between a list of protein sequences / GO terms / Entrez Gene IDs. ProtrWeb, the web service built on protr, is located at: http://cbdd.csu.edu.cn:8080/protrweb/ . The protr package is developed by Computational Biology and Drug Design (CBDD) Group, Central South University.

Copy Link

Version

Install

install.packages('protr')

Monthly Downloads

581

Version

0.3-1

License

BSD 3-clause License + file LICENSE

Issues

Pull Requests

Stars

Forks

Repository

https://github.com/road2stat/protr

Maintainer

Nan Xiao

Last Published

August 23rd, 2014

Functions in protr (0.3-1)

PAM120 Matrix for 20 Amino Acids

Geometrical Descriptors for 20 Amino Acids calculated by Dragon

Topological Descriptors for 20 Amino Acids calculated by Dragon

Auto Cross Covariance (ACC) for Generating Scales-Based Descriptors of the Same Length

2D Autocorrelations Descriptors for 20 Amino Acids calculated by Dragon

Eigenvalue-Based Indices Descriptors for 20 Amino Acids calculated by Dragon

PAM250 Matrix for 20 Amino Acids

BLOSUM100 Matrix for 20 Amino Acids

GETAWAY Descriptors for 20 Amino Acids calculated by Dragon

Randic Molecular Profiles Descriptors for 20 Amino Acids calculated by Dragon

Edge Adjacency Indices Descriptors for 20 Amino Acids calculated by Dragon

BLOSUM50 Matrix for 20 Amino Acids

CTD Descriptors - Distribution

Burden Eigenvalues Descriptors for 20 Amino Acids calculated by Dragon

Amino Acid Composition Descriptor

BLOSUM62 Matrix for 20 Amino Acids

3D-MoRSE Descriptors for 20 Amino Acids calculated by Dragon

extractDescScales

Scales-Based Descriptors with 20+ classes of Molecular Descriptors

Sequence-Order-Coupling Numbers

Information Indices Descriptors for 20 Amino Acids calculated by Dragon

extractMDSScales

Generalized Scales-Based Descriptors derived by Multidimensional Scaling

AAindex Data of 544 Physicochemical and Biological Properties for 20 Amino Acids

Protein Sequence Segmentation

Topological Charge Indices Descriptors for 20 Amino Acids calculated by Dragon

Protein Sequence Similarity Calculation based on Gene Ontology (GO) Similarity

extractPropScales

Generalized AA-Properties Based Scales Descriptors

Pseudo Amino Acid Composition Descriptor

Get Protein Sequences from UniProt by Protein ID

2D Descriptors for 20 Amino Acids calculated by MOE 2011.10

Check if the protein sequence's amino acid types are in the 20 default types

CTD Descriptors - Transition

PAM30 Matrix for 20 Amino Acids

BLOSUM45 Matrix for 20 Amino Acids

Functional Group Counts Descriptors for 20 Amino Acids calculated by Dragon

PAM40 Matrix for 20 Amino Acids

3D Descriptors for 20 Amino Acids calculated by MOE 2011.10

Geary Autocorrelation Descriptor

OptAA3d.sdf - 20 Amino Acids Optimized with MOE 2011.10 (Semiempirical AM1)

Connectivity Indices Descriptors for 20 Amino Acids calculated by Dragon

Parallellized Protein Sequence Similarity Calculation based on Sequence Alignment

Amphiphilic Pseudo Amino Acid Composition Descriptor

extractMoreauBroto

Normalized Moreau-Broto Autocorrelation Descriptor

Dipeptide Composition Descriptor

Protein Sequence Alignment for Two Protein Sequences

Walk and Path Counts Descriptors for 20 Amino Acids calculated by Dragon

Read Protein Sequences in PDB Format

RDF Descriptors for 20 Amino Acids calculated by Dragon

Protein Similarity Calculation based on Gene Ontology (GO) Similarity

Atom-Centred Fragments Descriptors for 20 Amino Acids calculated by Dragon

BLOSUM80 Matrix for 20 Amino Acids

Molecular Properties Descriptors for 20 Amino Acids calculated by Dragon

CPSA Descriptors for 20 Amino Acids calculated by Discovery Studio

Protein Sequence Descriptor Calculation and Similarity Computation with R

Read Protein Sequences in FASTA Format

Conjoint Triad Descriptor

All 2D Descriptors for 20 Amino Acids calculated by Dragon

Moran Autocorrelation Descriptor

Tripeptide Composition Descriptor

Quasi-Sequence-Order (QSO) Descriptor

PAM70 Matrix for 20 Amino Acids

Meta Information for the 20 Amino Acids

WHIM Descriptors for 20 Amino Acids calculated by Dragon

Generalized BLOSUM and PAM Matrix-Derived Descriptors

extractFAScales

Generalized Scales-Based Descriptors derived by Factor Analysis

Generalized Scales-Based Descriptors derived by Principal Components Analysis

Constitutional Descriptors for 20 Amino Acids calculated by Dragon

CTD Descriptors - Composition