Learn R Programming

sophisthse

Пакет sophisthse предназначен для скачивания временных рядов с sophist.hse.ru. Пакет можно установить командами:

install.packages("devtools")
devtools::install_github("bdemeshev/sophisthse")

Для новичков в R: Пакеты устанавливаются один раз, и каждый раз для скачанивания рядов выполнять эти команды совершенно ненужно :)

Пример простого использования:

library("sophisthse")
df <- sophisthse("WAG_Y")

Еще несколько примеров использования:

wagez <- sophisthse("WAG_Y", output = "zoo")
wgpd <- sophisthse(c("WAG_Y", "GDPVA_Y"))
wagez <- sophisthse(c("WAG_Y", "GDPVA_Y"), output = "data.frame")

Метаданные о рядах сохраняются в атрибуте metadata. Их можно увидеть с помощью команд:

df <- sophisthse("WAG_Y")
info <- attr(df, "metadata")
info

Полный список рядов доступных для скачивания удобно глянуть в Rstudio:

View(series_info)

Без Rstudio просто series_info.

Список актуальных доступных таблиц можно получить командой:

sophisthse_tables()

Есть очень короткое введение в пакет в виде виньетки.

Не очень срочные планы по развитию:

  • ряды пересматриваются. Добавить дату скачивания? Вести архив обновлений?
  • команда для получения списка всех рядов --- скорректировать (туда сразу качать описание переменной)
  • добавить labels для смысла переменных в data.frame, чтобы красиво отображалось в Rstudio (а-ля haven)
  • тип ts в output для корретного отображения дат при использовании пакета forecast.
  • убрать warning при скачивании рядов с пропущенными данными. Всё работает корректно, но для благозвучия лучше убрать. Возникает при вызове rus2num, например, sophisthse("HHI_Q_I")
  • у некоторых рядов в названии есть русская М вместо английской M. Переделать такой трэшак в английские буквы :)
  • в коде разделить: название таблицы с рядами и название ряда (нужно!) при этом базовая команда sophisthse должна кушать и названия таблиц и названия рядов и возвращать то, что хочет пользователь. Нужна просто функция series2tables :)

Разработчику:

  • При проверке пакет командой check() появляется заметка (note) о строках помеченных UTF-8. Это ок. Единицы измерения, методология, источник и прочее содержат русские буквы.

English translation:

R package to download data from sophist.hse.ru. The package sophisthse may be installed via:

install.packages("devtools")
devtools::install_github("bdemeshev/sophisthse")

Basic usage example:

library("sophisthse")
df <- sophisthse("WAG_Y")

Some more examples:

wagez <- sophisthse("WAG_Y", output = "zoo")
wgpd <- sophisthse(c("WAG_Y", "GDPVA_Y"))
wagez <- sophisthse(c("WAG_Y", "GDPVA_Y"), output = "data.frame")

Metadata is saved in the attribute metadata and may be accessed via:

df <- sophisthse("WAG_Y")
info <- attr(df, "metadata")
info

Built-in information about time series available for download maybe nicely viewed in Rstudio:

View(series_info)

Or just series_info without Rstudio.

The list of available tables:

sophisthse_tables()

Copy Link

Version

Install

install.packages('sophisthse')

Monthly Downloads

1

Version

0.7.0

License

GPL-3

Maintainer

Boris Demeshev

Last Published

July 15th, 2016

Functions in sophisthse (0.7.0)

sophisthse_tables

Construct a vector of all the available tables
hhi_q_i

Quarterly Russian real money income
series_info

Description of time series available at sophist.hse.ru
decyrillic

Replace cyrillic letters by corresponding latin letters
remove_slash_junk

Remove slash junk
series2tables

Get table name from time series name
get_stat_hse_info_vector

Obtain additional information for specific time series
sophisthse_metadata

Get metadata from downloaded time series
set_variable_labels

Set variable labels of a data.frame
rus2num

Convert string with a number in Russian tradition in numeric
sophisthse

Obtain multivariate time series from sophist.hse.ru
sophisthse0

Obtain time series from sophist.hse.ru