sophisthse
Пакет sophisthse предназначен для скачивания временных рядов с sophist.hse.ru. Пакет можно установить командами:
install.packages("devtools")
devtools::install_github("bdemeshev/sophisthse")Для новичков в R: Пакеты устанавливаются один раз, и каждый раз для скачанивания рядов выполнять эти команды совершенно ненужно :)
Пример простого использования:
library("sophisthse")
df <- sophisthse("WAG_Y")Еще несколько примеров использования:
wagez <- sophisthse("WAG_Y", output = "zoo")
wgpd <- sophisthse(c("WAG_Y", "GDPVA_Y"))
wagez <- sophisthse(c("WAG_Y", "GDPVA_Y"), output = "data.frame")Метаданные о рядах сохраняются в атрибуте metadata. Их можно увидеть с помощью команд:
df <- sophisthse("WAG_Y")
info <- attr(df, "metadata")
infoПолный список рядов доступных для скачивания удобно глянуть в Rstudio:
View(series_info)Без Rstudio просто series_info.
Список актуальных доступных таблиц можно получить командой:
sophisthse_tables()Есть очень короткое введение в пакет в виде виньетки.
Не очень срочные планы по развитию:
- ряды пересматриваются. Добавить дату скачивания? Вести архив обновлений?
- команда для получения списка всех рядов --- скорректировать (туда сразу качать описание переменной)
- добавить labels для смысла переменных в data.frame, чтобы красиво отображалось в Rstudio (а-ля haven)
- тип
tsв output для корретного отображения дат при использовании пакетаforecast. - убрать warning при скачивании рядов с пропущенными данными. Всё работает корректно, но для благозвучия лучше убрать. Возникает при вызове rus2num, например,
sophisthse("HHI_Q_I") - у некоторых рядов в названии есть русская М вместо английской M. Переделать такой трэшак в английские буквы :)
- в коде разделить: название таблицы с рядами и название ряда (нужно!) при этом базовая команда sophisthse должна кушать и названия таблиц и названия рядов и возвращать то, что хочет пользователь. Нужна просто функция
series2tables:)
Разработчику:
- При проверке пакет командой
check()появляется заметка (note) о строках помеченных UTF-8. Это ок. Единицы измерения, методология, источник и прочее содержат русские буквы.
English translation:
R package to download data from sophist.hse.ru. The package sophisthse may be installed via:
install.packages("devtools")
devtools::install_github("bdemeshev/sophisthse")Basic usage example:
library("sophisthse")
df <- sophisthse("WAG_Y")Some more examples:
wagez <- sophisthse("WAG_Y", output = "zoo")
wgpd <- sophisthse(c("WAG_Y", "GDPVA_Y"))
wagez <- sophisthse(c("WAG_Y", "GDPVA_Y"), output = "data.frame")Metadata is saved in the attribute metadata and may be accessed via:
df <- sophisthse("WAG_Y")
info <- attr(df, "metadata")
infoBuilt-in information about time series available for download maybe nicely viewed in Rstudio:
View(series_info)Or just series_info without Rstudio.
The list of available tables:
sophisthse_tables()