Learn R Programming

qsacnpj (version 0.2.2)

gerar_bd_cnpj: Fun<U+00E7><U+00E3>o que orquestra as demais fun<U+00E7><U+00F5>es para realizar o tratamento e organiza<U+00E7><U+00E3>o dos dados do CNPJ

Description

Essa fun<U+00E7><U+00E3>o foi desenvolvida utilizando como elementro central uma fun<U+00E7><U+00E3>o complementar chamada 'readr::read_lines_chunked', com o prop<U+00F3>sito de ler o arquivo de 95Gb em partes de 10.000, 100.000 ou 1.000.000 de linhas por vez.

Usage

gerar_bd_cnpj(
  path_arquivos_txt,
  localizar_cnpj = "NAO",
  n_lines = 1e+05,
  armazenar = "csv"
)

Arguments

path_arquivos_txt

Caminho (path) dos arquivos com a base de dados do CNPJ.

localizar_cnpj

Vetor com o n<U+00FA>mero dos CNPJ que se deseja filtrar e obter os dados. O valor padr<U+00E3>o <U+00E9> "NAO", o que for<U+00E7>a ao tratamento de todas as linha da base de dados

n_lines

N<U+00FA>mero de linhas que podem ser iteradas por vez: 10000, 100000 ou 1000000

armazenar

Indica a forma de armazenamento dos dados: 'csv' ou 'sqlite' (OBS1: O delimitador do CSV <U+00E9> o simbolo: "#'), (OBS2: Preferencialmente, defina a pasta de trabalho da sess<U+00E3>o 'Working Directory' na mesma em que est<U+00E3>o localizados os arquivos da base de dados no CNPJ)

Examples

Run this code
# NOT RUN {
qsacnpj::gerar_bd_cnpj(path_arquivos_txt = "D:/qsa_cnpj",
                       localizar_cnpj = "NAO",
                       n_lines = 100000,
                       armazenar = "csv")


# Exemplo com n<U+00C3><U+00BA>mero de CNPJ, entre aspas (""), do Banco do Brasil, Banco do Nordeste,
# Banco da Amaz<U+00C3><U+00B4>nia e Caixa Econ<U+00C3><U+00B4>mica

qsacnpj::gerar_bd_cnpj(path_arquivos_txt = "D:/qsa_cnpj",
                       localizar_cnpj = c("00000000000191", "07237373000120",
                                            "00360305000104", "04902979000144"),
                       n_lines = 100000,
                       armazenar = "sqlite")
# }
# NOT RUN {

# }

Run the code above in your browser using DataLab