Learn R Programming

qsacnpj (version 0.2.2)

obter_dados_qsa: Fun<U+00E7><U+00E3>o que orquestra as demais fun<U+00E7><U+00F5>es para realizar o tratamento e organiza<U+00E7><U+00E3>o dos dados

Description

Essa fun<U+00E7><U+00E3>o foi desenvolvida utilizando como elementro central uma fun<U+00E7><U+00E3>o complementar chamada 'readr::read_lines_chunked', com o prop<U+00F3>sito de ler o arquivo de 95Gb em partes de 10.000, 100.000 ou 1.000.000 de linhas por vez.

Usage

obter_dados_qsa(path_arquivos_txt, localizar_cnpj, n_lines, armazenar)

Arguments

path_arquivos_txt

Caminho (path) dos arquivos com a base de dados do CNPJ.

localizar_cnpj

Vetor com o n<U+00FA>mero dos CNPJ que se deseja filtrar e obter os dados. O valor padr<U+00E3>o <U+00E9> "NAO", o que for<U+00E7>a ao tratamento de todas as linha da base de dados

n_lines

N<U+00FA>mero de linhas que podem ser iteradas por vez: 10000, 100000 ou 1000000

armazenar

Indica a forma de armazenamento dos dados: 'csv' ou 'sqlite' (OBS1: O delimitador do CSV <U+00E9> o simbolo: "#'), (OBS2: Preferencialmente, defina a pasta de trabalho da sess<U+00E3>o 'Working Directory' na mesma em que est<U+00E3>o localizados os arquivos da base de dados no CNPJ)