Analisando propostas

Disponibilização de base de dados

Publicado em 13 de Dezembro de 2022 dias na TI e Programação

Sobre este projeto

Aberto

Objetivo: Otimizar o acessos às bases de dados; Temos bases com grande volume de dados tanto em relação a quantidade como também em variedade de formatos de armazenamento (pdfs, csv, json). Para se ter uma noção a Hemeroteca Política Externa Brasileira (HPEB) tem quase 30 mil notícias; o NewsCloud tem mais de 3 milhões de notícias e é atualizado diariamente; e o IRjournalsBR de mais de 4 mil artigos e é atualizado periodicamente. Precisamos melhorar o acesso a estas informações para viabilizar uma análise de dados mais aprimorada e integrada. Para isso almejamos:
(1) Criar uma API para facilitar o consumo dos dados;
(2) Integração do Júpiter Notebook com bibliotecas de lidam com grande volume de dados
## Sugestões de bibliotecas (Spark, Dask, DuckDB, Python Elasticsearch Client)

Categoria TI e Programação
Subcategoria Data Science
Tamanho do projeto Médio
Isso é um projeto ou uma posição de trabalho? Um projeto
Disponibilidade requerida Conforme necessário

Prazo de Entrega: Não estabelecido

Habilidades necessárias

Outro projetos publicados por R. D. A.