Evaluando propuestas

Creacion de algoritmo de procesamiento de texto no estructurado

Publicado el 31 Mayo, 2022 en Programación y Tecnología

Sobre este proyecto

Abierto

Necesitamos desarrollar un algoritmo que sirva para procesar texto no estructurado sobre el Diario Oficial, documentos que contienen la información de conformación de empresas, esto la idea es tenerlo en formato de tabla, para poder armar diferentes bases de datos relacionales.
Existen 2 fuentes:
1. Fuentes escritas: https://www.diariooficial.interior.gob.cl/versiones-anteriores/
En este caso se necesitan descargar todos los documentos desde el año 1980 y procesar los textos, no importa si se procesan de forma manual ya que no posee tanta calidad como la versión digital. Lo que importa en este caso es poder armar una base de datos con las versiones anteriores.

2. Versión digital: https://www.diariooficial.interior.gob.cl/edicionelectronica/empresas_cooperativas.php?date=30-05-2022&edition=43265
En este caso la idea es poder generar un algoritmo de procesamiento de texto no estructurado ya sea en Python o R de modo que se pueda ejecutar y vaya extrayendo quienes son los socios de las empresas, fechas de creación , etc

Categoría Programación y Tecnología
Subcategoría Data Science
Tamaño del proyecto Grande
¿Es un proyecto o una posición? Un proyecto
Disponibilidad requerida Según se necesite

Plazo de Entrega: 25 Junio, 2022

Habilidades necesarias

Otros proyectos publicados por N. T.