Sobre este projeto
it-programming / artificial-intelligence-1
Aberto
Contexto Geral do Projeto
Possuo um grande número de arquivos em PDF contendo questões de provas de concursos e residências médicas. O objetivo deste projeto é extrair e organizar, de forma sistemática e precisa, os seguintes elementos de cada arquivo: 1. Enunciados das questões. 2. Imagens associadas às questões (quando aplicável). 3. Opções de respostas. 4. Gabaritos (respostas corretas). 5. Comentários e análises. Esses elementos devem ser extraídos de arquivos em PDF que possuem layouts complexos (com imagens, caixas de texto e formatação diversificada) e organizados em um formato padronizado, que poderá ser usado posteriormente em uma plataforma de inteligência artificial. Escopo Inicial: Realizar a extração completa de todos os elementos acima mencionados de um conjunto inicial de arquivos PDF. Organizar as questões extraídas em um banco de dados ou documento estruturado (como Excel, json, ou outro formato apropriado para integração com ia). Garantir que o conteúdo extraído seja livre de elementos visuais desnecessários (fundo, logotipos, margens excessivas, etc.), Mantendo apenas o essencial. Habilidades Necessárias: Experiência em manipulação e extração de conteúdo de arquivos PDF. Conhecimento de ferramentas como Adobe Acrobat Pro, Python (bibliotecas como PyMuPDF/Fitz, PDFPlumber), ou outras soluções automatizadas para lidar com PDFs. Capacidade de organização e padronização de dados para uso em plataformas digitais. Preferencialmente, familiaridade com o uso de bancos de dados e integração com sistemas de IA. Entrega Esperada: 1. Documento ou banco de dados padronizado contendo todas as questões extraídas e organizadas. 2. Arquivo em formato limpo e pronto para uso (livre de poluição visual ou elementos desnecessários). 3. Processo documentado (se aplicável) para que o trabalho possa ser replicado em outros arquivos. Obs.: Caso o resultado inicial seja satisfatório, há possibilidade de contratação para volumes maiores de arquivos.
Categoria TI e Programação
Subcategoria Inteligência Artificial
Tamanho do projeto Médio
Isso é um projeto ou uma posição de trabalho? Um projeto
Disponibilidade requerida Conforme necessário
Prazo de Entrega: 20 de Janeiro de 2025
Habilidades necessárias