Analisando propostas

Extração de dados com python. Preciso extrair o nome de empresas com espaço correto a partir do site da empresa.

Publicado em 17 de Fevereiro de 2023 dias na TI e Programação

Sobre este projeto

Aberto

Olá, preciso obter nomes de empresas de sites com espaço adequado. Por exemplo: O nome real da empresa imperiodasmilhas.com é "imperio das milhas".

Eu consigo essa informação do meta título do site: title Império das Milhas - Tudo sobre milhas bem aqui! title Mas eu preciso remover todas as outras palavras, e no final ter apenas: Imperio das milhas

Eu acho que o método mais rápido para isso provavelmente está usando Regex, para detectar as 3 primeiras letras do domínio e as 3 últimas letras, e usar isso para excluir tudo depois e excluir tudo antes. Abaixo está uma planilha explicando como resolver isso de maneiras diferentes e com dados de amostra:
https://docs.google.com/spreadsheets/d/1ZMDfZTeAmshHMWAX5j9cfzy_vw5QiRjx1EXBzSNhD48/edit#gid=489305207

Também preciso que isso seja feito em python, eu preciso do código-fonte e também preciso que você me entregue um arquivo executável para que eu possa usá-lo para fornecer uma lista de URLs e a saída seja um arquivo txt ou csv com os nomes das empresas.  Inclua o codigo 1020 na sua proposta para provar que você leu minha descrição.

Categoria TI e Programação
Subcategoria Outros
Tamanho do projeto Médio
Isso é um projeto ou uma posição de trabalho? Um projeto
Tenho, atualmente Eu tenho especificações
Disponibilidade requerida Conforme necessário
Funções necessárias Desenvolvedor

Prazo de Entrega: 18 de Fevereiro de 2023

Habilidades necessárias

Outro projetos publicados por R. P.