A ideia por trás do bot é extrair notícias dos principais portais de notícias de Arapiraca: Diário Arapiraca, 7 segundos e Já é notícia. O projeto surgiu da necessidade de facilitar o acesso a notícias de Arapiraca a partir de um único lugar em um formato acessível (mensagens).
-
main.py
: arquivo principal do projeto contém todas as funções de funcionamento do bot (funções da API do Telegram e de scraping); -
arapiracanews.py
: arquivo que contém todas as funções de scraping; -
/test
: diretório que contém testes unitários para funções auxiliares ao scraping;
- Extração de notícias do slideshow do 7 segundos por meio do comando
/7segundos
; - Extração de notícias do slideshow do Já é notícia por meio do comando
/jaenoticia
; - Extração das notícias mais lidas do Diário Arapiraca por meio do comando
/diarioarapiraca
.
Esse projeto foi desenvolvido usando a linguagem de programação Python usando as bibliotecas BeautifulSoup para scraping dos dados dos sites de notícias e a pyTelegramBotAPI para execução do bot do Telegram.
O projeto usa testes unitários para garantir a confiabilidade dos dados das notícias por meio das bibliotecas unittest e validators. Além disso, o projeto utiliza um cache TTL (Time to Live) da biblioteca cachetools simples para manter notícias recentes guardadas em memória, evitando assim um consumo excessivo de recursos de rede no servidor onde o bot está executando.
Para detalhes de como contribuir para o projeto, verifique o arquivo CONTRIBUTING.MD.
No momento, o único colaborador desse projeto sou eu (Eduardo Vítor).