Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Erro de scrapping no primeiro dia do mês #64

Open
guites opened this issue May 1, 2024 · 3 comments
Open

Erro de scrapping no primeiro dia do mês #64

guites opened this issue May 1, 2024 · 3 comments
Labels
bug Something isn't working paulo-amorim Relacionado a scrapping do site da Paulo Amorim (CCMQ)

Comments

@guites
Copy link
Collaborator

guites commented May 1, 2024

Ao raspar os filmes, da Cinemateca Paulo Amorim, do primeiro dia de um mês, os filmes não estão sendo detectados na página /grade-semanal.

Esse erro ocorre provavelmente porque o scrapper busca a data 1 de maio, mas o site mostra com o º, ou seja, 1º de maio.

Exemplo:

Captura de Tela 2024-05-01 às 20 46 28

Arquivos html onde o scrapping falha quando o dia é 01/05,

grade-programacao-htmls.zip

@guites guites added bug Something isn't working paulo-amorim Relacionado a scrapping do site da Paulo Amorim (CCMQ) labels May 1, 2024
@KozielGPC
Copy link
Contributor

Fala @guites, posso trabalhar nessa issue?

@KozielGPC
Copy link
Contributor

Aliás, vc chegou a testar de alguma forma localmente com os HTMLs gerados nos arquivos que deixou? Eu tava tentando de algumas formas aqui mas não consegui simular o erro.

  • Testei passando direto o HTML do arquivo q vc deixou
  • Testei rodar um servidor HTTPS local servindo o HTML
  • Testei fazendo o fetch do dia atual do cinema e depois indo manualmente trocar o arquivo do cinema

Na maioria caí num caso de retorno assim:
image

@KozielGPC
Copy link
Contributor

@guites Consegui testar localmente e validar a solução! Fico no aguardo do review do MR!!

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
bug Something isn't working paulo-amorim Relacionado a scrapping do site da Paulo Amorim (CCMQ)
Projects
None yet
Development

No branches or pull requests

2 participants