Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Download Data #4

Open
InterestedStudent opened this issue Jan 26, 2023 · 1 comment
Open

Download Data #4

InterestedStudent opened this issue Jan 26, 2023 · 1 comment

Comments

@InterestedStudent
Copy link

Hallo,
vielen Dank für dieses tolle Projekt. Ich bin noch neu im R und habe auch keine Vorkenntnisse im Scraping, aber ich habe die App installiert und sie funktioniert.

--> Seltsamerweise kann ich nur 18 Einträge downloaden, obwohl ich mehr einstelle. Ich denke, nur die erste Seite bei WG Gesucht wird erfasst, aber nicht die Folgeseiten.

--> Ich frage mich, ob man auch die Einträge für alle Städte gebündelt downloaden kann, sodass ich die durchschnittlichen Preise zwischen Städten vergleichen kann. Gibt es da eine elegante Lösung?

Liebe Grüße

@jansim
Copy link
Owner

jansim commented Jan 26, 2023

Hallo InterestedStudent,

Vielen Dank für dein Interesse!

--> Seltsamerweise kann ich nur 18 Einträge downloaden, obwohl ich mehr einstelle. Ich denke, nur die erste Seite bei WG Gesucht wird erfasst, aber nicht die Folgeseiten.

Bzgl den 18 Einträgen weiß ich auch nicht genau woran das liegt, eventuell gibt es auch nur 18 Einträge für die Stadt die du lädst? Normalerweise sollten es bei einer Seite zumindest eine runde Zahl an Einträgen sein glaube ich 🤔

--> Ich frage mich, ob man auch die Einträge für alle Städte gebündelt downloaden kann, sodass ich die durchschnittlichen Preise zwischen Städten vergleichen kann. Gibt es da eine elegante Lösung?

Du könntest denke ich die Funktionen in data.R verwenden um die Daten für mehrere Städte runter zu laden. Hierbei musst da aber auch bedenken, dass man nicht zu viele Daten von wg-gesucht herunterladen sollte weil sich dies (1) nicht unbedingt gehört, da der Platform dabei Server-Kosten etc. entstehen und (2) deine IP-Addresse bei übermaßigem Scraping von wg-gesucht gesperrt werden könnte. Deshalb würde ich dort ein bisschen zur Vorsicht raten 😉

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants