Zum Inhalt springen
View in the app

A better way to browse. Learn more.

Fachinformatiker.de

A full-screen app on your home screen with push notifications, badges and more.

To install this app on iOS and iPadOS
  1. Tap the Share icon in Safari
  2. Scroll the menu and tap Add to Home Screen.
  3. Tap Add in the top-right corner.
To install this app on Android
  1. Tap the 3-dot menu (⋮) in the top-right corner of the browser.
  2. Tap Add to Home screen or Install app.
  3. Confirm by tapping Install.

Empfohlene Antworten

Veröffentlicht

Guten Tag zusammen,

Ziel ist es aus den Suchmaschinen Google, Yahoo und Bing Ad-Anzeigen zu bestimmten Suchwörtern zu crawlen. Leider geben die APIs der genannten Suchmaschinen diese nicht her, oder ich finde es nicht in den API Doks. Kurze Tests mit den APIs haben bei den Results die Ads nicht mitgeliefert.

Hat in dem Bereich jemand Erfahrung oder eine Idee, wie das programmatisch am sinnvollsten zu lösen ist? Ein Webcrawler in Java mit Proxyrotation etc. ist schon vorhanden, weitere ETL Prozesse werden ebenfalls in Java umgesetzt.

Danke schon mal für Ideen und Kommentare!

Dachte eigentlich das Ziel steht da ;)

Ziel ist es aus den Suchmaschinen Google, Yahoo und Bing Ad-Anzeigen zu bestimmten Suchwörtern zu crawlen.
Zweck ist es letztendlich die sichtbare Domain mit der tatsächlichen Redirect-Domain zu vergleichen, ob z. B. fachinformatiker.de dort steht, man aber auf einem ganz anderen Forum landet.

Zweck ist es letztendlich die sichtbare Domain mit der tatsächlichen Redirect-Domain zu vergleichen, ob z. B. fachinformatiker.de dort steht, man aber auf einem ganz anderen Forum landet.

Der Link einer Anzeige steht im HTML Code und auch der Link der redirectet wird, steht auch in dem Dokument.

Also wo ist das Problem?

Leider geben die APIs der genannten Suchmaschinen diese nicht her, oder ich finde es nicht in den API Doks. Kurze Tests mit den APIs haben bei den Results die Ads nicht mitgeliefert.

Das Suchen und Extrahieren funktioniert ja schon, bisher über einen Crawler + Parser. Nur ab einer bestimmten Anzahl an Querys verpasst Google einen Block auf die IP. Und das selbe Problem mit dem Block wird wohl auch bei den anderen Suchmaschinene passieren. Darum die Frage nach der API, ob jemand schon Vergleichbares mit der API gemacht hat.

Noch einmal der Hinweis: Beschreibe Dein Problem so, dass es verständlich ist, denn ich sehe im Moment weder einen Zusammenhang mit Java, noch ist mir klar was Du eigentlich machst / machen willst.

Du willst die Werbung von Google lesen, dafür gibt es entsprechende APIs

Sorry, -no offense- aber hast du meine Beiträge gelesen?

Die eingesetzte Sprache ist Java, sowohl beim Crawler als auch beim Parser. Und wie oben geschrieben: die APIs geben die Ads nicht her! Darum erneut die Frage: hat jemand Erfahrung damit die Ads von bestimmten Suchmaschinen (Google, Yahoo, Bing) programmatisch auszulesen und welche Möglichkeiten gibt es die dabei entstehenden Probleme wie IP Sperre zu umgehen. Falls die APIs das können, dann bitte einen Ref dazu, denn weder in der Doku noch in den Tests war es über die API möglich die Problemstellung zu lösen.

Falls das hier einfach der falsche Bereich ist, dann bitte verschieben bzw. Info an mich.

Erstelle ein Konto oder melde dich an, um einen Kommentar zu schreiben.

Configure browser push notifications

Chrome (Android)
  1. Tap the lock icon next to the address bar.
  2. Tap Permissions → Notifications.
  3. Adjust your preference.
Chrome (Desktop)
  1. Click the padlock icon in the address bar.
  2. Select Site settings.
  3. Find Notifications and adjust your preference.