Tweets mit der Twitter API abrufen | Schritt-für-Schritt-Anleitung
Hinweis: Twitter wurde in X umbenannt (ab 2023). Die API der Plattform heißt jetzt offiziell X API (früher Twitter API). Dieser Leitfaden behandelt die aktuelle X API v2, die die aktive und unterstützte Version ist. Endpunkt-URLs verwenden nun api.x.com anstelle der veralteten Domain api.twitter.com. Die ältere Twitter API v1.1 wurde eingestellt und steht für neue Projekte nicht mehr zur Verfügung.
Einrichtung der Twitter API zum Abrufen von Tweets: Ein Einsteigerleitfaden
Willkommen, Social-Media-Enthusiasten und angehende Entwickler! Haben Sie sich jemals gefragt, wie Sie die Fülle der Tweets im Twitterverse anzapfen können? Heute tauchen wir in die Welt der Twitter API v2 ein - Ihre Eintrittskarte zu diesen 280-Zeichen-Schätzen.
Bevor Sie sich mit der Twitter API v2 und dem Abrufen von Tweets beschäftigen, kann es hilfreich sein zu verstehen, wie APIs im Alltag eingesetzt werden. Lesen Sie Praktische Anwendungen und Beispiele von APIs im Alltag, um eine praktische Perspektive zu erhalten.
Die Zugangsebenen der Twitter API v2
Bevor Sie die Ärmel hochkrempeln und mit dem Programmieren beginnen, sprechen wir über die verschiedenen Zugangsebenen der Twitter API v2. Stellen Sie sich diese wie Ticket-Typen bei einem Konzert vor - jede bietet ein anderes Erlebnis!
Hier ist die Übersicht:
Essential Access (Grundzugang): Das Starterpaket! Diese Ebene wird automatisch gewährt, wenn Sie Ihr Entwicklerkonto erstellen. Sie ist ideal zum Experimentieren, Lernen und für kleinere Projekte. Sie erhalten Zugriff auf Standard-Endpunkte und können eine angemessene Menge an Tweets pro Monat abrufen - mehr als genug, um erste Erfahrungen zu sammeln.
Elevated Access (Erweiterter Zugang): Bereit für die nächste Stufe? Der erweiterte Zugang hebt die Beschränkungen auf, sodass Sie noch mehr Daten abrufen können - ideal für Produktions-Apps oder ernstere Projekte. Sie müssen einen kurzen Antrag im Entwicklerportal ausfüllen, der aber für alle offen ist.
Academic Research Access (Akademischer Forschungszugang): Wenn Sie Forscher an einer akademischen Institution sind, ist das Ihr goldenes Ticket. Der akademische Forschungszugang entsperrt nicht nur höhere Datenlimits, sondern ermöglicht auch etwas besonders Nützliches: Sie können bis zum allerersten Tweet von Twitter aus dem Jahr 2006 zurückgehen! Natürlich müssen Sie einen detaillierteren Antrag für diese Ebene ausfüllen, aber wenn Sie öffentliche Gespräche oder Trends über die Zeit analysieren, ist es ein Gamechanger.
Elevated+ (Demnächst verfügbar!): Twitter hat eine neue, noch leistungsstärkere Stufe angedeutet - Elevated+. Diese richtet sich an Schwergewichte mit dem Versprechen, auf bis zu 10 Millionen Tweets pro Monat zugreifen zu können. Frühbucher können sich auf die Warteliste setzen lassen, wenn sie mehr Kapazität für ihre Datenprojekte benötigen.
Kurze Zusammenfassung:
Essential = Einstieg
Elevated = Skalierung
Academic = Tiefgehende Forschung
Elevated+ = Der Traum für Power-User (demnächst verfügbar!)
Bevor wir mit der Einrichtung beginnen, schauen wir uns an, wie man von null zum API-Experten wird...
Warum Twitter-Daten wichtig sind
Twitter ist nicht nur ein Ort für Memes, Nachrichten und heiße Debatten - es ist ein riesiger, von der Gemeinschaft gespeister Datenstrom, der alles widerspiegelt, von alltäglichen Geschehnissen bis hin zur öffentlichen Meinung. Forscher und Entwickler haben Twitter-Daten genutzt, um Gesundheitsüberwachungssysteme zur Erkennung von Krankheitsausbrüchen zu entwickeln, Verkehrsunfälle in Echtzeit zu erkennen und sogar die Lebensmittelversorgung in Städten zu überwachen. Die Möglichkeiten sind enorm!
Natürlich ist es wichtig zu bedenken: Twitter-Nutzer bilden eine einzigartige Teilgruppe der Bevölkerung (ein wenig wie ein lauter Tisch am hinteren Ende des Cafés), und nur 10% der Nutzer sind für etwa 80% der Tweets verantwortlich. Die Daten sind zwar reichhaltig, kommen aber mit ihren eigenen Besonderheiten und Verzerrungen.
Loslegen: Twitter API v2 auf einen Blick
Twitters neueste API-Version ist wie ein glänzendes neues Spielzeug für Entwickler. Sie ist vollgepackt mit coolen Funktionen, die Ihre Tweet-Abruf-Träume wahr werden lassen. Hier ist, was uns begeistert:
Schlankere Antworten: Verabschieden Sie sich von unhandlichen Daten. Die neue API liefert Informationen in einem viel leichter verdaulichen Format.
Umfragen-Power: Lieben Sie Twitter-Umfragen? Jetzt können Sie diese Daten ebenfalls abrufen!
Intelligente Annotationen: Erhalten Sie tiefere Einblicke in den eigentlichen Inhalt eines Tweets mit kontextuellen Informationen und Entitätserkennung. Für Natural Language Processing (NLP) ist das ein Gamechanger - die Twitter API v2 ermöglicht es Ihnen, sowohl Entitäts-Annotationen (z.B. benannte Personen, Orte, Organisationen) als auch Kontext-Annotationen anzufordern (worum geht es im Tweet eigentlich?). Ob Sie einen Chatbot trainieren oder Tweet-Analysen durchführen - Sie können tiefer gehen als je zuvor.
Konversations-Threads: Verpassen Sie nicht mehr das große Bild. Rufen Sie ganze Konversations-Threads mühelos ab.
Warum sollte Sie das interessieren?
Ob Sie ein Social-Media-Dashboard aufbauen, Forschung betreiben oder einfach Ihre Neugier befriedigen - die Twitter API v2 eröffnet eine Welt voller Möglichkeiten. Es ist wie ein Backstage-Pass zur Twitterverse!
Bereit einzusteigen? In den nächsten Abschnitten führen wir Sie durch die Einrichtung Ihres Entwicklerkontos, den Erhalt der wichtigen API-Keys und Ihren allerersten API-Aufruf.
Zugang zur Twitter API: Die Einrichtung
Lassen Sie uns die Ärmel hochkrempeln und Sie für den Twitter API-Zugang einrichten.
Schritt 1: Twitter-Entwickler werden
Zunächst müssen Sie dem Kreis der Entwickler beitreten - also ein Twitter-Entwicklerkonto erstellen. So geht es:
Besuchen Sie die Website der Twitter Developer Platform.
Klicken Sie auf die Schaltfläche "Sign Up" und folgen Sie den Anweisungen.
Füllen Sie den Antrag mit Ihren Ideen zur Nutzung der API aus.
Warten Sie auf die Genehmigung. (Twitter ist dabei meist recht schnell!)
Schritt 2: Ihr Twitter-Projekt erstellen
Sobald Sie drin sind, geht es ans Projekt:
Melden Sie sich im Twitter Developer Portal an.
Suchen Sie die Schaltfläche "Create Project" und klicken Sie darauf.
Geben Sie Ihrem Projekt einen aussagekräftigen Namen.
Wählen Sie den Anwendungsfall, der Ihren Plänen am besten entspricht.
Schreiben Sie eine kurze Beschreibung Ihrer Absichten.
Schritt 3: Eine App verbinden
Nun zum interessanten Teil - die Einrichtung Ihrer App:
In Ihrem neuen Projekt sehen Sie eine Option zum "Add App" oder "Create App".
Wenn Sie neu anfangen, klicken Sie auf "Create App" und geben Sie ihr einen Namen.
Haben Sie bereits eine App? Verbinden Sie sie einfach mit Ihrem neuen Projekt.
Schritt 4: Ihre Schlüssel zum Twitter-Königreich sichern
Hier erhalten Sie Ihren VIP-Zugang:
Sobald Ihre App erstellt ist, sehen Sie einen Bildschirm mit Ihrem API Key, API Secret Key und Bearer Token.
Diese sind Ihre goldenen Tickets - bewahren Sie sie sicher auf! Kopieren und speichern Sie sie sicher auf Ihrem lokalen Rechner.
Profi-Tipp: Teilen Sie diese Keys niemals öffentlich. Sie sind wie die Passwörter zu Ihrem Twitter API-Königreich!
Und fertig! Sie haben nun offiziell den Twitter-Entwicklerzugang eingerichtet.
Ihre ersten Tweets abrufen: Die API zum Singen bringen!
Jetzt, da Sie Ihre API-Keys haben, ist es Zeit für den Moment der Wahrheit - Ihren ersten API-Request. Wir haben Optionen für alle, von Kommandozeilen-Kriegern bis zu Python-Enthusiasten.
Kurzer Halt: Rate Limits verstehen
Bevor Sie eine Flut von API-Requests loslassen, gibt es einen wichtigen Aspekt zu beachten: Twitter setzt Rate Limits fest, um sicherzustellen, dass alle fair spielen und die Server stabil bleiben.
Wenn Sie sich auf der Essential-Zugangsebene befinden, können Sie bis zu 180 Requests alle 15 Minuten für diesen bestimmten Endpunkt machen. Das entspricht etwa einem Request alle fünf Sekunden. Fügen Sie daher eine kurze Pause zwischen den Requests ein - andernfalls riskieren Sie Fehler oder werden vorübergehend blockiert. Denken Sie daran wie an eine obligatorische Kaffeepause zwischen jedem Datenabruf - entspannen Sie sich fünf Sekunden, dann machen Sie Ihren nächsten Schritt!
Option 1: Die Kommandozeilen-Methode (cURL)
Für diejenigen, die das Terminal lieben, ist cURL Ihr bester Freund:
Öffnen Sie Ihr Terminal.
Kopieren Sie diesen Befehl (drücken Sie noch nicht die Eingabetaste!):
curl --request GET 'https://api.x.com/2/tweets/search/recent?query=from:twitterdev' --header 'Authorization: Bearer $BEARER_TOKEN'Ersetzen Sie $BEARER_TOKEN durch Ihren tatsächlichen Bearer Token.
Drücken Sie die Eingabetaste und sehen Sie zu, wie die Magie geschieht! Sie erhalten eine JSON-Antwort mit aktuellen Tweets von @TwitterDev.
Aber was sehen Sie eigentlich?
Sobald Sie den Befehl ausführen, erhalten Sie ein JSON-Objekt zurück. Es enthält zwei Schlüssel: einen für die Liste der Tweets und einen für Metadaten mit Informationen darüber, wie viele Tweets Sie erhalten haben, die IDs des neuesten und ältesten Tweets sowie ein Paginierungs-Token für weitere Abrufe.
Herzlichen Glückwunsch! Mit einem einfachen cURL-Request haben Sie Ihren ersten Tweet-Stapel abgerufen.
Bonus: Daten wie ein Profi flachklopfen und verarbeiten
Sie haben Ihre Tweet-Daten mit Kommandozeilen-Tools gesammelt - super! Aber was, wenn Ihr glänzender neuer Datensatz als ein riesiger Brocken pro API-Antwort organisiert ist, anstatt als übersichtliche, zeilenweise Schätze? Hier kommt das "Flachklopfen" (Flattening) ins Spiel, und es ist einfacher als das Entwirren von Kopfhörerkabeln.
Schritt für Schritt:
Rohdaten sammeln. Wenn Sie beispielsweise einen Befehl wie
twarc2 timelinesmit einer Liste von User-IDs ausgeführt haben, enthält Ihre Ausgabe (z.B.results.jsonl) eine API-Antwort (oft mit mehreren Tweets) pro Zeile.Daten flachklopfen. Statt mit verschachteltem JSON zu kämpfen, leiten Sie Ihre Datei durch ein Flattening-Dienstprogramm. Mit twarc verwenden Sie:
twarc2 flatten results.jsonl tweets.jsonlJetzt wird jeder einzelne Tweet zu einer eigenen Zeile in
tweets.jsonl. Kein Graben mehr durch verschachtelte Objekte!In Ihre Datenbank oder Ihr Analyse-Tool importieren. Die meisten modernen Datenbanken (wie MongoDB) oder Datenverarbeitungsbibliotheken lieben dieses Format. Importieren Sie einfach Ihre geglättete Datei und Sie sind bereit zum Analysieren.
Dieser Trick verwandelt Ihre rohen, verschachtelten Antworten in einen Datensatz, der einfach zu durchsuchen, zu verarbeiten und zu visualisieren ist.
Option 2: Python-Power
Bevorzugen Sie Python? Wir haben Sie abgedeckt:
Gehen Sie zum Twitter API v2 Beispiel-Code auf GitHub.
Laden Sie das Repository herunter oder klonen Sie es.
Navigieren Sie zur Datei recent_search.py.
Stellen Sie sicher, dass Sie die requests-Bibliothek installiert haben (pip install requests).
Setzen Sie Ihren Bearer Token als Umgebungsvariable:
export 'BEARER_TOKEN'='your_actual_bearer_token_here'Führen Sie das Skript aus: python3 recent_search.py
Fertig! Sie rufen nun Tweets mit Python ab. Passen Sie die Abfrage im Skript gerne an, um verschiedene Tweets abzurufen.
Neugierig, was tatsächlich unter der Haube passiert? Hier ist eine Erklärung:
Das Skript einrichten
Zunächst müssen Sie Ihre Python-Pakete laden und Ihre Bearer Token-Anmeldeinformationen abrufen (Profi-Tipp: Umgebungsvariablen halten Ihre Keys geheim und Ihr Gewissen rein).
Ihre Tweet-Suche definieren
Angenommen, Sie möchten Tweets finden, die "Wärmepumpe" oder "Wärmepumpen" erwähnen, nur auf Englisch, und Retweets überspringen. Sie würden Ihren Endpunkt und Ihre Abfrageparameter wie folgt einrichten:
query: Wonach Sie suchen
tweet.fields: Welche Details Sie zurückerhalten möchten (Tweet-ID, Text, Autor, Datum)
max_results: Anzahl der Tweets pro Request
Den Request senden
Sie müssen Ihren Bearer Token in die Headers aufnehmen und eine grundlegende Fehlerprüfung durchführen.
Anpassen
Das Beste daran? Sie können die query anpassen, um Tweets zu jedem beliebigen Thema abzurufen. Suchen Sie nach Ihrem Lieblingshashtag, Nutzer oder Thema - lassen Sie Ihre Dateneugier freien Lauf!
Und da haben Sie es: Ein Python-Ticket zum Tweet-Stream von Twitter. Ob Sie das Beispielskript ausführen oder Ihr eigenes erstellen - Sie sind jetzt bereit, Tweets wie ein Profi abzurufen.
Profi-Modus: Durch mehrere Regeln mit Python schleifen
Bereit, Ihre Twitter API-Fähigkeiten zu verbessern? Angenommen, Sie möchten Tweets sammeln, die mehreren verschiedenen Suchregeln entsprechen - nicht nur einer. Hier ist, wie Sie den Prozess automatisieren und Tweet- und Nutzerinformationen für jede Regel in Ihrer Liste sammeln können.
Beginnen Sie mit zwei leeren Pandas DataFrames: einen für Tweets, einen für Nutzer. Sie schleifen durch Ihre Regelsammlung, aktualisieren das Abfragefeld jedes Mal, sodass Sie für jede Regel einen frischen Stapel von Tweets und Nutzern abrufen.
Ein grundlegender Workflow sieht wie folgt aus:
Richten Sie Ihre leeren DataFrames ein (einen für Tweets, einen für Nutzer).
Aktualisieren Sie für jede Regel in Ihrer Liste Ihre Abfrageparameter, sodass die Suche Ihrer aktuellen Regel entspricht.
Rufen Sie Ihre Funktion auf, die den Request an den Twitter-Endpunkt sendet und die Antwort verarbeitet - vergessen Sie nicht, die neuen Tweets/Nutzer in Ihre DataFrames einzufügen!
Respektieren Sie Twitters Rate Limits: Fügen Sie ein time.sleep(5) nach jedem Request ein, damit Sie nicht rate-limitiert werden. (Für Essential Access sind das maximal 180 Requests pro 15 Minuten, also etwa einer alle fünf Sekunden.)
Behandeln Sie die Paginierung: Wenn Ihre Antwort ein "next_token" im "meta"-Feld enthält, rufen Sie weitere Seiten ab, bis Sie alle verfügbaren Tweets für die Regel gesammelt haben.
Das Endergebnis? Sie haben robuste DataFrames mit Tweets und Nutzerdetails für jede Regel, die Sie interessiert.
API-Fehler wie ein Profi behandeln
Was passiert, wenn Sie beim Abrufen von Tweets auf ein Problem stoßen? Keine Sorge - Twitters API kommuniziert gerne in Status-Codes, und mit den richtigen Tricks können Sie auch die lästigsten Fehler wie ein erfahrener Entwickler behandeln.
Hier ist der Aktionsplan:
Die Antwort prüfen:
Überprüfen Sie nach Ihrem Request immerresponse.status_code.Wenn es 200 ist, haben Sie Erfolg!
Wenn es sich im 400er-Bereich befindet (wie 401 oder 403), stimmt etwas nicht - meist Ihre Anmeldeinformationen oder Berechtigungen. Stoppen Sie in diesem Fall das Programm und untersuchen Sie das Problem; fragen Sie die API nicht wiederholt ab, sonst erhalten Sie die gleichen Fehler.
Wenn es ein 500er-Code ist, liegt das Problem auf Twitters Seite. Diese sind in der Regel vorübergehend.
Freundlich bleiben, nicht spammen:
Bei einem vorübergehenden Fehler (z.B. 502, 503 oder 504) spammen Sie keine Requests! Stattdessen:Warten Sie ein wenig, bevor Sie es erneut versuchen. Ein zufälliger Sleep-Timer zwischen 5 und 60 Sekunden funktioniert oft (Pythons
time.sleep()ist Ihr Freund hier).Immer noch festgefahren nach einem erneuten Versuch? Erwägen Sie, noch länger zu warten oder die Twitter API-Statusseite auf weit verbreitete Probleme zu überprüfen.
Ausnahmen für größere Probleme auslösen:
Für clientseitige Fehler (Status 4xx) lösen Sie eine Ausnahme mit allen Details aus, damit Sie debuggen können.
Durch den Aufbau dieser Kontrollen und Gegengewichte in Ihre Skripte werden Ihre Twitter API-Erfahrungen viel reibungsloser verlaufen.
Option 3: Die GUI-Methode (Qodex)
Wenn Sie Klicken dem Tippen vorziehen:
Gehen Sie zu Qodex.ai.
Erstellen Sie einen neuen Request in Qodex.
Setzen Sie den Request-Typ auf GET.
Verwenden Sie diese URL: https://api.x.com/2/tweets/search/recent?query=from:twitterdev
Fügen Sie im Tab Headers Authorization als Key und Bearer your_actual_bearer_token als Wert hinzu.
Klicken Sie auf Send und beobachten Sie, wie die Tweets eintreffen!
Bonus: Bibliotheken in Hülle und Fülle
Möchten Sie Ihr Coding vereinfachen? Schauen Sie sich Twitters Tools und Bibliotheken-Seite an. Es gibt Bibliotheken in verschiedenen Programmiersprachen, die v2 der API unterstützen.
Fehlerbehebung beim Tweet-Abruf für akademische Forschung
Tweets für akademische Zwecke abzurufen kann manchmal wie ein Indiana Jones-Abenteuer wirken - mit mysteriösen Fehlermeldungen und komplexen Anforderungen. Wenn Sie auf Drittanbieter-Bibliotheken oder Kommandozeilen-Tools setzen (wie twarc, Tweepy und Freunde), sind hier einige klassische Hürden, die Sie treffen könnten, und wie Sie sie überwinden können.
1. Eingeschränkter Zugang zu Tweet-Archiven
Standardmäßig haben die meisten Entwickler nur Zugang zu Tweets der letzten sieben Tage (dank dieser API-Beschränkungen). Für breitere Datumsbereiche ist der akademische Zugang erforderlich.
Workaround: Anstatt von Live-Suchen suchen Sie nach offenen Datensätzen, die Sie hydratisieren können - schauen Sie sich https://catalog.docnow.io/ für öffentliche Tweet-Archive für die Forschung an. Sobald Sie Tweet-IDs haben, können Sie Tools wie twarc verwenden, um den vollständigen Inhalt abzurufen.
2. Verwirrende Abfrageparameter
Im Gegensatz zu regulären Suchplattformen erfordern einige Bibliotheken spezifische Parameterbenennungskonventionen. Zum Beispiel können Sie klassische Suchoperatoren wie
since:unduntil:nicht in API-Abfragen verwenden. Stattdessen müssen Sie die Parameterstart_timeundend_timeverwenden.Profi-Tipp: Lesen Sie die Dokumentation Ihrer Bibliothek, um die korrekte Syntax zu finden, und überprüfen Sie alle Beispiele, bevor Sie ausführen.
3. Authentifizierungsprobleme
Falsche Anmeldeinformationen verwenden? Das ist häufig. Viele APIs erwarten einen Bearer Token, der mit der richtigen Zugangsstufe verknüpft ist (besonders für akademische Endpunkte).
Lösung: Besuchen Sie Ihr Entwicklerportal, überprüfen Sie, mit welcher App Ihr Token verknüpft ist, und stellen Sie sicher, dass Sie den für akademische Forschung gekennzeichneten verwenden. Wenn Sie nur Standard-Zugang haben, sind Ihre Abrufgrenzen strenger.
4. Umgang mit Rate Limits und Datenvolumen
Die meisten APIs begrenzen die Anzahl der Tweets, die Sie pro Request oder pro Nutzer abrufen können (oft maximal die aktuellsten 3.200 pro Konto).
Strategie: Für größere Datensätze teilen Sie Requests auf, oder verwenden Sie lokale Datenverarbeitungsskripte, um mehrere Antworten zu glätten und zu kombinieren.
5. Daten importieren und verwalten
Die meisten Kommandozeilen-Tools geben Tweets im JSONL-Format aus. Keine Panik - diese sind einfach zu verarbeiten! Sie können integrierte Tool-Funktionen (wie
flattenmit twarc) verwenden, um Ergebnisse zu vereinfachen, und sie direkt in Datenbanken wie MongoDB für tiefgehende Analysen importieren.
Schnelle Tipps für erfolgreiche Datenjagd:
Achten Sie auf veraltete Tutorials - API-Endpunkte und Zugangsstufen ändern sich häufig.
Wenn Sie feststecken, suchen Sie nach Video-Guides oder Live-Coding-Sessions; es gibt eine florierende akademische Gemeinschaft, die Ressourcen teilt.
Testen Sie Ihre Keys und Abfragen im kleinen Maßstab, bevor Sie die vollständige Pipeline ausführen.
Gelegentlich stoßen Sie auf eine kryptisch wirkende Fehlermeldung. Nehmen Sie sich einen Moment, gehen Sie Ihre Einrichtung nochmals durch (Bearer Token, Zugangsstufe, korrekte Parameter), und scheuen Sie sich nicht, Google zu nutzen - das gehört alles zum Abenteuer.
Bonus-Runde: Erweiterte Tweet-Sammlung mit Twarc
Bereit, Ihre Fähigkeiten zu verbessern und Tweets von einer benutzerdefinierten Liste von User-IDs abzurufen - ohne an die gefürchtete Sieben-Tage-Grenze zu stoßen? Zeit, die großen Geschütze aufzufahren. Lernen Sie Twarc kennen, das Schweizer Taschenmesser für Twitter-Datensammlung.
Mit Twarc können Sie Tweets von bestimmten Nutzern über jeden Datumsbereich abrufen (sofern die Tweets noch verfügbar sind). Hier ist, wie Sie dieses nützliche Tool nutzen können:
Schritt 1: Installation und Einrichtung
Stellen Sie sicher, dass Python installiert ist.
Öffnen Sie Ihr Terminal und führen Sie aus:
pip install twarcSie müssen Twarc mit Ihren API-Keys authentifizieren. Initialisieren Sie Twarc mit:
twarc2 configure
Folgen Sie den Anweisungen, um Ihre Keys einzugeben.
Schritt 2: Ihre Liste von User-IDs vorbereiten
Legen Sie jede User-ID auf einer eigenen Zeile in einer Nur-Text-Datei ab, z.B.
twitter_ids.txt
Schritt 3: Tweets für einen Datumsbereich abrufen
Verwenden Sie den folgenden Befehl, um Tweets von diesen Nutzern abzurufen, und geben Sie Ihren bevorzugten Datumsbereich an:
twarc2 timelines --start-time "YYYY-MM-DD" --end-time "YYYY-MM-DD" --use-search twitter_ids.txt results.jsonlErsetzen Sie
YYYY-MM-DDdurch Ihre tatsächlichen Start- und Enddaten.Die Datei
results.jsonlspeichert Ihre rohen Tweet-Daten.
Schritt 4: Daten glätten
Twarc speichert Ergebnisse als eine API-Antwort pro Zeile. Um einen Tweet pro Zeile zu erhalten (viel einfacher zu verarbeiten), führen Sie aus:
twarc2 flatten results.jsonl tweets.jsonlJetzt enthält
tweets.jsonleinzelne Tweets, bereit für die Analyse oder den Import.
Schritt 5: Optional - In eine Datenbank importieren
Wenn Sie der Daten-Sammeltyp sind, können Sie
tweets.jsonldirekt in Datenbanken wie MongoDB zur weiteren Analyse importieren.
Brauchen Sie mehr Anleitung?
Twarcs offizielle Dokumentation und Community-Tutorials sind Goldgruben für neugierige Datenbeschäftiger.
Video-Walkthroughs und Guides können Ihnen helfen, schnell praktisch loszulegen.
Mit einem Drittanbieter-Tool wie Twarc sind Sie nicht nur auf aktuelle Tweets beschränkt - Sie können leistungsstarke, maßgeschneiderte Tweet-Sammlungen von bestimmten Nutzern über die Zeit aufbauen.
Bonus: Tweets in MongoDB für tiefgehende Analysen speichern
Tweets abzurufen ist erst der Anfang - was ist, wenn Sie all diese wertvollen Twitter-Daten sicher für zukünftige Analysen aufbewahren möchten? Geben Sie MongoDB ein, Ihre freundliche Nachbarschaftsdatenbank!
Hier ist eine schnelle, praktische Anleitung, um Ihre gesammelten Tweets aus Python in MongoDB zu bringen. Sie benötigen die pymongo-Bibliothek - wenn Sie sie noch nicht haben, öffnen Sie Ihr Terminal und führen Sie aus:
pip install pymongo
Jetzt legen wir los:
Mit MongoDB verbinden:
Importieren Siepymongound verbinden Sie sich mit Ihrer MongoDB-Instanz (stellen Sie sicher, dass MongoDB auf Ihrem Rechner läuft oder Ihre Verbindungszeichenfolge auf den richtigen Server zeigt).from pymongo import MongoClientclient = MongoClient('localhost', 27017)db = client['Twitter']collection = db['Tweets']Daten vorbereiten:
Wenn Sie Tweets von der API abrufen, erhalten Sie diese typischerweise als Wörterbücher - perfekt für MongoDB! Fügen Sie für jeden Tweet einfach ihn in die Sammlung ein. Wenn Sie viele Tweets auf einmal einfügen müssen, verwenden Sieinsert_many:Verifizieren und analysieren:
Nach dem Import können Sie schnelle Abfragen ausführen, um Ihre Daten zu überprüfen.
Voilà! Ihr Twitter-Schatz liegt jetzt sicher in MongoDB, bereit für alles: Analysen, Stimmungsbewertung, maschinelles Lernen und vieles mehr.
Den Recent Search Endpunkt meistern: Ihr Tor zu Twitter-Daten
Jetzt, da Sie die Grundlagen kennen, tauchen wir tiefer in den Recent Search Endpunkt ein. Dieses leistungsstarke Tool ist Ihre Eintrittskarte, um spezifische Tweets der letzten sieben Tage zu finden.
Essential Access Regellimits: Das Kleingedruckte
Bevor Sie clevere Abfragen erstellen, ist es gut, die Leitplanken zu kennen. Mit Essential Access können Sie bis zu 5 Regeln zum Sammeln von Tweets einrichten. Jede dieser Regeln kann so detailliert sein wie Sie möchten, aber beachten Sie, dass jede Regel auf 512 Zeichen begrenzt ist. Das bedeutet, Sie müssen Ihre Suchlogik priorisieren und Operatoren klug einsetzen.
Wenn Sie an diese Regel- oder Zeichenbeschränkungen stoßen, ist es vielleicht Zeit, Ihre Zugangsstufe zu upgraden. Für die meisten Einsteiger und Freizeitprojekte sollten jedoch fünf gut geplante Regeln ausreichen!
Grundlegende Abfragestruktur
Der Recent Search Endpunkt dreht sich alles um die Abfrage. Hier ist eine einfache Struktur:
https://api.x.com/2/tweets/search/recent?query=your_search_terms_hereZum Beispiel, um Tweets über Katzen zu finden:
https://api.x.com/2/tweets/search/recent?query=catsWie viele Tweets können Sie pro Request abrufen?
Neugierig, wie viel Twitter-Güte Sie in einem einzigen API-Aufruf erhalten können? Jeder Request an den Recent Search Endpunkt liefert Ihnen bis zu 100 Tweets auf einmal. Wenn Sie mehr benötigen, verwenden Sie einfach das Paginierungs-Token in der Antwort, um weitere Tweets der letzten sieben Tage abzurufen.
Abfragen für spezifische Daten anpassen
Möchten Sie es ausgefeilter machen? Versuchen Sie diese Abfragemodifikationen:
Von einem bestimmten Nutzer: from:username
Mit einem Hashtag: #hashtag
Tweets mit Medien: has:images oder has:videos
Tweets in einer Sprache: lang:de (für Deutsch)
Die Kunst der Abfrageoptimierung: Präzision ist entscheidend
Das Optimieren Ihrer Abfragen ist nicht nur ein Nice-to-have; es ist das Geheimnis, um hochwertige Twitter-Daten zu sammeln, ohne unter einem Berg irrelevanter Tweets begraben zu werden. Wenn Sie mit der Suche beginnen, können Ihre Ergebnisse etwas chaotisch oder zu breit sein. Das ist normal!
Warum optimieren? Weil zielgerichtete Abfragen bedeuten, dass Sie Tweets sammeln, die tatsächlich für Ihr Projekt relevant sind. Wenn Sie zum Beispiel nach Tweets über die Programmiersprache Swift suchen, ohne Ihre Suche anzupassen, könnten Sie in einem Tsunami von Taylor Swift Fan-Gesprächen ertrinken.
Tipps, um Ihre Abfragen scharf zu halten:
Passen Sie Ihre Keywords an, um nicht verwandte Themen auszuschließen.
Verwenden Sie erweiterte Suchoperatoren (wie -taylor, wenn Sie Swift ohne den Popstar möchten).
Erkunden Sie Ihre ersten Ergebnisse und passen Sie Ihre Abfrageterms basierend auf dem an, was Sie sehen - es ist ein wenig wie das Einstellen eines Radios auf den perfekten Sender.
Iterieren Sie, bis Ihre Suche genau das liefert, was Sie suchen.
Profi-Tipps: Effektive Regeln für relevante Tweets erstellen
Bereit, Ihr Twitter-Datensammlungsspiel zu verfeinern? Das Geheimnis liegt in der Erstellung smarter, präziser Abfragen. So treffen Sie genau die Tweets, die Sie möchten:
Beginnen Sie spezifisch. Beginnen Sie mit einer engen Abfrage, um Ihre Zielgruppe präzise zu treffen, und erweitern Sie dann, wenn Sie nicht genug Ergebnisse sehen.
Nutzen Sie Filter zu Ihrem Vorteil - kombinieren Sie Keywords, Hashtags, "from:"-Nutzernamen, Medientypen und Sprachcodes, um das Rauschen auszuschließen.
Testen und anpassen. Führen Sie eine Beispielsuche durch, überprüfen Sie die Ergebnisse und passen Sie Ihre Abfrage an, um unerwünschte Tweets herauszufiltern.
Achten Sie auf mehrdeutige Keywords! Das Suchen nach "Swift" könnte zum Beispiel Beiträge über Taylor Swift einfangen, wenn Sie eigentlich Programming-Gespräche möchten. Fügen Sie Kontext mit weiteren Keywords hinzu (wie "Swift language" oder "#iOSDev"), um auf Kurs zu bleiben.
Nicht einstellen und vergessen! Verfeinern Sie Ihre Regeln weiter, um Qualität und Relevanz zu verbessern. Datensammlung ist ein fortlaufender Prozess.
Mit jeder Anpassung kommen Sie dem Aufbau einer Goldgrube an gezielten, umsetzbaren Twitter-Daten näher.
Kombinieren Sie diese für präzisere Ergebnisse:
query=cats from:ASPCA has:images lang:enDadurch würden englische Tweets über Katzen von @ASPCA gefunden, die Bilder enthalten.
Durch Ergebnisse blättern: So verwenden Sie next_token
Angenommen, eine Seite Tweets reicht nicht aus. Twitters API hat Sie mit einfacher Paginierung abgedeckt. So funktioniert es:
Überprüfen Sie nach jedem API-Aufruf den
meta-Abschnitt der JSON-Antwort.Wenn es ein
next_token-Feld gibt, bedeutet das, dass weitere Tweets auf Sie warten.Nehmen Sie einfach diesen
next_token-Wert und fügen Sie ihn als Abfrageparameter hinzu, wie&next_token=your_token_here, zu Ihrem nächsten Request.
Wiederholen Sie: Verwenden Sie jedes Mal das neueste next_token, und Sie blättern durch Ergebnisseite nach Ergebnisseite, bis das Token schließlich verschwindet. Wenn das passiert, herzlichen Glückwunsch! Sie haben das Ende der verfügbaren Tweets für Ihre Suche erreicht.
Tweets nach Datumsbereich filtern: Der richtige Weg
Bereit, in der Zeit zurückzureisen (zumindest so weit die Twitter-Archive es erlauben)? Wenn Sie Tweets aus einem bestimmten Datumsbereich abrufen möchten, gibt es ein kleines Geheimnis: Sie fügen Daten nicht direkt in Ihre Abfragezeichenfolge ein wie since: oder until:. Stattdessen verwenden neuere API-Versionen spezielle URL-Parameter für die Zeitfilterung.
So geht es:
Verwenden Sie
start_time, um das früheste Datum und die früheste Uhrzeit für die Tweets festzulegen, die Sie abrufen möchten.Verwenden Sie
end_time, um das späteste Datum und die späteste Uhrzeit festzulegen.
Beide müssen im ISO 8601-Format vorliegen (z.B.: 2024-01-01T00:00:00Z).
So könnte Ihre URL aussehen:https://api.x.com/2/tweets/search/recent?query=cats&start_time=2024-06-01T00:00:00Z&end_time=2024-06-03T00:00:00Z
Dadurch werden Tweets mit "cats" vom 1. Juni 2024 bis (ausschließlich) zum 3. Juni 2024 abgerufen.
Profi-Tipp: Beliebte Bibliotheken wie twitter-api-v2 (für JavaScript) unterstützen diese Parameter.
Profi-Tipp: Tweets von bestimmten Nutzern für einen Datumsbereich abrufen
Möchten Sie Tweets von bestimmten User-IDs in einem benutzerdefinierten Zeitfenster abrufen? Das ist durchaus möglich! Beachten Sie dabei die goldene Regel: Bei der Abfrage nach Datum erhält der Recent Search Endpunkt nur Tweets der letzten sieben Tage. Wenn Sie Tweets von weiter zurück benötigen, benötigen Sie Zugang zum vollständigen Archiv, was in der Regel den akademischen Forschungszugang erfordert.
Python und Tweepy für einfache Abrufe verwenden (nur aktuelle Tweets):
Wenn Ihr Zieldatum innerhalb der letzten Woche liegt, ist Tweepy Ihr Freund. Hier ist, was Sie tun:
Authentifizieren Sie sich mit Ihren API-Keys wie immer.
Verwenden Sie die Parameter
start_timeundend_time, nicht Such-Keywords, wenn Sie nach Datumsbereich filtern möchten.Iterieren Sie über Ihre User-IDs und machen Sie entsprechende Requests.
Für tiefes Eintauchen: Ältere Tweets mit Kommandozeilen-Tools abrufen
Wenn Sie historische Tweets benötigen (weit mehr als 7 Tage zurück), sollten Sie Tools wie Twarc verwenden:
Speichern Sie Ihre User-IDs, eine pro Zeile, in einer Textdatei, z.B.
twitter_ids.txt.Abrufen von Timelines mit einem bestimmten Zeitrahmen.
Wenn Sie den akademischen Forschungszugang haben, können Sie über das vollständige Archiv abrufen. Wenn nicht, sind Sie auf die aktuellsten ca. 3200 Tweets pro Nutzer beschränkt, unabhängig vom Datum.
Optional: Glätten Sie die Ergebnisse, um einen Tweet pro Zeile zu erhalten:
twarc2 flatten results.jsonl tweets.jsonl
Sie können dann
tweets.jsonlin Ihre Lieblingsdatenbank für Analysen importieren.
Fehlerbehebungs-Tipps:
Stellen Sie sicher, dass Sie den richtigen Bearer Token verwenden; akademische Endpunkte erfordern spezifischen App-Zugang.
Wenn Sie auf Berechtigungsprobleme stoßen, überprüfen Sie Ihren Projekttyp im Twitter Developer Portal.
Kein akademischer Zugang? Sie sind auf aktuelle Tweets beschränkt, können aber immer noch eine erhebliche Menge pro Nutzer sammeln.
Mit diesen Ansätzen sind Sie bereit, Tweets von jeder Gruppe von Nutzern für jeden Zeitraum abzurufen, den Ihr Projekt verlangt!
Erweiterte Suchregeln erstellen
Der Recent Search Endpunkt ist nicht nur für die Suche nach einfachen Keywords - Sie können Regeln einrichten, um genau die Gespräche zu erfassen, die Sie interessieren.
Angenommen, Sie möchten Tweets über "Wärmepumpen" oder "Gasheizungen" abrufen, aber alle Retweets überspringen und sich nur auf englischsprachige Tweets konzentrieren. Die Twitter API macht dies mit Regelabfragesyntax zum Kinderspiel. Jede Regel ist ein Mini-Suchbefehl:
Verwenden Sie
OR, um verschiedene Arten zu erfassen, wie Menschen ein Thema erwähnen könnten.Schließen Sie Retweets aus (um Duplikate zu vermeiden) mit
-is:retweet.Setzen Sie die Sprache, wie
lang:enfür Englisch.
Tags helfen Ihnen, Ergebnisse zu beschriften und zu organisieren, sodass Sie leicht verfolgen können, welche Regel welchen Tweet erfasst hat. Sie können bis zu fünf Regeln mit dem Essential Access Level definieren, jede bis zu 512 Zeichen.
Felder und Erweiterungen verwenden
Um detailliertere Antworten zu erhalten, verwenden Sie Felder und Erweiterungen:
Tweet-Felder hinzufügen: tweet.fields=created_at,author_id,public_metrics
Nutzerdaten einschließen: expansions=author_id&user.fields=username,verified
Ihre URL könnte so aussehen:
https://api.x.com/2/tweets/search/recent?query=cats&tweet.fields=created_at,author_id,public_metrics&expansions=author_id&user.fields=username,verifiedDies liefert Ihnen Erstellungszeit, Autorinformationen und Engagement-Metriken für jeden Tweet.
Hinweis: Sie müssen den Erweiterungsparameter hinzufügen, um tatsächlich Nutzerdaten in Ihrer Antwort zu erhalten. Die Antwort-JSON enthält dann einen zusätzlichen Schlüssel, wo Sie nutzerbezogene Informationen wie Nutzernamen und Verifizierungsstatus finden.
Leistungsstarke Abfragen mit Operatoren erstellen
Die eigentliche Magie liegt in der Erstellung der perfekten Abfrage mit Operatoren - diese ermöglichen es Ihnen, Tweets mit chirurgischer Präzision zu filtern. Angenommen, Sie möchten Tweets über schwarze Katze(n), aber nicht Hund(e), und Sie möchten Retweets überspringen. Ihre Abfrage würde so aussehen:
Einige praktische Operatoren, um Ihre Suchen zu verbessern:
from: - Tweets von einem bestimmten Nutzer
#hashtag - Tweets mit einem Hashtag
has:images, has:videos - Tweets mit Medien
lang:de - Tweets auf Deutsch
is:retweet, is:reply - Filter für Retweets oder Antworten
Profi-Tipp zu Operator-Priorität: AND hat höhere Priorität als OR, also verwenden Sie immer Klammern, um Ihre Logik zu steuern.
Weitermachen: Paginierung und Rate Limits
Was ist, wenn Sie mehr als nur eine einzelne Seite mit Tweets abrufen möchten? Hier ist, wie Sie profi werden:
Paginierung mit next_token: Twitters API gibt Ergebnisse seitenweise zurück. Jede Antwort kann einen
next_token-Wert in ihremmeta-Feld enthalten. Solange Sie dieses Token sehen, greifen Sie es und fügen Sie es als Abfrageparameter zu Ihrem nächsten Request hinzu - und Sie erhalten den nächsten Stapel Tweets. Wiederholen Sie, bis keinnext_tokenmehr vorhanden ist und Sie das Ende erreicht haben.Das Rate Limit respektieren: Twitter setzt eine Obergrenze - in der Regel 180 Requests pro 15 Minuten für das Essential Access Level. Das ist ungefähr ein Request alle fünf Sekunden. Fügen Sie ein kurzes
sleep(etwa fünf Sekunden) zwischen Aufrufen ein, wenn Sie durch viele Seiten schleifen.
Beispiel: Durch mehrere Regeln schleifen
Wenn Sie Tweets basierend auf mehreren Suchregeln sammeln (z.B. "Katzen", "Hunde", "Papageien"), könnten Sie eine Struktur wie diese in Python verwenden (Pseudocode zur Verdeutlichung):
Was hier passiert:
Leere Pandas DataFrames werden eingerichtet, um Ihre Tweet- und Nutzerinformationen zu speichern.
Für jede Regel (oder jedes Thema) aktualisieren Sie die Abfrage und das Tag, führen den API-Aufruf durch, verarbeiten die Daten und pausieren fünf Sekunden.
Wenn es ein
next_tokengibt, sind Sie noch nicht fertig! Fahren Sie mit der Paginierung fort, bis Sie alle verfügbaren Tweets für diese Regel gesammelt haben.Die Fünf-Sekunden-Pause zwischen Requests hält Sie in der sicheren Zone von Twitters Rate Limits.
Jetzt sind Sie bereit, Tweets wie ein erfahrener Datenbeschäftiger zu ernten.
Profi-Tipps: Über die Grundlagen hinaus
Im obigen Beispiel haben wir den Recent Search Endpunkt verwendet, um historische Daten der letzten 7 Tage abzurufen - aber wussten Sie, dass Sie ihn verwenden können, um Tweets nahezu in Echtzeit zu erhalten? Durch die Nutzung des since_id-Parameters können Sie nur die Tweets abrufen, die neuer als eine bestimmte Tweet-ID sind - ideal, um den Puls zu fühlen, wenn neue Inhalte eintreffen.
Suchen Sie nach einem echten Echtzeit-Firehose? Erwägen Sie die Nutzung des Filtered Stream Endpunkts. Während Recent Search gut für On-Demand-Abfragen ist, ermöglicht der Filtered Stream Ihnen, kontinuierlich Tweets zu sammeln, während sie entstehen. Ideal für Live-Monitoring, Dashboards oder wenn Sie keinen Moment verpassen wollen.
Fehlerbehebung bei Zugriffsproblemen: Wenn Sie nicht alle Tweets suchen können
Stoßen Sie auf Hindernisse bei historischen Tweet-Suchen? Sie sind damit nicht allein! Wenn Ihre API-Anmeldeinformationen oder Zugangsstufe nicht für vollständige Archivsuchen ausreichen, hier ist, was Sie als nächstes tun können:
Ihre Zugangsstufe überprüfen: Die meisten Einsteiger- oder "Essential"-Twitter-API-Keys erlauben nur Zugang zum Recent Search Endpunkt (letzte 7 Tage) und unterstützen keine vollständige historische Suche.
Nach akademischem Zugang suchen: Um
/search/allzu entsperren, benötigen Sie den akademischen Forschungszugang.Nutzer-Timelines als Workaround versuchen: Wenn Sie Tweets weiter zurück benötigen - bis zu den letzten ca. 3.200 pro Nutzer - ziehen Sie in Betracht, Nutzer-Timelines abzurufen. Viele Bibliotheken (wie twarc oder Python Tweepy) ermöglichen Ihnen das Abrufen dieser Daten.
Ihren App Bearer Token überprüfen: Stellen Sie sicher, dass Sie den richtigen Satz Keys verwenden, besonders wenn Sie mehrere Twitter-Entwicklerprojekte oder Apps haben. Manchmal ist es nur eine Token-Verwechslung!
Kostenloser und Essential-Zugang: In die Vergangenheit schauen ist nicht so einfach
Bevor Sie in alte Tweets eintauchen, gibt es einige Hindernisse, die Sie kennen sollten. Mit den meisten Social-Media-APIs, einschließlich Twitter, kommt der kostenlose oder Essential-Zugang mit einem ziemlich strengen Zeitlimit: Sie können normalerweise nur Tweets der letzten sieben Tage mit dem Standard-Suchendpunkt abrufen. Wenn Sie hoffen, einige Monate oder Jahre zurückzuspulen, werden Sie gegen eine Wand stoßen, es sei denn, Sie haben akademische oder erweiterte Berechtigungen erlangt.
Workarounds und Datensätze
Wenn Sie ältere Tweets benötigen, gibt es noch einige clevere Möglichkeiten, an diese Daten zu gelangen:
Vorgesammelte Datensätze: Organisationen wie DocNow kuratieren öffentliche Tweet-Datensätze, die Sie herunterladen und analysieren können. Das ist eine beliebte Option für Forscher, die historische Daten benötigen, aber nicht mit Zugriffsbeschränkungen kämpfen möchten.
Hydrations-Tools: Tools wie
twarcermöglichen es Ihnen, Tweet-IDs aus diesen öffentlichen Archiven zu "hydratisieren" (d.h. vollständige Tweet-Objekte abzurufen). Sie liefern die IDs, und twarc ruft den Text und Metadaten über die API ab.
Kommandozeilen-Erweiterungen
Während Sie über die Standard-Suchendpunkte nicht nach Tweets aus der fernen Vergangenheit suchen können, können Sie dennoch:
Bis zu den letzten 3.200 Tweets von einzelnen Nutzer-Timelines abrufen.
Filter wie Datumsbereiche anwenden (wo von Tools unterstützt), aber beachten Sie, dass diese keine älteren Inhalte entsperren - sie helfen nur dabei, durch das Zugängliche zu sichten.
Hinweis zu Zugangsstufen
Wenn Sie versuchen, weiter zurückzugehen oder den /search/all Endpunkt ohne die entsprechenden akademischen Anmeldeinformationen zu verwenden, werden Sie Fehler erhalten, die Ihnen mitteilen, dass Sie nicht autorisiert sind. Nur Nutzer mit genehmigten akademischen Projekten haben diese Fähigkeit.
Kurz gesagt:
Ohne akademischen Zugang betrachten Sie API-Daten eher als Rückspiegel denn als Zeitmaschine. Für historische Tieftauchgänge sind öffentliche Datensätze und Hydrations-Tools Ihre besten Freunde.
Häufige Fehler beim Abrufen historischer Tweets - und wie Sie sie beheben
1. Das Sieben-Tage-Suchlimit treffen
Ohne akademischen Zugang erlauben die meisten APIs (einschließlich Twitters Standard-Angebote) nur die Suche nach Tweets der letzten sieben Tage. Wenn Sie weiter zurückgehen wollen, stoßen Sie wahrscheinlich auf eine Fehlermeldung. Wenn Sie ältere Daten benötigen, erwägen Sie die Nutzung kuratierter Datensätze von Ressourcen wie dem DocNow Catalog und das "Hydratisieren" der Tweet-IDs.
2. Falsche Abfragesyntax
Es ist verlockend, since: oder until: direkt in Ihre Suchabfrage zu schreiben, aber der richtige Weg ist die Verwendung von start_time und end_time als Parameter, nicht in der Abfragezeichenfolge.
3. Authentifizierungsverwechslungen
Viele Fehler - wie "Client Error" oder "Unauthorized" - passieren wegen falsch zugeordneter oder fehlender Bearer Tokens. Stellen Sie sicher, dass Sie genau das Token verwenden, das mit der richtigen Zugangsstufe verknüpft ist.
4. API-Endpunkt und Zugang stimmen nicht überein
Wenn Sie Endpunkte verwenden, die hinter höheren Zugangsstufen gesperrt sind (z.B. /search/all), aber nur Standard- oder Essential-Zugang haben, werden Sie abgewiesen. Überprüfen Sie, welche Endpunkte Ihr Zugang abdeckt.
5. Häufige Fallstricke mit Bibliotheken und Tools
Wenn Sie Tools wie Twarc oder andere Open-Source-Bibliotheken verwenden:
Überprüfen Sie, ob Ihre Kommandozeilen-Optionen Ihrer Zugangsstufe entsprechen
Lassen Sie für Bulk-Timelines erweiterte Flags wie
--use-searchweg, es sei denn, Sie haben akademische AnmeldeinformationenVerwenden Sie die
flatten-Funktion, um Multi-Tweet-Antworten in einzelne Tweets aufzuteilen
Schnelle Fehlerbehebungs-Checkliste
Stellen Sie sicher, dass Ihre Authentifizierungs-Keys korrekt und für den gewünschten Endpunkt gültig sind
Überprüfen Sie Ihre Abfrageparameter auf Tippfehler oder falsche Platzierung
Für mehr Daten kombinieren Sie öffentliche Datensätze mit Tools, die die Hydratisierung von Tweet-IDs ermöglichen
Wenn alles fehlschlägt, konsultieren Sie die Dokumentation oder versuchen Sie Beispiel-Code aus den Tutorials der Bibliotheks-Maintainer
Historische Tweets erkunden: Alternative Methoden bei eingeschränktem Zugang
Was können Sie tun, wenn Sie nach Tweet-Archiven suchen, Ihre üblichen Endpunkte aber Hindernisse aufwerfen? Lassen Sie uns Ihre Optionen für historische Twitter-Daten erkunden, wenn API-Berechtigungen nicht kooperieren.
Vorgesammelte Datensätze: Die Abkürzung
Wenn Sie einen schnellen Start möchten, sind kuratierte Datensätze Ihr Freund. Websites wie DocNow Catalog (https://catalog.docnow.io/) bieten Sammlungen von Tweet-IDs zu einer Vielzahl von Themen an. Während diese Datensätze keine vollständigen Tweet-Inhalte enthalten, können Sie einen Prozess namens "Hydratisierung" verwenden, um diese Tweet-IDs in ihre volle Pracht zurückzuverwandeln - vorausgesetzt, die Tweets sind noch öffentlich.
Tweets hydratisieren: Der Power-Tool-Ansatz
Um Tweet-IDs zu hydratisieren, benötigen Sie ein Drittanbieter-Tool. Twarc ist ein Community-Favorit für die Kommandozeile. Einmal installiert, zeigen Sie einfach auf Ihre Liste von Tweet-IDs und lassen Sie es so viele Daten abrufen, wie Ihr aktueller API-Zugang erlaubt.
Einstieg mit Twarc (und Freunden)
Wenn Sie neu in all dem sind, keine Sorge. Es gibt viele anfängerfreundliche Tutorials, die Sie durch die Installation und Nutzung von Tools wie Twarc führen. Video-Walkthroughs und schriftliche Guides decken alles ab, von der grundlegenden Einrichtung bis zur erweiterten Filterung.
Mit diesen Strategien können Sie Ihre Twitter-Forschung fortsetzen, auch wenn die üblichen Türen geschlossen sind.
Durch Tweets blättern: So funktioniert die Paginierung
Twitter schickt Ihnen nicht alle Tweets auf einmal. Stattdessen kommen Ergebnisse in handlichen, überschaubaren "Seiten" an, wobei die neuesten Tweets immer zuerst kommen. Aber was ist, wenn Sie tiefer graben und mehr als nur diesen ersten Stapel sehen möchten?
Hier kommen Paginierungs-Tokens ins Spiel - Ihr Schlüssel zum Durchblättern der restlichen Ergebnisse. Nach jedem API-Aufruf erhalten Sie eine Antwort, die ein next_token im "meta"-Abschnitt enthalten kann. Dieses Token fungiert wie ein Lesezeichen und teilt Twitter mit, wo Sie aufgehört haben.
So sieht das in der Praxis aus:
Stellen Sie Ihren anfänglichen Request an den Endpunkt.
Wenn die Antwort ein next_token enthält, fügen Sie es als Parameter zu Ihrem nächsten Request hinzu.
Wiederholen: Greifen Sie bei jeder neuen Antwort das next_token und verwenden Sie es für Ihren nächsten Aufruf.
Stoppen Sie, wenn das next_token verschwindet - herzlichen Glückwunsch, Sie haben das Ende der verfügbaren Ergebnisse erreicht!
Tipp: Um ein guter API-Nutzer zu sein (und nicht rate-limitiert zu werden), ist es klug, eine kurze Pause - wie einen Fünf-Sekunden-Sleep - zwischen Requests einzufügen.
Profi-Tipps für Echtzeit-Tweet-Sammlung
Einige Worte der Weisheit, bevor Sie mit der Echtzeit-Tweet-Sammlung loslegen: Nicht alle Tweets sind gleich - oder zugänglich! Der Recent Search Endpunkt gibt nur öffentlich verfügbare Tweets zurück.
Um zu vermeiden, dass Sie in irrelevanten Daten ertrinken oder wichtige Tweets verpassen, halten Sie Ihre Abfrageregeln so klar und zielgerichtet wie möglich. Hier ist ein Workflow:
Erstellen Sie Ihre Abfragen sorgfältig - denken Sie an Laserfokus statt Fischernetz.
Führen Sie Ihre anfänglichen Suchen durch und überprüfen Sie die Ergebnisse.
Verfeinern und feinabstimmen Ihrer Abfragen basierend auf dem, was Sie finden.
Wiederholen Sie, bis Sie die Tweets sehen, die am wichtigsten sind.
Wenn Sie die Programmiersprache Swift verfolgen, machen Sie Ihre Abfragen klug genug, um Gespräche über Taylor Swift zu überspringen. Der Teufel steckt in den Details - und in den Hashtags!
Echtzeit-Tweets mit since_id entsperren
Neugierig, Ihre Suchergebnisse frisch zu halten? Dafür ist der Parameter since_id nützlich. Durch das Hinzufügen von since_id zu Ihrem Request teilen Sie dem Recent Search Endpunkt mit: "Zeig mir nur Tweets, die neuer sind als diese bestimmte Tweet-ID." Das ist perfekt, um Twitter nach den neuesten Updates abzufragen, ohne von Wiederholungen überwältigt zu werden. Speichern Sie einfach die neueste Tweet-ID aus Ihrem letzten Stapel und verwenden Sie sie in Ihrer nächsten Abfrage.
Aber warten Sie, es gibt noch mehr: Die Welt der Twitter API-Endpunkte
Während der Recent Search Endpunkt ein Favorit ist, ist die Twitter API eine riesige Metropole von Endpunkten, jeder bietet einzigartige Möglichkeiten zum Sammeln oder Ausführen von Daten. Einige Endpunkte ermöglichen Ihnen das Sammeln von Daten - Tweets, Nutzerprofile oder Tweet-Volumen. Andere ermöglichen Ihnen, Aktionen auszuführen - Tweets posten oder löschen, liken und unliken, folgen und entfolgen.
Für diejenigen, die an Daten interessiert sind, achten Sie besonders auf Endpunkte wie:
Recent Search: Tweets der letzten 7 Tage abrufen.
Filtered Stream: Tweets in Echtzeit überwachen, während sie gepostet werden.
User Tweet Timeline: Aktuelle Tweets eines bestimmten Nutzers abrufen.
User Lookup: Nutzerprofilinformationen in großen Mengen abrufen.
Nächste Schritte: Ihre Twitter API-Reise geht weiter
Herzlichen Glückwunsch! Sie sind jetzt ausgestattet, Tweets wie ein Profi abzurufen und zu filtern. Aber warum hier aufhören? Sehen wir uns an, wohin Sie als nächstes gehen können:
Weitere Endpunkte erkunden
Versuchen Sie den Filtered Stream Endpunkt für Echtzeit-Tweet-Überwachung
Verwenden Sie den User Tweet Timeline Endpunkt, um aktuelle Tweets eines Nutzers abzurufen
Den Twitter API-Fahrplan prüfen
Besuchen Sie den offiziellen Twitter API-Fahrplan, um zu sehen, welche spannenden Funktionen kommen
Bleiben Sie der Zeit voraus, indem Sie sich auf bevorstehende Endpunkte und Funktionen vorbereiten
Ressourcen für weiteres Lernen
Tauchen Sie ein in die Twitter API-Dokumentation für detaillierte Informationen
Treten Sie der Twitter Developer Community bei, um sich mit anderen Entwicklern zu vernetzen
Schauen Sie sich Tutorial-Videos auf dem Twitter Developer YouTube-Kanal an
Denken Sie daran, die Welt der Twitter-Daten ist riesig und ständig im Wandel. Halten Sie weiter experimenting, bleiben Sie neugierig und scheuen Sie sich nicht, neue Dinge auszuprobieren. Wer weiß? Ihr nächstes großes Projekt oder bahnbrechende Forschung könnte nur eine Abfrage entfernt sein!
Fazit
Und da haben Sie es! Sie sind jetzt ausgestattet, um in die Twitter API einzutauchen und Tweets wie ein Profi abzurufen. Von der Einrichtung Ihres Entwicklerkontos bis zur Erstellung der perfekten Abfrage haben Sie die Grundlagen. Denken Sie daran, das ist nur der Anfang Ihrer Twitter API-Reise. Halten Sie weiter Erkundungen an, experimentieren Sie und erweitern Sie die Grenzen dessen, was Sie mit diesem leistungsstarken Tool tun können. Ob Sie die nächste große Social-Media-App bauen oder bahnbrechende Forschung betreiben - die Twitter API ist Ihre Auster. Also gehen Sie voran, programmieren Sie mutig und mögen Ihre Tweets immer zahlreich sein!
Häufig gestellte Fragen
Warum sollten Sie Qodex.ai wählen?
Qodex.ai vereinfacht und beschleunigt den API-Testprozess durch den Einsatz KI-gestützter Tools und Automatisierung. Hier sind die Vorteile:
- KI-gestützte Automatisierung
Erreichen Sie 100% API-Testautomatisierung ohne eine einzige Codezeile zu schreiben. Die KI von Qodex.ai reduziert den manuellen Aufwand und liefert unvergleichliche Effizienz und Präzision.
- Benutzerfreundliche Plattform
Importieren Sie API-Sammlungen aus Postman, Swagger oder Anwendungsprotokollen und beginnen Sie in Minuten mit dem Testen. Keine steilen Lernkurven oder technisches Fachwissen erforderlich.
- Anpassbare Testszenarien
Ob Sie KI-unterstützte Testgenerierung oder manuelle Erstellung von Testfällen verwenden, Qodex.ai passt sich Ihren Bedürfnissen an. Erstellen Sie robuste Szenarien, die auf Ihre Projektanforderungen zugeschnitten sind.
- Echtzeit-Überwachung und Berichterstattung
Gewinnen Sie sofortige Einblicke in den API-Zustand, Testerfolgszahlen und Leistungsmetriken. Unsere integrierten Dashboards stellen sicher, dass Sie immer die Kontrolle haben.
- Skalierbare Kollaborationstools
Qodex.ai bietet für Teams jeder Größe Testpläne, Suiten und Dokumentation, die eine reibungslose Zusammenarbeit fördern.
- Kosten- und Zeiteffizienz
Sparen Sie Zeit und Ressourcen, indem Sie den manuellen Testaufwand eliminieren. Mit Qodex.ais Automatisierung können Sie sich auf Innovation konzentrieren und gleichzeitig Betriebskosten senken.
- Kompatibilität mit Continuous Integration/Delivery (CI/CD)
Integrieren Sie Qodex.ai einfach in Ihre CI/CD-Pipelines, um konsistentes, automatisiertes Testen während Ihres gesamten Entwicklungslebenszyklus sicherzustellen.
Wie kann ich eine E-Mail-Adresse mit Python regex validieren?
Sie können das folgende regex-Muster verwenden, um eine E-Mail-Adresse zu validieren: ^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$
Was ist Go Regex Tester?
Go Regex Tester ist ein spezialisiertes Tool für Entwickler zum Testen und Debuggen regulärer Ausdrücke in der Go-Programmierumgebung. Es bietet Echtzeit-Auswertung von regex-Mustern und unterstützt eine effiziente Musterentwicklung und Fehlerbehebung.
Discover, Test, & Secure your APIs 10x Faster than before
Auto-discover every endpoint, generate functional & security tests (OWASP Top 10), auto-heal as code changes, and run in CI/CD - no code needed.
Related Blogs



