Screenshot der Datenbanksuche

Hier ist eine detaillierte Beschreibung der Dokumenten-Suche:


🧭 Navigationsleiste (oben)

  • Tabs:

    • Crawler: Für das automatisierte Abrufen von Inhalten.
    • Dokumenten-Suche: Aktiv im Screenshot – dient zur Volltextsuche in bereits verarbeiteten und gespeicherten Gemini-Chats.
    • Granulare Suche: Für die gezielte Extraktion einzelner Prompts oder Chatsegmente.
  • Suchfeld:

    • Eingabebeispiel „Model“ → Filtert die Dokumentenliste nach Titeln oder Inhalten, die diesen Begriff enthalten.

📄 Dokumentenliste (Mitte)

Eine tabellarische Übersicht der gespeicherten und indexierten Gemini-Chats:

  • Spalten:

    • [x]: Auswahlfeld zur Markierung einzelner Dokumente
    • ID: Eindeutige Identifikationsnummer (z. B. 382–399)
    • Titel: Beschreibungen der Chatinhalte, z. B.:
      • Model Label Mismatch and CPU Training
      • Jupyter und LLM-Training auf Pop!_OS
      • KI-Datenanalyse mit Ollama erweitern
      • ITSM-Vokabular für Ticket-Priorisierung
      • DistilBERT und k-fache Kreuzvalidierung
  • Datum:

    • Zeitstempel der Verarbeitung, z. B. „2025-12-19 14:39:47“ bis „2025-12-19 14:51:55“

Das Tool crawlt nicht nur, sondern nutzt auch eine persistente Datenbankstruktur um Inhalte langfristig zu speichern und durchsuchbar zu machen.


📋 System Log (unten)

Ein Echtzeit-Log dokumentiert die Verarbeitungsschritte:

  • Typische Einträge:

    • [GEMINI hh:mm:ss] Verarbeitet: <Titel>
    • [GEMINI hh:mm:ss] Erstelle Zusammenfassung...
    • [GEMINI hh:mm:ss] Erstellte Merged PDF...
    • [GEMINI hh:mm:ss] Fertig.
  • URLs:

    • Die verarbeiteten Inhalte stammen aus Google Gemini Share-Links, z. B.:
      https://gemini.google.com/share/blablub

Das Log zeigt, dass das Tool nicht nur einzelne Chats verarbeitet, sondern auch automatisch Zusammenfassungen erstellt und PDF-Dateien generiert.


🧠 Funktionaler Überblick

Dieser Screenshot demonstriert die Dokumentenverwaltungs- und Suchfunktion des Tools:

  • Volltextsuche über gespeicherte Gemini-Chats
  • Strukturierte Darstellung mit IDs, Titeln und Zeitstempeln
  • Auswahl und Export einzelner oder mehrerer Dokumente
  • Integration in den Crawl-Workflow mit PDF-Erstellung und Zusammenfassung
  • Ideal für wissenschaftliche Dokumentation, Projektberichte oder KI-gestützte Recherche