Daten Verarbeitung

Seit Tag eins bei bchic ist unser Credo: maximale Transparenz. Wir wollen genau zeigen, wie wir Daten verarbeiten und speichern. Für uns ist klar: Wir halten uns an alle relevanten Datenschutzgesetze und setzen konsequent auf Datenminimierung. Das bedeutet: Wir verarbeiten und speichern nur das, was wirklich nötig, nützlich und datenschutzfreundlich ist.

Tauchen wir gemeinsam ein und schauen uns ganz genau an, was passiert, wenn unser bchic-Skript auf deiner Website landet und wie es dabei die Privatsphäre deiner Besucher schützt.

Stell dir vor: Du hast gerade das bchic Analytics-Skript auf deiner Website eingebunden oder unser Plugin in deinem CMS aktiviert. Das Skript ist jetzt live und bereit, datenschutzkonforme Website-Daten zu erfassen. Sobald du (oder ein anderer Besucher) deine Seite im Browser aufrufst...

Dein Cookie-freies Skript lädt blitzschnell

Das bchic-Einbettungsskript (eine kleine JavaScript-Datei) wird von unserem globalen Content Delivery Network (CDN) geladen. Das hat einen Riesenvorteil: Die Datei kommt blitzschnell von einem Server, der dir am nächsten ist – oft in nur 30 Millisekunden.

Sobald das Skript geladen ist, wird eine Seitenaufrufanfrage an unsere Server gesendet. Befindet sich der Besucher in der EU, geht die Anfrage über unsere EU-Isolation an unsere Server in der EU. Außerhalb der EU läuft sie über unsere US-Server. Diese Anfrage enthält dann Infos zur aktuell besuchten Seite und zur verweisenden Website. Dein Browser übermittelt uns außerdem deine IP-Adresse und deinen User-Agent (der Infos zu deinem Browser und Gerät enthält). Das Beste daran: Wir nutzen keine Cookies. Tschüss, nerviges Cookie-Banner, das die halbe Seite blockiert!

Unsere digitale Festung: die Firewall

Wir überwachen genau, wie viele Anfragen jede IP-Adresse pro Sekunde und über Zeiträume von 1 Sekunde bis 5 Minuten stellt. Das hilft uns, DDoS-Spam-Angriffe abzuwehren. Und ja, Besucher aus der EU werden natürlich weiterhin über unsere EU-Infrastruktur geleitet.

Persönliche Daten speichern wir prinzipiell nicht in unseren Logs – das widerspricht fundamental unseren Werten. Der einzige Ausnahmefall, in dem wir eine IP-Adresse temporär speichern, ist, wenn sie als Angreifer eingestuft wird (z.B. bei einem DDoS-Angriff).

Sicherheitschecks im Detail

Wir erfassen, wie viele Anfragen deine IP-Adresse an unser System sendet. Das machen wir zwar schon auf Firewall-Ebene, aber zusätzlich haben wir auch eine eigene Anwendungslogik, um uns vor Spam-Attacken zu schützen. Die Daten, die wir dabei erfassen, sehen zum Beispiel so aus:

111.22.333.444 = 3 requests
444.22.333.444 = 2 requests

Die genauen Speicherfristen variieren und werden aus Sicherheitsgründen nicht öffentlich kommuniziert. Aber sei versichert: Wir wenden hier strenge Datenminimierung an. Länger als 24 Stunden nach deiner ersten Anfrage wird deine IP-Zählung nicht gespeichert – ähnlich unserer Zugriffslog-Richtlinie.

Sollten wir geringfügigen Missbrauch feststellen, wird die IP-Adresse auf Anwendungsebene kurzzeitig blockiert. Bei schwerwiegenderem Missbrauch sperren wir die IP-Adresse dauerhaft auf Firewall-Ebene. Das bedeutet, die IP-Adresse bleibt dann zum Schutz unserer Systeme gespeichert. Bislang ist das zum Glück nur einmal vorgekommen.

Bist du neu hier?

Sobald du unsere Firewall passiert hast, müssen wir erkennen, ob es sich um einen neuen oder wiederkehrenden Besuch auf deiner Website handelt. Dafür nutzen wir eine Methode zur Erkennung einzigartiger Besucher, die wir 2019 entwickelt haben. Kurz gesagt: Wir verwenden SHA256-Hashes (informier dich gerne über Hashes und Salts!), um über 24 Stunden hinweg einzigartige Besucher zu identifizieren – und das ganz ohne Datenschutzrisiko.

Hier ein Beispiel der Daten, die wir erhalten, wenn du eine Website besuchst, die bchic nutzt:

{
  "user_signature": "e5c7a9b0c2d1e6f8a3b5c7d9e1f3a5b7c9d1e3f5a7b9c1d3e5f7a9b1c3d5e7f9",
  "page_request_signature": "a1b2c3d4e5f6a7b8c9d0e1f2a3b4c5d6e7f8a9b0c1d2e3f4a5b6c7d8e9f0a1b2",
  "hostname": "example.com",
  "pathname": "/blog/artikel-123",
  "referrer": "google.com",
  "screen_width": 1920,
  "screen_height": 1080,
  "time_on_page": null
}

Eines unserer wichtigsten Entwicklungsprinzipien ist es, deine Rohdaten (IP und User-Agent) nicht zusammen mit deinen Browser-Aktivitäten zu speichern. Das wäre nicht datenschutzfreundlich genug. Stattdessen erstellen wir eine anonymisierte "Signatur", die wir für spätere Besuche nutzen können.

Viele Analyse-Anbieter speichern deine rohe IP-Adresse und deinen User-Agent direkt neben deinen Surf-Aktivitäten. Das lehnen wir strikt ab. Wir werden das niemals tun. Rohe IP-Adressen speichern wir ausschließlich zu Sicherheitszwecken, und sie tauchen weder in unseren Kundendaten-Exports noch in den Dashboards auf. IP-Adressen werden von uns nur dann näher geprüft, wenn wir unter einem DDoS-Angriff stehen und unser Schutzteam bösartige Akteure identifizieren muss.

Hier die Details zu unseren Hashes:

User Signature Hash (Nutzer-Signatur-Hash): Das ist unser Basis-Hash. So können wir einen Besucher (also dich) anonym identifizieren, ohne zu wissen, wer du wirklich bist. Das ermöglicht uns, website-weite, einzigartige Besuche zu erfassen. Dieser Hash wird zusammen mit deinen Seitenaufrufen gespeichert und dient auch dazu, Spam-Aufrufe zu filtern. Wir erstellen ihn aus folgenden Daten:
- Salt (Salz): Jede Website hat einen einzigartigen Salt, der täglich um Mitternacht erneuert wird. Das macht es einem Hacker unmöglich, die Hashes per Brute-Force zu knacken. Mehr zum Brute-Forcing weiter unten.
- IP-Adresse: Meist einzigartig für dein Netzwerk, selbsterklärend. Auch wenn du manchmal ein geteiltes Netzwerk oder einen Proxy nutzt, ist sie meist zuverlässig.
- User-Agent: Zusammen mit der IP-Adresse erhöht der User-Agent oft die Einzigartigkeit der Nutzer-Signatur.
- Hostname: Die Website-Adresse (z.B. http://www.beispielseite.de). Dieser Parameter ist entscheidend, denn er verhindert, dass wir Browser-Aktivitäten über verschiedene Websites hinweg verfolgen können.
Page Request Signature Hash (Seitenanfrage-Signatur-Hash): Jedes Mal, wenn du eine Seite aufrufst, generieren wir einen Hash, der uns signalisiert, dass diese Seite angesehen wurde. Damit erfassen wir einzigartige Aufrufe auf Seitenebene. Dieser Hash setzt sich zusammen aus:
- User Signature (Nutzer-Signatur): Die Nutzer-Signatur ist die Basis dieses Hashes.
- Pathname (Pfadname): Der aufgerufene Pfad (z.B. /blog).

Danach prüfen wir, ob diese Hashes bereits in unserer Datenbank existieren. Wenn nicht, handelt es sich um einen neuen, einzigartigen Besucher. Wenn doch, ist es ein wiederkehrender. Sind die Hashes neu, fügen wir sie hinzu; sie werden dann automatisch um Mitternacht gelöscht.

Das Geniale an diesem Hash-System? Wir (oder sonst jemand) können absolut nichts mit diesen Hashes anfangen – wir können sie nicht "entziffern", um persönliche Details zu sehen. Sie sind nur für die Dauer einer Datenbank-Existenzprüfung wertvoll. Darüber hinaus sind sie komplett, wunderbar nutzlos:

Selbst wenn es jemandem gelänge, in AWS einzubrechen, wo unsere Server gehostet sind, und alle unsere Hashes und Salt-Keys in die Finger zu bekommen, gäbe es immer noch Quadrillionen möglicher Kombinationen für einen Brute-Force-Angriff. Niemand auf diesem Planeten hat die Ressourcen, das zu knacken. Wir haben die Zahlen gecheckt: Dein Hacking-Budget müsste das Vielfache des weltweiten Bruttoinlandsprodukts betragen – Hunderte von Billionen Dollar.

Seitenaufrufe runden wir auf die nächste volle Stunde auf, anstatt sie sekundengenau zu erfassen. Warum? Weil wir so verhindern, dass unsere Zugriffslogs (die sekundenbasierte Daten enthalten) mit unserer Datenbank der Browser-Aktivitäten abgeglichen werden können. Das tun wir ganz bewusst, um deine Privatsphäre zu schützen.

Speichern des Seitenaufrufs

Wir sammeln Daten für Seiten, Referrer und weitere Statistiken (z.B. Browser-Statistiken, Gerätetyp-Statistiken, Länder-Statistiken). Das tun wir, um dir ein blitzschnelles Dashboard-Erlebnis und maximale Performance zu garantieren.

Ein Beispiel, wie wir Daten für Seitenstatistiken erfassen:

{
    id: 232332323234234,
    user_signature: 5f9b9f01f747722565af71b4e602dc6239f050616b2dfa00944db79b84804c32,
    site_id: 1234,
    hostname: http://www.milliondollarhomepage.com
    pathname: /blog
    is_new_visit: true,
    is_new_session: true,
    is_unique: true,
    referrer_hostname: https://bing.com,
    referrer_pathname: /about,
    timestamp: 2021-01-01 00:01:05,
    duration: 0,
}

Beachte: Der oben genannte Datensatz enthält keinerlei persönliche Daten. Die Nutzer-Signatur ist technisch gesehen gemäß DSGVO pseudononymisiert, aber das ist nur eine Formalität. Einen Hash wie diesen kann man nicht per Brute-Force knacken. Wir bezeichnen die user_signature als praktisch anonym. Hättest du wirklich Hunderte von Billionen von Dollar, könntest du sie vielleicht knacken – aber das ist pure Theorie.

{
    site_id: 1234,
    hostname: https://milliondollarhomepage.com,
    pathname: /blog,
    pageviews: 1,
    visits: 1,
    timestamp: 2021-01-01 00:00:00 (aggregated to current hour)
}

Ähnlich funktioniert es für Referrer-, Browser-Statistiken und so weiter. Bei Browser-Statistiken speichern wir natürlich browser_name und browser_version anstelle von Hostname und Pfadname.

Absprünge & Verweildauer erfassen

Wenn ein Nutzer eine Seite verlässt, versuchen wir, eine zweite Anfrage zu senden. Browser-spezifische Regeln können das manchmal verhindern, aber in den meisten Fällen, da die gängigsten Browser dies unterstützen, funktioniert es.

Wenn diese zweite Anfrage ausgelöst wird, enthält sie alle Infos der ersten Anfrage – plus die Verweildauer auf der Seite (in Sekunden). Da wir eine zweite Anfrage erhalten, wissen wir auch: Es war kein Absprung. So können wir den vorherigen Seitenaufruf (über die Nutzer-Signatur) aktualisieren, die Dauer speichern, ihn als 'kein Absprung' markieren und dann die aggregierten Tabellen (Seiten-, Browser-Statistiken etc.) aktualisieren.

Datenerfassung – ganz ohne Privatsphären-Eingriffe

Das war's!

So verarbeiten wir deinen Website-Besuch mit bchic – und das gilt für jeden einzelnen Besuch, der über unser Analyse-Skript läuft. Wir konnten wertvolle Informationen für dein Business gewinnen, ohne die Privatsphäre deiner Besucher zu verletzen. Genau so sollte es sein. Wir müssen nicht in die Privatsphäre deiner Website-Besucher eindringen, um dir nützliche Daten zu liefern. Wir haben Tausende von Stunden investiert, um die datenschutzfreundlichsten Methoden zu entwickeln und umzusetzen – und deine Website-Besucher werden es dir danken.

Nachdem du dies nun gelesen hast, hast du einen umfassenden Einblick in unsere Arbeitsweise bei bchic analytics bekommen. Vielleicht fragst du dich jetzt noch, wie das alles mit dem Datenschutzrecht zusammenpasst. Wir sind glücklich, einen erstklassigen, in der EU ansässigen Datenschutzbeauftragten zu haben, Zugriff auf exzellente Anwälte und eine echte Leidenschaft für Datenschutzrecht.

Hier ist eine Übersicht der Datenschutzstandards, auf die wir uns bei bchic analytics, unserem datenschutzfreundlichen Analysedienst, konzentrieren:

DSGVO-Konformität (GDPR Compliance)
Schrems II-Konformität
ePrivacy-Konformität (Cookie-Gesetz)
PECR-Konformität
COPPA-Konformität
CCPA-Konformität

Du hast noch Fragen zur Datenverarbeitung? Melde dich jederzeit bei uns!