Dieses Update bringt größere Neuerungen mit sich und steht ganz im Zeichen „Wie kommen Daten in den CorpusExplorer und aus dem CorpusExplorer heraus?“. Folgende Neuerungen gibt es:

  • Der Publishing-Wizzard
    Diese Funktion ist in der „Schnappschuss Übersicht“ zu finden. Dort ist ein neuer „Publizieren“-Button verfügbar.

    Mit einem Klick auf den Button öffnet sich der Wizzard. Zuerst einmal sollten die Felder wie z. B. Korpusname oder Lizenz ausgefüllt werden. Wird ein Link z. B. zum Lizenztext oder einer erweiterten Projetbeschreibung angegeben, wird diese später den publizierten Daten als Download bereitgelegt (automatischer Download). Folgende Optionen stehen zur Verfügung:

    • GRÜN:
      GRÜN wie der CorpusExplorer – Daten werden im Original und Open Access veröffentlicht. Ohne Einschränkungen. Das Besondere: Es erfolgt die Abfrage, in welchen Formaten der Export erfolgen sollen. Eine Mehrfachauswahl ist möglich. Mein Tipp: Publizieren Sie ihr Korpusmaterial in so vielen Formaten wie möglich.
    • GELB:
      Mit GELB wird ein Randomizer über das gesamte Material gelegt. D. h. Sätze in einem Dokument werden zufällig vertauscht. Zusätzlich können auch die Token innerhalb des Satzes vertauscht werden. Dieses Vertauschen bricht die Schöpfungshöhe und ermöglicht trotzdem  weiterhin viele analytische Funktionen.
    • ROT:
      Während bei GRÜN/GELB verschiedene Export-Formate zur Verfügung stehen, ist ROT eine ganz extreme Form des Schutzes. Bitte wählen Sie ROT nur dann, wenn Sie das Korpus vertraulich an andere CorpusExplorer-Nutzer*innen weitergeben möchten. ROT aktiviert das neue DRM-System des CorpusExplorers (siehe unten).Hinweis: CEC6-Dateien, die mit GRÜN/GELB erzeugt werden, tragen die eingegebenen Daten wie Korpusname/Lizenz/etc. immer bei sich. Wird ein solches Korpus geladen, zeigt der CorpusExplorer die Informationen an.
  • DRM-System: Auch wenn ich ein großer OpenSource und OpenAccess Enthusiast bin und es auch bleiben werden, ist mir klar, dass bestimmte Daten vielleicht niemals direkt tauschbar sind. Dafür gibt es jetzt das erste (mir bekannte und sichere) DRM-System für Korpusdaten. DRM steht für Digital Rights Management – also ein System, das digitale Rechte verwaltet. Wird ein DRM-Korpus erstellt (siehe oben – ROT). Wird ein zufälliger Verwaltungs-Token erzeugt. Diesen Token müssen sie als Korpusverwalter*in sicher verwahren. Nur Personen, die dieses Token kennen, können neue Nutzer*innen zum Korpus hinzufügen (siehe Projekteinstellungen > Werkzeuge > DRM-Nutzerverwaltung). Nutzer werden mit E-Mail und Passwort hinzugefügt. Beide Informationen werden kryptografisch abgesichert. Eine Rekonstruktion von E-Mail oder Passwort (und natürlich auch des Token) ist nicht möglich. Das Korpus kann nur mit einer gültigen E-Mail/Passwort-Kombination entsperrt werden.
    Achtung: Wird ein DRM geschütztes Korpus in den CorpusExplorer geladen, so werden alle Export-Funktionen (auch Publizieren) bis zum nächsten Programmneustart deaktiviert – dies verhindert, dass Nutzer*innen den Schutz via Export/Publizieren umgehen können.
  • BRIDGE: Die Bridge ist ein neuer Webservice, der direkt aus dem CorpusExplorer heraus gestartet werden kann. Sie finden die Funktion ganz unten auf der Seite „Schnappschuss Übersicht“. Klicken Sie auf den Switch (siehe Pfeil), um die BRIDGE zu aktivieren. Der Service stellt dann anderen Anwendungen oder Webseiten Daten bereit. Zugriff erfolgt über den Endpunkt, der sich aus IP und PORT zusammensetzt. z. B. http://127.0.0.1:27081/ – eine Besonderheit: Der Service erlaubt auch die Anbindung per WebSocket, sodass die verbundenen Anwendungen/Webseiten in Echtzeit aktualisiert werden.
  • KorAP-API: Sie können jetzt zufällige Belege aus KorAP via KorAP-API abfragen. Klicken Sie dazu auf den entsprechenden Button. Sie müssen sich dann mit ihren KorAP-Zugangsdaten authentifizieren und dem CorpusExplorer Zugriff gewähren. Danach kann der CorpusExplorer stellvertretend für Sie Abfragen gegen KorAP schicken. Bitte beachten Sie, dass die Nutzung von KorAP das DRM-System (siehe oben) aktiviert, d. h. Sie können dann die Funktionen Exportieren/Publizieren vorübergehend (bis zum Programmneustart) nicht mehr nutzen. Entsprechend der KorAP-API-Richtlinie können Sie bis zu 10’000 Belege pro Abfrage sampeln. Zusätzlich bietet der CorpusExplorer einen eigenen Sampling-Algorithmus (Fisher-Yates Schuffel).
  • Kleinere Verbesserungen und Korrekturen – Updates von 3rd-Party Programmbibliotheken.