CloneDetection

Egal ob Tweets oder Zeitungsartikel – viele Korpora enthalten Textsorten, die per se zu Duplikaten neigen. Der CorpusExplorer kann jetzt diese automatisch entfernen. Laden Sie ein Korpus. Rufen Sie die Schnappschuss-Detailansicht auf und klicken Sie auf AntiClone.

Hinweis: Aktuell ist diese Funktion nur für kleinere Schnappschüsse geeignet (bis 1 Mio. Token). Für Q1 2016 ist bereits ein Speed-Update geplant.

Clone-Detection