Das System verbessert das traditionelle NER (Named Entity Recognition) für die Erkennung von personenbezogenen Daten (PII), indem es Wikidata nutzt, um DEM- und MISC-Gazetteers aufzubauen, einen "silver-labeled" Korpus erstellt und ein RoBERTa-Modell für die datenschutzorientierte Erkennung von Textabschnitten (Spans) feinabstimmt.
hackernoon.com
How to Develop a Privacy-First Entity Recognition System
bsky.app
Hacker & Security News on Bluesky @hacker.at.thenote.app
Create attached notes ...
