Система улучшает традиционное NER (распознавание именованных сущностей) для обнаружения PII (персонально идентифицируемой информации) за счет использования Wikidata для создания газетчиков DEM (демографических данных) и MISC (разных данных), создания корпуса с серебряными метками и тонкой настройки модели RoBERTa для распознавания текстовых фрагментов, ориентированных на конфиденциальность.
bsky.app
Hacker & Security News on Bluesky @hacker.at.thenote.app
hackernoon.com
How to Develop a Privacy-First Entity Recognition System
Create attached notes ...
