RSS HackerNoon

Как разработать систему распознавания сущностей, ориентированную на конфиденциальность

Система улучшает традиционное NER (распознавание именованных сущностей) для обнаружения PII (персонально идентифицируемой информации) за счет использования Wikidata для создания газетчиков DEM (демографических данных) и MISC (разных данных), создания корпуса с серебряными метками и тонкой настройки модели RoBERTa для распознавания текстовых фрагментов, ориентированных на конфиденциальность.
favicon
bsky.app
Hacker & Security News on Bluesky @hacker.at.thenote.app
favicon
hackernoon.com
How to Develop a Privacy-First Entity Recognition System
Create attached notes ...