Сообщество RSS DEV

Сравнение библиотек обнаружения языка (& API) с использованием Java/ColdFusion/CFML

Автор ранее использовал fork библиотеки Optimaize под названием kju2 для обнаружения языка в прошлом проекте, но теперь этот fork находится в режиме только для чтения. Lingua, другая библиотека Java, активно обновляется и заявляет о высокой точности, но была немного медленнее в тестировании и не смогла корректно определить текст на малайском языке. Обе библиотеки демонстрировали нестабильную производительность для английского языка, с временем обнаружения от миллисекунд до десятков тысяч миллисекунд. API Detect Language от третьей стороны предлагает поддержку 165 языков и заявляет о высокой точности, требует API-ключа и предлагает бесплатный и премиум-планы. Автор ищет мнения других разработчиков, использующих Java и ColdFusion/CFML для обнаружения языка, и делится своими опытом и предпочтительными библиотеками или API. Предоставленные данные включают результаты обнаружения языка от kju2, Lingua и API для различных языков, демонстрируя производительность каждого подхода. Данные подчеркивают, что хотя kju2 кажется быстрее, Lingua предлагает более высокую точность для большинства языков, за исключением малайского. API предлагает более широкую поддержку языков, но требует API-ключа. Опыт автора и предоставленные данные могут служить ценным справочником для разработчиков, ищущих подходящие решения для обнаружения языка.
favicon
dev.to
Comparing Language Detection Libraries (& API) Using Java/ColdFusion/CFML