Морфологический анализ
Мы предлагаем быстрый и эффективный модуль морфологического анализа, который используется
во всех наших разработках. Основные характеристики модуля:
- Относится к классу POS-Tagger.
- Примерная скорость: около 2Мб текста в секунду на компьютере средней мощности.
- Языки: русский, украинский и английский.
- Для неизвестных слов формируются гипотезы (по похожим окончаниям).
- Для каждой словоформы предлагается её нормальная форма (лемма).
- При токенизации используются алгоритмы, учитывающие возможные тексто-графические замены
(когда некоторые буквы кириллицы записываются латиницей или цифрами и т.п.).
Документацию можно посмотреть
здесь.
Попробуйте сами: задайте любой текст и нажмите