СЕМАНТИК


Морфологический анализ

Мы предлагаем быстрый и эффективный модуль морфологического анализа, который используется во всех наших разработках. Основные характеристики модуля:

  • Относится к классу POS-Tagger.
  • Примерная скорость: около 2Мб текста в секунду на компьютере средней мощности.
  • Языки: русский, украинский и английский.
  • Для неизвестных слов формируются гипотезы (по похожим окончаниям).
  • Для каждой словоформы предлагается её нормальная форма (лемма).
  • При токенизации используются алгоритмы, учитывающие возможные тексто-графические замены (когда некоторые буквы кириллицы записываются латиницей или цифрами и т.п.).

Документацию можно посмотреть здесь.

Попробуйте сами: задайте любой текст и нажмите


 
 

Контактная информация

ООО Семантик
ул. Чечулина д.11 корп.2
г. Москва, Россия

E-mail: semantick@mail.ru
Тел.: +7 (495) 960-67-50