Обзор лингвистических Perl модулей

  • Lingua::Ispell - проверка орфографии;
  • Lingua::Ident - автоопределение языка по отрывку текста;
  • Lingua::Num2Word - преобразование цифр в буквенное написание;
  • Lingua::RU::Number - буквенное написание денежной суммы (в рублях);
  • Lingua::RU::PhTranslit - преобразование текста в правильный транслит или другую русскую кодировку;
  • Lingua::DetectCharset, Lingua::DetectCyrillic - определение русской кодировки по отрывку текста;
  • Lingua::RU::Charset - преобразование из одной кодировки в другую;
  • Snowball Stemmer - работа с русскими словарными формами (стемминг, выделение корня убирая суффиксы и окончания);