пятница, 19 апреля 2013 г.

Lucene в .net и словари hunspell

Недавно на работе мне задали такую задачку: замутить в  lucene поиск не только по точному совпадению ключевого слова, а также по его свловоформам.
А, надо сказать, проект у нас написан на .net и порт lucene там довольно старый (lucene 3.0.3). А что это значило для меня? А то, что штатной поддержки морфологии нужного мне языка не было. Я пошерстил интернет в поисках отвеа на вопрос: что же lucene может предложить в вопросах морфологии и стемминга той кучи языков, которую она не поодерживает из коробки?