Hajm 416 sahifalar
2013 yil
Обработка неструктурированных текстов. Поиск, организация и манипулирование
Kitob haqida
В книге описаны инструменты и методы обработки неструктурированных текстов. Прочитав ее, вы научитесь пользоваться полнотекстовым поиском, распознавать имена собственные, производить кластеризацию, пометку, извлечение информации и автореферирование. Знакомство с фундаментальными принципами сопровождается изучением реальных применений.
Издание предназначено для читателей без подготовки в области математической статистики и обработки естественных языков. Примеры написаны на Java, но сами идеи могут быть реализованы на любом языке программирования.
Прекрасная книга и притом единственная на русском языке, которая охватывает целый спектр современных инструментов для обработки неструктурированного текста, таких как Apache Tika и Apache Solr (он же Apache Lucene, свободный поисковик)
Прекрасная книга! Одна из редких книг по NLP на русском. Всё расписано от отдельных алгоритмов до построения полноценной системы поиска. Одно жалко, что на Джаве. Но ничего, перепишу на Питон.
Izohlar, 2 izohlar2