Курс изучает теоретические и практические основы обработки естественного языка. В курсе рассматриваются теоретические аспекты NLP, включая базовые сведения из области лингвистики, и практические методы обработки текстов. Рассматриваются классические алгоритмы обработки текстовой информации, такие как регулярные выражения, измерение расстояний, подстановок, поиск строк и подстрок. Лингвистические деревья. Корпус текста. Таксономия. Рассматриваются модели Word2Vec, Text Embeding, LSTM модели нейронных сетей. Изучаются существующие библиотеки анализа текстовой информации.