Познакомимся с историей языковых моделей: N-граммы, Word2Vec, GPT 1-4, открытые LLM, рассмотрим базовые компоненты LLM и библиотеки для работы с ними, изучим токенизаторы для LLM, алгоритм BPE, разберем деплой и параметры инференса LLM, познакомимся с продвинутыми компонентами современных LLM и техниками промпт инженеринга, займемся файтюнингом LLM, рассмотрим квантизацию и ее виды, а также изучим методы ускорения инференса и их реализации