Пенг Шао | Интервью по машинному обучению. 151 вопрос от FAANG (2026) [PDF]
Автор: Пенг Шао
Перевод: В.Щербакова
Издательство: Питер
Серия: Библиотека программиста
ISBN: 978-5-4461-4414-3
Жанр: Компьютерная литература. Учебное пособие
Формат: PDF
Качество: Изначально электронное (ebook)
Иллюстрации: Черно-белые
Описание:Хотите построить карьеру в области ML? Воспользуйтесь опытом и советами Пенга Шао, чтобы научиться тому, как успешно пройти собеседование по машинному обучению.
Книга охватывает весь процесс подготовки к интервью: от базовых концепций ML и программирования до проектирования сложных систем и инфраструктуры. Практические примеры, стратегии ответов на типичные вопросы и советы по прохождению различных этапов интервью помогут вам уверенно справиться как с техническим телефонным скринингом, так и с углубленным обсуждением моделей и оценок. Независимо от уровня — новичок вы или опытный специалист — эта книга станет вашим надежным навигатором в мире ML-собеседований, сочетая теорию, практику и реальные инсайты от экспертов.
Вы с легкостью справитесь с вопросами: «Как собрать и подготовить датасет?», «Какие проблемы возникают при сборе данных?», «Что делать с несбалансированными метками или неразмеченными данными?», «Как выполнить отбор признаков?», а также сможете реализовать резервуарное семплирование, построить матрицу совместной встречаемости из корпуса текста, спроектировать рекомендательную систему для YouTube или Amazon и многое другое.
Внутри:
Четкая структура собеседования по ML: от основ и программирования до проектирования систем и инфраструктуры.
Проверенные стратегии решения задач ML, основанные на реальной практике.
Пошаговое руководство по прохождению заданий — от кода до архитектуры.
Анализ логики экспертов, проводящих собеседование: что они действительно ценят и как показать себя с лучшей стороны.
Практические кейсы, отражающие развитие подходов к ML — от первых шагов до новейших решений.
Книга — настоящая находка! Она дает не просто структуру подготовки к сложным ML-интервью с реальными примерами, но и ключ к пониманию мышления интервьюеров, а значит — к успешному прохождению собеседований.
Силинская Мария — старший консультант по трансформации бизнеса в компании Крок, сертифицированный скрам-мастер PSM II, научный редактор книги.
Содержание
От издательства
О научном редакторе русского издания
1 Введение
Как читать эту книгу
Предварительная подготовка
Ход собеседования
Техническое телефонное собеседование
Собеседование по основам ML
Собеседование по программированию ML
Собеседование по проектированию систем ML
Другие этапы собеседования
Составляющие успешного ответа
2 Основы ML
Вопросы для подготовки
Датасеты
Признаки
Моделирование
Оценка
Ответы
Датасеты
Признаки
Моделирование
Оценка
3 Программирование в ML
На что обращают внимание интервьюеры
Реализация алгоритма ML
Вопросы для подготовки
Стратегия подготовки
Вопросы по теории вероятностей и статистике
Вопросы для подготовки
Стратегия подготовки
Хеш-таблицы и распределенное программирование
Вопросы для подготовки
Стратегия подготовки
Другие задачи по программированию
Вопросы для подготовки
Стратегия подготовки
4 Проектирование систем ML Часть 1
Структура ответа
Вопросы для подготовки
Уточнение задачи
Высокоуровневое проектирование
Сбор данных
Отбор кандидатов
Предварительное ранжирование
Генерация признаков
Моделирование и оценка
Развертывание и сервинг
Ответы
Уточнение задачи
Высокоуровневое проектирование
Сбор данных
Отбор кандидатов
Предварительное ранжирование
Ге н ерация признаков
Моделирование и оценка
Развертывание и сервинг
5 Проектирование систем ML Часть 2
Информационный поиск и ранжирование по проектированию
Вопросы для подготовки
Высокоуровневое проектирование
Сбор данных
Генерация признаков
Моделирование и оценка
Развертывание и сервинг
Высокоуровневое проектирование
Парсинг документов
Анализ тональности
Тематическое моделирование
Резюмирование текста
Понимание естественного языка
Сбор данных
Обучение с учителем
Обучение без учителя
Генерация признаков
Дискриминативный подход
Генеративный подход
Моделирование и оценка
Извлечение информации
Классификация
Регрессия
Тематическое моделирование
Кластеризация
Генеративное моделирование
Развертывание и сервинг
Примечание о больших языковых моделях
6 Проектирование инфраструктуры ML
Вопросы для подготовки
Офлайн
Онлайн
Ответы
Офлайн
Онлайн
7 Вопросы продвинутого уровня
Отложенные метки
Обучение без меток
Модели ценообразования
Приложение
Генеративные модели: от модели зашумленного канала до LLM
Ссылки на источники
Об авторе
Пенг Шао
На протяжении более 15 лет Шао Пенг занимает руководящие позиции в области машинного обучения, работая в самых разных отраслях — от социальных сетей и рекламы до финтеха и онлайн-торговли. Проведя около тысячи собеседований, он как никто другой понимает, какими знаниями, навыками и опытом должен обладать сильный кандидат в сфере ML.
В компании Twitter он занимал должность стафф-инженера по ML, где отвечал за разработку ключевых компонентов, лежащих в основе алгоритмов рекомендаций, а также систем прогнозирования и ранжирования рекламы. Ранее он стал сооснователем стартапа в сфере искусственного интеллекта под названием Roxy, который привлек многомиллионные инвестиции и был успешно продан в 2019 году.
В более ранний период своей карьеры он руководил ML-командами в Amazon и FactSet. В рамках этих проектов он курировал разработку целого ряда систем ML, включая машинный перевод, извлечение табличных данных, распознавание именованных сущностей и тематическое моделирование.
Шао Пенг — признанный эксперт в области высокоэффективного ранжирования с низкой задержкой. Как практикующий ML-инженер, он применяет системный подход к проектированию решений на базе ML, охватывающий все ключевые этапы: от анализа данных и моделирования до управления признаками и построения инфраструктуры.
Скриншоты:
Время раздачи: по мере возможности (минимум до появления первых 3-5 скачавших)