В. Бабушкин, А.Кравченко | Машинное обучение. Проектирование систем от идеи до реализации [2 книги] (2025, 2026) [PDF, EPUB, MOBI, AZW3]
Автор: В. Бабушкин, А.Кравченко
Перевод: В. Щербакова
Издательство: Manning Publications, Питер
Серия: Библиотека пользователя
ISBN: 978-1-6334-3875-0, 978-5-4461-4373-3
Жанр: Компьютерная литература
Язык: Русский, английский
Формат: PDF, EPUB, MOBI
Качество: Изначально электронное (ebook)
Иллюстрации: Цветные и черно-белые
Описание:Проектирование и развертывание системы машинного обучения — это сложный многоэтапный процесс, требующий разнообразных компетенций и участия специалистов разных ролей. Независимо от того, интегрируете ли вы ML в существующий проект или проектируете ML-систему с нуля, вам необходимо ориентироваться в огромных датасетах и потоках, определять требования к тестированию и развертыванию, а также учитывать сложности внедрения ML-моделей в продакшен. Это практическое руководство по полному циклу разработки ML-проектов. Вы шаг за шагом пройдете весь фреймворк: проектирование, внедрение, релиз и сопровождение ML-системы. Чек-листы с необходимыми требованиями и примеры из реальной практики помогут развернуть и оптимизировать вашу собственную ML-систему. Вам особенно понравятся авторские байки и советы из личного опыта авторов, а также рекомендации по подготовке к System design интервью.
Краткое содержание
Часть 1. Подготовка к работе
Глава 1. Основы проектирования систем машинного обучения
Глава 2. В чем проблема?
Глава 3. Предварительное изучение
Глава 4. Дизайн-документ
Часть 2. Первые шаги
Глава 5. Функции потерь и метрики
Глава 6. Подготовка датасета
Глава 7. Схемы валидации
Глава 8. Базовая модель
Часть 3. Промежуточные этапы
Глава 9. Анализ ошибок
Глава 10. Пайплайны обучения
Глава 11. Признаки и генерация признаков
Глава 12. Измерение и представление результатов
Часть 4. Интеграция и масштабирование
Глава 13. Интеграция
Глава 14. Мониторинг и надежность
Глава 15. Сервинг и оптимизация инференса
Глава 16. Владение и сопровождение
Об авторах
Валерий Бабушкин — опытный руководитель в области анализа данных с обширным опытом работы в технологической индустрии. В настоящее время он занимает должность вице-президента по анализу данных в Blockchain.com, где отвечает за руководство инициативами компании, основанными на данных. До прихода в Blockchain.com Валерий занимал ключевые должности в ведущих технологических компаниях, таких как Facebook, Alibaba и X5 Retail Group.
Арсений Кравченко — опытный инженер по машинному обучению с подтвержденным опытом создания и оптимизации надежных систем машинного обучения для стартапов, включая обработку видео в реальном времени, оптимизацию производства и анализ финансовых транзакций.
В оригинале
Machine Learning System Design: With end-to-end examples by Valerii Babushkin, Arseny Kravchenko
Get the big picture and the important details with this end-to-end guide for designing highly effective, reliable machine learning systems.
From information gathering to release and maintenance, Machine Learning System Design guides you step-by-step through every stage of the machine learning process. Inside, you’ll find a reliable framework for building, maintaining, and improving machine learning systems at any scale or complexity.
In «Machine Learning System Design: With end-to-end examples» you will learn:
The big picture of machine learning system design.
Analyzing a problem space to identify the optimal ML solution.
Ace ML system design interviews.
Selecting appropriate metrics and evaluation criteria.
Prioritizing tasks at different stages of ML system design.
Solving dataset-related problems with data gathering, error analysis, and feature engineering.
Recognizing common pitfalls in ML system development.
Designing ML systems to be lean, maintainable, and extensible over time.
Authors Valeri Babushkin and Arseny Kravchenko have filled this unique handbook with campfire stories and personal tips from their own extensive careers. You’ll learn directly from their experience as you consider every facet of a machine learning system, from requirements gathering and data sourcing to deployment and management of the finished system.
About the technology
Designing and delivering a machine learning system is an intricate multistep process that requires many skills and roles. Whether you’re an engineer adding machine learning to an existing application or designing a ML system from the ground up, you need to navigate massive datasets and streams, lock down testing and deployment requirements, and master the unique complexities of putting ML models into production. That’s where this book comes in.
About the book
Machine Learning System Design shows you how to design and deploy a machine learning project from start to finish. You’ll follow a step-by-step framework for designing, implementing, releasing, and maintaining ML systems. As you go, requirement checklists and real-world examples help you prepare to deliver and optimize your own ML systems. You’ll especially love the campfire stories and personal tips, and ML system design interview tips.
What's inside
Metrics and evaluation criteria.
Solve common dataset problems.
Common pitfalls in ML system development.
ML system design interview tips.
About the reader
For readers who know the basics of software engineering and machine learning. Examples in Python.
About the Author
Valerii Babushkin is an accomplished data science leader with extensive experience in the tech industry. He currently serves as the VP of Data Science at Blockchain.com, where he is responsible for leading the company's data-driven initiatives. Prior to joining Blockchain.com, Valerii held key roles at leading tech companies, such as Facebook, Alibaba, and X5 Retail Group.
Arseny Kravchenko is a seasoned ML engineer with a proven track record of building and optimizing reliable ML systems for startups, including real-time video processing, manufacturing optimization, and financial transactions analysis.
Table of Contents
Part 1
Essentials of machine learning system design
Is there a problem?
Preliminary research
Design document
Part 2
Loss functions and metrics
Gathering datasets
Validation schemas
Baseline solution
Part 3
Error analysis
Training pipelines
Features and feature engineering
Measuring and reporting results
Part 4
Integration
Monitoring and reliability
Serving and inference optimization
Ownership and maintenance
Скриншоты:
Время раздачи: с 10.00 до 21.00 (минимум до появления первых 3-5 скачавших)