
عنوان:
Beginning Apache Spark 3
نویسنده:
Hien Luu
انتشارات:
Apress
تاریخ انتشار:
2021
حجم:
3.7MB
معرفی کتاب : " آغاز کار با Apache Spark 3: با DataFrame، Spark SQL، Structured Streaming و کتابخانه یادگیری ماشین Spark "
با این کتاب، سفری به دنیای Apache Spark 3.0 خواهید داشت تا آن را کشف، یاد بگیرید و استفاده کنید. در این کتاب، شما مهارتهای لازم برای کار با موتور پردازش داده توزیعشده و قدرتمند Apache Spark، مدل برنامهنویسی کاربرپسند، جامع و انعطافپذیر برای پردازش دادهها در حالت batch و streaming، و الگوریتمها و ابزارهای مقیاسپذیر یادگیری ماشین برای ساخت برنامههای یادگیری ماشین را کسب خواهید کرد.
کتاب Beginning Apache Spark 3 با توضیح روشهای مختلف تعامل با Apache Spark شروع میشود، مانند مفاهیم و معماری Spark و Spark Unified Stack. سپس مروری بر Spark SQL ارائه میدهد و بعد به ویژگیهای پیشرفته آن میپردازد. کتاب نکات و تکنیکهایی برای حل مشکلات عملکردی را ارائه میکند و پس از آن موتور پردازش Structured Streaming را معرفی میکند. در پایان، نحوه توسعه برنامههای یادگیری ماشین با Spark MLlib و مدیریت چرخه توسعه یادگیری ماشین آموزش داده میشود. مثالها و قطعهکدهای عملی به شما کمک میکند مفاهیم را بلافاصله پس از یادگیری تمرین و درک کنید.
پس از مطالعه این کتاب، شما دانش لازم برای ساخت فرآیندهای دادهای بزرگ، اپلیکیشنها و برنامههای یادگیری ماشین را خواهید داشت.
آنچه خواهید آموخت:
- تسلط بر موتور تحلیلی یکپارچه Spark و اجزای مختلف آن
- کار با موتور پردازش داده مقیاسپذیر، مقاوم و با عملکرد بالا
- استفاده از مدل برنامهنویسی کاربرپسند و انعطافپذیر برای انجام تحلیلهای ساده تا پیچیده با dataframe و Spark SQL
- توسعه برنامههای یادگیری ماشین با Spark MLlib
- مدیریت چرخه توسعه یادگیری ماشین با MLflow
مخاطب کتاب:
این کتاب برای دانشمندان داده، مهندسان داده و توسعهدهندگان نرمافزار نوشته شده است.
فهرست مطالب
- Table of Contents
- About the Author
- About the Technical Reviewers
- Acknowledgments
- Introduction
- Chapter 1: Introduction to Apache Spark
- Overview
- History
- Spark Core Concepts and Architecture
- Apache Spark 3.0
- Apache Spark Applications
- Spark Example Applications
- Apache Spark Ecosystem
- Summary
- Chapter 2: Working with Apache Spark
- Downloading and Installation
- Having Fun with the Spark Scala Shell
- Introduction to Collaborative Notebooks
- Setting up Spark Source Code
- Summary
- Chapter 3: Spark SQL: Foundation
- Understanding RDD
- Introduction to the DataFrame API
- Creating a DataFrame
- Introduction to Datasets
- Using SQL in Spark SQL
- Writing Data Out to Storage Systems
- The Trio: DataFrame, Dataset, and SQL
- DataFrame Persistence
- Summary
- Chapter 4: Spark SQL: Advanced
- Aggregations
- Joins
- Functions
- Advanced Analytics Functions
- Exploring Catalyst Optimizer
- Summary
- Chapter 5: Optimizing Spark Applications
- Common Performance Issues
- Leverage In-Memory Computation
- Understanding Spark Joins
- Adaptive Query Execution
- Summary
- Chapter 6: Spark Streaming
- Stream Processing
- Spark Streaming Overview
- Spark DStream
- Summary
- Chapter 7: Advanced Spark Streaming
- Event Time
- Arbitrary Stateful Processing
- Handling Duplicate Data
- Fault Tolerance
- Streaming Query Metrics and Monitoring
- Summary
- Chapter 8: Machine Learning with Spark
- Machine Learning Overview
- Spark Machine Learning Library
- Machine Learning Tasks in Action
- Deep Learning Pipeline
- Summary
- Chapter 9: Managing the Machine Learning Life Cycle
- The Rise of MLOps
- MLflow Overview
- Model Deployment and Prediction
- Summary
- Index
مشخصات
نام کتاب
Beginning Apache Spark 3
نویسنده
Hien Luu
انتشارات
Apress
تاریخ انتشار
2021
ISBN
9781484273821
تعداد صفحات
445
زبان
انگلیسی
فرمت
حجم
3.7MB
موضوع
Big Data Processing