جلد کتاب آغاز کار با Apache Spark 3: با DataFrame، Spark SQL، Structured Streaming و کتابخانه یادگیری ماشین Spark

عنوان:

Beginning Apache Spark 3

نویسنده:

Hien Luu

انتشارات:

Apress

تاریخ انتشار:

2021

حجم:

3.7MB

دانلود

معرفی کتاب : " آغاز کار با Apache Spark 3: با DataFrame، Spark SQL، Structured Streaming و کتابخانه یادگیری ماشین Spark "

با این کتاب، سفری به دنیای Apache Spark 3.0 خواهید داشت تا آن را کشف، یاد بگیرید و استفاده کنید. در این کتاب، شما مهارت‌های لازم برای کار با موتور پردازش داده توزیع‌شده و قدرتمند Apache Spark، مدل برنامه‌نویسی کاربرپسند، جامع و انعطاف‌پذیر برای پردازش داده‌ها در حالت batch و streaming، و الگوریتم‌ها و ابزارهای مقیاس‌پذیر یادگیری ماشین برای ساخت برنامه‌های یادگیری ماشین را کسب خواهید کرد.

کتاب Beginning Apache Spark 3 با توضیح روش‌های مختلف تعامل با Apache Spark شروع می‌شود، مانند مفاهیم و معماری Spark و Spark Unified Stack. سپس مروری بر Spark SQL ارائه می‌دهد و بعد به ویژگی‌های پیشرفته آن می‌پردازد. کتاب نکات و تکنیک‌هایی برای حل مشکلات عملکردی را ارائه می‌کند و پس از آن موتور پردازش Structured Streaming را معرفی می‌کند. در پایان، نحوه توسعه برنامه‌های یادگیری ماشین با Spark MLlib و مدیریت چرخه توسعه یادگیری ماشین آموزش داده می‌شود. مثال‌ها و قطعه‌کدهای عملی به شما کمک می‌کند مفاهیم را بلافاصله پس از یادگیری تمرین و درک کنید.

پس از مطالعه این کتاب، شما دانش لازم برای ساخت فرآیندهای داده‌ای بزرگ، اپلیکیشن‌ها و برنامه‌های یادگیری ماشین را خواهید داشت.

آنچه خواهید آموخت:

  • تسلط بر موتور تحلیلی یکپارچه Spark و اجزای مختلف آن
  • کار با موتور پردازش داده مقیاس‌پذیر، مقاوم و با عملکرد بالا
  • استفاده از مدل برنامه‌نویسی کاربرپسند و انعطاف‌پذیر برای انجام تحلیل‌های ساده تا پیچیده با dataframe و Spark SQL
  • توسعه برنامه‌های یادگیری ماشین با Spark MLlib
  • مدیریت چرخه توسعه یادگیری ماشین با MLflow

مخاطب کتاب:

این کتاب برای دانشمندان داده، مهندسان داده و توسعه‌دهندگان نرم‌افزار نوشته شده است.

فهرست مطالب

  • Table of Contents
  • About the Author
  • About the Technical Reviewers
  • Acknowledgments
  • Introduction
  • Chapter 1: Introduction to Apache Spark
  • Overview
  • History
  • Spark Core Concepts and Architecture
  • Apache Spark 3.0
  • Apache Spark Applications
  • Spark Example Applications
  • Apache Spark Ecosystem
  • Summary
  • Chapter 2: Working with Apache Spark
  • Downloading and Installation
  • Having Fun with the Spark Scala Shell
  • Introduction to Collaborative Notebooks
  • Setting up Spark Source Code
  • Summary
  • Chapter 3: Spark SQL: Foundation
  • Understanding RDD
  • Introduction to the DataFrame API
  • Creating a DataFrame
  • Introduction to Datasets
  • Using SQL in Spark SQL
  • Writing Data Out to Storage Systems
  • The Trio: DataFrame, Dataset, and SQL
  • DataFrame Persistence
  • Summary
  • Chapter 4: Spark SQL: Advanced
  • Aggregations
  • Joins
  • Functions
  • Advanced Analytics Functions
  • Exploring Catalyst Optimizer
  • Summary
  • Chapter 5: Optimizing Spark Applications
  • Common Performance Issues
  • Leverage In-Memory Computation
  • Understanding Spark Joins
  • Adaptive Query Execution
  • Summary
  • Chapter 6: Spark Streaming
  • Stream Processing
  • Spark Streaming Overview
  • Spark DStream
  • Summary
  • Chapter 7: Advanced Spark Streaming
  • Event Time
  • Arbitrary Stateful Processing
  • Handling Duplicate Data
  • Fault Tolerance
  • Streaming Query Metrics and Monitoring
  • Summary
  • Chapter 8: Machine Learning with Spark
  • Machine Learning Overview
  • Spark Machine Learning Library
  • Machine Learning Tasks in Action
  • Deep Learning Pipeline
  • Summary
  • Chapter 9: Managing the Machine Learning Life Cycle
  • The Rise of MLOps
  • MLflow Overview
  • Model Deployment and Prediction
  • Summary
  • Index

مشخصات

نام کتاب

Beginning Apache Spark 3

نویسنده

Hien Luu

انتشارات

Apress

تاریخ انتشار

2021

ISBN

9781484273821

تعداد صفحات

445

زبان

انگلیسی

فرمت

pdf

حجم

3.7MB

موضوع

Big Data Processing