کتاب اصول پایه‌ای مهندسی داده — راهنمای ورود به دنیای داده‌ها-Joe Reis Matt Housley-آی تی بوک

عنوان:

Fundamentals of Data Engineering

نویسنده:

Joe Reis; Matt Housley

انتشارات:

O'Reilly Media, Inc

تاریخ انتشار

2022

حجم:

8.9MB

دانلود

معرفی کتاب: "اصول پایه‌ای مهندسی داده — راهنمای ورود به دنیای داده‌ها"

راهنمای عملی برای ساخت معماری‌های داده مدرن و کارآمد، مبتنی بر فناوری‌های ابری و رویکرد چرخه عمر مهندسی داده.

درباره کتاب:

مهندسی داده در سال‌های اخیر رشد چشم‌گیری داشته و نیاز به متخصصانی با درک جامع از این حوزه بیش از گذشته احساس می‌شود. کتاب Data Engineering نوشته Joe Reis و Matt Housley، با رویکردی کاربردی و ساختاریافته، شما را با طراحی، ساخت، و نگهداری سیستم‌های داده‌ای آشنا می‌کند که پاسخگوی نیازهای سازمان‌ها و مشتریان باشند.

این کتاب شما را در کل چرخه عمر مهندسی داده همراهی می‌کند — از تولید داده تا استقرار نهایی — و به شما کمک می‌کند تا فناوری‌های مختلف ابری را به‌درستی در کنار هم قرار دهید و زیرساختی مقیاس‌پذیر و قابل اعتماد بسازید.

آنچه در این کتاب خواهید آموخت:

  • ✔ ارزیابی مشکلات مهندسی داده با چارچوبی جامع و مبتنی بر بهترین شیوه‌ها
  • ✔ انتخاب آگاهانه فناوری‌ها و ابزارها بدون تأثیرپذیری از تبلیغات بازاریابی
  • ✔ طراحی معماری داده قوی با در نظر گرفتن چرخه عمر کامل مهندسی داده
  • ✔ پیاده‌سازی مؤثر مفاهیمی همچون تولید، جذب، هماهنگی، تبدیل، ذخیره‌سازی و استقرار داده
  • ✔ به‌کارگیری اصول حاکمیت داده و امنیت در تمام مراحل مدیریت داده

مخاطب این کتاب:

  • ✔ مهندسین داده و مهندسین نرم‌افزار علاقه‌مند به طراحی سیستم‌های داده مقیاس‌پذیر
  • ✔ دانشمندان داده و تحلیل‌گران که به دنبال درک عمیق‌تری از زیرساخت داده هستند
  • ✔ معماران فناوری اطلاعات که با چالش‌های داده در محیط‌های ابری و ترکیبی سروکار دارند

فهرست مطالب

  • Preface
  • I. Foundation and Building Blocks
  • Chapter 1: Data Engineering Described
  • What Is Data Engineering?
  • Data Engineering Skills and Activities
  • Data Engineers Inside an Organization
  • Conclusion
  • Additional Resources
  • Chapter 2: The Data Engineering Lifecycle
  • What Is the Data Engineering Lifecycle?
  • Major Undercurrents Across the Data Engineering Lifecycle
  • Conclusion
  • Additional Resources
  • Chapter 3: Designing Good Data Architecture
  • What Is Data Architecture?
  • Principles of Good Data Architecture
  • Major Architecture Concepts
  • Examples and Types of Data Architecture
  • Who’s Involved with Designing a Data Architecture?
  • Conclusion
  • Additional Resources
  • Chapter 4: Choosing Technologies Across the Data Engineering Lifecycle
  • Team Size and Capabilities
  • Speed to Market
  • Interoperability
  • Cost Optimization and Business Value
  • Today Versus the Future: Immutable Versus Transitory Technologies
  • Location
  • Build Versus Buy
  • Monolith Versus Modular
  • Serverless Versus Servers
  • Optimization, Performance, and the Benchmark Wars
  • Undercurrents and Their Impacts on Choosing Technologies
  • Conclusion
  • Additional Resources
  • II. The Data Engineering Lifecycle in Depth
  • Chapter 5: Data Generation in Source Systems
  • Sources of Data: How Is Data Created?
  • Source Systems: Main Ideas
  • Source System Practical Details
  • Whom You’ll Work With
  • Undercurrents and Their Impact on Source Systems
  • Conclusion
  • Additional Resources
  • Chapter 6: Storage
  • Raw Ingredients of Data Storage
  • Data Storage Systems
  • Data Engineering Storage Abstractions
  • Big Ideas and Trends in Storage
  • Whom You’ll Work With
  • Undercurrents
  • Conclusion
  • Additional Resources
  • Chapter 7: Ingestion
  • What Is Data Ingestion?
  • Key Engineering Considerations for the Ingestion Phase
  • Batch Ingestion Considerations
  • Message and Stream Ingestion Considerations
  • Ways to Ingest Data
  • Whom You’ll Work With
  • Undercurrents
  • Conclusion
  • Additional Resources
  • Chapter 8: Queries, Modeling, and Transformation
  • Queries
  • Data Modeling
  • Transformations
  • Whom You’ll Work With
  • Undercurrents
  • Conclusion
  • Additional Resources
  • Chapter 9: Serving Data for Analytics, Machine Learning, and Reverse ETL
  • General Considerations for Serving Data
  • Analytics
  • Machine Learning
  • What a Data Engineer Should Know About ML
  • Ways to Serve Data for Analytics and ML
  • Reverse ETL
  • Whom You’ll Work With
  • Undercurrents
  • Conclusion
  • Additional Resources
  • III. Security, Privacy, and the Future of Data Engineering
  • Chapter 10: Security and Privacy
  • People
  • Processes
  • Technology
  • Conclusion
  • Additional Resources
  • Chapter 11: The Future of Data Engineering
  • The Data Engineering Lifecycle Isn’t Going Away
  • The Decline of Complexity and the Rise of Easy-to-Use Data Tools
  • The Cloud-Scale Data OS and Improved Interoperability
  • “Enterprisey” Data Engineering
  • Titles and Responsibilities Will Morph...
  • Moving Beyond the Modern Data Stack, Toward the Live Data Stack
  • Conclusion
  • Appendix A: Serialization and Compression Technical Details
  • Serialization Formats
  • Database Storage Engines
  • Compression: gzip, bzip2, Snappy, Etc.
  • Appendix B: Cloud Networking
  • Cloud Network Topology
  • CDNs
  • The Future of Data Egress Fees
  • Index
  • About the Authors

مشخصات

نام کتاب

Fundamentals of Data Engineering

نویسنده

Joe Reis; Matt Housley

انتشارات

O'Reilly Media, Inc

تاریخ انتشار

2022

ISBN

9781098108304

تعداد صفحات

636

زبان

انگلیسی

فرمت

pdf

حجم

8.9MB

موضوع

Data science