
عنوان:
Fundamentals of Data Engineering
نویسنده:
Joe Reis; Matt Housley
انتشارات:
O'Reilly Media, Inc
تاریخ انتشار
2022
حجم:
8.9MB
معرفی کتاب: "اصول پایهای مهندسی داده — راهنمای ورود به دنیای دادهها"
راهنمای عملی برای ساخت معماریهای داده مدرن و کارآمد، مبتنی بر فناوریهای ابری و رویکرد چرخه عمر مهندسی داده.
درباره کتاب:
مهندسی داده در سالهای اخیر رشد چشمگیری داشته و نیاز به متخصصانی با درک جامع از این حوزه بیش از گذشته احساس میشود. کتاب Data Engineering نوشته Joe Reis و Matt Housley، با رویکردی کاربردی و ساختاریافته، شما را با طراحی، ساخت، و نگهداری سیستمهای دادهای آشنا میکند که پاسخگوی نیازهای سازمانها و مشتریان باشند.
این کتاب شما را در کل چرخه عمر مهندسی داده همراهی میکند — از تولید داده تا استقرار نهایی — و به شما کمک میکند تا فناوریهای مختلف ابری را بهدرستی در کنار هم قرار دهید و زیرساختی مقیاسپذیر و قابل اعتماد بسازید.
آنچه در این کتاب خواهید آموخت:
- ✔ ارزیابی مشکلات مهندسی داده با چارچوبی جامع و مبتنی بر بهترین شیوهها
- ✔ انتخاب آگاهانه فناوریها و ابزارها بدون تأثیرپذیری از تبلیغات بازاریابی
- ✔ طراحی معماری داده قوی با در نظر گرفتن چرخه عمر کامل مهندسی داده
- ✔ پیادهسازی مؤثر مفاهیمی همچون تولید، جذب، هماهنگی، تبدیل، ذخیرهسازی و استقرار داده
- ✔ بهکارگیری اصول حاکمیت داده و امنیت در تمام مراحل مدیریت داده
مخاطب این کتاب:
- ✔ مهندسین داده و مهندسین نرمافزار علاقهمند به طراحی سیستمهای داده مقیاسپذیر
- ✔ دانشمندان داده و تحلیلگران که به دنبال درک عمیقتری از زیرساخت داده هستند
- ✔ معماران فناوری اطلاعات که با چالشهای داده در محیطهای ابری و ترکیبی سروکار دارند
فهرست مطالب
- Preface
- I. Foundation and Building Blocks
- Chapter 1: Data Engineering Described
- What Is Data Engineering?
- Data Engineering Skills and Activities
- Data Engineers Inside an Organization
- Conclusion
- Additional Resources
- Chapter 2: The Data Engineering Lifecycle
- What Is the Data Engineering Lifecycle?
- Major Undercurrents Across the Data Engineering Lifecycle
- Conclusion
- Additional Resources
- Chapter 3: Designing Good Data Architecture
- What Is Data Architecture?
- Principles of Good Data Architecture
- Major Architecture Concepts
- Examples and Types of Data Architecture
- Who’s Involved with Designing a Data Architecture?
- Conclusion
- Additional Resources
- Chapter 4: Choosing Technologies Across the Data Engineering Lifecycle
- Team Size and Capabilities
- Speed to Market
- Interoperability
- Cost Optimization and Business Value
- Today Versus the Future: Immutable Versus Transitory Technologies
- Location
- Build Versus Buy
- Monolith Versus Modular
- Serverless Versus Servers
- Optimization, Performance, and the Benchmark Wars
- Undercurrents and Their Impacts on Choosing Technologies
- Conclusion
- Additional Resources
- II. The Data Engineering Lifecycle in Depth
- Chapter 5: Data Generation in Source Systems
- Sources of Data: How Is Data Created?
- Source Systems: Main Ideas
- Source System Practical Details
- Whom You’ll Work With
- Undercurrents and Their Impact on Source Systems
- Conclusion
- Additional Resources
- Chapter 6: Storage
- Raw Ingredients of Data Storage
- Data Storage Systems
- Data Engineering Storage Abstractions
- Big Ideas and Trends in Storage
- Whom You’ll Work With
- Undercurrents
- Conclusion
- Additional Resources
- Chapter 7: Ingestion
- What Is Data Ingestion?
- Key Engineering Considerations for the Ingestion Phase
- Batch Ingestion Considerations
- Message and Stream Ingestion Considerations
- Ways to Ingest Data
- Whom You’ll Work With
- Undercurrents
- Conclusion
- Additional Resources
- Chapter 8: Queries, Modeling, and Transformation
- Queries
- Data Modeling
- Transformations
- Whom You’ll Work With
- Undercurrents
- Conclusion
- Additional Resources
- Chapter 9: Serving Data for Analytics, Machine Learning, and Reverse ETL
- General Considerations for Serving Data
- Analytics
- Machine Learning
- What a Data Engineer Should Know About ML
- Ways to Serve Data for Analytics and ML
- Reverse ETL
- Whom You’ll Work With
- Undercurrents
- Conclusion
- Additional Resources
- III. Security, Privacy, and the Future of Data Engineering
- Chapter 10: Security and Privacy
- People
- Processes
- Technology
- Conclusion
- Additional Resources
- Chapter 11: The Future of Data Engineering
- The Data Engineering Lifecycle Isn’t Going Away
- The Decline of Complexity and the Rise of Easy-to-Use Data Tools
- The Cloud-Scale Data OS and Improved Interoperability
- “Enterprisey” Data Engineering
- Titles and Responsibilities Will Morph...
- Moving Beyond the Modern Data Stack, Toward the Live Data Stack
- Conclusion
- Appendix A: Serialization and Compression Technical Details
- Serialization Formats
- Database Storage Engines
- Compression: gzip, bzip2, Snappy, Etc.
- Appendix B: Cloud Networking
- Cloud Network Topology
- CDNs
- The Future of Data Egress Fees
- Index
- About the Authors
مشخصات
نام کتاب
Fundamentals of Data Engineering
نویسنده
Joe Reis; Matt Housley
انتشارات
O'Reilly Media, Inc
تاریخ انتشار
2022
ISBN
9781098108304
تعداد صفحات
636
زبان
انگلیسی
فرمت
حجم
8.9MB
موضوع
Data science