کتاب Reliability Engineering in the Cloud راهنمای جامع طراحی، پیادهسازی و بهینهسازی سیستمهای ابری با تمرکز بر Cloud Reliability Engineering و استفاده از AI در بهبود قابلیت اطمینان است.
Reliability Engineering in the Cloud نوشته Mariya Breiter و Carlos Rojas یک راهنمای پیشرفته برای طراحی و مدیریت سیستمهای ابری Highly Reliable است. این کتاب به صورت عملی نشان میدهد چگونه میتوان سیستمهایی Resilient، Scalable و Fault-Tolerant در محیط Cloud طراحی و اجرا کرد.
موضوعاتی مانند Incident Response، Operational Excellence، Observability، Service Level Objectives، Chaos Engineering، OKRs در Reliability و استفاده از AI، ML و GenAI در بهبود CRE بهصورت کامل بررسی شدهاند. همچنین کتاب به ایجاد فرهنگ سازمانی مبتنی بر Reliability، مدیریت تغییر، Disaster Recovery و اندازهگیری ROI در Reliability Engineering میپردازد.
این اثر برای مهندسان DevOps، معماران Cloud، Site Reliability Engineers (SRE) و مدیران فناوری که به دنبال ارتقای پایداری سیستمهای ابری خود هستند بسیار مناسب است.
سرفصلهای کتاب
Chapter 1: Reliability Engineering in the Cloud
Chapter 2: Resilient, Available, and Scalable Systems
Chapter 3: Incident Response for Fast Recovery
Chapter 4: Operational Excellence and Change Management
Chapter 5: Leveraging Observability, Monitoring, Reliability Metrics, and GenAI
Chapter 6: CRE via Objectives and Key Results (OKRs)
Chapter 7: CRE Tooling
Chapter 8: Cutting-Edge Technologies in CRE (AI, ML, LLMs, GenAI)