
عنوان:
Scalable Kubernetes Infrastructure for AI Platforms
نویسنده:
Alex Corvin, Taneem Ibrahim, and Kyle Stratis
انتشارات:
O'Reilly Media, Inc
تاریخ انتشار
2025
حجم:
3.25MB
معرفی کتاب:" زیرساخت مقیاسپذیر Kubernetes برای پلتفرمهای هوش مصنوعی "
هوش مصنوعی مولد در حال دگرگون کردن صنایع است، اما برای بسیاری از سازمانها، مسیر از اثبات مفهوم تا تولید نهایی همچنان یک مانع جدی بهشمار میرود.
در حالیکه کسبوکارها بهطور گسترده در ساخت اپلیکیشنهای مبتنی بر هوش مصنوعی، مانند چتباتهای RAG، سرمایهگذاری میکنند، اکثریت این پروژهها نتایج ملموسی به همراه ندارند.
موفقیت تنها با آزمایش حاصل نمیشود — بلکه نیازمند درک عمیقتری از چالشهای مدیریت هوش مصنوعی در محیط تولید و بهکارگیری عملی روشهای MLOps برای سادهسازی این فرایند است.
این گزارش بررسی میکند که چگونه سازمانها میتوانند با رویکرد اول-کوبرنتیس (Kubernetes-first) و بهرهگیری از MLOps، بر موانع پذیرش غلبه کرده، هوش مصنوعی را بهطور مؤثر مقیاسپذیر کنند و بیشترین تأثیر تجاری را بهدست آورند.
از ساخت مدلهای مسئولانه تا اجرای سیستمهای تولیدی قابل اعتماد، این راهنما استراتژیها و ابزارهایی را در اختیار شما قرار میدهد تا در فضای رقابتی مبتنی بر هوش مصنوعی موفق عمل کنید.
اهداف کلیدی این گزارش:
- تسریع پروژههای هوش مصنوعی از مرحله آزمایش تا آمادگی برای تولید
- استانداردسازی و سادهسازی فرایند ساخت مدل برای اطمینان از تکرارپذیری
- استقرار و مدیریت مطمئن مدلهای هوش مصنوعی در محیط تولید
- ایجاد اعتماد با توسعه سیستمهای هوش مصنوعی مسئولانه و قابل توضیح
- استفاده از ابزارهای بومی Kubernetes برای پیادهسازی اصول MLOps در مقیاس وسیع
فهرست مطالب
- 1. Introduction
- What Is MLOps?
- Why Use Kubernetes for Your MLOps Platform?
- 2. Model Development on Kubernetes
- Overview of LLM Customization Techniques
- Kubernetes-Native Model Training Tools
- Managing Compute Resources for Training
- 3. Making Training Repeatable
- Retraining and the Model Development Lifecycle
- Tracking Model Versions
- Automating Model Training
- GitOps for Model Training Pipelines
- 4. Model Deployment and Monitoring
- Overview of LLM Serving
- Using a Model-Serving Platform
- Diving Into LLM-Serving Runtimes with vLLM
- Monitoring and Keeping Track of Your Models
- 5. Responsible AI
- Data Safety and Transparency
- AI Guardrails
- 6. Summary and Outlook
- Personalized Healthcare Chatbot
- Future Technology Outlook
- About the Authors
مشخصات
نام کتاب
Scalable Kubernetes Infrastructure for AI Platforms
نویسنده
Alex Corvin, Taneem Ibrahim, and Kyle Stratis
انتشارات
O'Reilly Media, Inc
تاریخ انتشار
2025
ISBN
9798341608184
تعداد صفحات
82
زبان
انگلیسی
فرمت
حجم
3.25MB
موضوع
kubernetes/ai-infrastructure