
عنوان:
Building Generative AI Services with FastAPI
نویسنده:
Alireza Parandeh
انتشارات:
O'Reilly Media, Inc
تاریخ انتشار
2025
حجم:
8.3MB
معرفی کتاب:" ساخت سرویسهای هوش مصنوعی مولد با FastAPI "
آمادهاید تا برنامههایی مبتنی بر هوش مصنوعی بسازید که واقعاً مفید و قابل استقرار باشند؟ این کتاب کاربردی شما را گامبهگام در ساخت سرویسهای AI مولد با استفاده از فریمورک سریع، مدرن و مبتنی بر async یعنی FastAPI همراهی میکند.
علیرضا پرنده، نویسنده این کتاب، با بهرهگیری از تجربه توسعه واقعی، مفاهیم پیچیده را به زبان ساده و با مثالهای عملی توضیح میدهد تا شما را برای طراحی، پیادهسازی و استقرار اپلیکیشنهای هوش مصنوعی مولد آماده کند.
ویژگیهای برجسته کتاب:
- ساخت سرویسهایی مبتنی بر مدلهای AI برای پردازش متن، تصویر، صدا و ویدیو
- تعامل یکپارچه با پایگاههای داده، سیستم فایل، وبسایتها و APIها
- استفاده از WebSocket و Server-Sent Events برای پخش بلادرنگ خروجیهای تولیدی
- مدیریت وظایف طولانی و همزمانی پیچیده با async و task queues
- بهینهسازی عملکرد با کشکردن، پردازش دستهای، fine-tuning و مدیریت بار
مباحث پیشرفته:
- احراز هویت کاربران، کنترل سرعت درخواستها و فیلتر محتوای تولیدشده
- یکپارچهسازی RAG (تولید افزودهشده با بازیابی) با پایگاههای داده برداری (vector DB)
- تست خروجی مدلهای زبانی و تصویری و ارزیابی کیفیت نتایج
- استقرار مقیاسپذیر با Docker و آمادهسازی برای فضای ابری
مناسب برای چه کسانی است؟
این کتاب برای توسعهدهندگان وب، مهندسان DevOps، دانشمندان داده و تمام کسانی مناسب است که میخواهند اپلیکیشنهایی مبتنی بر هوش مصنوعی مولد بسازند که در دنیای واقعی قابل استفاده و توسعهپذیر باشند.
در پایان این کتاب:
شما قادر خواهید بود تا یک اپلیکیشن AI واقعی را از صفر تا استقرار در فضای ابری طراحی، توسعه و اجرا کنید — همراه با تمام اجزای حیاتی از امنیت گرفته تا مقیاسپذیری و بهینهسازی.
فهرست مطالب
- Foreword
- Preface
- I. Developing AI Services
- Chapter 1. Introduction
- What Is Generative AI?
- Why Generative AI Services Will Power Future Applications
- How to Build a Generative AI Service
- Why Build Generative AI Services with FastAPI?
- What Prevents the Adoption of Generative AI Services
- Overview of the Capstone Project
- Summary
- Chapter 2. Getting Started with FastAPI
- Introduction to FastAPI
- Setting Up Your Development Environment
- FastAPI Features and Advantages
- FastAPI Project Structures
- Onion/Layered Application Design Pattern
- Comparing FastAPI to Other Python Web Frameworks
- FastAPI Limitations
- Setting Up a Managed Python Environment and Tooling
- Summary
- Chapter 3. AI Integration and Model Serving
- Serving Generative Models
- Strategies for Serving Generative AI Models
- The Role of Middleware in Service Monitoring
- Summary
- Additional References
- Chapter 4. Implementing Type-Safe AI Services
- Introduction to Type Safety
- Implementing Type Safety
- Pydantic Models
- Summary
- II. Communicating with External Systems
- Chapter 5. Achieving Concurrency in AI Workloads
- Optimizing GenAI Services for Multiple Users
- Optimizing for I/O Tasks with Asynchronous Programming
- Optimizing Model Serving for Memory- and Compute-Bound AI Inference Tasks
- Managing Long-Running AI Inference Tasks
- Summary
- Additional References
- Chapter 6. Real-Time Communication with Generative Models
- Web Communication Mechanisms
- Implementing SSE Endpoints
- Implementing WS Endpoints
- Summary
- Chapter 7. Integrating Databases into AI Services
- The Role of a Database
- Database Systems
- Project: Storing User Conversations with an LLM in a Relational Database
- Managing Database Schemas Changes
- Storing Data When Working with Real-Time Streams
- Summary
- III. Securing, Optimizing, Testing, and Deploying AI Services
- Chapter 8. Authentication and Authorization
- Authentication and Authorization
- Authentication Methods
- Implementing OAuth Authentication
- Authorization
- Summary
- Chapter 9. Securing AI Services
- Usage Moderation and Abuse Protection
- Guardrails
- API Rate Limiting and Throttling
- Summary
- Chapter 10. Optimizing AI Services
- Optimization Techniques
- Summary
- Chapter 11. Testing AI Services
- The Importance of Testing
- Software Testing
- Challenges of Testing GenAI Services
- Project: Implementing Tests for a RAG System
- Summary
- Chapter 12. Deployment of AI Services
- Deployment Options
- Containerization with Docker
- Summary
- Afterword
- Index
- About the Author
مشخصات
نام کتاب
Building Generative AI Services with FastAPI
نویسنده
Alireza Parandeh
انتشارات
O'Reilly Media, Inc
تاریخ انتشار
2025
ISBN
9781098160302
تعداد صفحات
1091
زبان
انگلیسی
فرمت
حجم
8.3MB
موضوع
artificial-intelligence