کتاب ساخت سرویس‌های هوش مصنوعی مولد با FastAPI نوشته علیرضا پرنده

عنوان:

Building Generative AI Services with FastAPI

نویسنده:

Alireza Parandeh

انتشارات:

O'Reilly Media, Inc

تاریخ انتشار

2025

حجم:

8.3MB

دانلود

معرفی کتاب:" ساخت سرویس‌های هوش مصنوعی مولد با FastAPI "

آماده‌اید تا برنامه‌هایی مبتنی بر هوش مصنوعی بسازید که واقعاً مفید و قابل استقرار باشند؟ این کتاب کاربردی شما را گام‌به‌گام در ساخت سرویس‌های AI مولد با استفاده از فریم‌ورک سریع، مدرن و مبتنی بر async یعنی FastAPI همراهی می‌کند.

علیرضا پرنده، نویسنده این کتاب، با بهره‌گیری از تجربه توسعه واقعی، مفاهیم پیچیده را به زبان ساده و با مثال‌های عملی توضیح می‌دهد تا شما را برای طراحی، پیاده‌سازی و استقرار اپلیکیشن‌های هوش مصنوعی مولد آماده کند.

ویژگی‌های برجسته کتاب:

  • ساخت سرویس‌هایی مبتنی بر مدل‌های AI برای پردازش متن، تصویر، صدا و ویدیو
  • تعامل یکپارچه با پایگاه‌های داده، سیستم فایل، وب‌سایت‌ها و APIها
  • استفاده از WebSocket و Server-Sent Events برای پخش بلادرنگ خروجی‌های تولیدی
  • مدیریت وظایف طولانی و هم‌زمانی پیچیده با async و task queues
  • بهینه‌سازی عملکرد با کش‌کردن، پردازش دسته‌ای، fine-tuning و مدیریت بار

مباحث پیشرفته:

  • احراز هویت کاربران، کنترل سرعت درخواست‌ها و فیلتر محتوای تولیدشده
  • یکپارچه‌سازی RAG (تولید افزوده‌شده با بازیابی) با پایگاه‌های داده برداری (vector DB)
  • تست خروجی مدل‌های زبانی و تصویری و ارزیابی کیفیت نتایج
  • استقرار مقیاس‌پذیر با Docker و آماده‌سازی برای فضای ابری

مناسب برای چه کسانی است؟

این کتاب برای توسعه‌دهندگان وب، مهندسان DevOps، دانشمندان داده و تمام کسانی مناسب است که می‌خواهند اپلیکیشن‌هایی مبتنی بر هوش مصنوعی مولد بسازند که در دنیای واقعی قابل استفاده و توسعه‌پذیر باشند.

در پایان این کتاب:

شما قادر خواهید بود تا یک اپلیکیشن AI واقعی را از صفر تا استقرار در فضای ابری طراحی، توسعه و اجرا کنید — همراه با تمام اجزای حیاتی از امنیت گرفته تا مقیاس‌پذیری و بهینه‌سازی.

فهرست مطالب

  • Foreword
  • Preface
  • I. Developing AI Services
  • Chapter 1. Introduction
  • What Is Generative AI?
  • Why Generative AI Services Will Power Future Applications
  • How to Build a Generative AI Service
  • Why Build Generative AI Services with FastAPI?
  • What Prevents the Adoption of Generative AI Services
  • Overview of the Capstone Project
  • Summary
  • Chapter 2. Getting Started with FastAPI
  • Introduction to FastAPI
  • Setting Up Your Development Environment
  • FastAPI Features and Advantages
  • FastAPI Project Structures
  • Onion/Layered Application Design Pattern
  • Comparing FastAPI to Other Python Web Frameworks
  • FastAPI Limitations
  • Setting Up a Managed Python Environment and Tooling
  • Summary
  • Chapter 3. AI Integration and Model Serving
  • Serving Generative Models
  • Strategies for Serving Generative AI Models
  • The Role of Middleware in Service Monitoring
  • Summary
  • Additional References
  • Chapter 4. Implementing Type-Safe AI Services
  • Introduction to Type Safety
  • Implementing Type Safety
  • Pydantic Models
  • Summary
  • II. Communicating with External Systems
  • Chapter 5. Achieving Concurrency in AI Workloads
  • Optimizing GenAI Services for Multiple Users
  • Optimizing for I/O Tasks with Asynchronous Programming
  • Optimizing Model Serving for Memory- and Compute-Bound AI Inference Tasks
  • Managing Long-Running AI Inference Tasks
  • Summary
  • Additional References
  • Chapter 6. Real-Time Communication with Generative Models
  • Web Communication Mechanisms
  • Implementing SSE Endpoints
  • Implementing WS Endpoints
  • Summary
  • Chapter 7. Integrating Databases into AI Services
  • The Role of a Database
  • Database Systems
  • Project: Storing User Conversations with an LLM in a Relational Database
  • Managing Database Schemas Changes
  • Storing Data When Working with Real-Time Streams
  • Summary
  • III. Securing, Optimizing, Testing, and Deploying AI Services
  • Chapter 8. Authentication and Authorization
  • Authentication and Authorization
  • Authentication Methods
  • Implementing OAuth Authentication
  • Authorization
  • Summary
  • Chapter 9. Securing AI Services
  • Usage Moderation and Abuse Protection
  • Guardrails
  • API Rate Limiting and Throttling
  • Summary
  • Chapter 10. Optimizing AI Services
  • Optimization Techniques
  • Summary
  • Chapter 11. Testing AI Services
  • The Importance of Testing
  • Software Testing
  • Challenges of Testing GenAI Services
  • Project: Implementing Tests for a RAG System
  • Summary
  • Chapter 12. Deployment of AI Services
  • Deployment Options
  • Containerization with Docker
  • Summary
  • Afterword
  • Index
  • About the Author

مشخصات

نام کتاب

Building Generative AI Services with FastAPI

نویسنده

Alireza Parandeh

انتشارات

O'Reilly Media, Inc

تاریخ انتشار

2025

ISBN

9781098160302

تعداد صفحات

1091

زبان

انگلیسی

فرمت

pdf

حجم

8.3MB

موضوع

artificial-intelligence