دانلود رایگان کتاب Hands-On Generative AI with Transformers and Diffusion Models در آی‌تی بوک

جلد کتاب راهنمای عملی هوش مصنوعی مولد با ترنسفورمرها و
مدل‌های پخشی اثر Omar Sanseviero

عنوان:

Hands-On Generative AI with Transformers and Diffusion Models

نویسنده:

Omar Sanseviero

انتشارات:

O'Reilly Media

تاریخ انتشار:

2024

حجم:

7MB

دانلود

معرفی فهرست مشخصات

معرفی کتاب:" راهنمای عملی هوش مصنوعی مولد با ترنسفورمرها و مدل‌های پخشی"

یاد بگیرید چگونه از تکنیک‌های هوش مصنوعی مولد (Generative AI) برای تولید متن، تصویر، صدا و حتی موسیقی استفاده کنید — با این کتاب پروژه‌محور و عملی که مفاهیم پیچیده را به زبان ساده ارائه می‌دهد.

این کتاب به شما نشان می‌دهد که مدل‌های مولد پیشرفته چگونه کار می‌کنند، چطور می‌توانید آن‌ها را شخصی‌سازی کرده و با نیازهای خاص خود تطبیق دهید، و چگونه بلوک‌های سازنده موجود را برای ساخت مدل‌های خلاقانه ترکیب نمایید.

مطالب کلیدی کتاب:

ساخت و تنظیم مدل‌هایی که توانایی تولید متن و تصویر را دارند
بررسی مزایا و معایب مدل‌های از پیش آموزش‌دیده در مقابل مدل‌های تنظیم‌شده شخصی
ایجاد مدل‌هایی با قابلیت تولید، ویرایش و تغییر تصاویر در سبک‌های مختلف
شخصی‌سازی مدل‌های ترنسفورمر و مدل‌های پخشی برای ایجاد خروجی‌های خلاقانه در حوزه‌های مختلف

ویژگی‌های این کتاب:

این راهنمای عملی، با ارائه‌ی نمونه‌کدهای واقعی و تصاویر گویا، شما را در مسیر پیاده‌سازی پروژه‌هایی با مدل‌های Transformers و Diffusion هدایت می‌کند. با تحلیل کدها و بررسی پروژه‌های نمونه، می‌توانید پروژه‌های خلاقانه‌ی خود را توسعه دهید.

مناسب برای:

مخاطبان این کتاب، برنامه‌نویسان، هنرمندان دیجیتال، پژوهشگران هوش مصنوعی و تمامی علاقه‌مندان به تکنولوژی‌های مولد هستند که می‌خواهند درک عمیقی از ابزارهای مدرن تولید محتوا به دست آورند.

فهرست مطالب

Preface
I. Leveraging Open Models
1. An Introduction to Generative Media
Generating Images
Generating Text
Generating Sound Clips
Ethical and Societal Implications
Where We’ve Been and Where Things Stand
How Are Generative AI Models Created?
Summary
2. Transformers
A Language Model in Action
A Transformer Block
Transformer Model Genealogy
The Power of Pretraining
Transformers Recap
Project Time: Using LMs to Generate Text
Summary
Exercises
Challenges
References
3. Compressing and Representing Information
AutoEncoders
Variational AutoEncoders
CLIP
Alternatives to CLIP
Project Time: Semantic Image Search
Summary
Exercises
Challenges
References
4. Diffusion Models
The Key Insight: Iterative Refinement
Training a Diffusion Model
In Depth: Noise Schedules
In Depth: UNets and Alternatives
In Depth: Diffusion Objectives
Project Time: Train Your Diffusion Model
Summary
Exercises
Challenges
References
5. Stable Diffusion and Conditional Generation
Adding Control: Conditional Diffusion Models
Improving Efficiency: Latent Diffusion
Stable Diffusion: Components in Depth
Putting It All Together: Annotated Sampling Loop
Open Data, Open Models
Project Time: Build an Interactive ML Demo with Gradio
Summary
Exercises
Challenge
References
II. Transfer Learning for Generative Models
6. Fine-Tuning Language Models
Classifying Text
Generating Text
Instructions
A Quick Introduction to Adapters
A Light Introduction to Quantization
Putting It All Together
A Deeper Dive into Evaluation
Project Time: Retrieval-Augmented Generation
Summary
Exercises
Challenge
References
7. Fine-Tuning Stable Diffusion
Full Stable Diffusion Fine-Tuning
DreamBooth
Training LoRAs
Giving Stable Diffusion New Capabilities
Project Time: Train an SDXL DreamBooth LoRA by Yourself
Summary
Exercises
Challenge
References
III. Going Further
8. Creative Applications of Text-to-Image Models
Image to Image
Inpainting
Prompt Weighting and Image Editing
Real Image Editing via Inversion
ControlNet
Image Prompting and Image Variations
Project Time: Your Creative Canvas
Summary
Exercises
References
9. Generating Audio
Audio Data
Speech to Text with Transformer-Based Architectures
From Text to Speech to Generative Audio
Evaluating Audio-Generation Systems
What’s Next?
Project Time: End-to-End Conversational System
Summary
Exercises
Challenges
References
10. Rapidly Advancing Areas in Generative AI
Preference Optimization
Long Contexts
Mixture of Experts
Optimizations and Quantizations
Data
One Model to Rule Them All
Computer Vision
3D Computer Vision
Video Generation
Multimodality
Community
A. Open Source Tools
B. LLM Memory Requirements
C. End-to-End Retrieval-Augmented Generation
Index
About the Authors

مشخصات

نام کتاب

Hands-On Generative AI with Transformers and Diffusion Models

نویسنده

Omar Sanseviero

انتشارات

O'Reilly Media

تاریخ انتشار