
عنوان:
Hands-On Generative AI with Transformers and Diffusion Models
نویسنده:
Omar Sanseviero
انتشارات:
O'Reilly Media
تاریخ انتشار:
2024
حجم:
7MB
معرفی کتاب:" راهنمای عملی هوش مصنوعی مولد با ترنسفورمرها و مدلهای پخشی"
یاد بگیرید چگونه از تکنیکهای هوش مصنوعی مولد (Generative AI) برای تولید متن، تصویر، صدا و حتی موسیقی استفاده کنید — با این کتاب پروژهمحور و عملی که مفاهیم پیچیده را به زبان ساده ارائه میدهد.
این کتاب به شما نشان میدهد که مدلهای مولد پیشرفته چگونه کار میکنند، چطور میتوانید آنها را شخصیسازی کرده و با نیازهای خاص خود تطبیق دهید، و چگونه بلوکهای سازنده موجود را برای ساخت مدلهای خلاقانه ترکیب نمایید.
مطالب کلیدی کتاب:
- ساخت و تنظیم مدلهایی که توانایی تولید متن و تصویر را دارند
- بررسی مزایا و معایب مدلهای از پیش آموزشدیده در مقابل مدلهای تنظیمشده شخصی
- ایجاد مدلهایی با قابلیت تولید، ویرایش و تغییر تصاویر در سبکهای مختلف
- شخصیسازی مدلهای ترنسفورمر و مدلهای پخشی برای ایجاد خروجیهای خلاقانه در حوزههای مختلف
ویژگیهای این کتاب:
این راهنمای عملی، با ارائهی نمونهکدهای واقعی و تصاویر گویا، شما را در مسیر پیادهسازی پروژههایی با مدلهای Transformers و Diffusion هدایت میکند. با تحلیل کدها و بررسی پروژههای نمونه، میتوانید پروژههای خلاقانهی خود را توسعه دهید.
مناسب برای:
مخاطبان این کتاب، برنامهنویسان، هنرمندان دیجیتال، پژوهشگران هوش مصنوعی و تمامی علاقهمندان به تکنولوژیهای مولد هستند که میخواهند درک عمیقی از ابزارهای مدرن تولید محتوا به دست آورند.
فهرست مطالب
- Preface
- I. Leveraging Open Models
- 1. An Introduction to Generative Media
- Generating Images
- Generating Text
- Generating Sound Clips
- Ethical and Societal Implications
- Where We’ve Been and Where Things Stand
- How Are Generative AI Models Created?
- Summary
- 2. Transformers
- A Language Model in Action
- A Transformer Block
- Transformer Model Genealogy
- The Power of Pretraining
- Transformers Recap
- Project Time: Using LMs to Generate Text
- Summary
- Exercises
- Challenges
- References
- 3. Compressing and Representing Information
- AutoEncoders
- Variational AutoEncoders
- CLIP
- Alternatives to CLIP
- Project Time: Semantic Image Search
- Summary
- Exercises
- Challenges
- References
- 4. Diffusion Models
- The Key Insight: Iterative Refinement
- Training a Diffusion Model
- In Depth: Noise Schedules
- In Depth: UNets and Alternatives
- In Depth: Diffusion Objectives
- Project Time: Train Your Diffusion Model
- Summary
- Exercises
- Challenges
- References
- 5. Stable Diffusion and Conditional Generation
- Adding Control: Conditional Diffusion Models
- Improving Efficiency: Latent Diffusion
- Stable Diffusion: Components in Depth
- Putting It All Together: Annotated Sampling Loop
- Open Data, Open Models
- Project Time: Build an Interactive ML Demo with Gradio
- Summary
- Exercises
- Challenge
- References
- II. Transfer Learning for Generative Models
- 6. Fine-Tuning Language Models
- Classifying Text
- Generating Text
- Instructions
- A Quick Introduction to Adapters
- A Light Introduction to Quantization
- Putting It All Together
- A Deeper Dive into Evaluation
- Project Time: Retrieval-Augmented Generation
- Summary
- Exercises
- Challenge
- References
- 7. Fine-Tuning Stable Diffusion
- Full Stable Diffusion Fine-Tuning
- DreamBooth
- Training LoRAs
- Giving Stable Diffusion New Capabilities
- Project Time: Train an SDXL DreamBooth LoRA by Yourself
- Summary
- Exercises
- Challenge
- References
- III. Going Further
- 8. Creative Applications of Text-to-Image Models
- Image to Image
- Inpainting
- Prompt Weighting and Image Editing
- Real Image Editing via Inversion
- ControlNet
- Image Prompting and Image Variations
- Project Time: Your Creative Canvas
- Summary
- Exercises
- References
- 9. Generating Audio
- Audio Data
- Speech to Text with Transformer-Based Architectures
- From Text to Speech to Generative Audio
- Evaluating Audio-Generation Systems
- What’s Next?
- Project Time: End-to-End Conversational System
- Summary
- Exercises
- Challenges
- References
- 10. Rapidly Advancing Areas in Generative AI
- Preference Optimization
- Long Contexts
- Mixture of Experts
- Optimizations and Quantizations
- Data
- One Model to Rule Them All
- Computer Vision
- 3D Computer Vision
- Video Generation
- Multimodality
- Community
- A. Open Source Tools
- B. LLM Memory Requirements
- C. End-to-End Retrieval-Augmented Generation
- Index
- About the Authors
مشخصات
نام کتاب
Hands-On Generative AI with Transformers and Diffusion Models
نویسنده
Omar Sanseviero
انتشارات
O'Reilly Media
تاریخ انتشار
2024
ISBN
9781098149246
تعداد صفحات
576
زبان
انگلیسی
فرمت
حجم
7MB
موضوع
Artificial Intelligence