جلد کتاب راهنمای عملی هوش مصنوعی مولد با ترنسفورمرها و
                مدل‌های پخشی اثر Omar Sanseviero

عنوان:

Hands-On Generative AI with Transformers and Diffusion Models

نویسنده:

Omar Sanseviero

انتشارات:

O'Reilly Media

تاریخ انتشار:

2024

حجم:

7MB

دانلود

معرفی کتاب:" راهنمای عملی هوش مصنوعی مولد با ترنسفورمرها و مدل‌های پخشی"

یاد بگیرید چگونه از تکنیک‌های هوش مصنوعی مولد (Generative AI) برای تولید متن، تصویر، صدا و حتی موسیقی استفاده کنید — با این کتاب پروژه‌محور و عملی که مفاهیم پیچیده را به زبان ساده ارائه می‌دهد.

این کتاب به شما نشان می‌دهد که مدل‌های مولد پیشرفته چگونه کار می‌کنند، چطور می‌توانید آن‌ها را شخصی‌سازی کرده و با نیازهای خاص خود تطبیق دهید، و چگونه بلوک‌های سازنده موجود را برای ساخت مدل‌های خلاقانه ترکیب نمایید.

مطالب کلیدی کتاب:

  • ساخت و تنظیم مدل‌هایی که توانایی تولید متن و تصویر را دارند
  • بررسی مزایا و معایب مدل‌های از پیش آموزش‌دیده در مقابل مدل‌های تنظیم‌شده شخصی
  • ایجاد مدل‌هایی با قابلیت تولید، ویرایش و تغییر تصاویر در سبک‌های مختلف
  • شخصی‌سازی مدل‌های ترنسفورمر و مدل‌های پخشی برای ایجاد خروجی‌های خلاقانه در حوزه‌های مختلف

ویژگی‌های این کتاب:

این راهنمای عملی، با ارائه‌ی نمونه‌کدهای واقعی و تصاویر گویا، شما را در مسیر پیاده‌سازی پروژه‌هایی با مدل‌های Transformers و Diffusion هدایت می‌کند. با تحلیل کدها و بررسی پروژه‌های نمونه، می‌توانید پروژه‌های خلاقانه‌ی خود را توسعه دهید.

مناسب برای:

مخاطبان این کتاب، برنامه‌نویسان، هنرمندان دیجیتال، پژوهشگران هوش مصنوعی و تمامی علاقه‌مندان به تکنولوژی‌های مولد هستند که می‌خواهند درک عمیقی از ابزارهای مدرن تولید محتوا به دست آورند.

فهرست مطالب

  • Preface
  • I. Leveraging Open Models
  • 1. An Introduction to Generative Media
  • Generating Images
  • Generating Text
  • Generating Sound Clips
  • Ethical and Societal Implications
  • Where We’ve Been and Where Things Stand
  • How Are Generative AI Models Created?
  • Summary
  • 2. Transformers
  • A Language Model in Action
  • A Transformer Block
  • Transformer Model Genealogy
  • The Power of Pretraining
  • Transformers Recap
  • Project Time: Using LMs to Generate Text
  • Summary
  • Exercises
  • Challenges
  • References
  • 3. Compressing and Representing Information
  • AutoEncoders
  • Variational AutoEncoders
  • CLIP
  • Alternatives to CLIP
  • Project Time: Semantic Image Search
  • Summary
  • Exercises
  • Challenges
  • References
  • 4. Diffusion Models
  • The Key Insight: Iterative Refinement
  • Training a Diffusion Model
  • In Depth: Noise Schedules
  • In Depth: UNets and Alternatives
  • In Depth: Diffusion Objectives
  • Project Time: Train Your Diffusion Model
  • Summary
  • Exercises
  • Challenges
  • References
  • 5. Stable Diffusion and Conditional Generation
  • Adding Control: Conditional Diffusion Models
  • Improving Efficiency: Latent Diffusion
  • Stable Diffusion: Components in Depth
  • Putting It All Together: Annotated Sampling Loop
  • Open Data, Open Models
  • Project Time: Build an Interactive ML Demo with Gradio
  • Summary
  • Exercises
  • Challenge
  • References
  • II. Transfer Learning for Generative Models
  • 6. Fine-Tuning Language Models
  • Classifying Text
  • Generating Text
  • Instructions
  • A Quick Introduction to Adapters
  • A Light Introduction to Quantization
  • Putting It All Together
  • A Deeper Dive into Evaluation
  • Project Time: Retrieval-Augmented Generation
  • Summary
  • Exercises
  • Challenge
  • References
  • 7. Fine-Tuning Stable Diffusion
  • Full Stable Diffusion Fine-Tuning
  • DreamBooth
  • Training LoRAs
  • Giving Stable Diffusion New Capabilities
  • Project Time: Train an SDXL DreamBooth LoRA by Yourself
  • Summary
  • Exercises
  • Challenge
  • References
  • III. Going Further
  • 8. Creative Applications of Text-to-Image Models
  • Image to Image
  • Inpainting
  • Prompt Weighting and Image Editing
  • Real Image Editing via Inversion
  • ControlNet
  • Image Prompting and Image Variations
  • Project Time: Your Creative Canvas
  • Summary
  • Exercises
  • References
  • 9. Generating Audio
  • Audio Data
  • Speech to Text with Transformer-Based Architectures
  • From Text to Speech to Generative Audio
  • Evaluating Audio-Generation Systems
  • What’s Next?
  • Project Time: End-to-End Conversational System
  • Summary
  • Exercises
  • Challenges
  • References
  • 10. Rapidly Advancing Areas in Generative AI
  • Preference Optimization
  • Long Contexts
  • Mixture of Experts
  • Optimizations and Quantizations
  • Data
  • One Model to Rule Them All
  • Computer Vision
  • 3D Computer Vision
  • Video Generation
  • Multimodality
  • Community
  • A. Open Source Tools
  • B. LLM Memory Requirements
  • C. End-to-End Retrieval-Augmented Generation
  • Index
  • About the Authors

مشخصات

نام کتاب

Hands-On Generative AI with Transformers and Diffusion Models

نویسنده

Omar Sanseviero

انتشارات

O'Reilly Media

تاریخ انتشار

2024

ISBN

9781098149246

تعداد صفحات

576

زبان

انگلیسی

فرمت

pdf

حجم

7MB

موضوع

Artificial Intelligence