
عنوان:
Generative AI on AWS
نویسنده:
Chris Fregly, Antje Barth, Shelbee Eigenbrode
انتشارات:
.O’Reilly Media, Inc
تاریخ انتشار:
2023
حجم:
2.78MB
معرفی کتاب:"هوش مصنوعی مولد در AWS (Generative AI on AWS) "
امروزه شرکتها به سرعت در حال ادغام هوش مصنوعی مولد در محصولات و خدمات خود هستند، اما در مورد تأثیر و وعدههای این فناوری، تبلیغات زیادی وجود دارد و بسیاری دچار سوءتفاهم شدهاند. با این کتاب، کریس فِرِگلی (Chris Fregly)، آنتجی بارت (Antje Barth) و شلبی آینبروود (Shelbee Eigenbrode) از AWS، به CTOها، متخصصان یادگیری ماشین، توسعهدهندگان، تحلیلگران کسبوکار، مهندسان داده و دانشمندان داده کمک میکنند تا روشهای عملی برای بهرهگیری از این فناوری هیجانانگیز بیابند.
در این کتاب، شما چرخه عمر کامل پروژههای هوش مصنوعی مولد را میآموزید، شامل تعریف کاربرد، انتخاب مدل، تنظیم دقیق مدل، تولید تقویتشده با بازیابی (RAG), یادگیری تقویتی با بازخورد انسانی (RLHF), کوانتیزهسازی، بهینهسازی و استقرار مدل. همچنین با انواع مدلها، از جمله مدلهای زبان بزرگ (LLM) و مدلهای چندرسانهای مانند Stable Diffusion برای تولید تصویر و Flamingo/IDEFICS برای پاسخ به پرسشها درباره تصاویر، آشنا خواهید شد.
آنچه خواهید آموخت:
- اعمال هوش مصنوعی مولد در کاربردهای کسبوکار خود
- تعیین مدلهای هوش مصنوعی مولد مناسب برای پروژههای خود
- انجام مهندسی پرامپت و یادگیری در متن (in-context learning)
- تنظیم دقیق مدلهای مولد روی دادههای خود با LoRA (Low-Rank Adaptation)
- همسوسازی مدلها با ارزشهای انسانی از طریق یادگیری تقویتی با بازخورد انسانی (RLHF)
- تقویت مدل با تولید تقویتشده با بازیابی (RAG)
- بررسی کتابخانههایی مانند LangChain و ReAct برای توسعه عوامل و اقدامات
- ساخت برنامههای هوش مصنوعی مولد با Amazon Bedrock
فهرست مطالب
- Cover
- Copyright
- Table of Contents
- Preface
- Chapter 1. Generative AI Use Cases, Fundamentals, and Project Life Cycle
- Use Cases and Tasks
- Foundation Models and Model Hubs
- Generative AI Project Life Cycle
- Generative AI on AWS
- Why Generative AI on AWS?
- Building Generative AI Applications on AWS
- Summary
- Chapter 2. Prompt Engineering and In-Context Learning
- Prompts and Completions
- Tokens
- Prompt Engineering
- Prompt Structure
- In-Context Learning with Few-Shot Inference
- Prompt-Engineering Best Practices
- Inference Configuration Parameters
- Summary
- Chapter 3. Large-Language Foundation Models
- Large-Language Foundation Models
- Tokenizers
- Embedding Vectors
- Transformer Architecture
- Types of Transformer-Based Foundation Models
- Pretraining Datasets
- Scaling Laws
- Compute-Optimal Models
- Summary
- Chapter 4. Memory and Compute Optimizations
- Memory Challenges
- Data Types and Numerical Precision
- Quantization
- Optimizing the Self-Attention Layers
- Distributed Computing
- Distributed Computing on AWS
- Summary
- Chapter 5. Fine-Tuning and Evaluation
- Instruction Fine-Tuning
- Instruction Dataset
- Instruction Fine-Tuning
- Evaluation
- Summary
- Chapter 6. Parameter-Efficient Fine-Tuning
- Full Fine-Tuning Versus PEFT
- LoRA and QLoRA
- Prompt Tuning and Soft Prompts
- Summary
- Chapter 7. Fine-Tuning with Reinforcement Learning from Human Feedback
- Human Alignment: Helpful, Honest, and Harmless
- Reinforcement Learning Overview
- Train a Custom Reward Model
- Existing Reward Model: Toxicity Detector by Meta
- Fine-Tune with Reinforcement Learning from Human Feedback
- Evaluate RLHF Fine-Tuned Model
- Summary
- Chapter 8. Model Deployment Optimizations
- Model Optimizations for Inference
- Large Model Inference Container
- AWS Inferentia: Purpose-Built Hardware for Inference
- Model Update and Deployment Strategies
- Metrics and Monitoring
- Autoscaling
- Summary
- Chapter 9. Context-Aware Reasoning Applications Using RAG and Agents
- Large Language Model Limitations
- Retrieval-Augmented Generation
- RAG Orchestration and Implementation
- Agents
- Generative AI Applications
- FMOps: Operationalizing the Generative AI Project Life Cycle
- Summary
- Chapter 10. Multimodal Foundation Models
- Use Cases
- Multimodal Prompt Engineering Best Practices
- Image Generation and Enhancement
- Inpainting, Outpainting, Depth-to-Image
- Image Captioning and Visual Question Answering
- Model Evaluation
- Diffusion Architecture Fundamentals
- Stable Diffusion 2 Architecture
- Stable Diffusion XL Architecture
- Summary
- Chapter 11. Controlled Generation and Fine-Tuning with Stable Diffusion
- ControlNet
- Fine-Tuning
- Human Alignment with Reinforcement Learning from Human Feedback
- Summary
- Chapter 12. Amazon Bedrock: Managed Service for Generative AI
- Bedrock Foundation Models
- Bedrock Inference APIs
- Large Language Models
- Fine-Tuning
- Agents
- Multimodal Models
- Data Privacy and Network Security
- Governance and Monitoring
- Summary
- Index
- About the Authors
- Colophon
مشخصات
نام کتاب
Generative AI on AWS: Building Context-Aware Multimodal Reasoning Applications
نویسنده
Chris Fregly, Antje Barth, Shelbee Eigenbrode
انتشارات
.O’Reilly Media, Inc
تاریخ انتشار
2023
ISBN
9781098159221
تعداد صفحات
312
زبان
انگلیسی
فرمت
حجم
2.78MB
موضوع
Artificial Intelligence