
عنوان:
LLMs in Production
نویسنده:
Christopher Brousseau, Matt Sharp
انتشارات:
Manning City: Shelter Island, NY
تاریخ انتشار:
2024
حجم:
4.8MB
معرفی کتاب:" مدلهای زبانی بزرگ در محیط عملیاتی: از مدلهای زبانی تا محصولات موفق ویرایش: اول "
این کتاب راهنمایی جامع و کاربردی برای پیادهسازی مدلهای زبانی بزرگ (LLM) در محیطهای تولیدی واقعی است. از اصول پایه تا پیشرفتهترین تکنیکهای LLMOps، هر آنچه برای تبدیل یک مدل از مرحله آزمایش به محصول واقعی نیاز دارید، در این کتاب خواهید یافت.
آنچه خواهید آموخت
- درک مفاهیم پایهای LLMها و تفاوت آنها با مدلهای سنتی یادگیری ماشین
- تصمیمگیری آگاهانه درباره استفاده از مدل آماده یا ساخت مدل سفارشی
- استفاده از تکنیکهایی مانند LoRA، PEFT، RLHF برای تنظیم مدل با هزینه کم
- استقرار LLM در محیطهای ابری یا لبهای (Edge) با در نظر گرفتن امنیت و کارایی
- بهینهسازی عملکرد مدلها برای سختافزارهای معمولی و سناریوهای عملیاتی
- مدیریت هزینه، زمان استقرار، و آزمونهای تحمل بار (Load Testing)
- ساخت افزونههای هوشمند مانند افزونه VSCode یا استقرار مدل روی Raspberry Pi
محتویات کتاب
کتاب در دو بخش اصلی سازماندهی شده است:
- بخش اول: آشنایی با LLMها، آموزش، دادهها، Fine-tuning، و مهندسی Prompt
- بخش دوم: پیادهسازی پروژههای واقعی شامل:
- ساخت LLM سفارشی
- افزونه هوش مصنوعی برای VSCode
- استقرار LLM روی سختافزارهای سبک مانند Raspberry Pi
تکنولوژیهای پوشش دادهشده
- Python و PyTorch
- Hugging Face Transformers
- Weights & Biases
- Kubernetes، Docker
- dbt، Snowflake برای MLOps
مخاطبان کتاب
این کتاب برای دانشمندان داده، مهندسان یادگیری ماشین و توسعهدهندگان نرمافزار طراحی شده که آشنایی اولیه با پایتون و مفاهیم استقرار ابری دارند. حتی مدیران فنی نیز میتوانند از بینشهای عملی برای تصمیمگیریهای زیرساختی بهرهمند شوند.
درباره نویسندگان
کریستوفر بروسو و مت شارپ از پیشگامان طراحی و اجرای پروژههای LLM در مقیاس تولیدی هستند. تجربه آنها در حوزهی LLMOps باعث شده تا این کتاب سرشار از نکات کاربردی و تجربیات میدانی باشد.
مقدمهای از Joe Reis
جو ریِس، نویسنده کتاب موفق "Fundamentals of Data Engineering"، در مقدمه این کتاب اهمیت معماری دقیق، دادههای استانداردشده و MLOps منسجم را برای موفقیت LLMها تشریح میکند.
فهرست مطالب
- brief contents
- contents
- foreword
- preface
- acknowledgments
- about the book
- Who should read this book
- How this book is organized
- About the code
- liveBook Discussion Forum
- about the authors
- about the cover illustration
- Chapter 1: Words’ awakening: Why large language models have captured attention
- 1.1 Large language models accelerating communication
- 1.2 Navigating the build-and-buy decision with LLMs
- 1.3 Debunking myths
- Summary
- Chapter 2: Large language models: A deep dive into language modeling
- 2.1 Language modeling
- 2.2 Language modeling techniques
- 2.3 Attention is all you need
- 2.4 Really big transformers
- Summary
- Chapter 3: Large language model operations: Building a platform for LLMs
- 3.1 Introduction to large language model operations
- 3.2 Operations challenges with large language models
- 3.3 LLMOps essentials
- 3.4 LLM operations infrastructure
- Summary
- Chapter 4: Data engineering for large language models: Setting up for success
- 4.1 Models are the foundation
- 4.2 Evaluating LLMs
- 4.3 Data for LLMs
- 4.4 Text processors
- 4.5 Preparing a Slack dataset
- Summary
- Chapter 5: Training large language models: How to generate the generator
- 5.1 Multi-GPU environments
- 5.2 Basic training techniques
- 5.3 Advanced training techniques
- 5.4 Training tips and tricks
- Summary
- Chapter 6: Large language model services: A practical guide
- 6.1 Creating an LLM service
- 6.2 Setting up infrastructure
- 6.3 Production challenges
- 6.4 Deploying to the edge
- Summary
- Chapter 7: Prompt engineering: Becoming an LLM whisperer
- 7.1 Prompting your model
- 7.2 Prompt engineering basics
- 7.3 Prompt engineering tooling
- 7.4 Advanced prompt engineering techniques
- Summary
- Chapter 8: Large language model applications: Building an interactive experience
- 8.1 Building an application
- 8.2 Edge applications
- 8.3 LLM agents
- Summary
- Chapter 9: Creating an LLM project: Reimplementing Llama 3
- 9.1 Implementing Meta’s Llama
- 9.2 Simple Llama
- 9.3 Making it better
- 9.4 Deploy to a Hugging Face Hub Space
- Summary
- Chapter 10: Creating a coding copilot project: This would have helped you earlier
- 10.1 Our model
- 10.2 Data is king
- 10.3 Build the VS Code extension
- 10.4 Lessons learned and next steps
- Summary
- Chapter 11: Deploying an LLM on a Raspberry Pi: How low can you go?
- 11.1 Setting up your Raspberry Pi
- 11.2 Preparing the model
- 11.3 Serving the model
- 11.4 Improvements
- Summary
- Chapter 12: Production, an ever-changing landscape: Things are just getting started
- 12.1 A thousand-foot view
- 12.2 The future of LLMs
- 12.3 Final thoughts
- Summary
- Appendix A: History of linguistics
- A.1 Ancient linguistics
- A.2 Medieval linguistics
- A.3 Renaissance and early modern linguistics
- A.4 Early 20th-century linguistics
- A.5 Mid-20th century and modern linguistics
- Appendix B: Reinforcement learning with human feedback
- Appendix C: Multimodal latent spaces
- Index
مشخصات
نام کتاب
LLMs in Production
نویسنده
Christopher Brousseau, Matt Sharp
انتشارات
Manning City: Shelter Island, NY
تاریخ انتشار
2024
ISBN
9781633437203
تعداد صفحات
456
زبان
انگلیسی
فرمت
حجم
4.8MB
موضوع
Large Language Models (LLMs)