
عنوان:
LLM Engineer's Handbook
نویسنده:
Maxime Labonne, Paul Iusztin
انتشارات:
Packt Publishing
تاریخ انتشار:
2024
حجم:
4.91MB
معرفی کتاب:" راهنمای مهندسی LLM: تسلط بر هنر مهندسی مدلهای زبانی بزرگ از مفاهیم تا تولید (LLM Engineer's Handbook)"
معرفی کلی
با این راهنمای کاربردی وارد دنیای LLMها شوید که شما را از مبانی ابتدایی تا استقرار اپلیکیشنهای پیشرفته با استفاده از بهترین شیوههای LLMOps راهنمایی میکند.
ویژگیهای کلیدی
- ساخت و بهبود LLMها گام به گام، شامل آمادهسازی دادهها، RAG و fine-tuning
- یادگیری مهارتهای ضروری برای استقرار و نظارت بر LLMها، با هدف اطمینان از عملکرد بهینه در محیطهای تولید
- استفاده از alignment ترجیحات، ارزیابی و بهینهسازی استنتاج برای افزایش عملکرد و سازگاری اپلیکیشنهای LLM شما
توضیحات کتاب
هوش مصنوعی در مسیر پیشرفت سریع قرار دارد و مدلهای زبانی بزرگ (LLM) در صدر این انقلاب قرار دارند. این کتاب به شما بینشهایی در مورد طراحی، آموزش و استقرار LLMها در سناریوهای واقعی با استفاده از بهترین شیوههای MLOps ارائه میدهد. راهنما شما را از ساخت یک LLM-powered twin که مقرون به صرفه، مقیاسپذیر و ماژولار است، آشنا میکند.
این کتاب فراتر از Jupyter notebooks ایزوله رفته و به شما نشان میدهد چگونه سیستمهای LLM در سطح تولید بسازید. در طول این کتاب، یاد میگیرید چگونه مهندسی دادهها، fine-tuning نظارتشده و استقرار LLMها را انجام دهید.
روش عملی استفاده از LLM Twin به شما کمک میکند تا اجزای MLOps را در پروژههای خود پیادهسازی کنید. همچنین به پیشرفتهای نوین در این حوزه مانند بهینهسازی استنتاج، alignment ترجیحات و پردازش دادههای بلادرنگ پرداخته میشود که این کتاب را به منبعی ضروری برای کسانی تبدیل میکند که میخواهند LLMها را در پروژههای خود بهکار ببرند.
آنچه خواهید آموخت
- پیادهسازی پایپلاینهای دادهای مستحکم و مدیریت چرخههای آموزشی LLM
- ساخت LLM خود و بهبود آن با استفاده از مثالهای عملی
- شروع کار با LLMOps و اصول MLOps مانند orchestrators و prompt monitoring
- انجام fine-tuning نظارتشده و ارزیابی LLMها
- استقرار راهحلهای LLM در سطح تولید با استفاده از AWS و دیگر ابزارها
- طراحی سیستمهای LLM مقیاسپذیر و ماژولار
- آشنایی با RAG و ساخت یک feature و inference pipeline
مخاطبان کتاب
این کتاب برای مهندسان هوش مصنوعی، متخصصان NLP و مهندسان LLM است که میخواهند درک عمیقتری از LLMها داشته باشند. داشتن دانش پایه از LLMها، Gen AI، Python و AWS توصیه میشود. چه شما تازهکار در هوش مصنوعی باشید و چه بخواهید مهارتهای خود را بهبود دهید، این کتاب راهنمای جامع برای پیادهسازی LLMها در سناریوهای واقعی است.
فهرست مطالب
- Cover
- Copyright
- Contributors
- Table of Contents
- Preface
- Chapter 1: Understanding the LLM Twin Concept and Its Architecture
- Understanding the LLM twin concept
- Planning the MVP of the LLM twin product
- Building ML systems with feature/training/inference pipelines
- Designing the system architecture of the LLM twin
- Summary
- References
- Chapter 2: Tooling and Installation
- Python ecosystem and project installation
- MLOps and LLMOps tooling
- Databases for storing unstructured and vector data
- Preparing for AWS
- Summary
- References
- Chapter 3: Data Engineering
- Designing the LLM Twin’s data collection pipeline
- Gathering raw data into the data warehouse
- Summary
- References
- Chapter 4: RAG Feature Pipeline
- Understanding RAG
- An overview of advanced RAG
- Exploring the LLM Twin’s RAG feature pipeline architecture
- Implementing the LLM Twin’s RAG feature pipeline
- Summary
- References
- Chapter 5: Supervised Fine-Tuning
- Creating an instruction dataset
- Creating our own instruction dataset
- Exploring SFT and its techniques
- Fine-tuning in practice
- Summary
- References
- Chapter 6: Fine-Tuning with Preference Alignment
- Understanding preference datasets
- Creating our own preference dataset
- Preference alignment
- Implementing DPO
- Summary
- References
- Chapter 7: Evaluating LLMs
- Model evaluation
- RAG evaluation
- Evaluating TwinLlama-3.1-8B
- Summary
- References
- Chapter 8: Inference Optimization
- Model optimization strategies
- Model parallelism
- Model quantization
- Summary
- References
- Chapter 9: RAG Inference Pipeline
- Understanding the LLM twin’s RAG inference pipeline
- Exploring the LLM twin’s advanced RAG techniques
- Implementing the LLM twin’s RAG inference pipeline
- Summary
- References
- Chapter 10: Inference Pipeline Deployment
- Criteria for choosing deployment types
- Understanding inference deployment types
- Monolithic versus microservices architecture in model serving
- Exploring the LLM Twin’s inference pipeline deployment strategy
- Deploying the LLM Twin service
- Autoscaling capabilities to handle spikes in usage
- Summary
- References
- Chapter 11: MLOps and LLMOps
- The path to LLMOps: Understanding its roots in DevOps and MLOps
- Deploying the LLM Twin’s pipelines to the cloud
- Adding LLMOps to the LLM Twin
- Summary
- References
- Appendix: MLOps Principles
- Packt Page
- Other Books You May Enjoy
- Index
مشخصات
نام کتاب
LLM Engineer's Handbook: Master the art of engineering large language models from concept to production
نویسنده
Maxime Labonne, Paul Iusztin
انتشارات
Packt Publishing
تاریخ انتشار
2024
ISBN
9781836200079
تعداد صفحات
523
زبان
انگلیسی
فرمت
حجم
4.91MB
موضوع
LLMs | Generative Ai