Louis-Francois Bouchard, Louie Peters کتاب ساخت مدل‌های زبانی بزرگ برای محیط تولید نوشته

عنوان:

Building LLMs for Production

نویسنده:

Louis-Francois Bouchard, Louie Peters

انتشارات:

Towards AI

تاریخ انتشار

2024

حجم:

5.3MB

دانلود

معرفی کتاب: " ساخت مدل‌های زبانی بزرگ برای محیط تولید "

«این کامل‌ترین کتاب درسی تا به امروز برای ساخت اپلیکیشن‌های مبتنی بر مدل‌های زبانی بزرگ (LLM) است — تمام موضوعات ضروری در جعبه‌ابزار یک مهندس هوش مصنوعی را پوشش می‌دهد.»
– جری لیو، هم‌بنیان‌گذار و مدیرعامل LlamaIndex

خلاصه

با بازخوردهای فوق‌العاده از رهبران صنعت، این کتاب یک منبع جامع از ابتدا تا انتها برای هر کسی است که به دنبال ارتقای مهارت‌های خود یا ورود به دنیای هوش مصنوعی و توسعه‌ی درک خود از هوش مصنوعی مولد و مدل‌های زبانی بزرگ (LLM) است.

این کتاب روش‌های مختلفی برای انطباق LLMهای پایه با کاربردهای خاص با دقت، قابلیت اطمینان و مقیاس‌پذیری بیشتر را بررسی می‌کند. توسط بیش از ۱۰ نفر از تیم Towards AI نوشته شده و با همکاری متخصصانی از Activeloop، LlamaIndex، Mila و دیگران گردآوری شده است.

ویژه‌ی توسعه‌دهندگانی با دانش متوسط از پایتون

ویژگی‌های کلیدی کتاب

  • ✓ راهنمای عملی درباره‌ی LLM، Prompting، بازیابی تقویتی (RAG) و تنظیم دقیق (Fine-tuning)
  • ✓ نقشه راه برای ساخت اپلیکیشن‌های آماده تولید
  • ✓ مبانی نظری مدل‌های زبانی بزرگ
  • ✓ پروژه‌های واقعی به همراه نوت‌بوک‌های اجرایی در Colab
  • ✓ دسترسی به جامعه و مربی اختصاصی هوش مصنوعی

فهرست مطالب

  1. مقدمه‌ای بر مدل‌های زبانی بزرگ
  2. معماری‌ها و چشم‌انداز LLM
  3. LLMها در عمل
  4. مقدمه‌ای بر Prompting
  5. بازیابی تقویتی (RAG)
  6. مقدمه‌ای بر LangChain و LlamaIndex
  7. Prompting با LangChain
  8. ایندکس‌ها، بازیاب‌ها، و آماده‌سازی داده‌ها
  9. RAG پیشرفته
  10. عامل‌ها (Agents)
  11. تنظیم دقیق (Fine-Tuning)
  12. استقرار و بهینه‌سازی

نظرات کارشناسان

«منبعی واقعاً فوق‌العاده که درک مدل‌های زبانی بزرگ را از پایه تا کد و فریم‌ورک‌های مدرن توسعه می‌دهد. بسیار توصیه می‌شود.»
– پیت هوانگ، هم‌بنیان‌گذار The Neuron
«این کتاب مملو از توضیحات جامع، مثال‌ها، و جزئیات کامل است. افزودنی ارزشمند برای کتابخانه‌های شخصی و حرفه‌ای.»
– الکس وولکوف، Weights & Biases
«این کتاب جامع‌ترین مرور بر LLMهایی است که تاکنون دیده‌ام. مقدمه‌ای عالی برای تازه‌واردها و مرجعی ارزشمند برای حرفه‌ای‌ها.»
– شاو طالبی، The Data Entrepreneurs

مناسب برای چه کسانی است؟

چه مبتدی باشید و چه بخواهید مهارت‌های خود را ارتقا دهید، این کتاب برای شماست. از مبانی مدل‌های زبانی بزرگ گرفته تا تسلط بر تنظیم دقیق و RAG برای ساخت اپلیکیشن‌هایی با مقیاس‌پذیری و قابلیت اطمینان بالا، ما در هر قدم همراه شما هستیم.

فهرست مطالب

  • What Experts Think About Building LLMs for Production
  • Acknowledgement
  • (Untitled)
  • Preface
  • (Untitled)
  • Introduction
  • Why Prompt Engineering, Fine-Tuning, and RAG?
  • Coding Environment and Packages
  • Learning Resources
  • (Untitled)
  • Chapter I: Introduction to LLMs
  • What are Large Language Models
  • Key LLM Terminologies
  • From Language Models to Large Language Models
  • History of NLP/LLMs
  • Recap
  • Chapter II: LLM Architectures and Landscape
  • Understanding Transformers
  • Transformer Model’s Design Choices
  • The Generative Pre-trained Transformer (GPT) Architecture
  • Introduction to Large Multimodal Models
  • Proprietary vs. Open Models vs. Open-Source Language Models
  • Applications and Use-Cases of LLMs
  • Recap
  • Chapter III: LLMs in Practice
  • Understanding Hallucinations and Bias
  • Evaluating LLM Performance
  • Controlling LLM Outputs
  • Pretraining and Fine-Tuning LLMs
  • Recap
  • Chapter IV: Introduction to Prompting
  • Prompting and Prompt Engineering
  • Bad Prompt Practices
  • Tips for Effective Prompt Engineering
  • Recap
  • (Untitled)
  • Chapter V: Introduction to LangChain & LlamaIndex
  • LangChain Introduction
  • LangChain Agents & Tools Overview
  • Building LLM-Powered Applications with LangChain
  • Building a News Articles Summarizer
  • LlamaIndex Introduction
  • LangChain vs. LlamaIndex vs. OpenAI Assistants
  • Recap
  • Chapter VI: Prompting with LangChain
  • What are LangChain Prompt Templates
  • Few-Shot Prompts and Example Selectors
  • Managing Outputs with Output Parsers
  • Improving Our News Articles Summarizer
  • Creating Knowledge Graphs from Textual Data: Unveiling Hidden Connections
  • Recap
  • (Untitled)
  • (Untitled)
  • Chapter VII: Retrieval-Augmented Generation
  • (Untitled)
  • Retrieval-Augmented Generation
  • LangChain’s Indexes and Retrievers
  • Data Ingestion
  • What are Text Splitters and Why They are Useful
  • Tutorial: A Customer Support Q&A Chatbot
  • Embeddings
  • What are LangChain Chains
  • Tutorial: A YouTube Video Summarizer Using Whisper and LangChain
  • Tutorial: A Voice Assistant for Your Knowledge Base
  • Preventing Undesirable Outputs With the Self-Critique Chain
  • Recap
  • Chapter VIII: Advanced RAG
  • Prompting vs. Fine-Tuning vs. RAG
  • Advanced RAG Techniques with LlamaIndex
  • Production-Ready RAG Solutions with LlamaIndex
  • RAG - Metrics & Evaluation
  • LangChain’s LangSmith – Introduction
  • Recap
  • (Untitled)
  • Chapter IX: Agents
  • What are Agents: Large Models as Reasoning Engines
  • An Overview of AutoGPT and BabyAGI
  • The Agent Simulation Projects in LangChain
  • Tutorial: Building Agents for Analysis Report Creation
  • Tutorial: Query and Summarize a DB with LlamaIndex
  • Building Agents with OpenAI Assistants
  • Complement Your Agents Using Hugging Face’s APIs
  • LangChain OpenGPT
  • Tutorial: Multimodal Financial Document Analysis from PDFs
  • Recap
  • Chapter X: Fine-Tuning
  • Techniques for Fine-Tuning LLMs
  • Low-Rank Adaptation (LoRA)
  • Practical Example: SFT with LoRA
  • Using SFT for Financial Sentiment
  • Fine-Tuning a Cohere LLM with Medical Data
  • Reinforcement Learning from Human Feedback
  • Tutorial: Improving LLMs with RLHF
  • Recap
  • Chapter XI: Deployment
  • Challenges of LLM Deployment
  • Model Quantization
  • Model Pruning
  • Deploying an LLM on a Cloud CPU
  • Recap
  • (Untitled)
  • Conclusion

مشخصات

نام کتاب

Building LLMs for Production

نویسنده

Louis-Francois Bouchard, Louie Peters

انتشارات

Towards AI

تاریخ انتشار

2024

ISBN

9798324731472

تعداد صفحات

533

زبان

انگلیسی

فرمت

pdf

حجم

5.3MB

موضوع

Artificial Intelligence > machine learning >large language models