
عنوان:
RAG-Driven Generative AI
نویسنده:
Denis Rothman
انتشارات:
Packt
تاریخ انتشار:
2024
حجم:
4.1MB
معرفی کتاب:" هوش مصنوعی مولد هدایتشده با RAG: ساخت خطوط تولید سفارشی بازیابی تقویتشده با استفاده از LlamaIndex، Deep Lake و Pinecone"
کاهش خطاهای «توهم» در هوش مصنوعی و ساخت خطوط تولید دقیق و سفارشی هوش مصنوعی مولد با استفاده از RAG و پایگاههای داده برداری تعبیهشده همراه با بازخورد انسانی یکپارچه.
ویژگیهای کلیدی
- پیادهسازی خروجیهای قابل پیگیری RAG، بهطوری که هر پاسخ به سند منبع خود متصل باشد تا عوامل گفتگوی چندرسانهای قابل اعتماد ساخته شود
- ارائه مدلهای دقیق هوش مصنوعی مولد در خطوط تولیدی که RAG، بهبود بازخورد انسانی در زمان واقعی و نمودارهای دانش را یکپارچه میکنند
- متعادلسازی هزینه و عملکرد بین مجموعه دادههای بازیابی پویا و دادههای ایستا که با ریزتنظیم بهینه شدهاند
توضیحات کتاب
کتاب «هوش مصنوعی مولد هدایتشده با RAG» نقشه راهی برای ساخت سیستمهای مؤثر LLM (مدلهای زبان بزرگ)، بینایی کامپیوتری و هوش مصنوعی مولد ارائه میدهد که عملکرد و هزینه را به تعادل میرسانند.
این کتاب بهطور دقیق به بررسی RAG میپردازد و نحوه طراحی، مدیریت و کنترل خطوط تولید هوش مصنوعی چندرسانهای را آموزش میدهد. با اتصال خروجیها به اسناد منبع قابل پیگیری، RAG دقت و مرتبط بودن زمینهای خروجیها را افزایش میدهد و رویکردی پویا برای مدیریت حجم بالای اطلاعات ارائه میکند.
این کتاب چارچوب ساخت RAG را آموزش میدهد و دانش عملی درباره ذخیرهسازهای برداری، تقسیمبندی دادهها (chunking)، ایندکسگذاری و رتبهبندی ارائه میکند. شما با تکنیکهایی برای بهینهسازی عملکرد پروژه و درک بهتر دادهها آشنا میشوید، از جمله استفاده از RAG تطبیقی و بازخورد انسانی برای بهبود دقت بازیابی، متعادلسازی RAG با ریزتنظیم، پیادهسازی RAG پویا برای ارتقای تصمیمگیری در زمان واقعی و تصویریسازی دادههای پیچیده با نمودارهای دانش.
شما با ترکیبی عملی از چارچوبهایی مانند LlamaIndex و Deep Lake، پایگاههای داده برداری مانند Pinecone و Chroma، و مدلهایی از Hugging Face و OpenAI آشنا خواهید شد. تا پایان این کتاب، مهارت لازم برای پیادهسازی راهحلهای هوشمند را به دست میآورید و در زمینههایی از تولید تا خدمات مشتری در هر پروژه رقابتی باقی میمانید.
آنچه خواهید آموخت
- مقیاسبندی خطوط تولید RAG برای مدیریت بهینه دادههای بزرگ
- بهکارگیری تکنیکهایی که خطاهای توهمآمیز را کاهش داده و پاسخهای دقیق تضمین میکنند
- پیادهسازی روشهای ایندکسگذاری برای بهبود دقت هوش مصنوعی با خروجیهای قابل پیگیری و شفاف
- سفارشیسازی و مقیاسبندی سیستمهای هوش مصنوعی مولد هدایتشده توسط RAG در حوزههای مختلف
- استفاده از Deep Lake و Pinecone برای بازیابی داده سریع و کارآمد
- کنترل و ساخت سیستمهای هوش مصنوعی مولد مستحکم مبتنی بر دادههای واقعی
- ترکیب دادههای متنی و تصویری برای پاسخهای غنیتر و آموزندهتر هوش مصنوعی
مخاطبان کتاب
این کتاب برای دانشمندان داده، مهندسان هوش مصنوعی، مهندسان یادگیری ماشین و مهندسان MLOps ایدهآل است. همچنین اگر شما معمار راهحلها، توسعهدهنده نرمافزار، مدیر محصول یا مدیر پروژه هستید و به دنبال بهبود فرآیند تصمیمگیری در ساخت برنامههای RAG میباشید، این کتاب برای شما بسیار مفید خواهد بود.
فهرست مطالب
- Preface
- Why Retrieval Augmented Generation?
- What is RAG?
- Naïve, advanced, and modular RAG configurations
- RAG versus fine-tuning
- The RAG ecosystem
- Naïve, advanced, and modular RAG in code
- Summary
- Questions
- References
- Further reading
- RAG Embedding Vector Stores with Deep Lake and OpenAI
- From raw data to embeddings in vector stores
- Organizing RAG in a pipeline
- A RAG-driven generative AI pipeline
- Building a RAG pipeline
- Evaluating the output with cosine similarity
- Summary
- Questions
- References
- Further reading
- Building Index-Based RAG with LlamaIndex, Deep Lake, and OpenAI
- Why use index-based RAG?
- Building a semantic search engine and generative agent for drone technology
- Vector store index query engine
- Tree index query engine
- List index query engine
- Keyword index query engine
- Summary
- Questions
- References
- Further reading
- Multimodal Modular RAG for Drone Technology
- What is multimodal modular RAG?
- Building a multimodal modular RAG program for drone technology
- Summary
- Questions
- References
- Further reading
- Boosting RAG Performance with Expert Human Feedback
- Adaptive RAG
- Building hybrid adaptive RAG in Python
- Summary
- Questions
- References
- Further reading
- Scaling RAG Bank Customer Data with Pinecone
- Scaling with Pinecone
- Pipeline 1: Collecting and preparing the dataset
- Pipeline 2: Scaling a Pinecone index (vector store)
- Pipeline 3: RAG generative AI
- Summary
- Questions
- References
- Further reading
- Building Scalable Knowledge-Graph-Based RAG with Wikipedia API and LlamaIndex
- The architecture of RAG for knowledge-graph-based semantic search
- Pipeline 1: Collecting and preparing the documents
- Pipeline 2: Creating and populating the Deep Lake vector store
- Pipeline 3: Knowledge graph index-based RAG
- Summary
- Questions
- References
- Further reading
- Dynamic RAG with Chroma and Hugging Face Llama
- The architecture of dynamic RAG
- Installing the environment
- Activating session time
- Downloading and preparing the dataset
- Embedding and upserting the data in a Chroma collection
- Querying the collection
- Prompt and retrieval
- RAG with Llama
- Total session time
- Summary
- Questions
- References
- Further reading
- Empowering AI Models: Fine-Tuning RAG Data and Human Feedback
- The architecture of fine-tuning static RAG data
- Installing the environment
- 1. Preparing the dataset for fine-tuning
- 2. Fine-tuning the model
- 3. Using the fine-tuned OpenAI model
- Metrics
- Summary
- Questions
- References
- Further reading
- RAG for Video Stock Production with Pinecone and OpenAI
- The architecture of RAG for video production
- The environment of the video production ecosystem
- Pipeline 1: Generator and Commentator
- Pipeline 2: The Vector Store Administrator
- Pipeline 3: The Video Expert
- Summary
- Questions
- References
- Further reading
- Appendix
- Other Books You May Enjoy
- Index
مشخصات
نام کتاب
RAG-Driven Generative AI
نویسنده
Denis Rothman
انتشارات
Packt
تاریخ انتشار
2024
ISBN
9781836200918
تعداد صفحات
493
زبان
انگلیسی
فرمت
حجم
4.1MB
موضوع
Generative AI