کتاب اصول علوم داده ویرایش سوم: راهنمایی برای مبتدیان در مهارت‌های ضروری ریاضی و کدنویسی برای تسلط بر داده و یادگیری ماشین

عنوان:

Principles of Data Science - Third Edition

نویسنده:

Sinan Ozdemir

انتشارات:

Packt Publishing Pvt Ltd

نسخه:

pdf

حجم:

4.3MB

دانلود

معرفی کتاب: "اصول علوم داده ویرایش سوم: راهنمایی برای مبتدیان در مهارت‌های ضروری ریاضی و کدنویسی برای تسلط بر داده و یادگیری ماشین"

داده‌های خود را به بینش تبدیل کنید! اگر می‌خواهید با تسلط بر ریاضی، آمار و یادگیری ماشین، به کشف الگوها و حل مسائل واقعی بپردازید، کتاب «اصول علوم داده» یکی از بهترین راهنماها برای شماست. این کتاب به‌جای تمرکز صرف بر تئوری، شما را به دنیای عملی و کاربردی علوم داده می‌برد؛ جایی که مفاهیم انتزاعی تبدیل به ابزارهایی برای درک بهتر جهان می‌شوند.

ویژگی‌های کلیدی:

  • آموزش علوم داده کاربردی همراه با مفاهیم نظری داده برای استخراج حداکثر بینش
  • پیاده‌سازی خطوط یادگیری ماشین، بررسی مدل‌های زبانی بزرگ و کاربرد یادگیری انتقالی
  • تمرکز ویژه بر کاهش سوگیری در داده‌ها، مدل‌ها و فرایندهای تصمیم‌گیری
  • مطالعه مطالعات موردی واقعی برای یادگیری عمیق و بلافاصله قابل استفاده
  • آشنایی با موضوعات پیشرفته مانند MLOps، حفظ حریم خصوصی، و حکمرانی داده

توضیحات کتاب:

کتاب «اصول علوم داده» شما را گام‌به‌گام از پایه‌ترین مراحل مثل پاک‌سازی داده، تا تحلیل‌های پیچیده، مدل‌سازی پیشرفته و مصورسازی بینش‌ها پیش می‌برد. این کتاب ترکیبی است از ریاضیات محاسباتی، برنامه‌نویسی پایتون و آمار کاربردی با تمرکز ویژه بر کاربرد در دنیای واقعی.

از مدل‌های کلاسیک تا مدل‌های پیش‌آموزش‌دیده‌ای چون GPT و BERT، این کتاب شما را با روش‌های مدرن تحلیل داده آشنا می‌سازد. همچنین خواهید آموخت چگونه با مصورسازی مؤثر، داستان داده را روایت کرده و بینش‌ها را با دیگران به اشتراک بگذارید.

آنچه در این کتاب می‌آموزید:

  • آشنایی گام‌به‌گام با فرایندهای اساسی علوم داده، از جمع‌آوری تا تحلیل
  • تلفیق آمار پیشرفته و یادگیری ماشین برای حل مسائل تحلیلی
  • کاربرد عملی مفاهیم ریاضی مانند احتمال، حسابان و جبر خطی
  • درک و به‌کارگیری مدل‌های زبانی بزرگ مانند BERT و GPT
  • ارزیابی کیفیت مدل‌ها و آشنایی با تکنیک‌های MLOps
  • مصورسازی داده‌ها به صورت حرفه‌ای برای تصمیم‌گیری‌های تجاری
  • شناسایی و کاهش سوگیری‌ها در داده‌ها و الگوریتم‌ها

مخاطبان این کتاب:

  • دانشمندان داده تازه‌کار که می‌خواهند پایه‌های ریاضی و آماری خود را تقویت کنند
  • برنامه‌نویسان پایتون که به دنبال ورود به دنیای علوم داده هستند
  • تحلیلگران داده که به دنبال ارتقاء سطح تحلیل و مدل‌سازی خود هستند
  • علاقه‌مندان به هوش مصنوعی و یادگیری ماشین که می‌خواهند مفاهیم را با رویکردی کاربردی یاد بگیرند

نتیجه‌گیری:

کتاب «اصول علوم داده» شما را به یک متخصص چندبعدی تبدیل می‌کند؛ کسی که نه‌تنها با آمار و مدل‌ها آشناست، بلکه می‌داند چگونه آن‌ها را برای حل مسائل تجاری و تحلیل‌های واقعی به‌کار بگیرد. چه به‌دنبال رشد شغلی باشید، چه صرفاً یادگیری عمیق‌تر، این کتاب همراهی ایده‌آل برای مسیر شماست.

فهرست مطالب

  • Contributor
  • About the author
  • About the reviewer
  • Preface
  • Chapter 1: Data Science Terminology
  • What is data science?
  • The data science Venn diagram
  • Some more terminology
  • Data science case studies
  • Summary
  • Chapter 2: Types of Data
  • Structured versus unstructured data
  • The four levels of data
  • Summary
  • Questions and answers
  • Chapter 3: The Five Steps of Data Science
  • Introduction to data science
  • Exploring the data
  • Summary
  • Chapter 4: Basic Mathematics
  • Basic symbols and terminology
  • Linear algebra
  • Summary
  • Chapter 5: Impossible or Improbable – A Gentle Introduction to Probability
  • Basic definitions
  • Bayesian versus frequentist
  • How to utilize the rules of probability
  • Introduction to binary classifiers
  • Summary
  • Chapter 6: Advanced Probability
  • Bayesian ideas revisited
  • Random variables
  • Summary
  • Chapter 7: What Are the Chances? An Introduction to Statistics
  • What are statistics?
  • How do we obtain and sample data?
  • How do we measure statistics?
  • The empirical rule
  • Summary
  • Chapter 8: Advanced Statistics
  • Understanding point estimates
  • Sampling distributions
  • Confidence intervals
  • Hypothesis tests
  • Summary
  • Chapter 9: Communicating Data
  • Why does communication matter?
  • Identifying effective visualizations
  • When graphs and statistics lie
  • Verbal communication
  • Summary
  • Chapter 10: How to Tell if Your Toaster is Learning – Machine Learning Essentials
  • Introducing ML
  • Types of ML
  • Predicting continuous variables with linear regression
  • Summary
  • Chapter 11: Predictions Don’t Grow on Trees, or Do They?
  • Performing naïve Bayes classification
  • Understanding decision trees
  • Diving deep into UL
  • Feature extraction and PCA
  • Summary
  • Chapter 12: Introduction to Transfer Learning and Pre-Trained Models
  • Understanding pre-trained models
  • Different types of TL
  • TL with BERT and GPT
  • Summary
  • Chapter 13: Mitigating Algorithmic Bias and Tackling Model and Data Drift
  • Understanding algorithmic bias
  • Sources of algorithmic bias
  • Measuring bias
  • Consequences of unaddressed bias and the importance of fairness
  • Mitigating algorithmic bias
  • Bias in LLMs
  • Emerging techniques in bias and fairness in ML
  • Understanding model drift and decay
  • Mitigating drift
  • Summary
  • Chapter 14: AI Governance
  • Mastering data governance
  • Navigating the intricacy and the anatomy of ML governance
  • A guide to architectural governance
  • Summary
  • Chapter 15: Navigating Real-World Data Science Case Studies in Action
  • Introduction to the COMPAS dataset case study
  • Text embeddings using pretrained models and OpenAI
  • Summary
  • Index
  • Other Books You May Enjoy

مشخصات

نام کتاب

Principles of Data Science - Third Edition

نویسنده

Sinan Ozdemir

انتشارات

Packt Publishing Pvt Ltd

تاریخ انتشار

2024

ISBN

9781837636303

تعداد صفحات

330

زبان

انگلیسی

فرمت

pdf

حجم

4.3MB

موضوع

Data science