جلد کتاب Pandas در عمل: Pandas in Action

عنوان:

Pandas in Action

نویسنده:

Boris Paskhaver

انتشارات:

Manning Publications

تاریخ انتشار:

2021

حجم:

3.87MB

دانلود

معرفی کتاب: "Pandas در عمل: Pandas in Action"

قدم‌های بعدی در مسیر حرفه‌ای علوم داده خود را بردارید! این راهنمای دوستانه و عملی به شما نشان می‌دهد چگونه با مهارت‌هایی که از نرم‌افزارهای صفحه گسترده می‌شناسید، شروع به تسلط بر Pandas کنید.

در این کتاب می‌آموزید:

  • وارد کردن مجموعه داده‌ها، شناسایی مشکلات ساختار داده‌ها و بهینه‌سازی آن‌ها برای کارایی
  • مرتب‌سازی، فیلتر کردن، pivot و نتیجه‌گیری از یک مجموعه داده و زیرمجموعه‌های آن
  • شناسایی روندها در داده‌های متنی و زمانی
  • سازماندهی، گروه‌بندی، ادغام و join کردن مجموعه داده‌های جداگانه
  • استفاده از یک شیء GroupBy برای نگهداری چندین DataFrame

Pandas به سرعت تبدیل به یکی از محبوب‌ترین کتابخانه‌های تحلیل داده در Python شده است. در Pandas در عمل، نویسنده Boris Paskhaver با ارائه مثال‌های فراوان، به شما نشان می‌دهد چگونه بر این ابزار چندکاره تسلط پیدا کرده و قدم بعدی در مسیر حرفه‌ای علوم داده خود را بردارید. شما خواهید دید که Pandas تا چه اندازه انجام کارهایی مانند مرتب‌سازی، تحلیل، فیلتر کردن و مدیریت تقریبا هر نوع داده‌ای را آسان می‌کند.

درباره فناوری:

تحلیل داده با Python نباید دشوار باشد. اگر می‌توانید از صفحه گسترده استفاده کنید، می‌توانید Pandas را یاد بگیرید! هرچند ظاهر شبکه‌ای آن ممکن است یادآور Excel باشد، اما Pandas بسیار انعطاف‌پذیر و قدرتمندتر است. این کتابخانه Python عملیات روی میلیون‌ها ردیف را به سرعت انجام می‌دهد و به آسانی با سایر ابزارها در اکوسیستم داده Python تعامل دارد. این روش مناسبی برای ارتقاء مهارت‌های داده‌ای شماست.

درباره کتاب:

Pandas در عمل تحلیل داده مبتنی بر Python را با استفاده از کتابخانه Pandas معرفی می‌کند. شما یاد می‌گیرید عملیات تکراری را خودکار کنید و به بینش‌های عمیق‌تری در داده‌های خود دست یابید که در Excel غیرعملی یا غیرممکن بودند. هر فصل یک آموزش مستقل است و مجموعه داده‌های واقعی قابل دانلود به شما کمک می‌کنند از داده‌های آشفته‌ای که در دنیای واقعی پیدا می‌کنید، بیاموزید.

آنچه در کتاب خواهید یافت:

  • سازماندهی، گروه‌بندی، ادغام، تقسیم و join کردن مجموعه داده‌ها
  • شناسایی روندها در داده‌های متنی و زمانی
  • مرتب‌سازی، فیلتر کردن، pivot، بهینه‌سازی و نتیجه‌گیری
  • اعمال عملیات تجمیعی (aggregate)

مخاطب کتاب:

خوانندگانی که با صفحه گسترده آشنا هستند و برنامه‌نویسی پایه Python را می‌دانند.

درباره نویسنده:

Boris Paskhaver مهندس نرم‌افزار، مشاور Agile و مدرس آنلاین است. دوره‌های برنامه‌نویسی او توسط ۳۰۰,۰۰۰ دانشجو در ۱۹۰ کشور دنبال شده است.

فهرست مطالب

  • Pandas in Action
  • Dedication
  • Copyright
  • Front Matter
  • Part 1: Core pandas
  • Chapter 1: Introducing pandas
  • 1.1 Data in the 21st century
  • 1.2 Introducing pandas
  • 1.3 A tour of pandas
  • Summary
  • Chapter 2: The Series object
  • 2.1 Overview of a Series
  • 2.2 Creating a Series from Python objects
  • 2.3 Series attributes
  • 2.4 Retrieving the first and last rows
  • 2.5 Mathematical operations
  • 2.6 Passing the Series to Python’s built-in functions
  • 2.7 Coding challenge
  • Summary
  • Chapter 3: Series methods
  • 3.1 Importing a data set with the read_csv function
  • 3.2 Sorting a Series
  • 3.3 Overwriting a Series with the inplace parameter
  • 3.4 Counting values with the value_counts method
  • 3.5 Invoking a function on every Series value with the apply method
  • 3.6 Coding challenge
  • Summary
  • Chapter 4: The DataFrame object
  • 4.1 Overview of a DataFrame
  • 4.2 Similarities between Series and DataFrames
  • 4.3 Sorting a DataFrame
  • 4.4 Sorting by index
  • 4.5 Setting a new index
  • 4.6 Selecting columns and rows from a DataFrame
  • 4.7 Selecting rows from a DataFrame
  • 4.8 Extracting values from Series
  • 4.9 Renaming columns or rows
  • 4.10 Resetting an index
  • 4.11 Coding challenge
  • Summary
  • Chapter 5: Filtering a DataFrame
  • 5.1 Optimizing a data set for memory use
  • 5.2 Filtering by a single condition
  • 5.3 Filtering by multiple conditions
  • 5.4 Filtering by condition
  • 5.5 Dealing with duplicates
  • 5.6 Coding challenge
  • Summary
  • Part 2: Applied pandas
  • Chapter 6: Working with text data
  • 6.1 Letter casing and whitespace
  • 6.2 String slicing
  • 6.3 String slicing and character replacement
  • 6.4 Boolean methods
  • 6.5 Splitting strings
  • 6.6 Coding challenge
  • 6.7 A note on regular expressions
  • Summary
  • Chapter 7: MultiIndex DataFrames
  • 7.1 The MultiIndex object
  • 7.2 MultiIndex DataFrames
  • 7.3 Sorting a MultiIndex
  • 7.4 Selecting with a MultiIndex
  • 7.5 Cross-sections
  • 7.6 Manipulating the Index
  • 7.7 Coding challenge
  • Summary
  • Chapter 8: Reshaping and pivoting
  • 8.1 Wide vs. narrow data
  • 8.2 Creating a pivot table from a DataFrame
  • 8.3 Stacking and unstacking index levels
  • 8.4 Melting a data set
  • 8.5 Exploding a list of values
  • 8.6 Coding challenge
  • Summary
  • Chapter 9: The GroupBy object
  • 9.1 Creating a GroupBy object from scratch
  • 9.2 Creating a GroupBy object from a data set
  • 9.3 Attributes and methods of a GroupBy object
  • 9.4 Aggregate operations
  • 9.5 Applying a custom operation to all groups
  • 9.6 Grouping by multiple columns
  • 9.7 Coding challenge
  • Summary
  • Chapter 10: Merging, joining, and concatenating
  • 10.1 Introducing the data sets
  • 10.2 Concatenating data sets
  • 10.3 Missing values in concatenated DataFrames
  • 10.4 Left joins
  • 10.5 Inner joins
  • 10.6 Outer joins
  • 10.7 Merging on index labels
  • 10.8 Coding challenge
  • Summary
  • Chapter 11: Working with dates and times
  • 11.1 Introducing the Timestamp object
  • 11.2 Storing multiple timestamps in a DatetimeIndex
  • 11.3 Converting column or index values to datetimes
  • 11.4 Using the DatetimeProperties object
  • 11.5 Adding and subtracting durations of time
  • 11.6 Date offsets
  • 11.7 The Timedelta object
  • 11.8 Coding challenge
  • Summary
  • Chapter 12: Imports and exports
  • 12.1 Reading from and writing to JSON files
  • 12.2 Reading from and writing to CSV files
  • 12.3 Reading from and writing to Excel workbooks
  • 12.4 Coding challenge
  • Summary
  • Chapter 13: Configuring pandas
  • 13.1 Getting and setting pandas options
  • 13.2 Precision
  • 13.3 Maximum column width
  • 13.4 Chop threshold
  • 13.5 Option context
  • Summary
  • Chapter 14: Visualization
  • 14.1 Installing matplotlib
  • 14.2 Line charts
  • 14.3 Bar graphs
  • 14.4 Pie charts
  • Summary
  • Appendix A: Installation and setup
  • Appendix B: Python crash course
  • Appendix C: NumPy crash course
  • Appendix D: Generating fake data with Faker
  • Appendix E: Regular expressions
  • Index

مشخصات

نام کتاب

Pandas in Action Edition: 1

نویسنده

Boris Paskhaver

انتشارات

Manning Publications

تاریخ انتشار

2021

ISBN

9781617297434

تعداد صفحات

736

زبان

انگلیسی

فرمت

pdf

حجم

3.87MB

موضوع

Python; Data Visualization; pandas; Relational Algebra; Time Series Analysis; Data Exploration