جلد کتاب Python Polars: راهنمای نهایی برای پردازش سریع و مؤثر داده‌ها اثر  Jeroen Janssens and Thijs Nieuwdorp

عنوان:

Python Polars

نویسنده:

Jeroen Janssens and Thijs Nieuwdorp

انتشارات:

O'Reilly Media, Inc

تاریخ انتشار:

2025

حجم:

3.5MB

دانلود

معرفی کتاب:" Python Polars: راهنمای نهایی برای پردازش سریع و مؤثر داده‌ها "

آیا می‌خواهید تحلیل داده‌های خود را سرعت ببخشید و با مجموعه‌داده‌هایی بزرگ‌تر از حافظه RAM کار کنید؟ کتاب Python Polars به شما نشان می‌دهد که چگونه با استفاده از یک API بسیار سریع، چندرشته‌ای (multi-threaded) و در عین حال ساده، به بارگذاری، دست‌کاری و پردازش داده‌ها بپردازید.

در این راهنمای عملی، شما با تمام جنبه‌های کتابخانه Polars آشنا خواهید شد و با استفاده از داده‌های واقعی، یاد می‌گیرید که چگونه مسائل کاربردی تحلیل داده را با رویکردی مدرن و قدرتمند حل کنید.

در این کتاب خواهید آموخت:

  • نحوه بارگذاری سریع داده‌ها از منابع مختلف
  • پردازش، فیلتر و تغییر ساختار داده‌ها با Polars
  • مقایسه عملکرد Polars با Pandas و ابزارهای مشابه
  • استفاده از قابلیت multi-threading برای تحلیل داده‌های سنگین
  • حل مسائل واقعی با داده‌های حجیم و دنیای واقعی

ویژگی‌های کلیدی Polars:

  • پشتیبانی از پردازش داده خارج از حافظه (out-of-core)
  • طراحی‌شده برای عملکرد بالا در محیط‌های چندرشته‌ای
  • ساختار ستونی بهینه‌سازی‌شده برای تحلیل سریع

مخاطبان کتاب:

این کتاب برای دانشمندان داده، تحلیل‌گران، مهندسان داده و تمام علاقه‌مندان به ابزارهای نوین تحلیل داده طراحی شده است. اگر به دنبال جایگزینی سریع‌تر برای Pandas هستید، این کتاب برای شماست.

فهرست مطالب

  • Foreword
  • Preface
  • I. Begin
  • 1. Introducing Polars
  • What Is This Thing Called Polars?
  • Why You Should Use Polars
  • Polars Compared to Other Data Processing Packages
  • Why We Focus on Python Polars
  • How This Book is Organized
  • An ETL Showcase
  • Takeaways
  • 2. Getting Started
  • Setting Up Your Environment
  • Crash Course JupyterLab
  • Installing Polars on Other Projects
  • Configuring Polars
  • Compiling Polars from Scratch
  • Takeaways
  • 3. Moving from Pandas to Polars
  • Animals
  • Similarities to Recognize
  • Appearances to Appreciate
  • Concepts to Unlearn
  • Syntax to Forget
  • To and From Pandas
  • Takeaways
  • II. Form
  • 4. Data Structures and Data Types
  • Series, DataFrames, and LazyFrames
  • Data Types
  • Data Type Conversion
  • Takeaways
  • 5. Eager and Lazy APIs
  • Eager API: DataFrame
  • Lazy API: LazyFrame
  • Performance Differences
  • Functionality Differences
  • Tips and Tricks
  • Takeaways
  • 6. Reading and Writing Data
  • Format Overview
  • Reading CSV Files
  • Parsing Missing Values Correctly
  • Reading Files with Encodings Other than UTF-8
  • Reading Excel Spreadsheets
  • Working with Multiple Files
  • Reading Parquet
  • Reading JSON and NDJSON
  • Other File Formats
  • Querying Databases
  • Writing Data
  • Takeaways
  • III. Express
  • 7. Beginning Expressions
  • 8. Continuing Expressions
  • Types of Operations
  • Element-Wise Operations
  • Nonreducing Series-Wise Operations
  • Series-Wise Operations that Summarize to One
  • Series-Wise Operations that Summarize to One or More
  • Series-Wise Operations that Extend
  • Takeaways
  • 9. Combining Expressions
  • Inline Operators Versus Methods
  • Arithmetic Operations
  • Comparison Operations
  • Boolean Algebra Operations
  • Bitwise Operations
  • Using Functions
  • Takeaways
  • IV. Transform
  • 10. Selecting and Creating Columns
  • Selecting Columns
  • Creating Columns
  • Related Column Operations
  • Takeaways
  • 11. Filtering and Sorting Rows
  • Filtering Rows
  • Sorting Rows
  • Related Row Operations
  • Takeaways
  • 12. Working with Textual, Temporal, and Nested Data Types
  • String
  • Categorical
  • Enum
  • Temporal
  • List
  • Array
  • Struct
  • Takeaways
  • 13. Summarizing and Aggregating
  • Split, Apply, and Combine
  • GroupBy Context
  • The Descriptives
  • The Advanced
  • Aggregate Values to a List
  • Rename Aggregated Columns
  • Apply Multiple Aggregations At Once
  • Row-Wise Aggregations
  • Window Functions in Selection Context
  • Dynamic Grouping
  • Rolling Aggregations
  • Upsampling
  • Takeaways
  • 14. Joining and Concatenating
  • Joining
  • Inexact Joining
  • Vertical and Horizontal Concatenation
  • Takeaways
  • 15. Reshaping
  • Wide Versus Long DataFrames
  • Pivot to Wider DataFrame
  • Unpivot to Longer DataFrame
  • Transposing
  • Exploding
  • Partition into Multiple DataFrames
  • Takeaways
  • V. Advance
  • 16. Visualizing Data
  • NYC Bike Trips
  • Built-in Plotting with Altair
  • Pandas-like Plotting With hvPlot
  • Publication-Quality Graphics with Plotnine
  • Styling DataFrames With Great Tables
  • Takeaways
  • 17. Extending Polars
  • User Defined Functions in Python
  • Registering Your Own Namespace
  • Polars Plug-Ins in Rust
  • Takeaways
  • 18. Polars Internals
  • Polars’ Architecture
  • Arrow
  • Multi-Threaded Computations and SIMD Operations
  • The String Data Type in Memory
  • ChunkedArrays in Series
  • Query Optimization
  • Checking Your Expressions
  • Profiling Polars
  • Tests in Polars
  • Common Anti-patterns
  • Takeaways
  • Appendix A. Accelerating Polars with the GPU
  • Index

مشخصات

نام کتاب

Python Polars

نویسنده

Jeroen Janssens and Thijs Nieuwdorp

انتشارات

O'Reilly Media, Inc

تاریخ انتشار

2025

ISBN

9781098156084

تعداد صفحات

653

زبان

انگلیسی

فرمت

pdf

حجم

3.5MB

موضوع

python