
عنوان:
Python Polars
نویسنده:
Jeroen Janssens and Thijs Nieuwdorp
انتشارات:
O'Reilly Media, Inc
تاریخ انتشار:
2025
حجم:
3.5MB
معرفی کتاب:" Python Polars: راهنمای نهایی برای پردازش سریع و مؤثر دادهها "
آیا میخواهید تحلیل دادههای خود را سرعت ببخشید و با مجموعهدادههایی بزرگتر از حافظه RAM کار کنید؟ کتاب Python Polars به شما نشان میدهد که چگونه با استفاده از یک API بسیار سریع، چندرشتهای (multi-threaded) و در عین حال ساده، به بارگذاری، دستکاری و پردازش دادهها بپردازید.
در این راهنمای عملی، شما با تمام جنبههای کتابخانه Polars آشنا خواهید شد و با استفاده از دادههای واقعی، یاد میگیرید که چگونه مسائل کاربردی تحلیل داده را با رویکردی مدرن و قدرتمند حل کنید.
در این کتاب خواهید آموخت:
- نحوه بارگذاری سریع دادهها از منابع مختلف
- پردازش، فیلتر و تغییر ساختار دادهها با Polars
- مقایسه عملکرد Polars با Pandas و ابزارهای مشابه
- استفاده از قابلیت multi-threading برای تحلیل دادههای سنگین
- حل مسائل واقعی با دادههای حجیم و دنیای واقعی
ویژگیهای کلیدی Polars:
- پشتیبانی از پردازش داده خارج از حافظه (out-of-core)
- طراحیشده برای عملکرد بالا در محیطهای چندرشتهای
- ساختار ستونی بهینهسازیشده برای تحلیل سریع
مخاطبان کتاب:
این کتاب برای دانشمندان داده، تحلیلگران، مهندسان داده و تمام علاقهمندان به ابزارهای نوین تحلیل داده طراحی شده است. اگر به دنبال جایگزینی سریعتر برای Pandas هستید، این کتاب برای شماست.
فهرست مطالب
- Foreword
- Preface
- I. Begin
- 1. Introducing Polars
- What Is This Thing Called Polars?
- Why You Should Use Polars
- Polars Compared to Other Data Processing Packages
- Why We Focus on Python Polars
- How This Book is Organized
- An ETL Showcase
- Takeaways
- 2. Getting Started
- Setting Up Your Environment
- Crash Course JupyterLab
- Installing Polars on Other Projects
- Configuring Polars
- Compiling Polars from Scratch
- Takeaways
- 3. Moving from Pandas to Polars
- Animals
- Similarities to Recognize
- Appearances to Appreciate
- Concepts to Unlearn
- Syntax to Forget
- To and From Pandas
- Takeaways
- II. Form
- 4. Data Structures and Data Types
- Series, DataFrames, and LazyFrames
- Data Types
- Data Type Conversion
- Takeaways
- 5. Eager and Lazy APIs
- Eager API: DataFrame
- Lazy API: LazyFrame
- Performance Differences
- Functionality Differences
- Tips and Tricks
- Takeaways
- 6. Reading and Writing Data
- Format Overview
- Reading CSV Files
- Parsing Missing Values Correctly
- Reading Files with Encodings Other than UTF-8
- Reading Excel Spreadsheets
- Working with Multiple Files
- Reading Parquet
- Reading JSON and NDJSON
- Other File Formats
- Querying Databases
- Writing Data
- Takeaways
- III. Express
- 7. Beginning Expressions
- 8. Continuing Expressions
- Types of Operations
- Element-Wise Operations
- Nonreducing Series-Wise Operations
- Series-Wise Operations that Summarize to One
- Series-Wise Operations that Summarize to One or More
- Series-Wise Operations that Extend
- Takeaways
- 9. Combining Expressions
- Inline Operators Versus Methods
- Arithmetic Operations
- Comparison Operations
- Boolean Algebra Operations
- Bitwise Operations
- Using Functions
- Takeaways
- IV. Transform
- 10. Selecting and Creating Columns
- Selecting Columns
- Creating Columns
- Related Column Operations
- Takeaways
- 11. Filtering and Sorting Rows
- Filtering Rows
- Sorting Rows
- Related Row Operations
- Takeaways
- 12. Working with Textual, Temporal, and Nested Data Types
- String
- Categorical
- Enum
- Temporal
- List
- Array
- Struct
- Takeaways
- 13. Summarizing and Aggregating
- Split, Apply, and Combine
- GroupBy Context
- The Descriptives
- The Advanced
- Aggregate Values to a List
- Rename Aggregated Columns
- Apply Multiple Aggregations At Once
- Row-Wise Aggregations
- Window Functions in Selection Context
- Dynamic Grouping
- Rolling Aggregations
- Upsampling
- Takeaways
- 14. Joining and Concatenating
- Joining
- Inexact Joining
- Vertical and Horizontal Concatenation
- Takeaways
- 15. Reshaping
- Wide Versus Long DataFrames
- Pivot to Wider DataFrame
- Unpivot to Longer DataFrame
- Transposing
- Exploding
- Partition into Multiple DataFrames
- Takeaways
- V. Advance
- 16. Visualizing Data
- NYC Bike Trips
- Built-in Plotting with Altair
- Pandas-like Plotting With hvPlot
- Publication-Quality Graphics with Plotnine
- Styling DataFrames With Great Tables
- Takeaways
- 17. Extending Polars
- User Defined Functions in Python
- Registering Your Own Namespace
- Polars Plug-Ins in Rust
- Takeaways
- 18. Polars Internals
- Polars’ Architecture
- Arrow
- Multi-Threaded Computations and SIMD Operations
- The String Data Type in Memory
- ChunkedArrays in Series
- Query Optimization
- Checking Your Expressions
- Profiling Polars
- Tests in Polars
- Common Anti-patterns
- Takeaways
- Appendix A. Accelerating Polars with the GPU
- Index
مشخصات
نام کتاب
Python Polars
نویسنده
Jeroen Janssens and Thijs Nieuwdorp
انتشارات
O'Reilly Media, Inc
تاریخ انتشار
2025
ISBN
9781098156084
تعداد صفحات
653
زبان
انگلیسی
فرمت
حجم
3.5MB
موضوع
python