Tutorials › Pandas › GroupBy

GroupBy

6 min read Quiz at the end

GroupBy aggregates data by category — use agg, transform, and filter for powerful group analytics.

GroupBy Operations

import pandas as pd
df = pd.read_csv('data.csv')

# Basic groupby
df.groupby('dept')['salary'].mean()
df.groupby('dept')['salary'].sum()
df.groupby('dept')['salary'].agg(['mean','min','max','count'])

# Multiple columns
df.groupby(['dept','level'])['salary'].mean()

# agg with different functions per column
df.groupby('dept').agg(
    avg_salary=('salary', 'mean'),
    max_age=('age', 'max'),
    headcount=('id', 'count')
)

# Transform — add group result back to original rows
df['dept_avg'] = df.groupby('dept')['salary'].transform('mean')
df['above_avg'] = df['salary'] > df['dept_avg']

# Filter groups
df.groupby('dept').filter(lambda g: g['salary'].mean() > 50000)

← Adding and Modifying Columns Next: Merging and Joining →

Topic Quiz · 1 questions

Test your understanding before moving on

1. What does df.groupby('dept')['salary'].transform('mean') return?

💡 transform returns a same-index result — each employee gets their department average salary.

Quick Access

GroupBy

GroupBy Operations

Test your understanding before moving on