GroupBy

GroupBy 对象是 groupby 方法调用的结果,groupby 方法可以是 mars.dataframe.DataFrame.groupby() 或者 mars.dataframe.Series.groupby() 等。

索引和迭代

应用函数

GroupBy.apply(func, *args[, output_type, ...])

Apply function func group-wise and combine the results together.

GroupBy.agg([func, method])

Aggregate using one or more operations on grouped data.

GroupBy.aggregate([func, method])

Aggregate using one or more operations on grouped data.

GroupBy.transform(f, *args[, dtypes, dtype, ...])

Call function producing a like-indexed DataFrame on each group and return a DataFrame having the same indexes as the original object filled with the transformed values

计算和描述统计

GroupBy.all(**kw)

GroupBy.any(**kw)

GroupBy.count(**kw)

GroupBy.cumcount([ascending])

GroupBy.cummax([axis])

GroupBy.cummin([axis])

GroupBy.cumprod([axis])

GroupBy.cumsum([axis])

GroupBy.head([n])

Return first n rows of each group.

GroupBy.kurt(**kw)

GroupBy.kurtosis(**kw)

GroupBy.max(**kw)

GroupBy.mean(**kw)

GroupBy.min(**kw)

GroupBy.size(**kw)

GroupBy.sem(**kw)

GroupBy.skew(**kw)

GroupBy.std(**kw)

GroupBy.sum(**kw)

GroupBy.var(**kw)

下面的方法对 SeriesGroupByDataFrameGroupBy 均可用,但有细微的差别。通常 DataFrameGroupBy 允许指定坐标,以及会提供一个是否将操作限制在特定数据类型上的参数。

DataFrameGroupBy.count(**kw)

DataFrameGroupBy.cummax([axis])

DataFrameGroupBy.cummin([axis])

DataFrameGroupBy.cumprod([axis])

DataFrameGroupBy.cumsum([axis])

DataFrameGroupBy.sample([n, frac, replace, ...])

Return a random sample of items from each group.

下列方法仅对 SeriesGroupBy 对象可用。

下列方法仅对 DataFrameGroupBy 对象可用。