1, df.groupby(‘列名‘).size 计算每个group的size 2, .get_group(‘行名‘) 取 3, .describe() 4, df.groupby(‘symbol’).head() 5, .tail()/.first()/.last()/.nth(n)取前几行数据 前面集中都是将groupby对象,也就是symbol设置为index, 如果不想设置symbol为index,则按照下面方式 df.groupby(‘symbol’,as_index = False).nth(2) 取groupby以后,可以取一部分变量就行计算 把相同symbol的行取出来,这些行对应不同的时间,将这些行的close列做平均,得出close在这段时间内的均值。同理对于volume. 应用场景:所有的symbol在一个表里,我们需要知道同一个symbol在某一列的均值。 df.groupby(‘symbol’)[‘close‘, ‘volume‘].mean() df.groupby(‘symbol’)[‘close‘, ‘volume‘].max() df.group...