超强图解 Pandas 18 招!

Pandas是数据挖掘常见的工具,掌握使用过程中的函数是非常重要的。本文将借助可视化的过程,讲解Pandas的各种操作。

sort_values

(dogs[dogs['size'] == 'medium']
 .sort_values('type')
 .groupby('type').median()
)

执行步骤:

  • size列筛选出部分行
  • 然后将行的类型进行转换
  • 按照type列进行分组,计算中位数

selecting a column

dogs['longevity']

groupby + mean

dogs.groupby('size').mean()

执行步骤:

  • 将数据按照size进行分组
  • 在分组内进行聚合操作

grouping multiple columns

dogs.groupby(['type''size'])

groupby + multi aggregation

(dogs
  .sort_values('size')
  .groupby('size')['height']
  .agg(['sum''mean''std'])
)

执行步骤

  • 按照size列对数据进行排序
  • 按照size进行分组
  • 对分组内的height进行计算

filtering for columns

df.loc[:, df.loc['two'] <= 20]

filtering for rows

dogs.loc[(dogs['size'] == 'medium') & (dogs['longevity'] > 12), 'breed']

dropping columns

dogs.drop(columns=['type'])

joining

ppl.join(dogs)

merging

ppl.merge(dogs, left_on='likes', right_on='breed', how='left')

pivot table

dogs.pivot_table(index='size', columns='kids', values='price')

melting

dogs.melt()

pivoting

dogs.pivot(index='size', columns='kids')

stacking column index

dogs.stack()

unstacking row index

dogs.unstack()

resetting index

dogs.reset_index()

setting index

dogs.set_index('breed')

相关推荐

  • 不是付费订阅用不起,而是“开源平替”更有性价比
  • [开源]自主研发基于SpringBoot + Activiti 开发的轻量级工作流框架
  • 终于有人讲明白了,数据资产、标签体系、指标体系、数据体系与用户画像(附案例+资料下载)
  • 看完这篇文章还不懂K-means聚类算法,就来找我
  • 图解 Kafka 架构 | 为什么那么快?
  • 冯·诺依曼的传奇人生
  • 何为“用户画像(Persona)”,它在产品设计和市场研究中发挥了什么作用呢?
  • 开眼!!!CODESYS竟然支持这么多协议
  • 37.4K Star 万人选择!!!做数据面板,用这个UI准没错
  • 麻省理工开源:《理解深度学习》,有中文版了!
  • 物种多样性的后续,难绷······
  • 字节员工“跳槽”到上海市政研室
  • 胳膊肘往外拐?AMD的AI GPU助推器增加对英伟达的支持
  • CrowdStrike更新致850万Windows设备宕机,微软紧急救火!
  • 被 GPT-4o 的价格劝退了!
  • 程序员都干过哪些很刺激的事情?
  • 成都周报丨单季度收入50亿的药企,准备A+H双上市了
  • 超21亿,国家大基金二期投了一家重庆公司丨投融周报
  • 开发者的狂欢!首屏速度飞快,服务器配置提升80%!
  • 10 个非常有创意的 Button 按钮效果【附源码】