pandas中高维数据的多层次索引 - 代码天地

pandas中高维数据的多层次索引

其他 2018-10-07 02:09:47 阅读次数: 0

在pandas中，当涉及到高维数据时，通常用多层次索引来表示。当然pandas中还有一个panel数据结构，可表示三维的数据，但是pandas官方推荐使用多层次索引，不提倡使用panel数据结构，而且panel未来也将会被pandas抛弃。下面我们来说明一下pandas中多层次索引该怎么使用。

本文以pandas中的DataFrame数据结构为例，先构造一个含有多层次索引的DataFrame对象，如图一：

图一

对多层次索引，我们还是从标签索引和位置索引分别说明。首先是标签索引，如图二，如果要索引第一层索引对应的内容，直接df_m.loc['a']，如果要索引某一行，比如第一行，则有两种索引方式，df_m.loc['a','a1'] or df_m.loc[('a','a1')]，如果要索引某一列，比如第一列，则df_m.loc['a','c']，如果要索引具体某个值，比如第一个值，则df_m.loc[('a','a1'),'c']，这里需要注意的是，对于Multi_index的层次索引，是利用元组参数实现的。

图二

然后是位置索引，如图三，此时可以忽略外面的两层index，直接把数据看成一个二维的DataFrame即可。

图三

最后我们再看下多重索引对象是什么样的。如图四，df_m的index属性是一个MultiIndex对象，其中有两个主要的属性：levels、labels，当我们想要获取具体的index时，可以通过levels属性获取，即df_m.index.levels，返回一个列表，其中的元素是两层索引构成的列表，然后如果我们需要获取具体的索引，直接利用正常的列表索引即可得到。但要特别注意的是，这里的levels中的子列表是已经经过排序的，而不是原索引的顺序（这点我觉得是个没设计好的地方，大可以返回原顺序，是否排序用户本可以自己选择相应的排序方法解决），所以如果我们需要的是原顺序的索引，那么可以对df_m.index对象使用列表解析，因为可以把df_m.index看做是一个由索引元组组成的ndarray使用，然后得到列表后，可以转化为ndarray或者Series对象，再使用pandas或者Series的unique()函数来获取无重复的最外层索引。

图四

猜你喜欢

转载自blog.csdn.net/S_o_l_o_n/article/details/82847216

pandas中高维数据的多层次索引

DataFrame的多层次索引

pd.MultiIndex()多层次索引

建立多层次目录

海量数据多层次多维度分析

json多层次数据统计结构生成

rc/rs的区别 -- 多层次分析

多层次报表的性能优化方案

多层次存储器

递归遍历多层次菜单

多层次cache的包含关系

pandas层次化索引 ---- 创建多层行索引、多层索引对象的索引与切片操作

Hibernate Criteria 多层次查询关联问题

应用Apache BeanUtils set 多层次的 property value

中国多层次资本市场

Yotta企业云盘多层次的安全保障

多层次目录结构的CMake工程管理

Java组合模式：构建多层次公司组织架构

生产环境_从数据到层级结构JSON：使用Spark构建多层次树形数据_父子关系生成

【记录有趣的需求】之二.实现配置多层次树形数据的动态表单

Pandas数据分析14——pandas数据框的多层索引

【数据挖掘重要笔记day14】pandas层次化索引+创建多层行索引+显示构造pd.MultiIndex+多层索引对象的索引与切片操作+索引的堆（stack）+DataFrame的聚合操作

pandas数据分析-层次化索引

pandas 之多层索引

pandas(十九)分层索引Multilndex，多层索引如何筛选数据

pandas层次化索引

03 -3 pandas 层次化索引（隐式构造，显示构造）、多层列索引、多层索引对象的索引与切片操作（Series的操作，DataFrame的操作）

数据分享|R语言用lme4多层次（混合效应）广义线性模型（GLM），逻辑回归分析教育留级调查数据...

pandas学习(创建多层索引、数据重塑与轴向旋转)

Pandas 多层级索引 Python 数据处理案例指南

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)