标签:pandas

Python – 如何透视数据框?

什么是枢轴? 如何转动? 这是一个支点吗? 长格式到宽格式? 我见过很多关于数据透视表的问题。即使他们不知道他们询问数据透视表,他们通常也是。几乎不可能写出一个规范的问题和答案,其中包含了旋转的所有方面…. ……但是我要试一试。 现有问题和答案的问题在于,问题往往集中在OP难以概括以便使用一些现有的良好答案的细微差别。但是,没有一个答案试图给出全面的解释(因为这是一项艰巨的任务) 从我的谷歌搜索中查看一些示例 如何在Pandas中透视数据框? 好问答。但答案只 […]

Python – 如何迭代Pandas中的DataFrame中的行?

我有一只DataFrame熊猫: import pandas as pd inp = [{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2':120}] df = pd.DataFrame(inp) print df 输出: c1 c2 0 10 100 1 11 110 2 12 120 现在我想迭代这个帧的行。对于每一行,我希望能够通过列的名称访问其元素(单元格中的值)。例如: for row in df.rows: print row […]

Python – 使用大熊猫的“大数据”工作流程

在学习熊猫的过程中,我试图解答这个问题好几个月。我将SAS用于日常工作,对于它的核心支持非常重要。但是,由于许多其他原因,SAS作为一款软件很糟糕。 有一天,我希望用python和pandas取代我的SAS,但是我目前缺乏大型数据集的核心外工作流程。我不是在谈论需要分布式网络的“大数据”,而是文件太大而不适合内存,但又足够小以适应硬盘驱动器。 我的第一个想法是用于HDFStore在磁盘上保存大型数据集,并只将需要的部分拖放到数据框中进行分析。其他人提到MongoDB是一种更易于使用的替代方案。我 […]