下载此文档

python与pandas关系 Python之pandas操作.doc


文档分类:IT计算机 | 页数:约2页 举报非法文档有奖
1/2
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/2 下载此文档
文档列表 文档介绍
1
python与pandas关系_Python之pandas操作
Pandas是Python的核心数据分析支持库,提供了快速、灵活、明确的数据结构,旨在简单、直观地处理关系型、标记型数据°Pandas的目标是成为Python数据分
1
python与pandas关系_Python之pandas操作
Pandas是Python的核心数据分析支持库,提供了快速、灵活、明确的数据结构,旨在简单、直观地处理关系型、标记型数据°Pandas的目标是成为Python数据分析实践与实战的必备高级工具,其长远目标是成为最强大、最灵活、可以支持任何语言的开源数据分析工具。经过多年不懈的努力,Pandas离这个目标已经越来越近了。
Pandas适用于处理以下类型的数据:
与SQL或Excel表类似的,含异构列的表格数据;
有序和无序(非固定频率)的时间序列数据;
带行列标签的矩阵数据,包括同构或异构型数据;
任意其它形式的观测、统计数据集,数据转入Pandas数据结构时不必事先标记。
Pandas的主要数据结构是Series(—维数据)与DataFrame(二维数据),这两种数据结构足以处理金融、统计、社会科学、工程等领域里的大多数典型用例。对于R用户,°Pandas基于NumPy开发,可以与其它第三方科学计算支持库完美集成。
Pandas就像一把万能瑞士军刀,下面仅列出了它的部分优势:
处理浮点与非浮点数据里的缺失数据,表示为NaN;
大小可变:插入或删除DataFrame等多维对象的列;
自动、显式数据对齐:显式地将对象与一组标签对齐,也可以忽略标签,在Series、DataFrame计算时自动与数据对齐;
强大、灵活的分组(groupby)功能:拆分-应用-组合数据集,聚合、转换数据;
把Python和NumPy数据结构里不规则、不同索引的数据轻松地转换为DataFrame对象;
基于智能标签,对大型数据集进行切片、花式索引、子集分解等操作;
直观地合并(merge)、**连接(join)**数据集;
灵活地重塑(reshape)、**透视(pivot)**数据集;
轴支持结构化标签:一个刻度支持多个标签;
成熟的10工具:读取文本文件(CSV等支持分隔符的文件)、Excel文件、数据库等来源的数据,利用超快的HDF5格式保存/加载数据;
时间序列:支持日期范围生成、频率转换、移动窗口统计、移动窗口线性回归、日期位移等时间序列功能。
这些功能主要是为了解决其它编程语言、科研环境的痛点。处理数据一般分为几个阶段:数据整理与清洗、数据分析与建模、数据可视化与制表,Pandas是处理数据的理想工具。
其它说明:
Pandas速度很快°Pandas的很多底层算法都用Cython优化过。然而,为了保持通用性,必然要牺牲一些性能,如果专注某一功能,完全可以开发出比Pandas更快的专用工具。
Pandas是statsmodels的依赖项,因此,Pandas也是Python中统计计算生态系统的重要组成部分。
Pandas已广泛应用于金融领域。
#数据结构
维数名称描述
Series
1
带标签的一维同构数组
2
DataFram

python与pandas关系 Python之pandas操作 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数2
  • 收藏数0 收藏
  • 顶次数0
  • 上传人小辰GG
  • 文件大小37 KB
  • 时间2022-05-26
最近更新