全国旗舰校区

不同学习城市 同样授课品质

北京

深圳

上海

广州

郑州

大连

武汉

成都

西安

杭州

青岛

重庆

长沙

哈尔滨

南京

太原

沈阳

合肥

贵阳

济南

下一个校区
就在你家门口
+
当前位置:首页  >  技术干货

Pandas常用函数有哪些

发布时间:2023-12-03 09:04:04
发布人:xqq

count非 NA 值的数量describe针对 Series 或 DF 的列计算汇总统计min , max最小值和最大值argmin , argmax最小值和最大值的索引位置(整数)idxmin , idxmax最小值和最大值的索引值quantile样本分位数(0 到 1)sum求和mean均值median中位数mad根据均值计算平均绝对离差var方差std标准差skew样本值的偏度(三阶矩)kurt样本值的峰度(四阶矩)cumsum样本值的累计和cummin , cummax样本值的累计最大值和累计最小值cumprod样本值的累计积diff计算一阶差分(对时间序列很有用)pct_change计算百分数变化

(1).fillna()会填充nan数据,返回填充后的结果

(2)pddata["a"].unique() 特征a的值出现的set——唯一值

(3).loc[]选取指定列进行操作——df.loc[行标签,列标签]

(4).iloc[]函数——只能通过行号索引:df.iloc[0:4]它是基于索引位来选取数据集,0:4就是选取 0,1,2,3这四行

(5)作图

from pandas.tools.plotting import scatter_matrix(混淆散点图)

scatter_matrix(含有n个特征的数据X,s=100, alpha=1, c=colors[index], figsize=(10,10))

例如:scatter_matrix(beer[["calories","sodium","alcohol","cost"]],s=100, alpha=1, c=colors[beer["cluster"]], figsize=(16,16))

IT培训

相关文章

嵌入式培训课程:探索技术的无限可能

嵌入式培训课程:探索技术的无限可能

2023-12-12
web前端培训:vue实现双向数据绑定原理

web前端培训:vue实现双向数据绑定原理

2023-12-12
嵌入式开发:Linux系统编程的探索与实践

嵌入式开发:Linux系统编程的探索与实践

2023-12-12
Web前端:探索Web前端开发技术的新领域

Web前端:探索Web前端开发技术的新领域

2023-12-12

最新文章

python培训学校靠谱吗?为什么一定要选择千锋教育

python培训学校靠谱吗?为什么一定要选择千锋教育

2023-12-13
培训学校学java靠谱吗?为什么一定要选择千锋教育

培训学校学java靠谱吗?为什么一定要选择千锋教育

2023-12-13
网络安全哪个培训机构靠谱

网络安全哪个培训机构靠谱

2023-12-13
python培训机构可靠吗?为什么一定要选择千锋教育

python培训机构可靠吗?为什么一定要选择千锋教育

2023-12-13
在线咨询 免费试学 教程领取