使用 matplotlib 可视化数据时,经常要面对字体设置的问题。在要用到中文时,如果设置不当,会出现乱码。网上已经有很多文章提供了一些解决方法,但多数是片段式的“授人以鱼”,本文将系统地讨论 matplotlib 中的字体管理,希望能“授人以渔”。
在进行数据分析的时候除了有缺失值之外,还可能遇到异常值和重复值。### 异常值 异常值:> 偏离正常范围的值,不是错误值。> 出现的频率很低,但是会对数据分析造成偏差 常采用盖帽法或者数据离散化进行处理
strftime('%Y-%m-%d 00:00:00') |#### 提取日期类型的年月日| 原有数据类型(datetime64)和展示形式 | 想得到的格式 | 代码 || ------------------------------------ | -----...
大家数据分析的环境安装没有什么问题了吧?那我们就开始登上数据分析这趟列车吧!本次列车首先从Numpy数组与重塑出发,准备好了吗我们启程了~~~~#### Numpy是什么?#### Numpy是什么?我们一起看一下来自百度百科给出的解释: NumPy(Numerical Python)是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵,比Python自身的嵌套列表(nested list structure)结构要高效的多(该结构也可以用来表示矩阵(matrix))
text(x, y, s, fontdict=None, withdash=False, **kwargs)- x:注释位置的横坐标- y:注释位置的纵坐标- s:注释的文本内容- kwargs:可以设置如下fontsize设置字体大小,默认12,可选参数 [‘...