高级,这个Python库助力pandas智能可视化分析

 Pandas是用于数据处理的核心库,它也可以进行简单的可视化,绘制散点、折线、直方等基础图表都不在话下。

创新互联建站专注为客户提供全方位的互联网综合服务,包含不限于网站设计、成都网站设计、沾化网络推广、重庆小程序开发、沾化网络营销、沾化企业策划、沾化品牌公关、搜索引擎seo、人物专访、企业宣传片、企业代运营等,从售前售中售后,我们都将竭诚为您服务,您的肯定,是我们最大的嘉奖;创新互联建站为所有大学生创业者提供沾化建站搭建服务,24小时服务热线:13518219792,官方网址:www.cdcxhl.com

Pandas自带的可视化方法是基于matplotlib的函数接口,在Jupyter里可以静态展示。

这次介绍一个可视化工具-LUX,它能自动地将DataFrame数据转化为统计图表,让你一目了然地看到相关性、分布、频率等信息。

LUX在Jupyter Notebook或Lab中进行交互,图表与数据可以同步显示。

项目地址: https:// github.com/lux-org/lux

使用LUX

以下面数据集(美国各大学信息表)为例:

 
 
 
  1. # 导入pandas和lux库 
  2. import pandas as pd 
  3. import lux 
  4.  
  5. #加载数据 
  6. df = pd.read_excel("C:\\Users\\zii\\Documents\\USA_College.xlsx") 
  7. df 

读取的数据如下:

除了显示的数据表外,同时你还会看到数据集上面出现一个按钮,可以进行数据/图表的交换显示。

所以说只需要导入lux库,就能直接使用图表功能。

大家看到下面有三种类型的图表,代表的统计学含义分别是相关性、直方分布、事件频次。

除了全表的可视化探索外,你还可以研究特定变量间的关系。

比如,我想看 SAT平均值 和 收入中位数 的关联性.

 
 
 
  1. df.intent = ['SAT平均值','收入中位数'] 
  2. df 

左边的表是两个变量的总体分布,右边是在有筛选条件下的分布。

导出图表

LUX支持图表的导出,既可以导出图表文件,也可以导出相应的matplotlib、altair代码。

首先选定一个或多个图表,点击导出按钮。

可以直接将选定的图表单独显示出来:

  1. 导出html df.save_as_html('hpi.html')
  2. 导出matplotlib代码
 
 
 
  1. vis = df.exported 
  2. print (vis[0].to_matplotlib()) 

  1. 导出altair代码
 
 
 
  1. vis = df.exported 
  2. print(vis[0].to_Altair()) 

导出的代码可以直接运行:

 
 
 
  1. import altair as alt 
  2.  
  3. chart = alt.Chart(df).mark_circle().encode( 
  4.     x=alt.X('SAT平均值',scale=alt.Scale(domain=(666, 1534)),type='quantitative', axis=alt.Axis(title='SAT平均值')), 
  5.     y=alt.Y('收入中位数',scale=alt.Scale(domain=(20200, 125600)),type='quantitative', axis=alt.Axis(title='收入中位数')) 
  6. chart = chart.configure_mark(tooltip=alt.TooltipContent('encoding')) # Setting tooltip as non-null 
  7. chart = chart.interactive() # Enable Zooming and Panning 
  8. chart = chart.encode(color=alt.Color('最高学位',type='nominal')) 
  9.  
  10. chart = chart.configure_title(fontWeight=500,fontSize=13,font='Helvetica Neue') 
  11. chart = chart.configure_axis(titleFontWeight=500,titleFontSize=11,titleFont='Helvetica Neue', 
  12. labelFontWeight=400,labelFontSize=8,labelFont='Helvetica Neue',labelColor='#505050') 
  13. chart = chart.configure_legend(titleFontWeight=500,titleFontSize=10,titleFont='Helvetica Neue', 
  14. labelFontWeight=400,labelFontSize=8,labelFont='Helvetica Neue') 
  15. chart = chart.properties(width=160,height=150) 
  16.  
  17. chart 

安装设置

lux安装过程和其他库一样,可以通过pip或conda安装,直接在命令行输入:

 
 
 
  1. pip install lux-api 

 
 
 
  1. conda install -c conda-forge lux-api 

因为lux一般用在Jupyter生态中,所以需要安装并激活luxwidget拓展,才能显示交互式窗口。

如果你是在Jupyter Notebook或VSCode中使用,使用下面代码激活拓展:

 
 
 
  1. jupyter nbextension install --py luxwidget 
  2. jupyter nbextension enable --py luxwidget 

如果你使用的是Jupyter Lab,则激活lab拓展:

 
 
 
  1. jupyter labextension install @jupyter-widgets/jupyterlab-manager 
  2. jupyter labextension install luxwidget 

总结

LUX是一个不错的数据可视化分析工具,能智能地辅助Pandas做数据探索,省去了很多不必要的操作。

网站名称:高级,这个Python库助力pandas智能可视化分析
标题URL:http://www.stwzsj.com/qtweb/news39/10789.html

网站建设、网络推广公司-创新互联,是专注品牌与效果的网站制作,网络营销seo公司;服务项目有等

广告

声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联