Python数据可视化(微课版)-脊线图法

Python数据可视化(微课版)-脊线图法3 10 1 脊线图及应用场景 1 脊线图简介 脊线图是部分重叠的线形图 用以在二维空间产生山脉的印象 其中每一行对应的是一个类别 而 x 轴对应的是数值的范围 波峰的高度代表出现的次数 2 应用场景 适用于可视化指标数据随时间或空间分布的变化 例如

大家好,我是讯享网,很高兴认识大家。


讯享网

3.10.1  脊线图及应用场景

1.脊线图简介

脊线图是部分重叠的线形图,用以在二维空间产生山脉的印象,其中每一行对应的是一个类别,而x轴对应的是数值的范围,波峰的高度代表出现的次数。

2.应用场景

适用于可视化指标数据随时间或空间分布的变化。例如,为了分析不同食品类型与二氧化碳排放量的关系,我们可以使用R语言绘制两者之间的脊线图,如图3-27所示。

图3-27 食物类型与二氧化碳排放量

3.10.2  Python案例实战

为了深入研究该企业在2019年每个月份的商品退单量情况,我们使用每日退单量数据表(return_days.csv),该表包含退单日期(date)和退单量(return)两个字段,然后利用Altair库绘制每月商品退单量的脊线图,其中横轴是退单量,纵轴是退单所在的月份,山峰的高低表示退单的次数,代码如下:

#导入相应库

import altair as alt

import pandas as pd

#连接退单数据

source = pd.read_csv('D:/Python数据可视化分析与案例实战/ch03/return_days.csv',',')

step = 25

overlap = 1

#配置图形参数

alt.Chart(source, height=step).transform_timeunit(Month='month(date)'

).transform_joinaggregate(mean_temp='mean(return)', groupby=['Month']

).transform_bin(['bin_max', 'bin_min'], 'return'

).transform_aggregate(value='count()',groupby=['Month','mean_temp','bin_min','bin_max']

).transform_impute(impute='value',groupby=['Month','mean_temp'],key='bin_min',value=0

).mark_area(interpolate='monotone',fillOpacity=0.8,stroke='lightgray',strokeWidth=0.3

).encode(

    alt.X('bin_min:Q',bin='binned',title='退单量'),

    alt.Y('value:Q',scale=alt.Scale(range=[step, -step * overlap]),axis=None),

    alt.Fill('mean_temp:Q',legend=None,scale=alt.Scale(domain=[30, 5],scheme='redyellowblue')

    )

).facet(

    row=alt.Row('Month:T',title=None,header=alt.Header(labelAngle=0, labelAlign='right', format='%B')

    )

).properties(title='退单量分析',bounds='flush'

).configure_facet(spacing=0

).configure_view(stroke=None

).configure_title(anchor='end')

在Jupyter lab中运行上述代码,生成如图3-28所示的脊线图,从图形可以看出:在2019年,商品的退单量呈现先上升后下降的趋势,在7月份达到峰值,下半年退单量下降较快。

图3-28  脊线图

 

小讯
上一篇 2025-03-21 19:58
下一篇 2025-01-24 10:11

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/35557.html