import pandas as pd
import holoviews as hv
from holoviews import opts
hv.extension('bokeh')


url = 'https://raw.githubusercontent.com/shoukewei/data/main/data-pydm/gdp_china_outlier_treated.csv'

df = pd.read_csv(url)
df.head()


%%opts Curve [tools=["hover"] xlabel="Province" ylabel="GDP (x10⁸CNY)" height=500 width=700]

line1 = hv.Curve(df[df["prov"] == "Guangdong"], kdims="year", vdims="gdp",label="Guangdong")
line2 = hv.Curve(df[df["prov"] == "Jiangsu"], kdims="year", vdims="gdp",label="Jiangsu")
line3 = hv.Curve(df[df["prov"] == "Shandong"], kdims="year", vdims="gdp",label="Shandong")
line4 = hv.Curve(df[df["prov"] == "Zhejiang"], kdims="year", vdims="gdp",label="Zhejiang")
line5 = hv.Curve(df[df["prov"] == "Henan"], kdims="year", vdims="gdp",label="Henan")

lines=(line1 * line2 * line3 * line4 * line5)

lines.opts(legend_position='top_left')


print(lines)

:Overlay
   .Curve.Guangdong :Curve   [year]   (gdp)
   .Curve.Jiangsu   :Curve   [year]   (gdp)
   .Curve.Shandong  :Curve   [year]   (gdp)
   .Curve.Zhejiang  :Curve   [year]   (gdp)
   .Curve.Henan     :Curve   [year]   (gdp)


lines.Curve.Guangdong


%%opts Bars [tools=["hover"] xlabel="Province" ylabel="GDP (x10⁸CNY)" height=500 width=700]
%%opts Bars (bar_width=0.6 line_color="black")

bar1 = hv.Bars(df[df["prov"] == "Guangdong"], kdims="prov", vdims="gdp",label="Guangdong")
bar2 = hv.Bars(df[df["prov"] == "Jiangsu"], kdims="prov", vdims="gdp",label="Jiangsu")
bar3 = hv.Bars(df[df["prov"] == "Shandong"], kdims="prov", vdims="gdp",label="Shandong")
bar4 = hv.Bars(df[df["prov"] == "Zhejiang"], kdims="prov", vdims="gdp",label="Zhejiang")
bar5 = hv.Bars(df[df["prov"] == "Henan"], kdims="prov", vdims="gdp",label="Henan")

bars=(bar1 * bar2 * bar3 * bar4 * bar5)
bars


%%opts Scatter [tools=["hover"] xlabel="year" ylabel="GDP (x10⁸CNY)" height=500 width=700]
%%opts Scatter (alpha=0.5 size=10 line_color="black")

scat1 = hv.Scatter(df[df["prov"] == "Guangdong"], kdims="year", vdims="gdp")
scat2 = hv.Scatter(df[df["prov"] == "Jiangsu"], kdims="year", vdims="gdp")
scat3 = hv.Scatter(df[df["prov"] == "Shandong"], kdims="year", vdims="gdp")
scat4 = hv.Scatter(df[df["prov"] == "Zhejiang"], kdims="year", vdims="gdp")
scat5 = hv.Scatter(df[df["prov"] == "Henan"], kdims="year", vdims="gdp")

scatters = scat1 * scat2 * scat3 * scat4 * scat5
scatters


from holoviews.operation import gridmatrix

ds = hv.Dataset(df[['prov','year', 'gdp', 'pop', 'finv', 'trade', 'fexpen','uinc']])

grouped_by = ds.groupby('prov', container_type=hv.NdOverlay)

grid = gridmatrix(grouped_by, diagonal_type=hv.Scatter)

grid.options('Scatter', tools=['hover', 'box_select'], bgcolor='#efe8e2', fill_alpha=0.2, size=4)


%%opts BoxWhisker [tools=["hover"] height=500 width=700 xlabel="Province" ylabel="GDP (x10⁸CNY)"]

box1 = hv.BoxWhisker(df[df["prov"]=="Guangdong"], kdims="prov", vdims="gdp")
box2 = hv.BoxWhisker(df[df["prov"]=="Jiangsu"], kdims="prov", vdims="gdp")
box3 = hv.BoxWhisker(df[df["prov"]=="Zhejiang"], kdims="prov", vdims="gdp")
box4 = hv.BoxWhisker(df[df["prov"]=="Shandong"], kdims="prov", vdims="gdp")
box5 = hv.BoxWhisker(df[df["prov"]=="Henan"], kdims="prov", vdims="gdp")

box1 * box2 * box3 * box4 * box5


melted_df = df.melt(id_vars=["prov"], var_name="variables")

melted_df = melted_df[melted_df["variables"].isin(['gdp', 'pop', 'finv', 'trade', 'fexpen','uinc'])]

melted_df.head()


%%opts BoxWhisker [tools=["hover"] height=500 width=700]

box1 = hv.BoxWhisker(melted_df[melted_df["variables"]=="gdp"], kdims="variables", vdims="value")
box2 = hv.BoxWhisker(melted_df[melted_df["variables"]=="pop"], kdims="variables", vdims="value")
box3 = hv.BoxWhisker(melted_df[melted_df["variables"]=="finv"], kdims="variables", vdims="value")
box4 = hv.BoxWhisker(melted_df[melted_df["variables"]=="trade"], kdims="variables", vdims="value")
box5 = hv.BoxWhisker(melted_df[melted_df["variables"]=="fexpen"], kdims="variables", vdims="value")
box6 = hv.BoxWhisker(melted_df[melted_df["variables"]=="uinc"], kdims="variables", vdims="value")

box1 * box2 * box3 * box4 * box5 * box6


%%opts BoxWhisker [tools=["hover"] height=500 width=700 ]
%%opts BoxWhisker [xrotation=45]
%%opts BoxWhisker (box_color="prov" box_cmap="Category20")

multiboxs = hv.BoxWhisker(melted_df, kdims=["prov","variables"], vdims="value")

multiboxs


import numpy as np


%%opts Histogram [height=500 width=800]
%%opts Histogram (alpha=0.6)

hist1 = hv.Histogram(np.histogram(df[df["prov"]=="Guangdong"]['gdp'], bins=30), kdims="gdp", label="Guangdong")
hist2 = hv.Histogram(np.histogram(df[df["prov"]=="Jiangsu"]['gdp'], bins=30), kdims="dgp", label="Jiangsu")
hist3 = hv.Histogram(np.histogram(df[df["prov"]=="Zhejiang"]['gdp'], bins=30), kdims="dgp", label="Zhejiang")
hist4 = hv.Histogram(np.histogram(df[df["prov"]=="Shandong"]['gdp'], bins=30), kdims="dgp", label="Shandong")
hist5 = hv.Histogram(np.histogram(df[df["prov"]=="Henan"]['gdp'], bins=30), kdims="gdp", label="Henan")

hist1 * hist2 * hist3 * hist4 * hist5


%%opts Violin [height=500 width=700 xlabel='Province' ylabel='GDP (x10⁸CNY)' ylim=(-7,18)]

violin1 = hv.Violin(df[df["prov"]=="Guangdong"],kdims='prov', vdims='gdp')
violin2 = hv.Violin(df[df["prov"]=="Jiangsu"],kdims='prov', vdims='gdp')
violin3 = hv.Violin(df[df["prov"]=="Zhejiang"],kdims='prov', vdims='gdp')
violin4 = hv.Violin(df[df["prov"]=="Shandong"],kdims='prov', vdims='gdp')
violin5 = hv.Violin(df[df["prov"]=="Henan"],kdims='prov', vdims='gdp')

violin1 * violin2 * violin3 * violin4 * violin5


melted_df = pd.DataFrame(melted_df.to_dict())


%%opts Violin [height=500 width=700 ylim=(-5,15)]

violin1 = hv.Violin(melted_df[melted_df["variables"]=="gdp"], kdims="variables", vdims="value")
violin2 = hv.Violin(melted_df[melted_df["variables"]=="pop"], kdims="variables", vdims="value")
violin3 = hv.Violin(melted_df[melted_df["variables"]=="finv"], kdims="variables", vdims="value")
violin4 = hv.Violin(melted_df[melted_df["variables"]=="trade"], kdims="variables", vdims="value")
violin5 = hv.Violin(melted_df[melted_df["variables"]=="fexpen"], kdims="variables", vdims="value")
violin6 = hv.Violin(melted_df[melted_df["variables"]=="uinc"], kdims="variables", vdims="value")

violin1 * violin2 * violin3 * violin4 * violin5 * violin6


%%opts Violin [height=500 width=800 ylim=(-8,18)]
%%opts Violin [xrotation=45]
%%opts Violin (box_color="prov" box_cmap="Category20")

violin_all = hv.Violin(melted_df, kdims=["prov","variables"], vdims="value")

violin_all


%%opts HexTiles [width=550 height=500 tools=["hover"] xlabel='Urban disposal income per capita (CNY)' ylabel='GDP (x10⁸CNY)' colorbar=True]
%%opts HexTiles (cmap="OrRd")
%%opts Bivariate [show_legend=False]
%%opts Bivariate (cmap="OrRd")

hextiles = hv.HexTiles(data=df, kdims=["uinc", "gdp"])

bivariate = hv.Bivariate(data=df, kdims=["uinc", "gdp"])

hextiles * bivariate


%%opts Curve [tools=["hover"] xlabel="Province" ylabel="GDP (x10⁸CNY)"]

line1 = hv.Curve(df[df["prov"] == "Guangdong"], kdims="year", vdims="gdp",label="Guangdong")
line2 = hv.Curve(df[df["prov"] == "Jiangsu"], kdims="year", vdims="gdp",label="Jiangsu")
line3 = hv.Curve(df[df["prov"] == "Shandong"], kdims="year", vdims="gdp",label="Shandong")
line4 = hv.Curve(df[df["prov"] == "Zhejiang"], kdims="year", vdims="gdp",label="Zhejiang")
line5 = hv.Curve(df[df["prov"] == "Henan"], kdims="year", vdims="gdp",label="Henan")

lines=(line1 + line2 + line3 + line4 + line5)
lines.cols(3)


%%opts Bars [tools=["hover"] xlabel="Province"]
%%opts Bars [height=400 width=400 xrotation=45]


bar1 = hv.Bars(df, "prov","gdp", label="GDP of each province")
bar2 = hv.Bars(df, "prov","pop", label="Population of each province")
bar3 = hv.Bars(df, "prov","finv", label="Fixed assets investment of each province")
bar4 = hv.Bars(df, "prov","trade", label="Trade of each province")

bar1.opts(color="red",ylabel="GDP (x10⁸CNY)")
bar2.opts(color="blue",ylabel="Population (x10⁴ person)")
bar3.opts(color="green",ylabel="Fixed assets investment (x10⁸ CNY)")
bar4.opts(color="orange",ylabel="Trade (CNY)")
 
bars = bar1 + bar2 + bar3 + bar4

bars.cols(2)


print(bars)

:Layout
   .Bars.GDP_of_each_province                     :Bars   [prov]   (gdp)
   .Bars.Population_of_each_province              :Bars   [prov]   (pop)
   .Bars.Fixed_assets_investment_of_each_province :Bars   [prov]   (finv)
   .Bars.Trade_of_each_province                   :Bars   [prov]   (trade)


bars.Bars.GDP_of_each_province


%%opts Bars [tools=["hover"] stacked=True  width=600 height=400 tools=["hover"]]
%%opts Bars [show_legend=True legend_position="right" legend_opts={"title": "GDP:"}]
%%opts Bars [xrotation=45,ylabel="GDP (x10⁸CNY)"]

bar = hv.Bars(df,
               kdims=["year", "prov"],
               vdims=["gdp"])

bar


%%opts Bars [width=950 height=450 tools=["hover"]]
%%opts Bars [show_legend=True legend_position="top" legend_opts={"title": "GDP"}]
%%opts Bars [xrotation=45 xlabel="Province, Year"]

provinces = ['Guangdong', 'Jiangsu', 'Zhejiang','Shandong','Henan']
bar_group = hv.Bars(df[df["prov"].isin(provinces)],
              kdims=["prov","year"],
              vdims=["gdp"])
bar_group


%%opts BoxWhisker [tools=["hover"] xlabel="Provinces" height=400 width=400 xrotation=45]

boxs1 = hv.BoxWhisker(df, kdims="prov", vdims="gdp" , label="GDP of 5 the prvinces ")
boxs2 = hv.BoxWhisker(df, kdims="prov", vdims="pop" , label="Population of the 5 prvinces ")
boxs3 = hv.BoxWhisker(df, kdims="prov", vdims="finv" , label="Fixed investment of the 5 prvinces ")
boxs4 = hv.BoxWhisker(df, kdims="prov", vdims="trade" , label="Trade of the 5 prvinces ")
boxs5 = hv.BoxWhisker(df, kdims="prov", vdims="fexpen" , label="Fixed expense of the 5 prvinces ")
boxs6 = hv.BoxWhisker(df, kdims="prov", vdims="uinc" , label="Urban income of the 5 prvinces ")

# set different ylabels
boxs1.opts(ylabel="GDP (x10⁸CNY)")
boxs2.opts(ylabel="Population (x10⁴person)")
boxs3.opts(ylabel="Fixed assets investment (x10⁸CNY)")
boxs4.opts(ylabel="Trade (CNY)")
boxs4.opts(ylabel="Fiscal expenditure (x10⁹CNY)")
boxs4.opts(ylabel="Urban disposal income per capita (CNY）")

(boxs1 + boxs2 + boxs3 + boxs4 + boxs5 + boxs6).cols(2)


%%opts Violin [tools=["hover"] xlabel="Provinces" height=400 width=400 xrotation=45 ylim=(-7,18) ]

violin1 = hv.Violin(df, kdims="prov", vdims="gdp" , label="GDP of 5 the prvinces ")
violin2 = hv.Violin(df, kdims="prov", vdims="pop" , label="Population of the 5 prvinces ")
violin3 = hv.Violin(df, kdims="prov", vdims="finv" , label="Fixed investment of the 5 prvinces ")
violin4 = hv.Violin(df, kdims="prov", vdims="trade" , label="Trade of the 5 prvinces ")
violin5 = hv.Violin(df, kdims="prov", vdims="fexpen" , label="Fixed expense of the 5 prvinces ")
violin6 = hv.Violin(df, kdims="prov", vdims="uinc" , label="Urban income of the 5 prvinces ")

# set different ylabels
violin1.opts(ylabel="GDP (x10⁸CNY)")
violin2.opts(ylabel="Population (x10⁴person)")
violin3.opts(ylabel="Fixed assets investment (x10⁸CNY)")
violin4.opts(ylabel="Trade (CNY)")
violin5.opts(ylabel="Fiscal expenditure (x10⁹CNY)")
violin6.opts(ylabel="Urban disposal income per capita (CNY）")

(violin1 + violin2 + violin3 + violin4 + violin5 + violin6).cols(2)


import numpy as np


%%opts Histogram [tools=["hover"] height=300 width=400 show_legend=True]
%%opts Histogram (alpha=0.6)

hist1 = hv.Histogram(np.histogram(df['gdp'], bins=24), kdims="gdp", label="GDP histogram")
hist2 = hv.Histogram(np.histogram(df['pop'], bins=24), kdims="pop", label="Population histogram")
hist3 = hv.Histogram(np.histogram(df['finv'], bins=24), kdims="finv", label="Fixed investment histogram")
hist4 = hv.Histogram(np.histogram(df['trade'], bins=24), kdims="trade", label="Trade histogram")
(hist1 + hist2 + hist3 + hist4).cols(2)


hd = hv.Dataset(df)
hd

:Dataset   [prov,gdpr,year,gdp,pop,finv,trade,fexpen,uinc]


# the dataframe columns of pandas
df.columns

Index(['prov', 'gdpr', 'year', 'gdp', 'pop', 'finv', 'trade', 'fexpen',
       'uinc'],
      dtype='object')


hd = hv.Dataset(df, kdims=['year'], vdims=['prov','year', 'gdp', 'pop', 'finv', 'trade', 'fexpen',
       'uinc'])
hd

:Dataset   [year]   (prov,year,gdp,pop,finv,trade,fexpen,uinc)


hv.Curve(hd.select(prov='Guangdong'), 'year', 'gdp').opts(tools=["hover"],width=400)


curves_app = hd.to(hv.Curve, kdims=['year'], vdims=['gdp'], groupby='prov')

curves_app.opts(height=400,width=500,
                tools=["hover"],
                xlabel="Province", 
                ylabel="GDP (x10⁸CNY)")


bars_app = hd.to(hv.Bars, kdims=['prov'], vdims=['gdp'], groupby='year')

bars_app.opts(height=400,width=500,
              xrotation=45,
              tools=["hover"],
              xlabel="Province", 
              ylabel="GDP (x10⁸CNY)",
              ylim=(0.0,10),
              color="red")

	prov	gdpr	year	gdp	pop	finv	trade	fexpen	uinc
0	Guangdong	First	2000	1.074125	8.650000	0.314513	1.408147	0.108032	0.976157
1	Guangdong	First	2001	1.203925	8.733000	0.348443	1.501391	0.132133	1.041519
2	Guangdong	First	2002	1.350242	8.842000	0.385078	1.830169	0.152108	1.113720
3	Guangdong	First	2003	1.584464	8.963000	0.481320	2.346735	0.169563	1.238043
4	Guangdong	First	2004	1.886462	9.052298	0.587002	2.955899	0.185295	1.362765

1. Read Dataset¶

(1) Import required libraries¶

(2) Read the dataset¶

2. Multiple Plots¶

3. Overlay of Multiple Plots¶

(1) Overlay of multiple lines¶

(2) Overlay of bar plots¶

(3) Overlay of scatter plots¶

(i) Scatter plots¶

(ii) Matrix scatter plot¶

(3) Overlay of box plots¶

(i) Overlay of multiple box of one variable in different categories¶

(ii) Different variables in different categories¶

(iii) Layout of multiple variables in different categories¶

(4) Overlays of histogram¶

(5) Overlay of violin plots¶

(i) Violin plots of the GDP of 5 provinces¶

(ii) Violin plots of the numerical columns¶

(iii) Violin plots of multiple variables in different categories¶

(6) Hexagonal Binning Plot (Hexbin Plot)¶

4. Layouts of Multiple Plots¶

(1) Layout of multiple lines¶

(2) Layout of multiple bar plots¶

(i) Multiple bar plots¶

(ii) Stacked Bar plots¶

(iii) Grouped bar plot¶

(3) Layout of multiple box whisker plots¶

(4) Layout of violin plots¶

(5) Layout of histograms¶

5. Interactive Plot App¶

(1) Convert dataset to HoloViews dataset¶

(2) Create interactive app¶

Example 1: Line App¶

Example 2: Bar App¶