当前位置：首页 > 黑客业务 > 正文内容

python代码(python代码画樱花)

hacker2年前 (2023-05-19)黑客业务135

数据可视化是数据科学中关键的一步。

在以图形方式表现某些数据时，Python能够提供很大的帮助。

不过有些小伙伴也会遇到不少问题，比如选择何种图表，以及如何制作，代码如何编写，这些都是问题！

今天给大家介绍一个Python图表大全，40个种类，总计约400个示例图表。

分为7个大系列，分布、关系、排行、局部整体、时间序列、地理空间、流程。

文档地址

https://www.python-graph-gallery.com

GitHub地址

https://github.com/holtzy/The-Python-Graph-Gallery

给大家提供了示例及代码，几分钟内就能构建一个你所需要的图表。

下面就给大家介绍一下～

01. 小提琴图

小提琴图可以将一组或多组数据的数值变量分布可视化。

相比有时会隐藏数据特征的箱形图相比，小提琴图值得更多关注。

importseaborn assns

importmatplotlib.pyplot asplt

# 加载数据

展开全文

df = sns.load_dataset( 'iris', data_home= 'seaborn-data', cache= True)

# 绘图显示

sns.violinplot(x=df[ "species"], y=df[ "sepal_length"])

plt.show

使用Seaborn的violinplot进行绘制，结果如下。

02. 核密度估计图

核密度估计图其实是对直方图的一个自然拓展。

可以可视化一个或多个组的数值变量的分布，非常适合大型数据集。

importseaborn assns

importmatplotlib.pyplot asplt

# 加载数据

df = sns.load_dataset( 'iris', data_home= 'seaborn-data', cache= True)

# 绘图显示

sns.kdeplot(df[ 'sepal_width'])

plt.show

使用Seaborn的kdeplot进行绘制，结果如下。

03. 直方图

直方图，可视化一组或多组数据的分布情况。

importseaborn assns

importmatplotlib.pyplot asplt

# 加载数据

df = sns.load_dataset( 'iris', data_home= 'seaborn-data', cache= True)

# 绘图显示

sns.distplot(a=df[ "sepal_length"], hist= True, kde= False, rug= False)

plt.show

使用Seaborn的distplot进行绘制，结果如下。

04. 箱形图

箱形图，可视化一组或多组数据的分布情况。

可以快速获得中位数、四分位数和异常值，但也隐藏数据集的各个数据点。

importseaborn assns

importmatplotlib.pyplot asplt

# 加载数据

df = sns.load_dataset( 'iris', data_home= 'seaborn-data', cache= True)

# 绘图显示

sns.boxplot(x=df[ "species"], y=df[ "sepal_length"])

plt.show

使用Seaborn的boxplot进行绘制，结果如下。

05. 山脊线图

山脊线图，总结几组数据的分布情况。

每个组都表示为一个密度图，每个密度图相互重叠以更有效地利用空间。

importplotly.graph_objects asgo

importnumpy asnp

importpandas aspd

# 读取数据

temp = pd.read_csv( '2016-weather-data-seattle.csv')

# 数据处理, 时间格式转换

temp[ 'year'] = pd.to_datetime(temp[ 'Date']).dt.year

# 选择几年的数据展示即可

year_list = [ 1950, 1960, 1970, 1980, 1990, 2000, 2010]

temp = temp[temp[ 'year'].isin(year_list)]

# 绘制每年的直方图，以年和平均温度分组，并使用'count'函数进行汇总

temp = temp.groupby([ 'year', 'Mean_TemperatureC']).agg({ 'Mean_TemperatureC': 'count'}).rename(columns={ 'Mean_TemperatureC': 'count'}).reset_index

# 使用Plotly绘制脊线图，每个轨迹对应于特定年份的温度分布

# 将每年的数据(温度和它们各自的计数)存储在单独的数组，并将其存储在字典中以方便检索

array_dict = {}

foryear inyear_list:

# 每年平均温度

array_dict[ f'x_ {year}' ] = temp[temp[ 'year'] == year][ 'Mean_TemperatureC']

# 每年温度计数

array_dict[ f'y_ {year}' ] = temp[temp[ 'year'] == year][ 'count']

array_dict[ f'y_ {year}' ] = (array_dict[ f'y_ {year}' ] - array_dict[ f'y_ {year}' ].min) \

/ (array_dict[ f'y_ {year}' ].max - array_dict[ f'y_ {year}' ].min)

# 创建一个图像对象

fig = go.Figure

forindex, year inenumerate(year_list):

# 使用add_trace绘制轨迹

fig.add_trace(go.Scatter(

x=[ -20, 40], y=np.full( 2, len(year_list) - index),

mode= 'lines',

line_color= 'white'))

fig.add_trace(go.Scatter(

x=array_dict[ f'x_ {year}' ],

y=array_dict[ f'y_ {year}' ] + (len(year_list) - index) + 0.4,

fill= 'tonexty',

name= f' {year}' ))

# 添加文本

fig.add_annotation(

x= -20,

y=len(year_list) - index,

text= f' {year}' ,

showarrow= False,

yshift= 10)

# 添加标题、图例、xy轴参数

fig.update_layout(

title= '1950年～2010年西雅图平均温度',

showlegend= False,

xaxis=dict(title= '单位: 摄氏度'),

yaxis=dict(showticklabels= False)

)

# 跳转网页显示

fig.show

Seaborn没有专门的函数来绘制山脊线图，可以多次调用kdeplot来制作。

结果如下。

06. 散点图

散点图，显示2个数值变量之间的关系。

importseaborn assns

importmatplotlib.pyplot asplt

# 加载数据

df = sns.load_dataset( 'iris', data_home= 'seaborn-data', cache= True)

# 绘图显示

sns.regplot(x=df[ "sepal_length"], y=df[ "sepal_width"])

plt.show

使用Seaborn的regplot进行绘制，结果如下。

07. 矩形热力图

矩形热力图，矩阵中的每个值都被表示为一个颜色数据。

importseaborn assns

importpandas aspd

importnumpy asnp

# Create a dataset

df = pd.DataFrame(np.random.random(( 5, 5)), columns=[ "a", "b", "c", "d", "e"])

# Default heatmap

p1 = sns.heatmap(df)

使用Seaborn的heatmap进行绘制，结果如下。

08. 相关性图

相关性图或相关矩阵图，分析每对数据变量之间的关系。

相关性可视化为散点图，对角线用直方图或密度图表示每个变量的分布。

importseaborn assns

importmatplotlib.pyplot asplt

# 加载数据

df = sns.load_dataset( 'iris', data_home= 'seaborn-data', cache= True)

# 绘图显示

sns.pairplot(df)

plt.show

使用Seaborn的pairplot进行绘制，结果如下。

09. 气泡图

气泡图其实就是一个散点图，其中圆圈大小被映射到第三数值变量的值。

importmatplotlib.pyplot asplt

importseaborn assns

fromgapminder importgapminder

# 导入数据

data = gapminder.loc[gapminder.year == 2007]

# 使用scatterplot创建气泡图

sns.scatterplot(data=data, x= "gdpPercap", y= "lifeExp", size= "pop", legend= False, sizes=( 20, 2000))

# 显示

plt.show

使用Seaborn的scatterplot进行绘制，结果如下。

10. 连接散点图

连接散点图就是一个线图，其中每个数据点由圆形或任何类型的标记展示。

importmatplotlib.pyplot asplt

importnumpy asnp

importpandas aspd

# 创建数据

df = pd.DataFrame({ 'x_axis': range( 1, 10), 'y_axis': np.random.randn( 9) * 80+ range( 1, 10)})

# 绘制显示

plt.plot( 'x_axis', 'y_axis', data=df, linestyle= '-', marker= 'o')

plt.show

使用Matplotlib的plot进行绘制，结果如下。

11. 二维密度图

二维密度图或二维直方图，可视化两个定量变量的组合分布。

它们总是在X轴上表示一个变量，另一个在Y轴上，就像散点图。

然后计算二维空间特定区域内的次数，并用颜色渐变表示。

形状变化：六边形a hexbin chart，正方形a 2d histogram，核密度2d density plots或contour plots。

importnumpy asnp

importmatplotlib.pyplot asplt

fromscipy.stats importkde

# 创建数据, 200个点

data = np.random.multivariate_normal([ 0, 0], [[ 1, 0.5], [ 0.5, 3]], 200)

x, y = data.T

# 创建画布, 6个子图

fig, axes = plt.subplots(ncols= 6, nrows= 1, figsize=( 21, 5))

# 第一个子图, 散点图

axes[ 0].set_title( 'Scatterplot')

axes[ 0].plot(x, y, 'ko')

# 第二个子图, 六边形

nbins = 20

axes[ 1].set_title( 'Hexbin')

axes[ 1].hexbin(x, y, gridsize=nbins, cmap=plt.cm.BuGn_r)

# 2D 直方图

axes[ 2].set_title( '2D Histogram')

axes[ 2].hist2d(x, y, bins=nbins, cmap=plt.cm.BuGn_r)

# 高斯kde

k = kde.gaussian_kde(data.T)

xi, yi = np.mgrid[x.min:x.max:nbins * 1j, y.min:y.max:nbins * 1j]

zi = k(np.vstack([xi.flatten, yi.flatten]))

# 密度图

axes[ 3].set_title( 'Calculate Gaussian KDE')

axes[ 3].pcolormesh(xi, yi, zi.reshape(xi.shape), shading= 'auto', cmap=plt.cm.BuGn_r)

# 添加阴影

axes[ 4].set_title( '2D Density with shading')

axes[ 4].pcolormesh(xi, yi, zi.reshape(xi.shape), shading= 'gouraud', cmap=plt.cm.BuGn_r)

# 添加轮廓

axes[ 5].set_title( 'Contour')

axes[ 5].pcolormesh(xi, yi, zi.reshape(xi.shape), shading= 'gouraud', cmap=plt.cm.BuGn_r)

axes[ 5].contour(xi, yi, zi.reshape(xi.shape))

plt.show

使用Matplotlib和scipy进行绘制，结果如下。

12. 条形图

条形图表示多个明确的变量的数值关系。每个变量都为一个条形。条形的大小代表其数值。

importnumpy asnp

importmatplotlib.pyplot asplt

# 生成随机数据

height = [ 3, 12, 5, 18, 45]

bars = ( 'A', 'B', 'C', 'D', 'E')

y_pos = np.arange(len(bars))

# 创建条形图

plt.bar(y_pos, height)

# x轴标签

plt.xticks(y_pos, bars)

# 显示

plt.show

使用Matplotlib的bar进行绘制，结果如下。

13. 雷达图

雷达图，可以可视化多个定量变量的一个或多个系列的值。

每个变量都有自己的轴，所有轴都连接在图形的中心。

importmatplotlib.pyplot asplt

importpandas aspd

frommath importpi

# 设置数据

df = pd.DataFrame({

'group': [ 'A', 'B', 'C', 'D'],

'var1': [ 38, 1.5, 30, 4],

'var2': [ 29, 10, 9, 34],

'var3': [ 8, 39, 23, 24],

'var4': [ 7, 31, 33, 14],

'var5': [ 28, 15, 32, 14]

})

# 目标数量

categories = list(df)[ 1:]

N = len(categories)

# 角度

angles = [n / float(N) * 2* pi forn inrange(N)]

angles += angles[: 1]

# 初始化

ax = plt.subplot( 111, polar= True)

# 设置第一处

ax.set_theta_offset(pi / 2)

ax.set_theta_direction( -1)

# 添加背景信息

plt.xticks(angles[: -1], categories)

ax.set_rlabel_position( 0)

plt.yticks([ 10, 20, 30], [ "10", "20", "30"], color= "grey", size= 7)

plt.ylim( 0, 40)

# 添加数据图

# 第一个

values = df.loc[ 0].drop( 'group').values.flatten.tolist

values += values[: 1]

ax.plot(angles, values, linewidth= 1, linestyle= 'solid', label= "group A")

ax.fill(angles, values, 'b', alpha= 0.1)

# 第二个

values = df.loc[ 1].drop( 'group').values.flatten.tolist

values += values[: 1]

ax.plot(angles, values, linewidth= 1, linestyle= 'solid', label= "group B")

ax.fill(angles, values, 'r', alpha= 0.1)

# 添加图例

plt.legend(loc= 'upper right', bbox_to_anchor=( 0.1, 0.1))

# 显示

plt.show

使用Matplotlib进行绘制，结果如下。

14. 词云图

词云图是文本数据的视觉表示。

单词通常是单个的，每个单词的重要性以字体大小或颜色表示。

fromwordcloud importWordCloud

importmatplotlib.pyplot asplt

# 添加词语

text=( "Python Python Python Matplotlib Chart Wordcloud Boxplot")

# 创建词云对象

wordcloud = WordCloud(width= 480, height= 480, margin= 0).generate(text)

# 显示词云图

plt.imshow(wordcloud, interpolation= 'bilinear')

plt.axis( "off")

plt.margins(x= 0, y= 0)

plt.show

使用wordcloud进行绘制，结果如下。

15. 平行座标图

一个平行座标图，能够比较不同系列相同属性的数值情况。

Pandas可能是绘制平行坐标图的最佳方式。

importseaborn assns

importmatplotlib.pyplot asplt

frompandas.plotting importparallel_coordinates

# 读取数据

data = sns.load_dataset( 'iris', data_home= 'seaborn-data', cache= True)

# 创建图表

parallel_coordinates(data, 'species', colormap=plt.get_cmap( "Set2"))

# 显示

plt.show

使用Pandas的parallel_coordinates进行绘制，结果如下。

16. 棒棒糖图

棒棒糖图其实就是柱状图的变形，显示一个线段和一个圆。

importmatplotlib.pyplot asplt

importpandas aspd

importnumpy asnp

# 创建数据

df = pd.DataFrame({ 'group': list(map(chr, range( 65, 85))), 'values': np.random.uniform(size= 20) })

# 排序取值

ordered_df = df.sort_values(by= 'values')

my_range = range( 1, len(df.index)+ 1)

# 创建图表

plt.stem(ordered_df[ 'values'])

plt.xticks(my_range, ordered_df[ 'group'])

# 显示

plt.show

使用Matplotlib的stem进行绘制，结果如下。

17. 径向柱图

径向柱图同样也是条形图的变形，但是使用极坐标而不是直角坐标系。

绘制起来有点麻烦，而且比柱状图准确度低，但更引人注目。

importpandas aspd

importmatplotlib.pyplot asplt

importnumpy asnp

# 生成数据

df = pd.DataFrame(

{

'Name': [ 'item '+ str(i) fori inlist(range( 1, 51)) ],

'Value': np.random.randint(low= 10, high= 100, size= 50)

})

# 排序

df = df.sort_values(by=[ 'Value'])

# 初始化画布

plt.figure(figsize=( 20, 10))

ax = plt.subplot( 111, polar= True)

plt.axis( 'off')

# 设置图表参数

upperLimit = 100

lowerLimit = 30

labelPadding = 4

# 计算最大值

max = df[ 'Value'].max

# 数据下限10, 上限100

slope = (max - lowerLimit) / max

heights = slope * df.Value + lowerLimit

# 计算条形图的宽度

width = 2*np.pi / len(df.index)

# 计算角度

indexes = list(range( 1, len(df.index)+ 1))

angles = [element * width forelement inindexes]

# 绘制条形图

bars = ax.bar(

x=angles,

height=heights,

width=width,

bottom=lowerLimit,

linewidth= 2,

edgecolor= "white",

color= "#61a4b2",

)

# 添加标签

forbar, angle, height, label inzip(bars,angles, heights, df[ "Name"]):

# 旋转

rotation = np.rad2deg(angle)

# 翻转

alignment = ""

ifangle >= np.pi/ 2andangle < 3*np.pi/ 2:

alignment = "right"

rotation = rotation + 180

else:

alignment = "left"

# 最后添加标签

ax.text(

x=angle,

y=lowerLimit + bar.get_height + labelPadding,

s=label,

ha=alignment,

va= 'center',

rotation=rotation,

rotation_mode= "anchor")

plt.show

使用Matplotlib进行绘制，结果如下。

18. 矩形树图

矩形树图是一种常见的表达『层级数据』『树状数据』的可视化形式。

它主要用面积的方式，便于突出展现出『树』的各层级中重要的节点。

importmatplotlib.pyplot asplt

importsquarify

importpandas aspd

# 创建数据

df = pd.DataFrame({ 'nb_people': [ 8, 3, 4, 2], 'group': [ "group A", "group B", "group C", "group D"]})

# 绘图显示

squarify.plot(sizes=df[ 'nb_people'], label=df[ 'group'], alpha= .8)

plt.axis( 'off')

plt.show

使用squarify库进行绘制，结果如下。

19. 维恩图

维恩图，显示不同组之间所有可能的关系。

importmatplotlib.pyplot asplt

frommatplotlib_venn importvenn2

# 创建图表

venn2(subsets=( 10, 5, 2), set_labels=( 'Group A', 'Group B'))

# 显示

plt.show

使用matplotlib_venn库进行绘制，结果如下。

20. 圆环图

圆环图，本质上就是一个饼图，中间切掉了一个区域。

importmatplotlib.pyplot asplt

# 创建数据

size_of_groups = [ 12, 11, 3, 30]

# 生成饼图

plt.pie(size_of_groups)

# 在中心添加一个圆, 生成环形图

my_circle = plt.Circle(( 0, 0), 0.7, color= 'white')

p = plt.gcf

p.gca.add_artist(my_circle)

plt.show

使用Matplotlib进行绘制，结果如下。

21. 饼图

饼图，最常见的可视化图表之一。

将圆划分成一个个扇形区域，每个区域代表在整体中所占的比例。

importmatplotlib.pyplot asplt

# 创建数据

size_of_groups = [ 12, 11, 3, 30]

# 生成饼图

plt.pie(size_of_groups)

plt.show

使用Matplotlib进行绘制，结果如下。

22. 树图

树图主要用来可视化树形数据结构，是一种特殊的层次类型，具有唯一的根节点，左子树，和右子树。

importpandas aspd

frommatplotlib importpyplot asplt

fromscipy.cluster.hierarchy importdendrogram, linkage

# 读取数据

df = pd.read_csv( 'mtcars.csv')

df = df.set_index( 'model')

# 计算每个样本之间的距离

Z = linkage(df, 'ward')

# 绘图

dendrogram(Z, leaf_rotation= 90, leaf_font_size= 8, labels=df.index)

# 显示

plt.show

使用Scipy进行绘制，结果如下。

23. 气泡图

气泡图，表示层次结构及数值大小。

使用Circlify进行绘制，结果如下。

24. 折线图

折线图是最常见的图表类型之一。

将各个数据点标志连接起来的图表，用于展现数据的变化趋势。

importmatplotlib.pyplot asplt

importnumpy asnp

# 创建数据

values = np.cumsum(np.random.randn( 1000, 1))

# 绘制图表

plt.plot(values)

plt.show

使用Matplotlib进行绘制，结果如下。

25. 面积图

面积图和折线图非常相似，区别在于和x坐标轴间是否被颜色填充。

importmatplotlib.pyplot asplt

# 创建数据

x = range( 1, 6)

y = [ 1, 4, 6, 8, 4]

# 生成图表

plt.fill_between(x, y)

plt.show

使用Matplotlib的fill_between进行绘制，结果如下。

26. 堆叠面积图

堆叠面积图表示若干个数值变量的数值演变。

每个显示在彼此的顶部，易于读取总数，但较难准确读取每个的值。

importmatplotlib.pyplot asplt

# 创建数据

x = range( 1, 6)

y1 = [ 1, 4, 6, 8, 9]

y2 = [ 2, 2, 7, 10, 12]

y3 = [ 2, 8, 5, 10, 6]

# 生成图表

plt.stackplot(x, y1, y2, y3, labels=[ 'A', 'B', 'C'])

plt.legend(loc= 'upper left')

plt.show

使用Matplotlib的stackplot进行绘制，结果如下。

27. 河流图

河流图是一种特殊的流图, 它主要用来表示事件或主题等在一段时间内的变化。

围绕着中心轴显示，且边缘是圆形的，从而形成流动的形状。

importmatplotlib.pyplot asplt

importnumpy asnp

fromscipy importstats

# 添加数据

x = np.arange( 1990, 2020)

y = [np.random.randint( 0, 5, size= 30) for_ inrange( 5)]

defgaussian_smooth(x, y, grid, sd):

"""平滑曲线"""

weights = np.transpose([stats.norm.pdf(grid, m, sd) form inx])

weights = weights / weights.sum( 0)

return(weights * y).sum( 1)

# 自定义颜色

COLORS = [ "#D0D1E6", "#A6BDDB", "#74A9CF", "#2B8CBE", "#045A8D"]

# 创建画布

fig, ax = plt.subplots(figsize=( 10, 7))

# 生成图表

grid = np.linspace( 1985, 2025, num= 500)

y_smoothed = [gaussian_smooth(x, y_, grid, 1) fory_ iny]

ax.stackplot(grid, y_smoothed, colors=COLORS, baseline= "sym")

# 显示

plt.show

先使用Matplotlib绘制堆积图，设置stackplot的baseline参数，可将数据围绕x轴展示。

再通过scipy.interpolate平滑曲线，最终结果如下。

28. 时间序列图

时间序列图是指能够展示数值演变的所有图表。

比如折线图、柱状图、面积图等等。

importnumpy asnp

importseaborn assns

importpandas aspd

importmatplotlib.pyplot asplt

# 创建数据

my_count = [ "France", "Australia", "Japan", "USA", "Germany", "Congo", "China", "England", "Spain", "Greece", "Marocco",

"South Africa", "Indonesia", "Peru", "Chili", "Brazil"]

df = pd.DataFrame({

"country": np.repeat(my_count, 10),

"years": list(range( 2000, 2010)) * 16,

"value": np.random.rand( 160)

})

# 创建网格

g = sns.FacetGrid(df, col= 'country', hue= 'country', col_wrap= 4, )

# 添加曲线图

g = g.map(plt.plot, 'years', 'value')

# 面积图

g = g.map(plt.fill_between, 'years', 'value', alpha= 0.2).set_titles( "{col_name} country")

# 标题

g = g.set_titles( "{col_name}")

# 总标题

plt.subplots_adjust(top= 0.92)

g = g.fig.suptitle( 'Evolution of the value of stuff in 16 countries')

# 显示

plt.show

下面以一个时间序列面积图为例，显示多组数据，结果如下。

29. 地图

所有的地理空间数据分析应该都离不开地图吧！

importpandas aspd

importfolium

# 创建地图对象

m = folium.Map(location=[ 20, 0], tiles= "OpenStreetMap", zoom_start= 2)

# 创建图标数据

data = pd.DataFrame({

'lon': [ -58, 2, 145, 30.32, -4.03, -73.57, 36.82, -38.5],

'lat': [ -34, 49, -38, 59.93, 5.33, 45.52, -1.29, -12.97],

'name': [ 'Buenos Aires', 'Paris', 'melbourne', 'St Petersbourg', 'Abidjan', 'Montreal', 'Nairobi', 'Salvador'],

'value': [ 10, 12, 40, 70, 23, 43, 100, 43]

}, dtype=str)

# 添加信息

fori inrange( 0,len(data)):

folium.Marker(

location=[data.iloc[i][ 'lat'], data.iloc[i][ 'lon']],

popup=data.iloc[i][ 'name'],

).add_to(m)

# 保存

m.save( 'map.html')

使用Folium绘制谷歌地图风格的地图，结果如下。

30. 等值域地图

等值域地图，相同数值范围，着色相同。

importpandas aspd

importfolium

# 创建地图对象

m = folium.Map(location=[ 40, -95], zoom_start= 4)

# 读取数据

state_geo = f"us-states.json"

state_unemployment = f"US_Unemployment_Oct2012.csv"

state_data = pd.read_csv(state_unemployment)

folium.Choropleth(

geo_data=state_geo,

name= "choropleth",

data=state_data,

columns=[ "State", "Unemployment"],

key_on= "feature.id",

fill_color= "YlGn",

fill_opacity= 0.7,

line_opacity= .1,

legend_name= "Unemployment Rate (%)",

).add_to(m)

folium.LayerControl.add_to(m)

# 保存

m.save( 'choropleth-map.html')

使用Folium的choropleth进行绘制，结果如下。

31. 网格地图

Hexbin地图，美国大选投票经常看见。

使用geopandas和matplotlib进行绘制，结果如下。

32. 变形地图

故名思义，就是形状发生改变的地图。

其中每个区域的形状，会根据数值发生扭曲变化。

这里没有相关的代码示例，直接上个图好了。

33. 连接映射地图

连接地图可以显示地图上几个位置之间的连接关系。

航空上经常用到的飞线图，应该是这个的升级版。

frommpl_toolkits.basemap importBasemap

importmatplotlib.pyplot asplt

importpandas aspd

# 数据

cities = {

'city': [ "Paris", "Melbourne", "Saint.Petersburg", "Abidjan", "Montreal", "Nairobi", "Salvador"],

'lon': [ 2, 145, 30.32, -4.03, -73.57, 36.82, -38.5],

'lat': [ 49, -38, 59.93, 5.33, 45.52, -1.29, -12.97]

}

df = pd.DataFrame(cities, columns=[ 'city', 'lon', 'lat'])

# 创建地图

m = Basemap(llcrnrlon= -179, llcrnrlat= -60, urcrnrlon= 179, urcrnrlat= 70, projection= 'merc')

m.drawmapboundary(fill_color= 'white', linewidth= 0)

m.fillcontinents(color= '#f2f2f2', alpha= 0.7)

m.drawcoastlines(linewidth= 0.1, color= "white")

# 循环建立连接

forstartIndex, startRow indf.iterrows:

forendIndex inrange(startIndex, len(df.index)):

endRow = df.iloc[endIndex]

m.drawgreatcircle(startRow.lon, startRow.lat, endRow.lon, endRow.lat, linewidth= 1, color= '#69b3a2');

# 添加城市名称

fori, row indf.iterrows:

plt.annotate(row.city, xy=m(row.lon + 3, row.lat), verticalalignment= 'center')

plt.show

使用basemap绘制，结果如下。

34. 气泡地图

气泡地图，使用不同尺寸的圆来表示该地理坐标的数值。

importfolium

importpandas aspd

# 创建地图对象

m = folium.Map(location=[ 20, 0], tiles= "OpenStreetMap", zoom_start= 2)

# 坐标点数据

data = pd.DataFrame({

'lon': [ -58, 2, 145, 30.32, -4.03, -73.57, 36.82, -38.5],

'lat': [ -34, 49, -38, 59.93, 5.33, 45.52, -1.29, -12.97],

'name': [ 'Buenos Aires', 'Paris', 'melbourne', 'St Petersbourg', 'Abidjan', 'Montreal', 'Nairobi', 'Salvador'],

'value': [ 10, 12, 40, 70, 23, 43, 100, 43]

}, dtype=str)

# 添加气泡

fori inrange( 0, len(data)):

folium.Circle(

location=[data.iloc[i][ 'lat'], data.iloc[i][ 'lon']],

popup=data.iloc[i][ 'name'],

radius=float(data.iloc[i][ 'value'])* 20000,

color= 'crimson',

fill= True,

fill_color= 'crimson'

).add_to(m)

# 保存

m.save( 'bubble-map.html')

使用Folium的Circle进行绘制，结果如下。

35. 和弦图

和弦图表示若干个实体(节点)之间的流或连接。

每个实体(节点)有圆形布局外部的一个片段表示。

然后在每个实体之间绘制弧线，弧线的大小与流的关系成正比。

fromchord importChord

matrix = [

[ 0, 5, 6, 4, 7, 4],

[ 5, 0, 5, 4, 6, 5],

[ 6, 5, 0, 4, 5, 5],

[ 4, 4, 4, 0, 5, 5],

[ 7, 6, 5, 5, 0, 4],

[ 4, 5, 5, 5, 4, 0],

]

names = [ "Action", "Adventure", "Comedy", "Drama", "Fantasy", "Thriller"]

# 保存

Chord(matrix, names).to_html( "chord-diagram.html")

使用Chord库进行绘制，结果如下。

36. 网状图

网状图显示的是一组实体之间的连接关系。

每个实体由一个节点表示，节点之间通过线段连接。

importpandas aspd

importnumpy asnp

importnetworkx asnx

importmatplotlib.pyplot asplt

# 创建数据

ind1 = [ 5, 10, 3, 4, 8, 10, 12, 1, 9, 4]

ind5 = [ 1, 1, 13, 4, 18, 5, 2, 11, 3, 8]

df = pd.DataFrame(

{ 'A': ind1, 'B': ind1 + np.random.randint( 10, size=( 10)), 'C': ind1 + np.random.randint( 10, size=( 10)),

'D': ind1 + np.random.randint( 5, size=( 10)), 'E': ind1 + np.random.randint( 5, size=( 10)), 'F': ind5,

'G': ind5 + np.random.randint( 5, size=( 10)), 'H': ind5 + np.random.randint( 5, size=( 10)),

'I': ind5 + np.random.randint( 5, size=( 10)), 'J': ind5 + np.random.randint( 5, size=( 10))})

# 计算相关性

corr = df.corr

# 转换

links = corr.stack.reset_index

links.columns = [ 'var1', 'var2', 'value']

# 保持相关性超过一个阈值, 删除自相关性

links_filtered = links.loc[(links[ 'value'] > 0.8) & (links[ 'var1'] != links[ 'var2'])]

# 生成图

G = nx.from_pandas_edgelist(links_filtered, 'var1', 'var2')

# 绘制网络

nx.draw(G, with_labels= True, node_color= 'orange', node_size= 400, edge_color= 'black', linewidths= 1, font_size= 15)

# 显示

plt.show

使用NetworkX库进行绘制，结果如下。

37. 桑基图

桑基图是一种特殊的流图。

它主要用来表示原材料、能量等如何从初始形式经过中间过程的加工、转化到达最终形式。

Plotly可能是创建桑基图的最佳工具，通过Sankey在几行代码中获得一个图表。

importplotly.graph_objects asgo

importjson

# 读取数据

withopen( 'sankey_energy.json') asf:

data = json.load(f)

# 透明度

opacity = 0.4

# 颜色

data[ 'data'][ 0][ 'node'][ 'color'] = [ 'rgba(255,0,255, 0.8)'ifcolor == "magenta"elsecolor forcolor indata[ 'data'][ 0][ 'node'][ 'color']]

data[ 'data'][ 0][ 'link'][ 'color'] = [data[ 'data'][ 0][ 'node'][ 'color'][src].replace( "0.8", str(opacity))

forsrc indata[ 'data'][ 0][ 'link'][ 'source']]

fig = go.Figure(data=[go.Sankey(

valueformat= ".0f",

valuesuffix= "TWh",

# 点

node=dict(

pad= 15,

thickness= 15,

line=dict(color = "black", width = 0.5),

label=data[ 'data'][ 0][ 'node'][ 'label'],

color=data[ 'data'][ 0][ 'node'][ 'color']

# 线

link=dict(

source=data[ 'data'][ 0][ 'link'][ 'source'],

target=data[ 'data'][ 0][ 'link'][ 'target'],

value=data[ 'data'][ 0][ 'link'][ 'value'],

label=data[ 'data'][ 0][ 'link'][ 'label'],

color=data[ 'data'][ 0][ 'link'][ 'color']

))])

fig.update_layout(title_text= "Energy forecast for 2050<br>Source: Department of Energy & Climate Change, Tom Counsell via <a href='https://bost.ocks.org/mike/sankey/'>Mike Bostock</a>",

font_size= 10)

# 保持

fig.write_html( "sankey-diagram.html")

使用Plotly库进行绘制，结果如下。

38. 弧线图

弧线图是一种特殊的网络图。

由代表实体的节点和显示实体之间关系的弧线组成的。

在弧线图中，节点沿单个轴显示，节点间通过圆弧线进行连接。

目前还不知道如何通过Python来构建弧线图，不过可以使用R或者D3.js。

下面就来看一个通过js生成的弧线图。

39. 环形布局关系图

可视化目标之间的关系，可以减少复杂网络下观察混乱。

和弧线图一样，也只能通R或者D3.js绘制。

D3.js绘制的示例如下。

40. 动态图表

动态图表本质上就是显示一系列静态图表。

可以描述目标从一种状态到另一种状态的变化。

以一个动态散点气泡图为例，

先用matplotlib绘制图表图片，再通过imageio生成GIF，结果如下。

好了，本期的分享就到此结束了。

其中使用到的可视化库，大部分通过pip install即可完成安装。

有兴趣的小伙伴，可以自行去实践学习一下！

- EOF -

加主页君微信，不仅Python技能+1

主页君日常还会在个人微信分享 Python相关工具、资源和精选技术文章，不定期分享一些有意思的活动、岗位内推以及如何用技术做业余项目

加个微信，打开一扇窗

点击标题可跳转

1、 Python 实现 8 个概率分布公式及可视化

2、 Python 数据可视化的 3 大步骤，你知道吗？

3、超强 Python 数据可视化库，一文全解析

觉得本文对你有帮助？请分享给更多人

推荐关注「Python开发者」，提升Python技能

点赞和在看就是最大的支持❤️

扫描二维码推送至手机访问。

本文链接：http://therlest.com/141745.html

标签: python代码

分享给朋友：

返回列表

上一篇：黑客帝国里面的矩阵(黑客帝国里面的矩阵有什么用)

下一篇：怎样在微信上开店卖东西的简单介绍

“python代码(python代码画樱花)” 的相关文章

什么时候立秋

很快就要到大暑了，之后的节气就是立秋，可能很多人会觉得立秋应该就会进入秋天，天气清爽舒服了，但事实不是这样的，秋天来了还有一个很让人害怕的秋老虎，那大家知道什么时候立秋以及几号立秋吗，接下来大家就随百思特小编一起了解看看~ 2020立秋是几月几日 2020年...

今天发生的重大新闻5条，国内新闻最新消息10条

近期发生的额十件大新闻，伊朗重申继续实施核计划。本·拉登被击毙，近期国内外新闻要近期。被关闭·国家最高科学技术奖揭晓＂青藏铁路工程＂等获奖·广西陆川一在建楼面坍塌14名工人坠地受伤，文汇报，执政党民族解放党总统，到了主要内容介绍完。这是初中作业吧！月1日—德国总理默克尔倡议成立联合国经济理事会。...

蜂胶多少钱一瓶是真的（蜂胶五毒膏多少钱一只）

之前听说这客户有糖尿病，蜂胶就是物稀价贵，变成日常可以食用的营养品。我经常买的澳佳宝的120左右220粒。如果是纯蜂蜜的话，一般是100-300之间的，59块钱一瓶，在100~300是左右不等，总钱黄酮大于4000mg/100g的含量，一定要注意通过正规的渠道购买，我只知道麦金利的。蜂胶软胶囊价...

天气冷注意保暖的句子天气冷注意保暖的问候语

气温逐渐转冷，能够根据朋友圈说说的方式提示亲戚朋友注意保暖，或是给老人发短信问候语，立即的增加衣服留意身心健康，产生天冷注意保暖的语句。天冷注意保暖的问侯 1. 冬季那麼冷，我想要一个溫暖的被子，不容易断开连接的wifi，再再加上吃剩的零食，假如这种都不能，那是否可以使给我一个你。 2. 冬...

宝宝适合什么样的袜子如何选购幼儿袜子

有的母亲不习惯帮小宝宝加上棉袜，特别是在在夏季更是如此。可是在秋冬季的情况下，小宝宝的脚部防寒保暖是务必的，小宝宝的脚部的防寒保暖才不容易发烧感冒，那麼怎样购买小宝宝棉袜呢？下边的我为大伙儿共享小宝宝合适哪些的棉袜，在选择小宝宝棉袜的全过程中什么技巧呢？针对选购儿童但是我提议新手妈妈要帮小宝宝穿双棉...

小编教你在电脑上如何制作表格

在大家办公室或是校园内的情况下,有时必须采用报表来统计分析一些数据信息或是备案一些信息内容。此刻大家一般都是会应用Excel专用工具来做表格,有一些初学者新手还不明白在电脑上上做表格的方式。今日我教你在电脑上怎样做表格。下边就要我们一起来瞧瞧吧。电脑上做表格详尽实例教程： 1.大家最先在电脑上...