import plotly_express as px
= px.data.iris()
df = px.scatter(df, x="sepal_width", y="sepal_length" )
fig fig.show()
散点图
Python
可视化
散点图也叫 X-Y 图,它将所有的数据以点的形式展现在直角坐标系上,以显示变量之间的相互影响程度,散点图还可以观察极值点。
用途
通过观察散点图上数据点的分布情况,我们可以估计出变量间的相关性。如果变量之间不存在相互关系,那么在散点图上就会表现为随机分布的离散的点,如果存在某种相关性,那么大部分的数据点就会相对密集并以某种趋势呈现。
构成
适用数据类型
数值变量
使用plotly绘制散点图
添加趋势线
趋势线帮助识别数据中的整体趋势或模式,无论这些趋势是线性的、指数的还是多项式的。例如,在时间序列数据中,趋势线可以揭示上升、下降或稳定的趋势。对于包含大量散点的图表,趋势线可以简化信息,使得观察者更容易理解数据的总体方向。趋势线可以用来预测未来的数据点,尤其在线性或其他简单模型中。在散点图中,趋势线可以帮助判断变量之间的关系强度。趋势线越接近所有点,关系就越强。
import plotly.express as px
= px.data.tips()
df = px.scatter(df, x="total_bill", y="tip", trendline="ols")
fig fig.show()
绘制多组变量的散点图
Plotly 可以非常方便地为多组变量绘制散点图,进而对比多个变量的差异。可以通过颜色、符号的不同,区分不同变量。
import plotly.express as px
= px.data.iris()
df = px.scatter(df, x="sepal_width", y="sepal_length", color="species", symbol="species")
fig fig.show()