【2.4.1】折线图lineplot

注意:数据一定是通过DataFrame中传送的

一、函数原型

seaborn.lineplot(x=None, y=None, hue=None, 
                 size=None, style=None, data=None,
                 palette=None, hue_order=None, hue_norm=None, 
                 sizes=None, size_order=None, size_norm=None, 
                 dashes=True, markers=None, style_order=None, 
                 units=None, estimator='mean', ci=95, n_boot=1000,
                 sort=True, err_style='band', err_kws=None,
                 legend='brief', ax=None, **kwargs)

参数解读

data:是DataFrame类型的;

可选:下面均为可选

x,y:数据中变量的名称;

hue:数据中变量名称(比如:二维数据中的列名)
作用:对将要生成不同颜色的线进行分组,可以是分类或数据。

size:数据中变量名称(比如:二维数据中的列名)
作用:对将要生成不同宽度的线进行分组,可以是分类或数据。

style:数据中变量名称(比如:二维数据中的列名)
作用:对将生成具有不同破折号、或其他标记的变量进行分组。

palette:调试板名称,列表或字典类型
作用:设置hue指定的变量的不同级别颜色。

hue_order:列表(list)类型
作用:指定hue变量出现的指定顺序,否则他们是根据数据确定的。

hue_norm:tuple或Normalize对象

sizes:list dict或tuple类型
作用:设置线宽度,当其为数字时,它也可以是一个元组,指定要使用的最大和最小值,会自动在该范围内对其他值进行规范化。

units:对变量识别抽样单位进行分组,使用时,将为每个单元绘制一个单独的行。

estimator:pandas方法的名称或回调函数或者None
作用:用于在同一x水平上聚合y变量的多个观察值的方法,如果为None,则将绘制所有观察结果。

二、案例教程

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline

from sklearn.datasets import load_diabetes

def fun(x):
    if x >0:
        return 1
    else:
        return 0
# sklearn自带数据 diabetes 糖尿病数据集
diabetes=load_diabetes()
data = pd.DataFrame(diabetes.data, columns=diabetes.feature_names)
#只抽取前80个数据
df=data[:80]
#由于diabetes中的数据均已归一化处理过,sex列中的值也归一化,现将其划分一下,大于0的设置为1,小于等于0的设置为0
df['sex']=df['sex'].apply(lambda x: fun(x))
#展示前5条数据
df[:5]
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns; sns.set()
%matplotlib inline

from sklearn.datasets import load_diabetes

def fun(x):
    if x >0:
        return 1
    else:
        return 0
# sklearn自带数据 diabetes 糖尿病数据集
diabetes=load_diabetes()
data = pd.DataFrame(diabetes.data, columns=diabetes.feature_names)
#只抽取前80个数据
df=data[:80]
#由于diabetes中的数据均已归一化处理过,sex列中的值也归一化,现将其划分一下,大于0的设置为1,小于等于0的设置为0
df['sex']=df['sex'].apply(lambda x: fun(x))

"""
案例1:绘制带有误差带的单线图,显示置信区间
"""
ax = sns.lineplot(x="age", y="s4",data=df)
plt.show()
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns; sns.set()
%matplotlib inline

from sklearn.datasets import load_diabetes

def fun(x):
    if x >0:
        return 1
    else:
        return 0

# sklearn自带数据 diabetes 糖尿病数据集
diabetes=load_diabetes()
data = pd.DataFrame(diabetes.data, columns=diabetes.feature_names)
#只抽取前80个数据
df=data[:80]
#由于diabetes中的数据均已归一化处理过,sex列中的值也归一化,现将其划分一下,大于0的设置为1,小于等于0的设置为0
df['sex']=df['sex'].apply(lambda x: fun(x))
"""
案例2:绘制带有误差带的单线图,显示置信区间
"""
dd=[df['s1'],df['s2'],df['s3'],df['s4']]
ax = sns.lineplot(data=dd)
plt.show()
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns; sns.set()
%matplotlib inline

from sklearn.datasets import load_diabetes

def fun(x):
    if x >0:
        return 1
    else:
        return 0

# sklearn自带数据 diabetes 糖尿病数据集
diabetes=load_diabetes()
data = pd.DataFrame(diabetes.data, columns=diabetes.feature_names)
#只抽取前80个数据
df=data[:80]
#由于diabetes中的数据均已归一化处理过,sex列中的值也归一化,现将其划分一下,大于0的设置为1,小于等于0的设置为0
df['sex']=df['sex'].apply(lambda x: fun(x))
"""
案例3:设置hue为sex,按照sex分组,并显示不同颜色
"""
sns.lineplot(x="age", y="s4", hue="sex",data=df)
plt.show()
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns; sns.set()
%matplotlib inline

from sklearn.datasets import load_diabetes

def fun(x):
    if x >0:
        return 1
    else:
        return 0

# sklearn自带数据 diabetes 糖尿病数据集
diabetes=load_diabetes()
data = pd.DataFrame(diabetes.data, columns=diabetes.feature_names)
#只抽取前80个数据
df=data[:80]
#由于diabetes中的数据均已归一化处理过,sex列中的值也归一化,现将其划分一下,大于0的设置为1,小于等于0的设置为0
df['sex']=df['sex'].apply(lambda x: fun(x))
"""
案例4:使用颜色和线型显示分组变量
"""
sns.lineplot(x="age", y="s1",hue="sex", style="sex", data=df)
plt.show()
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns; sns.set()
%matplotlib inline

from sklearn.datasets import load_diabetes

def fun(x):
    if x >0:
        return 1
    else:
        return 0
# sklearn自带数据 diabetes 糖尿病数据集
diabetes=load_diabetes()
data = pd.DataFrame(diabetes.data, columns=diabetes.feature_names)
#只抽取前80个数据
df=data[:80]
#由于diabetes中的数据均已归一化处理过,sex列中的值也归一化,现将其划分一下,大于0的设置为1,小于等于0的设置为0
df['sex']=df['sex'].apply(lambda x: fun(x))
"""
案例5:使用标记来标识组,而不用破折号来标识组:设置markers为True,设置dashes为False
"""
sns.lineplot(x="age", y="s1",hue="sex", style="sex", markers=True, dashes=False, data=df)
plt.show()
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns; sns.set()
%matplotlib inline

from sklearn.datasets import load_diabetes

def fun(x):
    if x >0:
        return 1
    else:
        return 0
# sklearn自带数据 diabetes 糖尿病数据集
diabetes=load_diabetes()
data = pd.DataFrame(diabetes.data, columns=diabetes.feature_names)
#只抽取前80个数据
df=data[:80]
#由于diabetes中的数据均已归一化处理过,sex列中的值也归一化,现将其划分一下,大于0的设置为1,小于等于0的设置为0
df['sex']=df['sex'].apply(lambda x: fun(x))
"""
案例6:显示错误条,而不显示错误带
"""
sns.lineplot(x="age", y="s5",hue="sex",err_style="bars", ci=68, data=df)
plt.show()
import numpy as np
import pandas as pd;
import matplotlib.pyplot as plt
# 构建 时间序列数据 从2000-1-31开始,以月份为间隔,构建100条记录
index = pd.date_range("1 1 2000", periods=100,freq="m", name="date")
data = np.random.randn(100, 4).cumsum(axis=0)

# 构建5列数据,列名分别为data a b c d
wide_df = pd.DataFrame(data, index, ["a", "b", "c", "d"])
"""
案例7:绘制时间序列数据
"""
sns.lineplot(data=wide_df)
plt.show()

三、我的案例

3.1 案例1

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from matplotlib import pyplot

input_tsv = '2.tr.vcf'
df = pd.read_csv(input_tsv,sep='\t',skiprows=33)

df['dp'] = df['INFO'].str.split(';',expand=True)[0].str.split('=',expand=True)[1].astype(int)

df_2 = df[['POS','dp']]
plt.figure(figsize=(16,12))

sns.lineplot(x="POS", y="dp", data=df_2) # , kind="line"

sns.lineplot([1,23], [16000000,16000000],color='green')
plt.text(3+0.2, 16000000, "Primer", horizontalalignment='left', size=18, color='black', weight='semibold')

sns.lineplot([24,93], [16000000,16000000],color='blue')
plt.text(40+0.2, 16000000, "5UTR", horizontalalignment='left', size=18, color='black', weight='semibold')


sns.lineplot([93,174], [16000000,16000000],color='red')
plt.text(100+0.2, 16000000, "CDS", horizontalalignment='left', size=18, color='black', weight='semibold')

sns.lineplot([175,299], [16000000,16000000],color='blue')
plt.text(200+0.2, 16000000, "3UTR", horizontalalignment='left', size=18, color='black', weight='semibold')

sns.lineplot([300,341], [16000000,16000000],color='green')
plt.text(300+0.2, 16000000, "Primer", horizontalalignment='left', size=18, color='black', weight='semibold')

plt.xlabel('POS',size=20)
plt.ylabel('Raw read depth',size=20)

参考资料

药企,独角兽,苏州。团队长期招人,感兴趣的都可以发邮件聊聊:tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn