2021-03-18
大家好,今天主要向大家分享下誤差柱狀圖的三種可視化方法,先上個(gè)示例圖:
正式介紹實(shí)現(xiàn)方法之前,我們先來了解下誤差柱狀圖上的帽子涉及的三個(gè)統(tǒng)計(jì)概念。
1、三個(gè)概念
標(biāo)準(zhǔn)偏差(Standard Deviation,SD)
標(biāo)準(zhǔn)偏差(簡稱標(biāo)準(zhǔn)差)是樣本平均數(shù)方差的開平方。它反映組內(nèi)個(gè)體間的離散程度。標(biāo)準(zhǔn)差通常是相對于樣本數(shù)據(jù)的平均值而定的,通常用M±SD來表示樣本數(shù)據(jù)觀察值和平均值的差距。從公式可以看出,標(biāo)準(zhǔn)差會(huì)受到極值的影響。標(biāo)準(zhǔn)差越小,表明數(shù)據(jù)越聚集;標(biāo)準(zhǔn)差越大,表明數(shù)據(jù)越離散。Excel中如何用函數(shù)實(shí)現(xiàn),請參考【Excel實(shí)現(xiàn)】部分:
# R 語言實(shí)現(xiàn)函數(shù)
sd <- sd(vec)
sd <- sqrt(var(vec))
標(biāo)準(zhǔn)誤差(Standard Error,SE)
標(biāo)準(zhǔn)誤差(簡稱標(biāo)準(zhǔn)誤)表示的是抽樣的誤差。因?yàn)閺囊粋€(gè)總體中可以抽取出無數(shù)多種樣本,每一種樣本的數(shù)據(jù)都是對總體的數(shù)據(jù)的估計(jì)。標(biāo)準(zhǔn)誤代表的就是當(dāng)前的樣本對總體數(shù)據(jù)的估計(jì),標(biāo)準(zhǔn)誤是由樣本的標(biāo)準(zhǔn)差除以樣本容量的開平方來計(jì)算的。從公式可以看到,標(biāo)準(zhǔn)誤更大的是受到樣本容量的影響。樣本容量越大,標(biāo)準(zhǔn)誤越小,那么抽樣誤差就越小,就表明所抽取的樣本能夠較好地代表總體。
se = sd(vec) / sqrt(length(vec))
置信區(qū)間(Confidence Interval,CI)
所謂置信區(qū)間就是分別以統(tǒng)計(jì)量的置信上限和置信下限為上下界構(gòu)成的區(qū)間,是這個(gè)參數(shù)的真實(shí)值在一定概率條件下落在測量結(jié)果周圍的程度。
# R 語言實(shí)現(xiàn)
alpha=0.05
t=qt((1-alpha)/2 + .5, length(vec)-1) # tend to 1.96 if sample size is big enough
CI=t*se
2、Excel 實(shí)現(xiàn)
本實(shí)例所示數(shù)據(jù)如下,依次為處理方案(Treat)、分組類別(Group)、平均值(Mean)和標(biāo)準(zhǔn)偏差(SD)。
標(biāo)準(zhǔn)偏差可以參照下圖所示函數(shù)(STDEV.S())進(jìn)行計(jì)算:
繪圖步驟:
選中前三列數(shù)據(jù),依次選擇【插入→柱狀圖】,生成柱狀圖后點(diǎn)擊右上圖標(biāo)添加按鈕,添加誤差線。在彈出的參數(shù)框中,選擇【更多選項(xiàng)→誤差量→自定義】,選擇第四列的SD值,即可繪制誤差線。另外根據(jù)需要,還可以在誤差線里面選擇只顯示“正偏差”。
3、R 語言實(shí)現(xiàn)
# 加載需要的包
library(plyr)
library(ggplot2)
# 讀取數(shù)據(jù)
dat <- read.delim("data.txt")
# 定義計(jì)算平均值和標(biāo)準(zhǔn)差函數(shù)
dat_sd <- function(data, varname, groupnames){
sum_func <- function(x, col){
c(Mean = mean(x[[col]], na.rm=TRUE),
SD = sd(x[[col]], na.rm=TRUE))
}
data_sum<-ddply(data, groupnames, .fun=sum_func,varname)
return(data_sum)
}
# 計(jì)算標(biāo)準(zhǔn)偏差
df <- dat_sd(dat,varname="Value", groupnames=c("Treat","Group"))
# 作圖
p<- ggplot(df, aes(x=Treat, y=Mean, fill=Group)) +
geom_bar(stat="identity", color="black",
position=position_dodge()) +
geom_errorbar(aes(ymin=Mean-SD, ymax=Mean+SD), width=.5,
position=position_dodge(.9))
4、云平臺(tái)實(shí)現(xiàn)
進(jìn)入基因云平臺(tái)【云圖匯→誤差柱狀圖】工具,在【圖表數(shù)據(jù)→文件上傳】頁面選擇數(shù)據(jù)文件后,點(diǎn)擊“提交繪圖”,即可生成誤差柱狀圖。進(jìn)入【圖表調(diào)整】頁面,可以實(shí)現(xiàn)顏色填充、圖案填充等多種類型圖表的隨意切換,分組/樣品的任意刪減和排序,以及近百種樣式的自由調(diào)整。
基因云平臺(tái)(https://www.genescloud.cn)除了上述誤差柱狀圖,還提供了斷軸柱狀圖、彩帶柱狀圖。進(jìn)入云圖匯總覽,搜索“柱狀圖”,可以查看近10種不同類型的柱狀圖。
交互斷軸柱狀圖
交互彩帶柱狀圖
極坐標(biāo)柱狀圖
趕緊來試一試吧,百度搜索“派森諾基因云”或者直接訪問https://www.genescloud.cn/home,進(jìn)入“云圖匯”搜索“柱狀圖”嘗試體驗(yàn),并提寶貴建議至平臺(tái)消息中心-》反饋列表,或者發(fā)送到郵箱:[email protected]。"派森諾基因云" 一直持續(xù)上心上新,接下來會(huì)有更多好圖好工具陸續(xù)和大家見面,歡迎大家關(guān)注并進(jìn)行體驗(yàn)。