GenAlex是一款基于EXCEL的生物數(shù)據(jù)分析加載宏,這款插件可以讓你直接在excel上進行生物數(shù)據(jù)分析。插件包括幾個Tutorial,有數(shù)據(jù)和實例,可對共線性數(shù)據(jù)、單倍體數(shù)據(jù)和二元數(shù)據(jù)分析,包含20多種不同的圖表總結數(shù)據(jù),可方便的在相關軟件中轉(zhuǎn)化格式。
功能介紹:
1、GenAlEx軟件在教學方面的功能
GenAlEx軟件的界面友好直觀,它可以使學生在一種非常熟悉的軟件環(huán)境中(MSExcel)分析真實的遺傳數(shù)據(jù)。教學可采用包括講座和個別指導相結合的方式,在這之中更多的是強調(diào)理論知識,同時也有大量的手動計算。一旦學生們掌握了理論和手
動計算,就可以向他們介紹在GenAlEx中分析現(xiàn)實的居群遺傳數(shù)據(jù)。雖然GenAlEx軟件是一種有力的教學輔助手段,但是它不能代替教師的作用。
盡管自從第一代GenAlEx被開發(fā)以來,出現(xiàn)了大批界面友好的用于居群遺傳分析的軟件包,但是GenAlEx軟件在教學方面仍舊表現(xiàn)出它獨特的優(yōu)勢——它在廣泛應用的兩個系統(tǒng)環(huán)境中都可以提供大量的居群遺傳分析選項。只要學生們理解了GenAlEx特有的參數(shù)和要求的數(shù)據(jù)格式,那么分析選項看起來就像是在Excel中的另一組選項而已。另外,除了為研究人員提供的輸出選項外,所有的GenAlEx分析產(chǎn)生的輸出結果都是Excel工作簿格式,因此學生們可以很容易地對結果進行修改校對和添加注釋。他們也可以復制、粘貼或者輸出圖像和表格到他們的研究報告或者實驗數(shù)據(jù)中。
在所提供的諸多輸出圖像中,有一些已經(jīng)被專門設計為教學環(huán)境服務。例如,基于遺傳距離的AMOVA分析和Mantel檢驗過程就涉及到前突變的重新取樣。在這些分析之中,除了繪制出專門分析的結果圖,GenAlEx還能輸出直方圖,比較獲得的統(tǒng)計數(shù)值。這對于理解統(tǒng)計檢驗的過程和解釋具有重要意義。
GenAlEx軟件同時還提供了一些一開始就為教學目的而設計的統(tǒng)計選項。這些包括F統(tǒng)計、哈迪-溫伯格平衡(HWE)的χ2檢驗以及基于頻率的分布檢驗。除此之外,GenAlEx軟件進行統(tǒng)計分析時,在必要的地方運用了一些在居群遺傳學教科書上被廣泛應用的公式和算法。另外,在一些分析中,GenAlEx軟件提供局部計算。這些計算通常都在幕后進行,從而學生們可以跟蹤整個計算過程。例如,在HWE選項之下有一個step-by-step選項,選中它之后,隨著實際的和預期的基因型總結圖一起會把檢驗HWE預期的所有步驟一一列出。
因為GenAlEx6涉及從教學平臺到合作教學/研究平臺,所以選擇菜單的排列也相應增加了。因此設計者增加了為教師定制的GenAlEx菜單項和對話框,從而保證教師在教學環(huán)境下可以隱藏一些高級功能來避免對他教學造成干擾。
2、GenAlEx軟件在科研方面的功能
雖然GenAlEx6并未取代其他一些居群遺傳學分析軟件包,但是它確實提供了我們認為會被科研工作者歡迎的一些選項。這些選擇包括一系列專門設計用來幫助用戶從自動生成的序列和基因型軟件中輸入、編輯并校對原始數(shù)據(jù)的新工具。有了這些程序用戶可以從自動生成序列的軟件中(如GENEMAPPER)快速輸入基因型數(shù)據(jù)。輸入DNA序列信息和查找單倍型的功能在GenAlEx中也可獲得。在輸入數(shù)據(jù)以后,選項就會提供在運行過程中合并數(shù)據(jù),檢驗是否完全匹配。因此,選項允許位點以任意順序出現(xiàn)。另外,此軟件可以立即獲取存在缺失位點數(shù)據(jù)的樣本列表,最終還能按照單個居群的數(shù)據(jù)形式給出數(shù)據(jù)集。只要完成了最終數(shù)據(jù)組的編輯收集,就可以運行GenAlEx軟件中的所有的統(tǒng)計分析功能了。為了擴大可被用于其他居群遺傳分析軟件的數(shù)據(jù)格式,GenAlEx軟件包還提供了輸出選項菜單。通過編輯該選項,可以將GENA2LEX格式的數(shù)據(jù)轉(zhuǎn)換為其他多種適于居群遺傳學分析軟件的數(shù)據(jù)格式,如ARLEQUIN、KINGROUP、GENEPOP、GENECLASSMSA、MSVAR、SPAGEDI以及STRUCTURE。用戶還可以通過NEXUS、PHYLIP和MEGA的輸出選項菜單將數(shù)據(jù)輸出為一系列系統(tǒng)發(fā)育分析的格式。這些新的工具可以使研究人員方便地在GenAlEx與其他分析軟件中輸入、校對、分析并輸出居群的遺傳數(shù)據(jù)組。
在GenAlEx6中還為高級用戶提供了一些新的統(tǒng)計分析算法。除了已經(jīng)存在的一系列多元空間分析選項外,其中還包括二維局部空間(2DLSA)自相關分析程序。此外,還有用于估測比較個體之間以及居群之間兩兩相互關系的選項。多位點共顯性數(shù)據(jù)組的分析工具也被添加到GenAlEx6中。在一個數(shù)據(jù)組中定位配對的多位點基因型,計算基因型概率、同一性概率以及排除概率等功能都可以在該軟件包內(nèi)實現(xiàn)。這些多位點分析工具在被應用到遺傳標簽的標志重捕研究中時,被認為有廣闊的應用空間。TWOGENER選項專門用于在植物學研究中分析花粉流,還可對植物克隆進行檢測并構圖。
實際上,所有的GenAlEx選項都可以處理缺失數(shù)據(jù)。這些缺失數(shù)據(jù)在基于距離的比對分析,如AMOVA、Mantel和空間自相關分析中是不可忽略的問題。因此,GenAlEx軟件包提供了一個獨立的選項用于入和缺失的逐個個體比對距離。
盡管在GenAlEx軟件包中有一小部分的統(tǒng)計分析選項最初是出于教學目編寫的,但是它們對研究人員也有一定的參考價值。例如,利用HWE選項做出的圖形可以幫助研究者快速估計所有符合HWE的類型。Paetkau等認為居群兩兩分配可能值的雙標圖為居群分配的統(tǒng)計學提供了可靠的圖表信息。這些圖表都是由GenAlEx軟件自動生成,在將數(shù)據(jù)輸出到專門的居群分配軟件中之前,其中的一些關鍵數(shù)據(jù)允許人工輸入。
使用方法:
1.軟件下載和安裝。在官網(wǎng)上下載最新版本,最新版Genalex6.5適用更大數(shù)據(jù)量的表格數(shù)據(jù)。(http://biology-assets.anu.edu.au/GenAlEx/Download.html)解壓后無需安裝,先打開Excel表格,文件菜單下選擇打開,找到Genalex6.2的xla文件,點擊打開。
會彈出對話框
選擇啟用宏,彈出歡迎界面。
加載成功以后顯示如下圖。
2.數(shù)據(jù)格式整理。
數(shù)據(jù)格式如下圖所示,需要說明的是Genalex6.2可識別多種數(shù)據(jù)格式,如每個標記只有1列的單倍體形式的數(shù)據(jù),二進制的數(shù)據(jù)和多種等位基因基因的數(shù)據(jù),以及每個標記有2列的二倍體形式的數(shù)據(jù)。建議盡可能整理成二倍體格式的數(shù)據(jù),因為進行居群分析的時候,有些計算單倍體格式的數(shù)據(jù)無法進行。缺失數(shù)據(jù)用“-1”表示,基因型可以用“0”“1”二進制的格式,也可以用“1”“2”“3”“4”這樣的數(shù)據(jù)表示,但是有1234的時候不可以有0,否則軟件會報錯。亞群的材料數(shù)不能為1,否則軟件會報錯。如果格式嚴格按照下圖進行設置,軟件仍然報錯,請檢查標記基因型區(qū)內(nèi)是否有空單元格、空格的單元格,缺失數(shù)據(jù)表示是否正確,標記數(shù)目和標記名稱數(shù)目,材料數(shù)目和材料編號數(shù)目,亞群數(shù)目和亞群編號數(shù)目,亞群材料數(shù)相加是否與材料數(shù)目總和一致。
3.Frequency計算。在GenAlEx下拉菜單選擇Frequency,彈出如下界面。
格式正確的話,會自動識別位點數(shù)目、材料數(shù)目、亞群數(shù)目以及各亞群材料數(shù)目。Data Format根據(jù)實際情況進行選擇。選擇之后點擊OK,進入下個界面。
根據(jù)分析目的選擇需要分析的選項。這一步主要分析每個位點在各亞群的等位基因頻率,每個亞群的特有的等位基因(Private Alleles)和亞群間Nei遺傳距離分析等。點擊OK,運行出結果,如下圖所示依次為allele frequency by population (AFP), summary of private alleles by population (PAS) 和 Loci with private Alleles (PAL)。亞群間的Nei遺傳距離必須利用二倍體格式數(shù)據(jù)計算。
AFP
PAS
PAL
4.哈溫平衡分析。數(shù)據(jù)必須使用共顯性的二倍體格式數(shù)據(jù)。
點擊OK之后會運行出結果。如下圖所示,有兩個結果文件分別命名為HW和HWS,HW為哈溫平衡檢測的詳細結果,HWS是哈溫平衡檢測的概況。
HW
HWS
5.分子遺傳變異方差分析(AMOVA)。進行AMOVA分析需要二倍體格式數(shù)據(jù)輸入,可以從原始數(shù)據(jù)raw data開始計算,也可以先計算遺傳距離(Genetic Distance, GD)分析。如圖所示,在GenAlex菜單選擇Distance—>Genetic。
計算完Genetic Distance之后,會生成遺傳距離矩陣,保存在GD工作簿里。從GD工作簿或者原始數(shù)據(jù)開始進行AMOVA分析。
根據(jù)數(shù)據(jù)類型選擇好之后,點擊OK,彈出界面如下圖所示。PhiPT就是群體分化系數(shù),有的文章中使用Fst來表示,即群體間分化系數(shù)。
點擊OK之后,會出現(xiàn)兩個工作簿,一個命名為PhiPT,保存了AMOVA分析的結果表格,群體分化系數(shù)PhiPT及其顯著性P值和基因流Nm,一個命名為PhiPTP,保存亞群兩兩間的群體分化系數(shù)。