視頻分割是指對圖像或視頻序列按一定的標(biāo)準(zhǔn)分割成區(qū)域,目的是為了從視頻序列中分離出有一定意義的實體。視頻分割軟件可以幫助您很簡單的完成視頻分割步驟,西西軟件園提供最好用的視頻分割軟件下載大全!
視頻分割軟件哪個好?
西西自己使用的是Ultra Video Splitter 這款軟件,在視頻分割的過程中又很好地表現(xiàn),并且分割后不會損壞原視頻。另外Boilsoft Video Splitter等視頻分割軟件也不錯!
視頻分割原理:(文章較長,想了解的可以認(rèn)真看看)
1.基于內(nèi)容檢索索引方法
在基于內(nèi)容檢索系統(tǒng)中,快速索引技術(shù)是影響系統(tǒng)速度的關(guān)鍵。由于媒體對象的特征描述一般都是高維的,而特征空間中的相近意味著較大的相似度,因此問題的 關(guān)鍵就在于如何在高維空間點集中尋找與給定點距離最近的一組點。在計算機科學(xué)中,在點集中尋找與給定點距離最近的點的問題叫做最近鄰搜索(nearest -neighbor-search)問題,記作NN-Search問題;趦(nèi)容檢索的索引問題要求尋找與給定點距離最近的一組點(不妨設(shè)為k個),常記 作k-NN-Search問題。
在一維空間下,最近鄰搜索可采用對順序表進(jìn)行簡單的折半查找來完成,但在高維空間這種算法就難以直接應(yīng)用了。 最早的最近鄰查找算法是所謂的桶算法(bucketing algo-rithm)。這種算法將數(shù)據(jù)集空間進(jìn)行規(guī)則劃分(如成格狀),每個劃分中的數(shù)據(jù)點存于一個桶中(bucket)。這樣,最近鄰搜索就轉(zhuǎn)化為在 所有的桶中尋找與給定點最近的桶。由于桶算法對數(shù)據(jù)集空間進(jìn)行規(guī)則劃分,因此其對于均勻分布的數(shù)據(jù)集十分有效。
對于主存中的最近鄰搜索來說, 一種比較實用的索引方法是k-d-樹方法,其思想是按照一定的準(zhǔn)則選擇某一坐標(biāo)軸方向作為切分方向,將數(shù)據(jù)集切分為兩個子數(shù)據(jù)集,再對此兩個子數(shù)據(jù)集遞歸 切分,形成一棵檢索樹。優(yōu)先k-d樹(priority k-d tree),這種索引結(jié)構(gòu)不僅檢索速度快,適用于k-NN-Search問題,而且其空間復(fù)雜度與數(shù)據(jù)集的維數(shù)成線性關(guān)系,且與二級存儲器實現(xiàn)相容,因此 是目前解決k-NN-Search問題最有效的一種索引算法。近似最近鄰搜索(approximate nearest neighbor search)也是基于內(nèi)容檢索索引研究的一個熱點。由于在多數(shù)應(yīng)用中,用戶只要求檢索結(jié)果中有一個或幾個滿意媒體對象即可,而并不要求查詢結(jié)果一定是信 息庫中滿足相似度和檢索結(jié)果集合大小限制的所有對象。相反地,在多數(shù)情況下用戶希望犧牲檢索的精確度以換取更高的檢索速度,這就導(dǎo)致了近似最近鄰搜索技術(shù) 的產(chǎn)生。而大量的實驗表明,對于高維數(shù)據(jù)集來說,即使允許極小的近似(檢索誤差),也會對檢索速度帶來很大的提高。
在基于內(nèi)容檢索系統(tǒng) 中,為加快檢索速度而經(jīng)常使用的另一個技術(shù)是分層索引技術(shù)。對于許多檢索操作(如二次型距離的直方圖匹配)而言,特征間距離的計算往往需要很大的計算量。 在這種情況下,可采用一種計算量較。╟heap)的距離度量先對信息庫進(jìn)行檢索,得到一組候選的媒體對象集,再對此候選媒體對象集采用原距離度量,以此 來降低計算量。
2.內(nèi)容描述技術(shù)
媒體分割和 特征提取用來在基于內(nèi)容檢索系統(tǒng)中建立媒體對象的內(nèi)容描述,其方法和技術(shù)直接來源于圖像處理與理解和計算機視覺等媒體理解研究的成果。由于目前的媒體理解 技術(shù)尚難建立通用的系統(tǒng),因此在基于內(nèi)容檢索系統(tǒng)的實現(xiàn)中引入與領(lǐng)域有關(guān)的高層知識將是有益的(即圖像/視頻庫涉及的內(nèi)容),這將直接影響到系統(tǒng)所采用的 媒體理解技術(shù)。以靜止圖像庫為例,對于醫(yī)療圖像庫的檢索,無疑需要結(jié)合專門領(lǐng)域的醫(yī)學(xué)圖像理解技術(shù)來進(jìn)行圖像的描述和組織。而面孔圖像庫或新聞人物照片的 檢索,結(jié)合面孔識別技術(shù)無疑可大大提高檢索的準(zhǔn)確率。像這樣的專用基于內(nèi)容檢索系統(tǒng),往往都需要針對系統(tǒng)的要求,專門設(shè)計用于檢索和描述的特征。
也 有一些圖像檢索系統(tǒng)由于其包含內(nèi)容十分廣泛(如QBIC系統(tǒng)和Virage系統(tǒng)),促使其選擇更為普遍的特征來進(jìn)行內(nèi)容的描述、組織和檢索。目前,對于通 用的靜止圖像檢索,用于檢索的特征主要有顏色(color)、紋理(texture)、草圖(sketch)、形狀(shape)等,其中顏色、形狀、紋 理應(yīng)用得尤為普遍。
對于視頻信息檢索,一般說來,領(lǐng)域知識的作用更為明顯。除了底層的片段檢測(shotdetection)、圖像拼接 (mosaicing)等不需要語義信息的技術(shù)外,要進(jìn)一步對視頻片斷進(jìn)行組織,則需要充分利用領(lǐng)域的知識。如對于新聞節(jié)目的檢索來說,利用視頻信號的某 些特點(電視臺的臺標(biāo))可有效地進(jìn)行信號區(qū)分,從而大大簡化檢索難度。而利用先驗知識,可更有效地完成對監(jiān)控系統(tǒng)視頻信號中被觸動過物體的檢索。
盡管由于不同的應(yīng)用背景,不同的基于內(nèi)容檢索系統(tǒng)在底層描述中采用的技術(shù)也各有側(cè)重,但一般都能在傳統(tǒng)的計算機視覺和圖像處理技術(shù)中找到其出處。可以說,媒體分割和特征抽取所使用的技術(shù)是圖像處理和計算機視覺各種技術(shù)應(yīng)用的綜合。
(1)圖像的特征描述
對于通用圖像庫的檢索來說,最常用的特征就是顏色、形狀和紋理。
①顏色特征的提取
在傳統(tǒng)的注重幾何特征的計算機視覺研究中,顏色未得到充分的重視,人們普遍認(rèn)為顏色不是刻劃一個物體的關(guān)鍵特征。然而,相對于幾何特征而言,顏色具有一 定的穩(wěn)定性,其對大小、方向都不敏感,表現(xiàn)出相當(dāng)強的魯棒性。同時,在許多情況下(特別是對于自然景物來說),顏色是描述一幅圖像最簡便而有效的特征。例 如;在需要檢索海濱景物圖像時,指定圖像中的主要顏色(如藍(lán)色,對應(yīng)海水;黃色,對應(yīng)海灘)的大致比例后即可以此為依據(jù)查找與此顏色分布類似的圖像,而此 時其他檢索特征往往難以奏效。所有這些,都促使顏色成為基于內(nèi)容檢所采用的主要手段之一。在QBIC和Virage系統(tǒng)中,顏色分別是最有效和權(quán)重最大的 檢索特征。
一種常用的顏色特征是圖像的顏色直方圖。在顏色檢索算法中,采用了互補顏色(opponent color)空間直方圖來描述物體,并通過定義在直方圖的相交(intersection)及反投影算法(backprojection algorithm)來完成物體的識別(檢索)和在圖像中的定位。通過直方圖相交算法,給定圖像直方圖后,顏色檢索就變?yōu)樵谀P蛶熘胁檎揖哂凶畲笃ヅ涠鹊?圖像。
顏色直方圖反映的是圖像的整體特征,而在許多情況下我們希望在檢索中只對圖像中的部分顏色加以指定(如檢索出現(xiàn)藍(lán)天的圖像,而不管圖像中出 現(xiàn)的其他景物)。在這種情況下,若把顏色直方圖作為特征直接進(jìn)行比較難以滿足檢索的要求,而描述圖像主要顏色組成的主顏色(dominant color)卻十分有效。一般情況下,可通過圖像分割或在顏色直方圖空間聚類來對主顏色加以計算。
②形狀特征的提取
形狀是傳統(tǒng)計 算機視覺刻劃物體的本質(zhì)特征之一,但對于通用圖像庫的檢索而言,利用形狀特征進(jìn)行檢索存在一定的困難。這是因為實際場景中物體的形狀會發(fā)生很大的變化,而 且從復(fù)雜場景中提取物體形狀本身也并不是一件簡單的事情。但針對某些特定應(yīng)用(如QBIC中針對可明顯分割為背景和前景的圖像),利用形狀可以提高檢索的 準(zhǔn)確性和效率。
對于基于形狀的檢索來說,形狀的表示和匹配無疑是需要解決的重要問題。傳統(tǒng)的計算機視覺中,曾先后用Freeman鏈碼、Y-s曲線、Fourier描述子、二次曲線及B樣條等來描述平面曲線。
對于形狀匹配來說,Hough變換是最經(jīng)典的方法,而且對于噪聲和遮擋具有良好的抗干擾性。但Hough變換僅能解決形狀的平移、旋轉(zhuǎn)和縮放所帶來的匹配問題,而對實際應(yīng)用中廣泛的變形匹配問題無能為力。
在實際應(yīng)用中,出于對算法時間和空間復(fù)雜性的考慮,形狀的表達(dá)和匹配往往采用更為簡單的方法,如形狀參數(shù)(shape factor)--關(guān)于形狀的一些定量測度(如面積、周長等)常用來描述形狀并進(jìn)行形狀的匹配。
③紋理特征的提取
作為物體的一個重要特征,紋理也是基于內(nèi)容檢索的一條主要線索。紋理檢索和紋理分類技術(shù)有著密不可分的關(guān)系,針對不同系統(tǒng)的應(yīng)用要求在紋理檢索的實現(xiàn)中往往采用不同的紋理識別技術(shù)。
早期的紋理識別技術(shù)可分為三類:統(tǒng)計方法、結(jié)構(gòu)方法和頻譜分析方法。結(jié)構(gòu)方法主要對規(guī)則的結(jié)構(gòu)紋理,采用句法分析方法識別。從20世紀(jì)70年代開始,基于二階灰度統(tǒng)計特征的統(tǒng)計方法得到了廣泛的研究。
進(jìn)入80年代后,隨機場模型也用于紋理的分類和識別。采用了高斯馬爾可夫隨機場GMRF(Gaussian Markov Random Field)模型后,對 9種自然紋理的識別正確率達(dá)到了99%~100%。
3.視頻檢索
與圖像檢索相比較,視頻檢索含有更豐富的內(nèi)容,但與圖像數(shù)據(jù)一樣,原始的視頻數(shù)據(jù)也是非結(jié)構(gòu)化的,在檢索前要對其結(jié)構(gòu)化。為此,首要工作是將此連續(xù)的視 頻流劃分為具有特定語義的視頻片段來作為檢索的基本單元,在此基礎(chǔ)上才能作進(jìn)一步的描述和組織。這樣,視頻檢索就包括視頻分割和描述建立兩部分內(nèi)容。
①視頻信號的結(jié)構(gòu)化
視頻信號的結(jié)構(gòu)化主要包括視頻分割和鏡頭組織兩部分,其中前者用于將連續(xù)的視頻流分割為可供檢索的視頻基元(鏡頭),而后者則用于對分割產(chǎn)生的大量鏡頭建立更高層的組織結(jié)構(gòu),以便于瀏覽檢索。
a.視頻分割
如上所述,視頻分割即將連續(xù)的視頻流分割為相對獨立的視頻片段。根據(jù)應(yīng)用背景的不同,對視頻流的分割可以采用不同的標(biāo)準(zhǔn),比如可以把某一物體在圖像中的 出現(xiàn)和消失定義為片段的頭和尾。但根據(jù)視頻信號的產(chǎn)生原理,我們知道一般的視頻信號本身是由多段鏡頭(攝像機上從記錄 RECORD到停止 STOP期間所獲得的一段連續(xù)視頻信號)通過拼接編輯而成,而每個鏡頭本身具有一定的獨立性和完整性。因此,在實際應(yīng)用中多是以視頻流中的自然分界--鏡 頭場景的切換作為視頻流的分割依據(jù)。從這個意義上說,視頻分割即對視頻流中幀圖像內(nèi)容連續(xù)性中斷的檢測。
根據(jù)視頻編輯特性的不同,鏡頭切 換可分為不同的類型。對最簡單的直接切換來說,由于視頻流由兩鏡頭不加編輯直接拼接而成,幀圖像特性在拼接發(fā)生突變,因此可通過幀間特性的比較進(jìn)行檢測。 通過對不同圖像度量的比較得出,采用子窗口直方圖比較的方法對于切換檢測性能最佳。窗口的選擇是影響性能的一個主要因素,大窗口算法對運動具有較好的魯棒 性,但在景物改變且具有類似顏色或灰度分布時可能漏檢,而小窗口算法則對于運動過于敏感,因此在實現(xiàn)中往往需要將二者結(jié)合使用。
另一種常見的 較為復(fù)雜的鏡頭切換是漸變(dissolves),即使一段視頻鏡頭在鏡頭轉(zhuǎn)換處在一段時間內(nèi)漸漸轉(zhuǎn)變?yōu)楹罄m(xù)視頻鏡頭。淡入(fade-In)淡出 (fade-out)可視為漸變的特殊情況。對于漸變,由于幀圖像特性逐漸改變,相鄰幀變化很小,就不能僅依靠相鄰幀特性的比較,而需要在更大的窗口范圍 內(nèi)進(jìn)行檢測。
由于大量視頻信號都以壓縮形式存儲,對壓縮視頻流的直接片段檢測也是人們感興趣的研究內(nèi)容。通過對視頻編碼中DCT變換系數(shù)性質(zhì)的分析,可以對壓縮視頻信號直接進(jìn)行片段檢測的算法。以此為基礎(chǔ),人們對MPEG視頻流又提出了許多改進(jìn)的算法。
b.鏡頭組織
通過視頻分割,連續(xù)的視頻流被切分為可供檢索的鏡頭。但對于許多視頻信號來說,其所含的鏡頭數(shù)可多到上百上千,使得用戶難于直接檢索。以電影為例,有多 于500鏡頭的影片并不少見,而現(xiàn)代動作片中鏡頭數(shù)則更多(如在"終結(jié)者II"中,15分鐘的影片就有300個片段)。在電視節(jié)目的新聞報導(dǎo)中,也有大量 的關(guān)于同一報導(dǎo)內(nèi)容的鏡頭。在這種情況下,就需要對鏡頭進(jìn)行組織,生成一種更高級、更具有語義性的結(jié)構(gòu)(如場景scene或幕act),以便于用戶的檢 索。
場景轉(zhuǎn)換圖 STG(scene transition graph)是一種常用的鏡頭組織方法。該方法根據(jù)語義信息對鏡頭進(jìn)行組織,從而對整個視頻流進(jìn)行建立一種層次化的表示。首先根據(jù)鏡頭間的相似性(主要利 用顏色、形狀及圖像間相關(guān)等)對在內(nèi)容描述空間對鏡頭進(jìn)行聚類,再根據(jù)聚類結(jié)果利用時間軸上的約束生成場景轉(zhuǎn)換圖。
②描述建立
與 圖像檢索有所不同,視頻檢索的描述建立除了特征提取外,還包括鏡頭的代表幀生成。特征提取用于對分割得到的鏡頭建立描述,常用的鏡頭特征是鏡頭的主運動, 這個特征適用于景物中有一個大背景的鏡頭。在此條件下不能得到滿足(如景物中存在多個較大運動物體的情況)時,就需要對鏡頭根據(jù)運動特性對不同景物分層并 對分層建立描述。代表幀生成用于對鏡頭生成一個或多個可代表內(nèi)容的圖像,可在瀏覽檢索用來代表鏡頭的內(nèi)容。
a.主運動估計(dominant motion estimation)
在多數(shù)視頻圖像中,往往有一個相對固定的背景,背景前面是運動的物體。此背景占據(jù)了大部分圖像,其在圖像平面中的變化是攝像機操作和運動(如聚焦、平移、追蹤等)的結(jié)果。在這種情況下,主運動(即此背景的運動)估計無疑對圖像的對準(zhǔn)和拼接效果起著重要的作用。
不同算法所依據(jù)的運動模型不同。在背景景深變化不大的情況下,可以把整個背景作為二維平面來考慮,這樣就得到了攝像機的二維運動模型。
對于背景景深變化較大的情況,此時單個二維運動模型已不能描述背景的運動,而必須考慮景深的影響。針對校準(zhǔn)過的攝像機,提出了三維運動結(jié)構(gòu)模型。
在模型參數(shù)的計算方面,為了去除前景運動的影響,在參數(shù)估計時一般不采用最小均方差(least squares)方法。而采用了 M估計(M-Estimation)方法。
b.層描述(layered representation)
在許多情況下,景物由多個具有不同運動特性的較大物體組成,很難指定哪一個運動是主運動。在這種情況下,就需要采用層描述方法,根據(jù)運動特性的不同對景 物進(jìn)行分割,將其劃分為不同的"層",并分別對每層建立相應(yīng)的描述。層描述一般包括三個部分:a一個運動描述符的集合;b對每個運動描述符在圖像序列中與 之對應(yīng)即滿足其約束關(guān)系的"層";c根據(jù)a和b及原始視頻圖像建立的對每個"層"建立的描述。
層描述所要解決的問題是:a需要多少個運動模型來描述景物中的運動;b運動模型參數(shù)的計算;c每個運動模型支撐"層"的計算。為了對運動模型的數(shù)目加以限制,算法一般都采用 MDL(minimum discription length)準(zhǔn)則來進(jìn)行計算。
在QBIC的實現(xiàn)中,就是根據(jù)2D運動模型,通過不同物體(由于在景物中遠(yuǎn)近不同所引起)的仿射變換的參數(shù)的不同,將景物劃分為不同的層 (layer),每一層具有自己的2D仿射運動參數(shù)以及在每一幀中的對應(yīng)區(qū)域,這樣,就對整個片段建立了一個運動的分層表述(layerd representation),供檢索時使用。
c.鏡頭代表幀生成
在許多視頻檢索應(yīng)用中,瀏覽檢索是一種十分重要的檢索手段。 在這種檢索方式中,鏡頭的內(nèi)容用一幅或多幅能夠代表鏡頭內(nèi)容的圖像(稱為代表幀representative frame,簡記為r-frame)來表示。系統(tǒng)通過在檢索界面上提供各鏡頭的代表幀,使得用戶可通過瀏覽來選擇相應(yīng)的鏡頭。這樣,如何生成代表幀,使其 更好地表現(xiàn)鏡頭的內(nèi)容,就成為一個需要解決的問題。
最簡單的辦法是直接從鏡頭的幀序列選擇一幅或多幅圖像作為代表幀。常用的方法是選擇圖像的首幀、中間幀或末幀,但這種方法的缺點是缺乏靈活性,不能根據(jù)鏡頭的內(nèi)容變化選擇代表幀,還可以采用根據(jù)對幀相關(guān)差(對應(yīng)像素差)設(shè)閾值來選擇代表幀的方法。
另一種常用的代表幀生成方法是圖像拼接(mosaicing),即對分割得到的鏡頭融合鏡頭中多幀的背景信息生成一個全景的拼接圖像(mosaic)來代表鏡頭內(nèi)容。
Ultra Video Splitter 是一款視頻分割工具。Ultra Video Splitter最近又更新了,版本號升級到了6.0.0801,相信廣大的視頻愛好者肯定對它不會陌生,可以說這個工具拾起來相當(dāng)順手,幾乎包攬了很多視頻格式的分割,最讓我興奮的是它的無損分割,即視頻源文件是什么格..
立即下載PC電腦版
安卓版
蘋果版
相關(guān)文章
精選合集
網(wǎng)友評論
聲明:西西軟件園為非贏利性網(wǎng)站 不接受任何贊助和廣告