亚洲视频在线观看视频_欧美一区二区三区_日韩精品免费在线观看_成人片网址_久草免费在线视频_激情欧美一区二区三区中文字幕

深度神經網絡綜述范例6篇

前言:中文期刊網精心挑選了深度神經網絡綜述范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。

深度神經網絡綜述

深度神經網絡綜述范文1

關鍵詞:垃圾郵件;深度置信網絡;分類;受限玻爾茲曼機;支持向量機

0 引言

電子郵件的速度快、成本低等優勢使其成為人們用于思想和信息交流的強大工具,然而伴隨而來的垃圾郵件成為當今網絡的一個重要問題[1]。根據Ferris的研究估計,垃圾郵件數量占美國一家企業組織總電子郵件的15%至20%。在這樣的情況下,垃圾郵件造成了大量的帶寬浪費和郵件系統超載。由于以上嚴重問題,必須采取措施來解決垃圾郵件現象。已有研究證明最好的方法是垃圾郵件過濾。

通常有兩種郵件過濾的方法:知識工程(Knowledge Engineering, KE)以及機器學習(Machine Learning, ML)?;诘谝环N方法的垃圾郵件過濾通常使用預定義的集合和用戶定義的規則,這樣的規則嘗試識別信息中垃圾郵件的典型特點;然而,已經證明在實踐中該方法的泛化能力較差。

實驗表明機器學習分類器具有更好的性能,因此大量的分類方法被提出來實現垃圾郵件檢測任務。Puniskis等[2]將神經網絡方法應用到垃圾郵件分類。也有其他研究人員將樸素貝葉斯法(Naive Bayes, NB)和支持向量機(Support Vector Machine, SVM)[3-9]應用到垃圾郵件分類任務中。深度置信網絡(Deep Belief Net, DBN)是擁有深層架構的前饋神經網絡,其中包含多個隱含層,而使用DBN的障礙在于如何訓練這樣的深層網絡。通常情況下,由于網絡權值的隨機初始化,基于梯度的優化容易陷入局部最小值[10]。Hinton等[11]提出了一種新的貪婪逐層非監督算法來初始化基于受限玻爾茲曼機(Restricted Boltzmann Machine, RBM)的DBN。這個算法提供了網絡權值的初始化方法,隨后使用基于梯度的算法如梯度下降法來微調網絡權值。研究指出,DBN初始化方法的有效性在多個數據集中得到驗證[12]。

在受限玻爾茲曼機的快速學習算法的驅動下, 本文提出了使用深度置信網絡來解決垃圾郵件問題,并且在三個充分研究的垃圾郵件數據集上評價分類方法的性能。將本文的算法和較好的垃圾郵件檢測方法支持向量機分類器[13]進行比較,結果表明,基于深度置信網絡的方法表現出和SVM相似的性能或者說比SVM更好的性能。

1 深度置信網絡分類

人工神經網絡(Artificial Neural Network, ANN)研究主要關注的是訓練網絡來找到正確的權重,可以正確地將輸入樣本分類。最成功的算法是著名的反向傳播(Back Propagation,BP)算法。反向傳播的問題是:ANN代表一個f(X,W)的非線性映射,其中:X是輸入向量,W是整個網絡的權重矩陣。隨著網絡層數的增加,函數f變得越來越復雜,如此一來將得到多個局部最小值。反向傳播算法根據權重W的初始化來收斂到某一最小值,但有時它會收斂到一個表現差的局部最小值而不是全局最小值。對于一些人工智能任務,有些局部最小值是沒有問題的,但是有些是不可以接受的。此外,隨著網絡層數的增加,訓練時間變得越來越長。反向傳播的另一問題是它需要大量的標簽數據,這對于許多需要分類的人工智能任務來說是不可能的。對于之前提到的問題,Hinton等[11]基于DBN和RBM介紹了一種快速學習算法來訓練深度人工神經網絡。

1.1 深度置信網絡模型

DBN由多層RBM和一層BP神經網絡構成,它的結構如圖1所示。其中,多層RBM網絡采用無監督的學習方法,而BP神經網絡采用有監督的學習方法。自底向上每一層RBM對輸入數據進行提取、抽象,盡可能保留重要信息,將最后一層RBM網絡的輸出信息作為BP神經網絡的輸入數據。由于每層RBM訓練只能使該層網絡參數達到最優,而不能使整個網絡達到最優,因此本文使用有監督的BP神經網絡將誤差反向傳播,自頂向下微調整個模型。同時,經過若干層RBM網絡優化得到的信息作為BP神經網絡的輸入數據,解決了BP神經網絡由于隨機初始值容易陷入局部最小值和收斂速度慢的問題。DBN網絡是一種深層學習模型,增加RBM網絡的層數,可以使提取的信息更抽象,網絡的精度更高。

3.3 實驗結果

下面描述DBN和SVM訓練的細節以及在三個數據集上的分類性能表現。對于LingSpam,設置k=1500,而對于SpamAssassin和Enron1設置k=1000。對于SpamAssassin,需要去掉其中的HTML標簽。三個數據集上的實驗都使用10折交叉驗證[15]。Lingspam已經被其創建者劃分為10份;對于其他兩個數據集,隨機將語料庫拆分成10份,并保證每一部分保留原有語料庫的垃圾郵件比例。

為了將DBN應用到垃圾郵件檢測,必須決定隱含層個數

以及每層隱含單元的個數的合適值。

根據已有研究,實驗選擇了比較簡單的有3個隱含層的網絡[11-12];通過選擇不同隱含單元為網絡嘗試不同的配置,設置三個隱含層的神經元個數分別為50、50、200,每一層神經元的數量適度的變化并沒有顯著的影響結果。為了強調DBN方法對于不同架構的魯棒性,本文實驗使用相同的架構。

4 結語

通過逐層無監督的學習方法預訓練深度網絡的權值參數,解決了權值的初始化問題,提出了基于深度置信網絡的分類方法,并將其應用到垃圾郵件過濾中。實驗結果表明,深度置信網絡的分類方法在垃圾郵件過濾中有較好的表現,但是也有一些問題將在今后的工作中繼續探討,例如,如何更好地選擇深度置信網絡隱藏層數以及每層的單元個數來提高算法的性能。

參考文獻:

[1]PU C, WEBB S. Observed trends in spam construction techniques: a case study of spam evolution [C]// CEAS 2006: Proceedings of the Third Conference on Email and AntiSpam. Mountain View, California: CEAS, 2006: 104-112.

[2]PUNIKIS D, LAURUTIS R, DIRMEIKIS R. An artificial neural nets for spam Email recognition [J]. Electronics and Electrical Engineering, 2006, 69(5): 73-76.

[3]ANDROUTSOPOULOS I, PALIOURAS G, MICHELAKIS E. Learning to filter unsolicited commercial Email [M]. Athens, Greece: "DEMOKRITOS", National Center for Scientific Research, 2004.

【谷歌圖書查找】

[4]METSIS V, ANDROUTSOPIULOS I, PALIOURAS G. Spam filtering with naive Bayes ― which naive Bayes? [C]// CEAS 2006: Proceedings of the Third Conference on Email and AntiSpam. Mountain View, California: CEAS, 2006: 27-28.

[5]ZHANG L, ZHU J, YAO T. An evaluation of statistical spam filtering techniques [J]. ACM Transactions on Asian Language Information Processing, 2004, 3(4): 243-269.

[6]HOVOLD J. Naive Bayes spam filtering using wordpositionbased attributes [C]// CEAS 2005: Proceedings of the Second Conference on Email and AntiSpam. Palo Alto, CA: CEAS, 2005: 41-48.

[7]FUMERA G, PILLAI I, ROLI F. Spam filtering based on the analysis of text information embedded into images [J]. The Journal of Machine Learning Research, 2006, 7: 2699-2720.

[8]ALMEIDA T A, ALMEIDA J, YAMAKAMI A. Spam filtering: how the dimensionality reduction affects the accuracy of Naive Bayes classifiers [J]. Journal of Internet Services and Applications, 2011, 1(3): 183-200.

[9]ALMEIDA T A, YAMAKAMI A, ALMEIDA J. Evaluation of approaches for dimensionality reduction applied with Naive Bayes antispam filters [C]// ICMLA09: Proceedings of the 2009 International Conference on Machine Learning and Applications. Piscataway: IEEE, 2009: 517-522.

[10]SUN Z, XUE L, XU M, et al. Overview of deep learning[J]. Application Research of Computers, 2012, 29(8): 2806-2810. (孫志軍,薛磊,許明陽,等.深度學習研究綜述[J]. 計算機應用研究, 2012, 29(8): 2806-2810.

[11]HINTON G E, OSINDERO S, TEH YW. A fast learning algorithm for deep belief nets [J]. Neural Computation, 2006, 18(7): 1527-1554.

[12]BENGIO Y, LAMBLIN P, POPOVICI D, et al. Greedy layerwise training of deep networks [C]// NIPS06: Proceedings of the 2007 Twentieth Annual Conference on Neural Information Processing Systems. Cambridge: MIT Press, 2007, 19: 153-160.

[13]BEUGES C J C. A tutorial on support vector machines for pattern recognition [J]. Data Mining and Knowledge Discovery, 1998, 2(2): 121-167.

深度神經網絡綜述范文2

關鍵詞: 粒子群優化算法; 神經網絡; 體育動作; 識別與分類

中圖分類號: TN711?34 文獻標識碼: A 文章編號: 1004?373X(2016)19?0049?04

Abstract: In order to improve the recognition accuracy of sports action, a sports action recognition model based on particle swarm optimizing neural network is proposed. The background subtraction method is used to process the sports video image to obtain the profile of sports action, segment the sports action, and extract the features of sports action. The kernel component analysis is performed for features. The BP neural network is used to train the feature vector. The particle swarm optimization algorithm is used to select the parameters of BP neural network to establish the recognition classifier of sports action. The test results show that the proposed model can improve the recognition rate of sports action and reduce the false recognition rate of sports action, and meet the online recognition requirement of sports action.

Keywords: particle swarm optimization algorithm; neural network; sports action; recognition and classification

0 引 言

隨著經濟水平不斷增長,人們越來越重視體育運動,而動作是體育運動的基本行為,對體育動作進行正確識別和分析,有利于規范運動員的動作和科學訓練,提高運動員成績,因此對體育動作識別進行研究具有十分重要的意義[1?3]。

體育動作識別是多分類的模式識別問題,包括兩個關鍵問題:體育動作特征和體育動作的分類[4]。體育動作特征有側影和輪廓兩種類型,側影特征維數高,使得體育動作的分類器輸入向量數量過大,計算時間復雜度較長,不能滿足體育動作的在線識別要求[5?7]。相對于側影特征,輪廓特征能夠更好地刻畫體育的動作類別,常采用傅里葉變換獲得體育動作輪廓特征,特征數量越多,越不利于體育動作的分類和識別,需要對輪廓特征進行降維處理,選擇一些重要特征進行體育動作識別建模[8]。體育動作識別的分類器主要采用神經網絡設計,尤其BP神經網絡的分類性能最優,應用最廣泛[9]。在體育動作分類過程中,BP神經網絡的初始閾值和連接權值影響識別率,當前主要根據經驗設置初始閾值和連接,難以獲得最優BP神經網絡結構。

為了獲得更加理想的體育動作識別結果,提出粒子群優化神經網絡的體育動作識別模型(PSO?BPNN),并通過具體實驗測試體育動作識別結果的優劣。

1 PSO?BPNN的體育動作識別模型

1.1 工作思路

PSO?BPNN的體育動作識別思路為:通過傅里葉變換獲得體育動作的特征,采用核主成分分析(KPCA)選擇重要特征;然后采用粒子群優化算法選擇BP神經網絡的初始閾值和連接權值,并對選擇重要特征進行學習,建立體育動作識別的分類器,具體如圖1所示。

1.2 體育動作檢測

在體育動作識別過程中,首先要檢測出運動員的動作,結合運動員的動作特點,采用幀間差分法實現動作檢測,并對檢測結果進行膨脹、腐蝕輪廓強化等處理,具體如下:

1.5.2 粒子群優化算法

要獲得性能優異的體育動作識別分類器,確定合理的BP神經網絡的初始權值和閾值,采用粒子群優化(PSO)算法解決初始權值和閾值確定問題,以獲得更優的體育動作識別效果。

(2) 采用KPCA對體育動作的原始特征進行處理,選擇對識別結果有重要貢獻的特征。

(3) 根據選擇特征對體育動作訓練集和測試樣本進行簡化。

(4) 將簡化后的訓練樣本集輸入到BP神經網絡中進行學習,并通過粒子群優化算法確定BP神經網絡的閾值和連接權值。

(5) 根據最優閾值和連接權值建立BP神經網絡的體育動作識別分類器。

(6) 將簡化后的測試樣本集輸入到已建立的體育動作識別分類器中進行測試,并輸出識別結果。

2 實驗結果與分析

為了檢驗PSO?BPNN的體育動作識別性能,在4核 2.75 GHz Intel CPU,8 GB RAM,Win7 OS的個人計算機上采用VC++編程實現識別模型。選擇10個運動員,他們演示各種簡單體育動作,共得到600個數據,隨機選擇400個數據構建訓練集,其余數據構建測試集,基本動作如圖3所示。對比體育動作識別模型為:KPCA選擇特征,BPNN的初始閾值和連接值隨機確定(KPCA?BPNN);全部原始體育動作特征,粒子群算法優化BPNN的初始閾值和連接值(BPNN),采用體育動作識別率和平均一個動作的識別時間(s)作為性能評價指標。

采用訓練樣本構建體育動作識別模型,然后采用測試樣本進行測試,它們的識別率如圖4所示,從圖4可以得到如下結論:

(1) 相對于KPCA?BPNN,PSO?BPNN的體育動作識別率更高,有效降低了體育動作的誤識率,這表明KPCA?BPNN采用隨機方式確定BPNN的初始閾值和連接值,無法構建結構最優的BP神經網絡,這樣體育動作分類器沒有達到最優,難以獲得理想的體育動作識別結果,從而驗證了PSO算法優化BP神經網絡的有效性。

(2) 相對于BPNN,PSO?BPNN提高了體育動作的識別率,這表明體育動作原始特征中有一些重復特征和無用特征,它們會對體育分類器構建產生不利影響,這樣體育動作的識別結果有待改善,而PSO?BPNN采用KPCA選擇一些重要特征,同時解決了特征選擇和分類器參數優化問題,使體育動作的識別結果更加可靠。

經常要進行體育視頻動作的在線識別,因此采用測試實驗分析體育動作的識別速度,PSO?BPNN與其他模型的體育動作平均識別時間如表1所示。從表1的體育動作平均識別時間可知,PSO?BPNN的體育動作平均識別時間要少于KPCA?BPNN以及BPNN,這是因為PSO?BPNN采用KPCA選擇重要特征,降低了體育動作分類器的輸入維數,加快了體育動作識別的建模速度,同時采用PSO算法確定BP神經網絡的閾值和連接權值,加快了BP神經網絡的收斂速度,提高了體育動作的識別效率,更好的滿足了實際應用要求。

3 結 語

針對當前體育動作識別建模中的分類器參數優化問題,提出PSO?BPNN的體育動作識別模型,采用測試實驗驗證了其有效性,結果表明,PSO?BPNN找到了體育動作識別的重要特征子集,PSO算法可以確定BPNN的最佳閾值和連接權值,獲得了比其他體育動作識別模型更高的識別率,執行時間縮短,加快了體育動作識別速度,可以為體育教學、訓練提供有價值的參考信息。

參考文獻

[1] 周巧云,于仕琪.運動體育動作分析[J].先進技術研究通報,2009,3(5):47?51.

[2] 阮濤濤,姚明海,瞿心昱,等.基于視覺的人體運動分析綜述[J].計算機系統應用,2010,20(2):245?253.

[3] CHEN L, HOEY J, NUGENT C D, et al. Sensor?based activity recognition [J]. IEEE transactions on applications and reviews, 2012, 42(6): 790?808.

[4] 黎洪松,李達.人體運動分析研究的若干新進展[J].模式識別與人工智能,2009,22(1): 70?78.

[5] 苗雪蘭.體育動作量化分析智能系統的設計與實現[J].體育科學,2000,20(3):85?87.

[6] 張毅,張爍,羅元,等.基于Kinect深度圖像信息的手勢軌跡識別及應用[J].計算機應用研究,2012,29(9):3547?3550.

[7] 曹雛清,李瑞峰,趙立軍,等.基于深度圖像技術的手勢識別方法[J].計算機工程,2012,38(8):16?18.

[8] 劉寅,滕曉龍,劉重慶.復雜背景下基于傅里葉描述子的手勢識別[J].計算機仿真,2005,22(12):158?161.

[9] 苗雪蘭.基于模糊神經網絡理論的體育動作模式識別方法[J].計算機工程與應用,2006(6):155?157.

[10] 王蕭.基于KPCA的探地雷達自適應雜波抑制算法研究[J].現代電子技術,2014,37(11):31?33.

[11] 張玲,王玲,吳桐.基于改進的粒子群算法優化反向傳播神經網絡的熱舒適度預測模型[J].計算機應用,2014,34(3):775?779.

深度神經網絡綜述范文3

關鍵詞:數據挖掘;體育訓練;決策樹ID3

中圖分類號:TP311文獻標識碼:A文章編號:1009-3044(2012)22-5492-04

Application Review and Analysis of Data Mining Techniques in Sport Training

XU Jian-min, OU Mu-hua, XIONG Jin-zhi

(Computer College, Dongguan University of Technology, Dongguan 523808, China)

Abstract:With the continuous development of sports, most sports are using IT to access and accumulate. Faced with a huge database and fierce competition in the game, the data mining technology in the field of sports will become a trend. This study focuses mainly on the implementation of the various algorithms based on the data mining, which investigates the algorithm based on decision tree classification applied to tennis, the algorithm based on BP neural network, and the FP-tree algorithm based on association rules. Finally, on the basis of the above method, the study analyzes the direction of improvement to and possible drawbacks of the decision-making ID3 algorithm, and provides a way of research of data mining which will be applied to sports.

Key words: data mining; sports training; decision tree ID3

目前體育數據信息的分析通常采用常規統計方法:抽樣理論、假設檢驗、決策理論、估計理論、時間序列等[1],大多數統計分析技術都要求完善的數學理論和嚴謹的使用技巧,對使用者要求很高,且大多屬于抽樣研究,存在不同程度的丟失信息現象。此外,傳統統計方法很難挖掘出數據資料的潛在規律。隨著近年來體育領域數據增多,各種指標的體質監測數據,各種各類體育競技比賽數據等越來越多,形成海量數據[2]。與此同時,計算機應用技術在存儲、模擬分析數據方面有著很明顯的發展潛力。于是,如何在海量數據中尋找各種因素間的相互關系、發現它們之間的變化規律,進而對數據深入分析就成為了計算機的重要發展方向之一。因此,數據挖掘技術的研究和應用成為體育科學研究中不可或缺的內容之一。

該文首先介紹數據挖掘的定義和基本方法,其次綜述數據挖掘技術在國內外體育訓練的應用情況,最后在此基礎上經過對方法和研究方向的分析,提出未來數據挖掘技術在體育訓練上的研究方向。

1數據挖掘的基本方法

數據挖掘作為一門跨學科的應用技術,它涵蓋了統計學、機器學習、人工智能、模糊數學等諸多科學領域,形成了根據具體任務而進行數據分析以及知識萃取的方法體系。同樣,對于相同的問題也可以根據不同的應用領域特點選擇不同的算法。比如,處理描述性挖掘任務有數據特征化和數據區分等概念抽象和數據匯總概要處理;預測性挖掘任務因目標變量屬性的不同有分類和預測方法。

數據挖掘的方法主要有:

1)分類:按照分析對象的屬性分門別類加以定義,建立類組。

2)回歸:是使用一系列的現有數值來預測一個連續數值的可能值。

3)預測:根據對象屬性的過去觀察值來估計該屬性未來的值。

4)聚類:是將一組數據按照相似性和差異性分為幾個類別,其目的是使得屬于同一個類別的數據間的相似性盡可能大,不同類別中的數據間的相似性盡可能小。

5)關聯:是要找出在某一事件同時出現的事件。主要是要找出:如果甲因素出現在某一事件的一部分,則乙因素也出現在該事件中的機率有多大。

數據挖掘常用的技術主要有決策樹、遺傳算法、聚類分析、神經網絡技術、關聯規則等[3-4]。

1)決策樹

一種用樹枝狀展現數據受各變量的影響情況的分析預測模型,根據對目標變量產生效應的不同而制定分類規則,它是建立在信息論基礎之上,對數據進行分類的一種方法。它首先通過一批已知的訓練數據建立一棵決策樹,然后采用建好的決策樹對數據進行預測。決策樹的建立過程是數據規則的生成過程,因此這種方法實現了數據規則的可視化,其輸出結果容易理解,精確度較好,效率較高,因而較常用。常用的方法有分類及回歸樹法、卡方自動交互探測法等[3]。

2)遺傳算法

一種新的最佳化空間搜索方法,它應用算法的適應函數來決定搜索的方向,運用一些擬生物化的人工運算過程進行一代又一代的周而復始的演化,求得一個最佳結果。特點是具有強固形與求值空間的獨立性。強固形使問題的限制條件降到最低,并大幅度提高系統的容錯能力;而求值空間的獨立性則使遺傳算法的設計單一化,且適用于多種不同性質、領域的問題。將遺傳算法運用于數據挖掘,可以開采出與眾不同的信息,是別的算法所不能替代的。

3)聚類分析

聚類分析是將數據對象分成類或簇的過程,使同一簇中的對象之間具有很高的相似度,而不同簇中的對象高度相異。一個好的聚類方法會最大化類內的相似性,最小化類間的相似性。主要聚類方法有:劃分算法、層次算法、基于密度的方法、基于網格的方法、基于模型的方法。

4)神經網絡技術

一種模仿人腦思考結構的數據分析模式,由輸入變量或數值中自我學習并根據學習經驗所得的知識不斷調整參數,以期得到資料的模式。是建立在自學習的數學模型基礎之上,它可以對大量復雜的數據進行分析,并能完成對人腦或計算機來說極為復雜的模式抽取及趨勢分析。神經網絡的處理過程主要是通過網絡的學習功能找到一個恰當的連接加權值來得到最佳結果。比較典型的學習方法是回溯法。通過將輸出結果同一些已知值進行一系列比較,加權值不斷調整,得到一個新的輸出值,再經過不斷的學習過程,最后該神經網絡得到一個穩定的結果。

5)關聯規則

關聯規則挖掘就是從大量的數據中挖掘出有價值描述數據項之間相互聯系的有關知識。關聯規則主要應用在商業數據庫中:商品分類設計、降價經銷分析、生產安排、貨架擺放策略等。關聯規則主要反映了一個事物與其他事物之間的相互依存性和關聯性。給定一個事務集D,挖掘關聯規則的問題就變成如何產生支持度和可信度分別大于用戶給定的最小支持度和最小可信度的關聯規則問題。

2數據挖掘在體育領域中的應用

2.1數據挖掘國內外研究情況

1)數據挖掘在體育訓練國內研究的情況

查閱中國期刊中文數據庫,碩士博士論文中,涉及到體育數據挖掘的體育科研論文內容主要有:體育教學、學生體質調研、運動訓練監控、臨場比賽優化、體育信息管理等的數據挖掘研究以及優化數據挖掘工具在體育領域的應用研究。

楊雙燕、趙水寧比較全面地介紹了數據挖掘技術在學生體質調研、體育產業、競技體育、體育決策管理中的應用方向[5]。高洪歌通過對優秀運動員參加的國際比賽中的各項技戰術參數,然后運用關聯規則、聚類分析和基于馬爾代夫過程的數據挖掘算法,揭示了隱含于數據中的很多信息[6]。孟憲明、凌培亮從視野和步長等方面對人工魚群算法進行改進,并提出基于該算法的乒乓球技戰術分類規則數據挖掘模型,分析頂級乒乓球運動員比賽實例,結果表明與乒乓球技戰術關聯規則數據挖掘相比,該模型在挖掘質量和挖掘效果上有較大優勢[7]。龔明波,鐘平中通過對通過球隊進球、射門、射門命中率、角球等11項攻防技術指標進行主成分分析的基礎上,確定球隊技戰術能力聚類的綜合指標,形成聚類樣本。在此基礎上,引入模擬人類視覺系統的尺度空間理論,提出了基于尺度層次空間聚類的球隊技戰術分類方法[8]。陳健、姚頌平以CBA聯賽為背景運用關聯規則得出核心運動員的得分與球隊獲勝的關聯度,核心運動員的上場時間和關聯度等[9]。

2)數據挖掘在國外體育領域中的應用現狀

在新世紀初美國NBA的教練運用IBM公司提供的DM工具Advanced Scout能在比賽中輔助教練員林場決定隊員替換方案,取得了很好地效果。此后,NBA球隊從各方面廣泛使用該系統來優化他們的戰術組合。

美國國家曲棍球聯盟與IBM建立了一個合資公司,推出了電子實時比賽計分和統計系統NHL-ICE.該軟件可以讓教練、播音員、記者及球迷共同利用NHL各類數據,使用NHL-ICE挖掘各自所需的信息。

意大利運用數據挖掘技術開發了Data Volley軟件系統,實現了排球比賽的技戰術統計分析。

2.2決策樹算法的應用

決策樹是一種典型的分類方法,首先對數據進行處理,利用歸納算法生成可讀的規則和決策樹,然后使用決策對新數據進行分析。本質上決策樹是通過一系列規則對數據進行分類的過程。分類(Classification)任務就是通過學習獲得一個目標函數(Target Function),將每個屬性集x映射到一個預先定義好的類標號y。分類任務的輸入數據是紀錄的集合,每條記錄也稱為實例或者樣例。

決策樹算法最具影響和最為典型的算法的主要是ID3算法。ID3算法的基本思想:以信息熵為度量,用于決策樹節點的屬性選擇,每次優先選取信息量最多的屬性,亦即能使熵值變為最小的屬性,以構造一顆熵值下降最快的決策樹,到葉子節點處的熵值為0。此時,每個葉子節點對應的實例集中的實例屬于同一類[10]。

2.3神經元網絡的應用

BP算法的基本思想是:學習過程分為兩個部分:信號正向傳播和誤差的反向回傳。信號從正向傳播時,輸入數據從輸入層進入,經過各級隱層網絡依次逐層處理,傳遞到輸出層,如果輸出層輸出的結果和期望不相符或者差距很大,那么將誤差值當做調整的信號一次各層向著相反的方向傳回來,通過作用神經元之間的連接權矩陣,使誤差減小。經過不斷的學習,最后使得誤差減小到可以接受的范圍以內。具體的算法步驟如下:

1)從訓練數據集中取出某一樣本數據,將信息錄入到神經網絡中的輸入端。

2)根據各個節點間的連接情況正向逐層的處理后,可以得到神經網絡的輸出數據。

3)計算網絡輸出的數據值與期望輸出的數據值的誤差。

4)把誤差逐層按照相反的方向傳回到之前各層網絡,并且按照一定的原則將誤差信號的值作用到連接的權值上,使整個神經網絡的連接權值誤差越來越小。

5)將數據集輸入—輸出樣本逐一重復以上步驟,直到整個樣本集的誤差減小到可以接受的范圍。

目前國內有學者將BP神經網絡技術應用到研究體育生化指標對競技的影響[12]。他們采用采用BP神經網絡,輸入的神經元個數為4個,隱含層5個神經元,輸出1個神經元。經研究得到的結論是:

1)BP神經網絡精確度比較高,預測結果清晰地預測了運動員競技能力和比較科學的預測了運動員的未來發展趨勢。

2)在體育訓練中,運用BP神經網絡模型對運動員生化指標數據可以預測運動員競技成績并且對指導教練員選拔運動員有一定的科學幫助。

2.4關聯規則

數據關聯是數據庫中存在的一類重要的可被發現的知識。若兩個或多個變量的取值之間存在某種規律性,就稱為關聯.關聯分析的目的是找出數據庫中隱藏的關聯網[13]。

設I={i1,i2,…,im}是項的集合。關聯規則:形如A => B的蘊涵式,其中A?I , B?I ,并且A∩B =?。支持度:P(AUB),即A和B這兩個項集在事務集D中同時出現的概率.置信度:P(B I A),即在出現項集A的事務集D中,項集B也同時出現的概率.如果一條關聯規則同時滿足最小支持度閾值和最小置信度閾值,那么就認為它是有趣的,并稱為強關聯規則。給定一個事務集D,挖掘關聯規則問題就是產生支持度和可信度分別大于用戶給定的最小支持度和最小可信度的關聯規則[14]。

3分析

3.1各種常用方法的適用范圍及不足

基于數據挖掘決策樹分類方法即ID3方法,比較簡單明了,它構建樹的步驟簡單,在屬性不多的情況下人為就可建立,實用性非常強。

基于數據挖掘關聯規則方法的乒乓球技戰術分析系統可以根據乒乓球比賽的實戰數據結果進行統計分析,應用關聯規則中的FP-growth算法,深入挖掘選手A和選手B在各項技術的比拼,切磋過程中的弱項和強項,也就是選手A與選手B進行比賽時哪些技戰術會讓自己得分,運用哪些技戰術會使自己失分。不僅有利于自身選手在體育訓練中加強自己的薄弱環節,并且在自己水平有限的情況下和某個個體選手對決時可以充分發揮自己的強項,盡量避免使自己失分的弱項,這樣可以把握形勢的主動權,取得更好的成績。所以數據挖掘在體育訓練方面的應用可以挖掘眾多體育信息中潛在的規律,使體育訓練和比賽朝著理性化和精確化的道路發展,故數據挖掘在體育方面產生的影響是舉足輕重的。

將乒乓球比賽技戰術分析做成一個實用、有效的軟件,廣泛的被各個乒乓球隊使用,作為為教練做出正確的分析和決策提供一個參考,使教練的意見和訓練更加的客觀,使體育比賽更加的科學精準[11-12]。

不過這種方法有一定的不足:

1)比如如果只錄入一場比賽,那么數據的說服力和準確度都會下降。并且在這種不完全數據的統計中技術水平往往也和現場情況選手的壓力、體能情況和發揮息息相關。

2)就是FP-tree關聯規則本身具有一定的誤差。源于它是以支持度-置信度為基礎的關聯規則挖掘方法,在理論上缺乏嚴格的理論證明和基礎。在閾值參數設定缺乏客觀標準時就將其直接應用到客戶細分中,可能會產生一些誤導。

基于關聯規則本身的局限,我們有必要開發更好的算法,克服這些不足,在發現規則的同時需要更多的數據,更深層次的聯系才行。

3.2對基于決策樹ID3算法的思考

決策樹ID3算法通過學習建立一棵決策樹。在生成決策樹的時候,通常采用信息增益方法來確定生成每個節點時所應選擇的合適屬性,也就是通過選擇具有最高信息增益的屬性作為測試是否合適做當前屬性的方法。目的是為了將劃分后的獲得的訓練樣本進行分類所需要信息最小。也就是利用該屬性進行信息劃分會使產生的各樣本子集中不同類別混合程度降低。因此決策樹采用這種規則能夠有效減少對象分類所需要的劃分次數。

理想的決策樹有三種:1)葉子結點數最少;2)葉子節點深度最?。?)葉子結點數最少且葉子節點深度最小。但是這種最優的決策樹是NP難題。因此,決策樹優化問題是很難解決的。不過可以盡量通過結合實際情況優化算法使數據挖掘的分類更有效[13]。決策樹ID3算法在網球的例子中尚可正確執行和得出可行的結論。但是ID3算法有一些不足:1)用戶信息的計算比較依賴于特征取值的數目較多的屬性,這樣不太合理。

2)ID3算法在建樹時,每個結點僅含有一個屬性,是一種單元的算法,屬性特征間的相關性強調的不夠充分,無法體現出屬性間相互聯系的特點。

3)ID3對噪聲較為敏感。

4)當數據樣本集增加時,ID3的決策樹會隨之變化。

4結論

該文首先是對國內體育訓練中數據挖掘技術的應用狀況進行綜述,然后對決策樹的應用,BP神經網絡技術在研究體育生化指標對競技的影響的應用以及FP-Tree算法在乒乓球比賽技術分析中的應用進行分析,最后對ID3算法和FP-Tree算法提出自己的見解:雖然做成最優的決策樹是一個難題,但是我們可以根據自己的經驗和實際情況靈活的運用算法,即可在實際應用中取得更好的效果,比如訓練人員可以根據天氣等情況判定每日是否適合戶外訓練或比賽;另外,運用關聯分析數據挖掘技術可以實現乒乓球比賽中技術運用更加合理、精確;它可以實現對實戰中選手自身的技術弱項和強項的挖掘,以及運用哪些技術可以得分或失分,為比賽中技術運用提供了科學的依據。

參考文獻:

[1]遲殿委,周興斌.數據挖掘的體育訓練決策支持系統[J].微型計算機,2009(25):190-192.

[2]郝麗,劉樂平.數據挖掘(Data Mining)在體育統計中的應用[J].華東理工學院學報,2004,6(5): 92-95.

[3]胡斐.數據挖掘在體育領域中的應用研究綜述[J].科技創新導報,2010(27):211-212.

[4]朱明.數據挖掘[M].2版.合肥:中國科學技術大學出版社,2008.

[5]楊雙燕,趙水寧.體育數據中數據挖掘技術的應用研究[J].浙江體育科學,2003,2(30): 49-51.

[6]高洪歌,趙會群.關聯規則挖掘在乒乓球比賽技戰術分析中的應用[J].北方工業大學學報,2003,18(1): 15-20.

[7]孟憲明,凌培亮.基于人工魚群算法的乒乓球數據挖掘[J].計算機工程,2010,36(5): 28-31.

[8]龔明波,鐘平.尺度空間層次聚類在足球球隊技、戰術能力分類中的應用研究[J].體育科學,2005,25(1):87-90.

[9]陳健,姚頌平.關聯分析在籃球技術統計數據分析中的應用[J].上海體育學院學報, 2009, 33(5):91-94.

[10]欒麗華,吉根林.決策樹分類技術研究[J].計算機工程,2004,5(9):95-96.

[11]高洪敏.數據挖掘技術在乒乓球比賽技戰術分析中的應用研究[D].北京,北方工業大學,2006.

[12]趙會群,孫晶,花勇民,等.數據挖掘技術在體育比賽技戰術分析中的應用研究[J].北京體育大學學報,2008,31(5):712-715.

深度神經網絡綜述范文4

【關鍵詞】電力系統;故障診斷;研究現狀;發展趨勢

中圖分類號:F407文獻標識碼: A 文章編號:

引言

電力系統故障診斷是近年來十分活躍的研究課題之一。主要包括系統故障診斷和元件故障診斷兩個方向,系統級故障診斷是指通過分析電網中各級各類保護裝置產生的報警信息、斷路器的狀態變位信息以及電壓電流等電氣量測量的特征,根據保護、斷路器動作的邏輯和運行人員的經驗來推斷可能的故障元件和故障類型的過程。

1國內外研究發展狀況

1.1 基于專家系統的診斷方法

專家系統(expert System)利用專家推理方法的計算機模型來解決問題,已獲得日益廣泛的應用。目前,專家系統用于電力系統故障診斷是比較成功的。根據故障診斷的知識表示和所用推理策略的不同,專家系統主要有兩類:

(1)基于啟發式規則推理的系統。此類系統把保護、斷路器的動作邏輯以及運行人員的診斷經驗用規則表示出來,形成故障診斷專家系統的知識庫,采用數據驅動的正向推理將所獲得的征兆與知識庫中的規則進行匹配,進而獲得故障診斷的結論?,F在大多數故障診斷屬于這一類。

(2)結合正、反推理的系統。此類系統結合了正反向混合推理方法,根據斷路器和繼電保護與被保護設備之間的邏輯關系建立推理規則,同時通過反向推理,有效地縮小可能故障的范圍,以動作的繼電保護與故障假設的符合程度計算可信度。文獻[1]介紹了基于事例推理(CBR)和基于規則推理(RBR)的混合推理的故障診斷專家系統。由于采用了混合推理,提高了故障診斷專家系統的適應性與自學習能力。

基于專家系統的診斷方法的主要特點是可以方便地把保護、斷路器的動作邏輯以及運行人員的診斷經驗用規則表示出來,并允許在知識庫中增加、刪除或修改一些規則,以確保診斷系統的實時性和有效性,同時還能夠給出符合人類語言習慣的結論,并具有相應的解釋能力等,比較適合中小型電力系統和變電站的故障診斷。該方法在實際應用中仍然存在如下主要缺陷:①建立知識庫及驗證其完備性比較困難;②容錯能力較差,缺乏有效的方法識別錯誤信息;③大型專家系統的知識庫的維護難度很大;④專家系統在復雜故障診斷任務中會出現組合爆炸和推理速度慢的問題。這些缺陷使得專家系統難以滿足大規模電力系統在線故障診斷的需要,目前主要應用于離線故障分析。

1.2基于人工神經網絡的診斷方法

與專家系統相比,基于人工神經網絡(ANN—artifieial neural network)的故障診斷方法具有魯棒性好、容錯能力強和學習能力強等特點。

目前應用于電力系統故障診斷的ANN有:基于BP(baekpropagation)算法的前向神經網絡和基于徑向基函數的神經網絡等。文獻[1]給出了典型的故障診斷神經網絡BP模型,其實現方法是:以電力系統繼電保護信息作為ANN的輸人,以可能發生的故障作為其輸出,選擇適當的樣本集訓練ANN。整個訓練過程為:首先根據網絡當前的內部表達,對輸人樣本進行前向計算;然后比較網絡的輸出與期望輸出之間的誤差,若誤差滿足條件,則訓練結束,否則,將誤差信號按原有的通路反向傳播,逐層調整權值和闌值,如此反復,直至達到誤差精度要求。文獻[2]將大型輸電網絡分區,對各個區域分別建立基于BP算法的故障診斷網絡,然后綜合獲得最終的故障診斷結果。

基于ANN的診斷方法的主要特點是避免了專家系統故障診斷所面臨的知識庫構造等難題,不需要推理機的構造。由于用于ANN訓練的完備樣本集獲取困難,目前該方法只比較適合中小型電力系統的故障診斷。ANN方法在故障診斷應用中存在的問題主要是:①其性能取決于樣本是否完備,而大型的電力系統的完備樣本集獲取非常困難;②與符號數據庫交互的功能較弱;③不擅長處理啟發性的知識;④不知如何確保ANN訓練時收斂的快速性和避免陷人局部最小;⑤缺乏解釋自身行為和輸出結果的能力。以上缺點限制了ANN故障診斷方法在線應用于大型電力系統。如何設計適用于大型電力系統的故障診斷系統,仍然是一個有待進一步研究的問題。

1.3 基于粗糙集理論的診斷方法

粗糙集理論(roughSettheory)是波蘭Z.Pawlak教授于1982年提出的一種處理不完整性和不確定性問題的新型數學工具。粗糙集理論的主要思想:在保持分類能力不變的前提下,通過知識約簡,導出問題的決策或分類規則。它無需提供問題所需處理的數據集合之外的任何先驗信息,能有效地分析和處理不精確、不一致、不完整等各種不完備數據,從中發現隱含知識,揭示潛在規律。鑒于粗糙集理論的優越性,已經有不少研究人員把它引人到故障診斷系統中。

文獻[3][4]把粗糙集理論應用于電力系統故障診斷和警報處理,嘗試應用粗糙集理論來處理因保護裝置和斷路器誤動作、信號傳輸誤碼而造成的錯誤或不完整警報信號,提出的方法考慮各種可能發生的故障情況,建立決策表(類似于ANN故障診斷的訓練樣本集),然后實現決策表的自動化簡和約簡的搜索,刪除多余屬性后抽取出診斷規則,揭示警報信息內在冗余性。

文獻[5]提出了基于粗糙集理論與二元邏輯運算相結合的屬性約簡算法以及改進的值約簡算法,并將其應用于由斷路器和保護作為條件屬性、故障區域作為決策屬性的診斷決策表的約簡過程中,利用決策表的約簡形成綜合混合知識模型。文獻[5]提出和構造了四類不同的粗糙集與神經網絡(NN)組合的故障診斷模型,給出了粗糙集與NN在四類模型中實現不同的互補性、關聯關系、應用機理和原則及相應的局限性。

2 電力系統故障診斷發展趨勢

隨著電網建設的發展、計算機技術和網絡技術以及數學和智能科學理論的發展,不斷有新的電網故障診斷方法出現,從電力系統故障診斷理論與方法研究和應用的深度、廣度可以清晰地看到,其研究仍停留在理論和模型的探索階段,基本上沒有非常成功的成型實用系統,實用化方面一直未有太大的發展。由于以前技術和設施的原因,導致信息資源比較有限,從發表的文獻來看,電網故障診斷系統大多依托于調度端或變電站內,分別利用調度SCADA系統的實時信息或站內綜合百動化系統收集的信息來實現;隨著系統、計算機和網絡技術的發展,以及故障錄波專用網絡的建設,后來又發展了基于故障錄波信息的故障診斷系統。此系統的建設,使諸多的信息孤島納入系統中,對故障后所有相關的故障信息,例如保護裝置信息、錄波器信息、雷電定位信息、監控裝置信息等,進行采集、傳輸、存儲和處理,為電網故障處理提供了信息支持。這些寶貴的信息為新的電網故障診斷方法提供了基礎,大大拓展了電網故障診斷的研究方向。因此,在電網故障診斷理論的實用化過程中,必須充分重視信息的收集與整理工作,包括用于故障診斷的數據倉庫的構建、故障綜合信息的預處理和診斷知識的提取等。

3結束語

電力系統故障診斷是關系到電力系統安全穩定運行的重要問題,國內外從20世紀80年代起已經進行了大量的研究工作,提出了多種故障診斷技術和方法,但實際系統中該問題并未很好地解決。隨著電力系統規模日趨龐大,結構更加復雜,對電力系統故障診斷提出了更高的要求。本文綜述了電力系統故障智能診斷的研究方法,評述了這些方法中需要改進之處,進一步指出了該領域的一些主要發展趨勢。它們對構建電力系統故障診斷智能輔助決策系統具有重要的指導意義,對保證電力系統的安全運行、減少事故的經濟損失具有重要的理論和現實意義。

參考文獻

[1]杜一,張沛超,郁惟墉.基于事例和規則棍合推理的變電站故障診斷系統[J].電網技術,2004,28(l).

[2]YANGH,CHANGW,HUANGC.power system Distributed On line Fault Seetion EstimationUsingDeeisionTreeBasedNeuralNetsApproaeh.IEEETransonPowerDelivery,1995,10(1).

[3]張琦,韓禎祥,文福拴一種基于粗糙集理論的電力系統故障診斷和警報處理新方法[J].中國電力,1998,31(4).

深度神經網絡綜述范文5

在不平衡電壓下PWM整流器的無電流傳感器控制策略研究

非平衡電橋數字溫度計的設計

英國皇家學會舉辦非洲科學發展研討會

回線源瞬變電磁法探測深度的影響因素探討

厭氧粘接劑在螺栓連接中的應用研究

定量熒光技術在錄井油氣中的應用

液體容積式流量計容量示值誤差的測量結果不確定度

GPSRTK實時動態測量技術的特點與應用淺談

電力配網線損管理系統的研究與開發

加拿大企業研制出新型太陽能飛艇

基于PLC的液壓實驗臺監控系統的研制及開發

Premiere利用Cool3D搭橋實現煙花制作

歐洲議會聯盟力促可再生能源的加速發展

淺析反滲透海水淡化裝置高壓泵變頻控制系統的應用研究

IBM開發高性能計算系統云技術與工程服務

淺談計算機網絡信息和網絡安全防護策略

計算機數據庫在信息管理中的應用

高職校園網組建設計與實現

中低壓配電網絡自適應電流保護的研究

視頻流應用層組播系統的設計與實現

基于OracleRowID實現批量數據的分頁下載

使用PHP動態生成SVG圖形

VLAN在嵌入式Linux以太網交換機中的劃分與實現

Linux下管道通信的實現

下一代網絡(NGN)綜述

Cygnal_C8051F020與80C51單片機的區別

物聯網技術在動產質押動態監管系統中的應用

基于PROFIBUS-DP現場總線的制造業企業能源監控系統設計——以某機車車輛制造企業為例

一種基于免疫的入侵檢測系統框架

個性化網絡信息檢索方法與技巧探討

蓄電池化成電源的設計與實現

混沌與混沌電路設計方法的可行性研究

一種用于PPT翻頁控制的無線遙控收發電路

微機五防系統在220kV普光變電站的應用

變電站綜合自動化系統發展趨勢探討

電力數據的采集與無線傳輸

關于輸配電線路安全運行的措施探析

淺析直流電動機的勵磁保護

國內核電反應堆微型精密控制網測量方法介紹

基于數字證書的單點登錄技術研究及應用

德國第一個海上風力發電場實現并網發電

CMOS電荷泵鎖相環中電荷泵的研究與設計

NS2中隨機早期檢測算法的優化設計和實現

PWM控制技術及其在調平控制器中的應用

BP神經網絡在WSN數據融合中的應用

基于MarcXchange查詢處理的優化

太陽能制冷空調進入試用階段

從“番茄花園事件”談中國軟件業知識產權戰略

計算機網絡環境下的自主學習策略及模式

基于GPRS/CDMA通信的山洪災害預警系統的設計

IBM擬用DNA開發下一代芯片

基于組織機構代碼數據庫信息共享的質監業務信息平臺建設

淺談Excel軟件在產品原材料消耗計算中的應用

美研發出新型醫用黏合劑

鉆井平臺電網中高次諧波的危害及抑制措施

酒精裝置的自控設計

LPG發動機技術發展展望

深度神經網絡綜述范文6

關鍵詞: 語音識別; 識別原理; 聲學建模方法; 多維模式識別系統

中圖分類號: TN912.3?34 文獻標識碼: A 文章編號: 1004?373X(2013)13?0043?03

Summary of speech recognition technology and its application

YU Lin?lin

(Naval Aviation Military Representative Office Stationed in Beijing, Beijing 100041, China)

Abstract: As a key technology of human?computer interface in information technology, speech recognition has great research significance and broad application value. the development history of speech recognition technology is introduced, the basic knowledge of speech recognition is expounded, such as concept, basic principle, the acoustic modeling approach. The application of speech recognition technology in various fields are briefly introduced.

Keywords: speech recognition; recognition principle; acoustic modeling approach; multi?dimension pattern recognition system

0 引 言

語言是人類相互交流最常用、最有效、最重要和最方便的通信形式,語音是語言的聲學表現,與機器進行語音交流是人類一直以來的夢想。隨著計算機技術的飛速發展,語音識別技術也取得突破性的成就,人與機器用自然語言進行對話的夢想逐步接近實現。語音識別技術的應用范圍極為廣泛,不僅涉及到日常生活的方方面面,在軍事領域也發揮著極其重要的作用。它是信息社會朝著智能化和自動化發展的關鍵技術,使人們對信息的處理和獲取更加便捷,從而提高人們的工作效率。

1 語音識別技術的發展

語音識別技術起始于20世紀50年代。這一時期,語音識別的研究主要集中在對元音、輔音、數字以及孤立詞的識別。

20世紀60年代,語音識別研究取得實質性進展。線性預測分析和動態規劃的提出較好地解決了語音信號模型的產生和語音信號不等長兩個問題,并通過語音信號的線性預測編碼,有效地解決了語音信號的特征提取。

20世紀70年代,語音識別技術取得突破性進展?;趧討B規劃的動態時間規整(Dynamic Time Warping, DTW)技術基本成熟,特別提出了矢量量化(Vector Quantization,VQ)和隱馬爾可夫模型(Hidden Markov Model,HMM)理論[1]。

20世紀80年代,語音識別任務開始從孤立詞、連接詞的識別轉向大詞匯量、非特定人、連續語音的識別,識別算法也從傳統的基于標準模板匹配的方法轉向基于統計模型的方法。在聲學模型方面,由于HMM能夠很好的描述語音時變性和平穩性,開始被廣泛應用于大詞匯量連續語音識別(Large Vocabulary Continous Speech Recognition, LVCSR)的聲學建模[2?3];在語言模型方面,以N元文法為代表的統計語言模型開始廣泛應用于語音識別系統[4]。在這一階段,基于HMM/VQ、HMM/高斯混合模型、HMM/人工神經網絡的語音建模方法開始廣泛應用于LVCSR系統,語音識別技術取得新突破。

20世紀90年代以后,伴隨著語音識別系統走向實用化,語音識別在細化模型的設計、參數提取和優化、系統的自適應方面取得較大進展[5]。同時,人們更多地關注話者自適應、聽覺模型、快速搜索識別算法以及進一步的語言模型的研究等課題[6]。此外,語音識別技術開始與其他領域相關技術進行結合,以提高識別的準確率,便于實現語音識別技術的產品化。

2 語音識別基礎

2.1 語音識別概念

語音識別是將人類的聲音信號轉化為文字或者指令的過程[7]。語音識別以語音為研究對象,它是語音信號處理的一個重要研究方向,是模式識別的一個分支。語音識別的研究涉及微機技術、人工智能、數字信號處理、模式識別、聲學、語言學和認知科學等許多學科領域,是一個多學科綜合性研究領域[8]。

根據在不同限制條件下的研究任務,產生了不同的研究領域。這些領域包括:根據對說話人說話方式的要求,可分為孤立字(詞)、連接詞和連續語音識別系統;根據對說話人的依賴程度,可分為特定人和非特定人語音識別系統;根據詞匯量的大小,可分為小詞匯量、中等詞匯量、大詞匯量以及無限詞匯量語音識別系統。

2.2 語音識別基本原理

從語音識別模型的角度講,主流的語音識別系統理論是建立在統計模式識別基礎之上的。語音識別的目標是利用語音學與語言學信息,把輸入的語音特征向量序列[X=x1,x2,…,xT]轉化成詞序列[W=w1,w2,…,wN]并輸出?;谧畲蠛篁灨怕实恼Z音識別模型如下式所示:

[W=argmaxW{P(W|X)}=argmaxWP(W|X)P(W)P(X)=argmaxW{P(X|W)P(W)}=argmaxW{logP(X|W)+λlogP(W)}]

上式表明,要尋找的最可能的詞序列[W],應該使[P(X|W)]與[P(W)]的乘積達到最大。其中,[P(X|W)]是特征矢量序列[X]在給定[W]條件下的條件概率,由聲學模型決定。[P(W)]是[W]獨立于語音特征矢量的先驗概率,由語言模型決定。由于將概率取對數不影響[W]的選取,第四個等式成立。[logP(X|W)]與[logP(W)]分別表示聲學得分與語言得分,且分別通過聲學模型與語言模型計算得到。[λ]是平衡聲學模型與語言模型的權重。從語音識別系統構成的角度講,一個完整的語音識別系統包括特征提取、聲學模型、語言模型、搜索算法等模塊。語音識別系統本質上是一種多維模式識別系統,對于不同的語音識別系統,人們所采用的具體識別方法及技術不同,但其基本原理都是相同的,即將采集到的語音信號送到特征提取模塊處理,將所得到的語音特征參數送入模型庫模塊,由聲音模式匹配模塊根據模型庫對該段語音進行識別,最后得出識別結果[9]。

語音識別系統基本原理框圖如圖1所示,其中:預處理模塊濾除原始語音信號中的次要信息及背景噪音等,包括抗混疊濾波、預加重、模/數轉換、自動增益控制等處理過程,將語音信號數字化;特征提取模塊對語音的聲學參數進行分析后提取出語音特征參數,形成特征矢量序列。語音識別系統常用的特征參數有短時平均幅度、短時平均能量、線性預測編碼系數、短時頻譜等。特征提取和選擇是構建系統的關鍵,對識別效果極為重要。

圖1 語音識別基本原理框圖

由于語音信號本質上屬于非平穩信號,目前對語音信號的分析是建立在短時平穩性假設之上的。在對語音信號作短時平穩假設后,通過對語音信號進行加窗,實現短時語音片段上的特征提取。這些短時片段被稱為幀,以幀為單位的特征序列構成語音識別系統的輸入。由于梅爾倒譜系數及感知線性預測系數能夠從人耳聽覺特性的角度準確刻畫語音信號,已經成為目前主流的語音特征。為補償幀間獨立性假設,人們在使用梅爾倒譜系數及感知線性預測系數時,通常加上它們的一階、二階差分,以引入信號特征的動態特征。

聲學模型是語音識別系統中最為重要的部分之一。聲學建模涉及建模單元選取、模型狀態聚類、模型參數估計等很多方面。在目前的LVCSR系統中,普遍采用上下文相關的模型作為基本建模單元,以刻畫連續語音的協同發音現象。在考慮了語境的影響后,聲學模型的數量急劇增加,LVCSR系統通常采用狀態聚類的方法壓縮聲學參數的數量,以簡化模型的訓練。在訓練過程中,系統對若干次訓練語音進行預處理,并通過特征提取得到特征矢量序列,然后由特征建模模塊建立訓練語音的參考模式庫。

搜索是在指定的空間當中,按照一定的優化準則,尋找最優詞序列的過程。搜索的本質是問題求解,廣泛應用于語音識別、機器翻譯等人工智能和模式識別的各個領域。它通過利用已掌握的知識(聲學知識、語音學知識、詞典知識、語言模型知識等),在狀態(從高層至底層依次為詞、聲學模型、HMM狀態)空間中找到最優的狀態序列。最終的詞序列是對輸入的語音信號在一定準則下的一個最優描述。在識別階段,將輸入語音的特征矢量參數同訓練得到的參考模板庫中的模式進行相似性度量比較,將相似度最高的模式所屬的類別作為識別中間候選結果輸出。為了提高識別的正確率,在后處理模塊中對上述得到的候選識別結果繼續處理,包括通過Lattice重打分融合更高元的語言模型、通過置信度度量得到識別結果的可靠程度等。最終通過增加約束,得到更可靠的識別結果。

2.3 聲學建模方法

常用的聲學建模方法包含以下三種:基于模式匹配的動態時間規整法(DTW);隱馬爾可夫模型法(HMM);基于人工神經網絡識別法(ANN)等。

DTW 是較早的一種模式匹配的方法。它基于動態規劃的思想,解決孤立詞語音識別中的語音信號特征參數序列比較時長度不一的模板匹配問題。在實際應用中,DTW通過計算已預處理和分幀的語音信號與參考模板之間的相似度,再按照某種距離測度計算出模板間的相似度并選擇最佳路徑。

HMM是對語音信號的時間序列結構所建立的統計模型,是在馬爾可夫鏈的基礎上發展起來的,它是一種基于參數模型的統計識別方法。HMM可模仿人的言語過程,可視作一個雙重隨機過程:一個是用具有有限狀態數的馬爾可夫鏈來模擬語音信號統計特性變化的隱含的隨機過程,另一個是與馬爾可夫鏈的每一個狀態相關聯的觀測序列的隨機過程[10]。

ANN以數學模型模擬神經元活動,將人工神經網絡中大量神經元并行分布運算的原理、高效的學習算法以及對人的認知系統的模仿能力充分運用到語音識別領域,并結合神經網絡和隱含馬爾可夫模型的識別算法,克服了ANN在描述語音信號時間動態特性方面的缺點,進一步提高了語音識別的魯棒性和準確率。其中成功的方法就是在混合模型中用ANN替代高斯混合模型估計音素或狀態的后驗概率。2011年,微軟以深度神經網絡替代多層感知機形成的混合模型系統大大提高了語音識別的準確率。

3 語音識別的應用

語音識別技術有著非常廣泛的應用領域和市場前景。在語音輸入控制系統中,它使得人們可以甩掉鍵盤,通過識別語音中的要求、請求、命令或詢問來作出正確的響應,這樣既可以克服人工鍵盤輸入速度慢,極易出差錯的缺點,又有利于縮短系統的反應時間,使人機交流變得簡便易行,比如用于聲控語音撥號系統、聲控智能玩具、智能家電等領域。在智能對話查詢系統中,人們通過語音命令,可以方便地從遠端的數據庫系統中查詢與提取有關信息,享受自然、友好的數據庫檢索服務,例如信息網絡查詢、醫療服務、銀行服務等。語音識別技術還可以應用于自動口語翻譯,即通過將口語識別技術、機器翻譯技術、語音合成技術等相結合,可將一種語言的語音輸入翻譯為另一種語言的語音輸出,實現跨語言交流[11]。

語音識別技術在軍事斗爭領域里也有著極為重要的應用價值和極其廣闊的應用空間。一些語音識別技術就是著眼于軍事活動而研發,并在軍事領域首先應用、首獲成效的,軍事應用對語音識別系統的識別精度、響應時間、惡劣環境下的頑健性都提出了更高的要求。目前,語音識別技術已在軍事指揮和控制自動化方面得以應用。比如,將語音識別技術應用于航空飛行控制,可快速提高作戰效率和減輕飛行員的工作負擔,飛行員利用語音輸入來代替傳統的手動操作和控制各種開關和設備,以及重新改編或排列顯示器上的顯示信息等,可使飛行員把時間和精力集中于對攻擊目標的判斷和完成其他操作上來,以便更快獲得信息來發揮戰術優勢。

4 結 語

語音識別的研究工作對于信息化社會的發展,人們生活水平的提高等方面有著深遠的意義。隨著計算機信息技術的不斷發展,語音識別技術將取得更多重大突破,語音識別系統的研究將會更加深入,有著更加廣闊的發展空間。

參考文獻

[1] 馬志欣,王宏,李鑫.語音識別技術綜述[J].昌吉學院學報,2006(3):93?97.

[2] RABINER L R, JUANG B H. An introduction to hidden Markov models [J]. IEEE ASSP Magazine, 1986, 3(1): 4?16.

[3] GALES M, YOUNG S. The application of hidden Markov models in speech recognition [J]. Foundations and Trends in Signal Processing, 2008, 1(3): 195?304.

[4] JELINEK F. Continuous speech recognition by statistical methods [J]. Proceedings of the IEEE, 1976, 64(4): 532?556.

[5] 倪崇嘉,劉文舉,徐波.漢語大詞匯量連續語音識別系統研究進展[J].中文信息學報,2009,23(1):112?123.

[6] 顧亞強.非特定人語音識別關鍵技術研究[D].長沙:國防科學技術大學,2009.

[7] 中華人民共和國國家質量監督檢驗檢疫總局.GB/T21023?2007 中文語音識別系統通用技術規范[S].北京:中國標準出版社,2007.

[8] 王文慧.基于ARM的嵌入式語音識別系統研究[D].天津:天津大學,2008.

[9] 何湘智.語音識別的研究與發展[J].計算機與現代化,2002(3):3?6.

主站蜘蛛池模板: 国产精品福利久久 | 久久99精品视频 | 九九免费观看全部免费视频 | 国产免费看 | 亚洲v欧美 | 国产97在线播放 | 国产精品欧美一区二区三区 | 97久久精品 | 国产高清免费视频 | 中文av在线免费观看 | 国产区视频 | 久久九 | 国产欧美综合一区二区三区 | 狠狠操综合网 | 精品精品久久 | 伊人激情影院 | 99精品国产热久久91蜜凸 | 欧美日韩成人影院 | 草草电影 | 免费福利视频一区 | 福利二区| 欧美一二三区在线观看 | 超碰激情| 国产一区二区免费视频 | 欧美性猛片aaaaaaa做受 | 一区二区三区视频在线观看 | a毛片| 欧美在线观看一区 | 91精品一区二区三区在线观看 | 日韩国产欧美一区 | 日本高清在线观看 | 真人一级毛片 | 成人在线视频网 | 亚洲成人av| www.国产精品 | 日韩国产高清在线 | 成人一区二区电影 | 日本高清视频在线观看 | 色成人免费网站 | 亚洲色图综合网 | 国产伦理一区二区 |