什麼是神經網路?它的運作方式與數字計算機有何不同?(換句話說,大腦像計算機嗎?)

加入我們的科學愛好者社群!

Mohamad Hassoun,人工神經網路基礎(麻省理工學院出版社,1995年)的作者,以及韋恩州立大學電氣與計算機工程教授,改編了他書中引言部分來回應。

人工神經網路是平行計算模型,包含密集互連的自適應處理單元。這些網路由許多簡單的處理器(相對於通常只有一個強大處理器的PC而言)並行運作組成,以模擬非線性靜態或動態系統,其中輸入與其相應的輸出之間存在複雜的關係。

這些網路的一個非常重要的特徵是它們的自適應性,其中“透過示例學習”取代了“程式設計”來解決問題。在這裡,“學習”指的是系統引數的自動調整,以便系統可以為給定的輸入生成正確的輸出;這種適應過程讓人聯想到大腦中透過神經元突觸效能的變化而發生的學習方式。這一特徵使得這些模型在應用領域非常具有吸引力,在這些領域中,人們對要解決的問題知之甚少或瞭解不完整,但可以獲得訓練資料。


支援科學新聞報道

如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。透過購買訂閱,您將幫助確保有關塑造我們當今世界的發現和想法的有影響力的故事的未來。


一個例子是教神經網路將印刷文字轉換為語音。在這裡,人們可以從報紙上挑選幾篇文章,並生成數百個訓練對——一個輸入及其相關的“期望”輸出聲音——如下:神經網路的輸入將是文字中給定單詞的三個連續字母的字串。然後,網路應該生成的期望輸出可以是輸入字串的第二個字母的聲音。然後,訓練階段將包括迴圈遍歷訓練示例並調整網路引數——本質上是學習——以便逐漸最小化所有輸入示例的輸出聲音中的任何錯誤。訓練後,網路可以在新文章上進行測試。其想法是,神經網路將透過能夠正確地將新文字轉換為語音來“泛化”。

另一個關鍵特徵是固有的並行架構,當這些網路在並行數字計算機上實現,或者最終在定製硬體中實現時,它允許快速計算解決方案。然而,在許多應用中,它們被實現為在PC或計算機工作站上執行的程式。

人工神經網路是各種問題的可行模型,包括模式分類、語音合成和識別、人與複雜物理系統之間的自適應介面、函式逼近、影像壓縮、預測和預報以及非線性系統建模。

這些網路之所以“神經”,是因為它們可能是受到大腦和神經科學的啟發,但不一定是因為它們是生物、神經或認知現象的忠實模型。事實上,許多人工神經網路與傳統的數學和/或統計模型(例如非引數模式分類器、聚類演算法、非線性濾波器和統計迴歸模型)的關係比與神經生物學模型的關係更密切。

© .