1、第 1 講,基於知識的智慧系統導言,n智慧型機器概述 n人工智慧發展歷史 n總結,n哲學家們花費了兩千多年的時間試圖理解並解答宇宙中的兩大疑難問題:人類是如何思考的?人類之外的物體是否有思維?然而,這兩個問題至今仍然是未解之謎。 1.智慧是人類理解和學習事情的能力n 2.智慧是思考和理解問題的能力而非本能和自 動地處理問題,智慧型機器概述,(大英基礎詞典,柯林斯,倫敦,1990年),1,n所以為了思考,無論是人類還是其他事物都必須有大腦,換句話說是一種器官,它能夠使人類或其他事物具有學習和理解事物的能力,能夠解決問題並做出決斷。所以智慧可以被定義為“學習和理解事物、解決問題並做出決斷的能力”
2、n作為一門科學,人工智慧(AI)的最終目標是使機器能夠做人類所能做到的智慧型,所以“機器能否思考?”這個問題的答案對該學科而言至關重要n答案又不是簡單的“是”與“非”,n有些人可能在某些方面比別人聰明一些;有時我們處理問題會非常明智,但有時又會犯非常愚蠢的錯誤;有些人或許解決數學或工程難題時遊刃有餘,然而卻對哲學或歷史問題束手無策;一些人非常善於賺錢而另外一些人卻精於花錢。人類都具有學習、理解、解決問題和做出決定的能力,然而能力卻並不相同,並可以劃分成不同的等級,所以如果我們希望機器也可以思考的話,那麼在某種程度上它們的智慧也應該有所差別,n英國數學家艾倫圖靈(Alan Turing)所撰寫的
3、:“電腦器與智慧型” 是最早和最具影響力的有關機器智慧的文章之一,雖然該文發表於50年前,但他的方法至今仍然通用,經得起時間的檢驗。n他曾經提出這樣的問題:是否存在沒有經驗的思想?是否存在不能交流的大腦?是否存在沒有生命的語言?是否存在脫離生命的智慧?不難發現所有這些問題都是“機器能否思考?”這一人工智慧基本問題的不同表達,n圖靈並沒有給出有關機器和思維的定義,他只是透過發明了一個名為“圖靈模仿遊戲”的方式避開了文字上的爭論 n圖靈提出的模仿遊戲最初包括2個階段。在第1階段,一男一女兩位問詢者被安排在不同的房間,只能透過諸如遠端終端機似的中間媒介進行交流,最終要求問詢者透過提問確定對方的性別,
4、而遊戲的規則是男方要欺騙對方自己是女性,同時女方則要盡力說服對方自己的女性身份。,圖靈模仿遊戲: 第 1 階段,n在遊戲的第2階段,男方被電腦所代替,透過程式模仿那位元男性操作者來欺騙對方問詢者,程式甚至可以模仿一些人類常犯的錯誤,並且還可以給出一些人類會做的模稜兩可的答案。如果電腦最終可以像男性操作者做的那樣經常蒙蔽對方的話,我們或許可以認為電腦通過了智慧行為測試。,圖靈模仿遊戲: 第 2 階段,圖靈模仿遊戲: 第 2 階段,n透過維持不同終端機間人機交流,該測試為我們提供了智慧系統客觀的標準模式。它不僅避開了有關人類智慧特性的辯論,而且排除了人為喜好與偏見。 n測試本身與實驗的細節沒有任何
5、依賴關係。測試既可以像上文描述的一樣分為兩個遊戲階段實行,也可以由問詢者在測試之前預先選擇與人還是機器進行一個階段的遊戲。問詢者還可以任意提出任何方面的問題,也可以僅僅專注於所獲答案的內容。,圖靈測試具備了以下兩個顯著的特質,這使它實作了真正通用的效果:,圖靈確信到20世紀末透過數位電腦程式設計可以實作模仿遊戲。儘管現代電腦還不能透過圖靈測試,它仍然為我們提供了對基於知識的評估和驗證標準。 透過與人類專家行為的比對,已經對一些較為狹窄專業領域的程式被認為是智慧的 為了建立一套智慧電腦系統,我們必須去捕捉、組織並利用人類在一些較為狹窄的專業領域裏的專業知識,人工智慧的基礎,哲學(西元前428年
6、現在)數學(約800年 現在)經濟學(1776年 現在)神經科學(1861年 現在)心理學(1879年 現在)電腦工程(1940年 現在)控制理論(1948年 現在)與研學(1957年 現在),人工智慧發展歷史,Warren McCulloch和Walter Pitts於1943年發表的研究報告被公認為人工智慧領域最早的研究。他們提出了一個人工神經網路模型,還進一步揭示了簡單的網路結構能夠學習的奧秘。 McCulloch是繼Alan Turing之後被稱為人工智慧的第二“教父”,為神經計算和人工神經網路(artificial neural networks,ANN)奠定了基礎。,人工智慧的誕生
7、 (1943 1956),2,人工智慧的第三位奠基人是聰明的匈牙利裔數學家John von Neumann。他於1930年加入普林斯頓大學執教於數學物理系。他擔任賓西法尼亞大學電子數值整合計算機(ENIAC)計劃的顧問,幫助設計一個電子離散變數自動電腦(EDVAC),一個可以儲存程式的機器。他的思想很大程度上受到了McCulloch和Pitts的神經網路模型的影響。當普林斯頓大學數學系的兩位研究生Marvin Minsky 和Dean Edmonds於1951年研製出了世界上第一台神經網路電腦時,他積極鼓勵並支持他們。,另一位第一代研究者的代表人物是Claude Shannon。他畢業於麻省理
8、工學院(MIT)並於1941年加入了貝爾實驗室。他繼承了Alan Turing機器智慧型可能性的觀點,於1950年發表了一篇關於棋藝對決機器的論文,指出了標準的棋藝遊戲包含著大約10120種可能的走法(Shannon,1950),即使是最新的von Neumann電腦也只能每微秒測試一種走法,這大約需要310106年才可能完成一次移動,所以Shannon論證了在搜尋答案時利用啟發方式的必要性。,在1956年, John McCarthy, Martin Minsky 和 Claude Shannon在英國達特茅斯學院組織了一個暑期研討會。他們召集了對機器智慧型、人工神經網路以及自動化理論研究領
9、域感興趣的學者舉行了由IBM贊助的研討會。儘管當時到會的學者僅有10位,這次研討會卻催生了一門名為人工智慧的新科學。,由McCulloch和Pitts開創的神經計算和人工神經網路研究得以繼續。隨著學習方法的改良,Frank Rosenblatt證明了感知器收斂理論,他還論證了他的學習演算法能夠調節感知器連接強度。,人工智慧的上升期,大膽預測時代(1956年60年代末),在這個大膽預測時代,最為雄心勃勃的計畫之一是一個被稱為“通用解決方案”(GPS)的項目。卡內基梅隆大學的Allen Newell和Herbert Simon開發了一個通用程式來模擬人類解決問題的方法。Newell和Simon假定
10、要解決的問題可以根據不同的狀態來定義,然後用手段-目的分析法來判定一個問題的目前狀態和期望狀態或目標狀態之間的差異,進而透過選擇並應用不同的演算子來達到目標狀態。而演算子集合則定義了解決方案。,儘管如此,GPS仍然無法解決複雜的問題。由於該程式是基於一般邏輯,就必然導致產生無數個可能的演算子,從而造成效率低下。由於GPS在解決實際問題時花費大量的計算時間並且佔用大量的記憶體,致使最終不得不放棄該計畫的實施。在60年代,人工智慧的研究者們曾試圖透過發明解決廣義問題的通用方法來模擬複雜的思考過程,他們採用了廣義的搜尋機制來尋求問題的一個解決方案,而該類方法在現在被認為是不健壯的方法,即運用了問題範
11、疇中的弱資訊。,到1970年,有關人工智慧的亢奮漸漸消退了,大多數的政府基金也取消了與人工智慧相關的專案。人工智慧仍然是一門新興的學科,無法擺脫科學發展的自然規律,除了一些遊戲之外很少有實際的應用成果。所以對於外界而言,那時公認的成就也無外乎一些遊戲,沒有產生可以真正解決實際問題的智慧系統。,由於人工智慧的研究者們專注於開發解決廣義問題的一般方法,早期的套裝程式含了很少甚至沒有相關問題範疇的知識。為了解決問題,程式應用了搜尋策略來測試每個小步驟的不同組合,直到找到正確的答案。這樣的方法對於“遊戲問題” 很有效,因而被順理成章地誤認為可以經過簡單地“擴展” 來解決龐大的問題,而且最終也會成功,然
12、而這樣的想法是錯誤的。,無法履行的承諾,現實的衝擊(20世紀60年代後期20世紀70年代初期),20世紀60年後期人工智慧所面對的主要困難是:,許多人工智慧試圖解決的問題都過於廣泛、過於困難了。早期人工智慧的典型問題就是機器翻譯,例如美國國家研究理事會在1957年蘇聯第一顆名為Sputnik的人造衛星發射成功後資助的蘇聯科學論文翻譯計畫,起初專案小組借助電子詞典簡單地試著將俄文單詞用英文代替,然而他們很快發現翻譯過程中只有對主題理解了才可能選擇正確的辭彙,而這項工作在當時來講太難了,因此到1966年所有美國政府資助的翻譯專案都被迫中止了。,在1971年,英國政府同樣中止了對人工智慧研究的支持。
13、James Lighthill爵士被大不列顛國家科學研究委員會任命來調查當時人工智慧的發展狀狀態,他沒能發現任何有關人工智慧的巨大成果,甚至明顯的結果也沒有,因而認為沒有必要再保留一門獨立的“人工智慧”學科了。,或許人工智慧在20世紀70年代最為重要的進展就是認識到了對智慧型機器研究的問題範疇需要有充分的限制。之前,人工智慧研究者們確信可以發明一種聰明的搜尋演算法和推理技術來效仿通用的、類似於人類的解決問題的方法。其中一種通用搜尋機制可以依據於元素化的推理步驟來發現完整的解決方案並可以利用弱知識範疇。,專家系統技術,成功的關鍵(20世紀70年代初期20世紀80年代中期),當這種弱方法失敗之後,
14、研究者們終於認識到獲得實用結果的唯一途徑是透過執行更大的推理步驟來解決狹窄專業領域的特殊問題。,DENDRAL,DENDRAL是由史丹佛大學開發,用來分析化學問題。這項計畫得到了美國航空及太空總署(NASA)的資助,因為當時計畫發射一艘無人太空船去火星,基於大規模光譜儀提供的大量光譜資料,需要設計程式來分析火星表面的土壤的分子結構。Edward Feigenbaum 、Bruce Buchanan(資訊科學家)和Joshua Lederberg(基因領域的諾貝爾獎獲得者)組成了解決這一極具挑戰性問題的研究團隊。沒有一種科學演算法可以完成大規模光譜圖與分子結構之間的對應關係。Feigenbaum
15、的工作就是把Lederberg的專業知識用電腦程式來實作,使它達到人類專家的水準,這種程式後來被命名為專家系統。,DENDRAL成為人工智慧領域主要的“變革典範”:從一般目標、知識匱乏以及弱方法到特定領域和高深知識技術的變革。 這個計畫的目標是開發可以達到富有經驗的人類化學家水準的電腦程式。借助於從人類專家那裏提煉出的特定高品質規則經驗定律(rules-of-thumb)形式的啟發式研究方法,DENDRAL團隊證明了電腦可以在特定的問題領域裏達到與人類專家等同的能力。 DENDRAL計畫開創了專家系統的嶄新方法基本理論即知識工程,它包含了以專家所熟知的規則捕捉、分析和表達的技術。,MYCIN,
16、MYCIN是一個用以診斷傳染性血液疾病的基於規則的專家系統,它還為醫生提供了方便、友善的使用者介面治療建議。MYCIN的知識體系包含了大約450種相互獨立的IF-THEN條件規則,這些是從廣泛的專家晤談。在一個狹小的知識領域裏總結出來的。這些以規則的形式組成的知識與推理機制完全分離,系統開發者因此可以輕易地透過插入或刪除一些規則來操控系統中的知識。例如史丹佛大學之後開發的被稱為EMYCIN(Empty MYCIN)的獨立於任何特定領域的MYCIN版本。,PROSPECTOR,PROSPECTOR是一個史丹佛研究院開發的用於勘探礦藏的專家系統。9位元專家為系統提供了專業知識和經驗。為了表達這些知
17、識,PROSPECTOR系統採用了結合規則和語意網路的混合結構,它具有上千個規則來表達廣泛的領域知識,還擁有一個包括知識獲得系統的複雜的系統支援函式庫。 系統首先要求作為探測地質學家的使用者輸入待檢沉澱物的特徵:地質框架、結構、岩石和礦藏的種類;然後程式將這些特徵與礦石沉澱物模型進行比對,如果需要的話還會要求使用者提供更多的資訊;最後,系統對待檢沉澱礦石物進行評估並做出結論,還可以解釋做出相關決定的步驟。,1986年的一次普查(Waterman,1986)報告了在化學、電子、工程、地質、管理、醫學、程序控制以及軍事科學等不同領域裏大量的專家系統成功應用範例。儘管Waterman發現了將近200
18、個專家系統,但大多數應用都集中在醫療診斷領域。7年後另一項類似調查(Durkin, 1994)報告了超過2500個開發出的專家系統,新興的應用領域是商業和製造業,佔到了應用總數的60%。專家系統技術明顯成熟了。,但是:,專家系統侷限於非常狹小的專業領域。例如開發MYCIN系統是用於診斷傳染性血液疾病,它本身缺乏真正的人體生理學知識。如果病人所患疾病不止一個,我們就無法依靠MYCIN了。事實上,如果患有其他疾病的話,針對血液疾病的治療處方甚至會是有害的。專家系統可以顯示用來解決問題的規則串列,但無法進行相關性累積,也不具有對問題領域更深刻理解的啟發式知識。,專家系統也很難進行核對和驗證。當給定一
19、項有別於標準問題的任務時,專家系統可能在嘗試解決它的過程中最終陷入出乎預料的失敗境地。 啟發式規則表現了知識的抽象形式,缺乏對領域的基本理解,這使得確認非正確性、不完全性和不一致性知識的任務相當困難。 專家系統、特別是第一代專家系統不具備從它們的經驗中學習的能力。專家系統的開發相對獨立而且無法進行快速擴展,複雜的系統要花費超過30人年。,在20世紀80年代中期,研究者、工程師和領域專家們發現建造一個專家系統不只是需要買一套推理系統或專家系統核心程式然後嵌入足夠多的規則那麼簡單,伴隨著人工智慧相關項目資助的嚴重削減,對於專家系統的技術可行性的醒悟甚至促使人們開始預測人工智慧的“冬季”即將來臨,人
20、工智慧研究者決定重新審定神經網路技術。,如何使機器學習,神經網路的再生(20世紀80年代中期至今),到20世紀60年代後期,神經計算所必需的基礎理論和概念都已經定型,然而直到80年代中期相對應的解決方法才出現。造成滯後的原因之一是技術層面的:那時還沒有個人電腦或高性能工作站可用來進行人工神經網的模式化和測試。在20世紀80年代,由於仿腦資訊處理的需求、電腦科技的發展以及神經科學的進步,神經網路領域經歷了戲劇性的復甦。多個研究前沿領域在理論和設計兩方面都做出了重要的貢獻。,Grossberg建立了自我組織(適應諧振理論)的新原理,為神經網路的新體系奠定了基礎(Grossberg,1980) 。H
21、opfield為神經網路引入了回授Hopfield網路,這在20世紀80年代引產生了廣泛的關注(Hopfield,1982) 。Kohonen發表了有關自我組織對應圖的論文(Kohonen,1982) Barto、Sutton和Anderson發表了有關加強學習與其在控制中的應用的論文(Barto et al.,1983)。,然而真正的突破是在1986年,Rumelhart和McClelland在Parallel Distributed Processing(1986)一書中重新發明了向後傳送學習演算法(BPN: Back Propagation Network),該演算法由Bryson和Ho
22、於1969年首次提出(Bryson和Ho,1969)。 自從McCulloch和Pitts建立了早期模型以來,人工神經網路已經經歷了很長的歷程而成為根植於神經科學、心理學、數學和工程學的跨學科主題,並將繼續在理論和實際應用方面得以發展。,知識工程的新時代,文字計算(20世紀80年代後期至今),神經網路技術比基於符號推理的系統能提供更多的與真實世界的自然互動,它可以學習,與不同的問題環境變化相適應,在規則未知的條件下也可以建立模式,並且可以處理模糊的不完整資訊。然而,神經網路缺乏解釋功能,常常像黑盒子一樣工作,以目前的技術來處理神經網路的訓練還很耗時,而且頻繁的再訓練可能帶來致命的困難。,傳統的
23、專家系統特別適合於具有精確輸入和邏輯輸出的封閉式系統的應用。它們以規則的形式利用專家知識,必要時還可以與使用者進行互動以建立特殊的事實。該系統最主要的缺點是人類專家不可能總是以規則的形式表達他們的知識或者闡明他們推理的界限,這可能會妨礙專家系統積累必要的知識,從而導致失敗。,一項非常重要的處理模糊的、不精確或不確定知識和資料的技術是模糊邏輯。專家並非總是用機率值來思考問題,而是使用諸如經常、一般、有時、偶爾和很少一類的術語。模糊邏輯則是使用模糊值來捕捉文字的涵義、人類的推理以及做出決定。模糊邏輯提供了突破傳統專家系統計算瓶頸的途徑。模糊邏輯的核心是依存於語言變數的概念,而語言變數的值並非數值而
24、是文字。,模糊邏輯或模糊集理論是由柏克萊電子工程系主任Lotfi Zadeh教授於1965年提出的。它提供了一種採用文字進行計算的方法。然而模糊集理論被科技社會接受的過程卻是很難、很緩慢,部分困難來自於它過激的名稱“模糊”,似乎太隨便而難以被認真對待。儘管模糊理論被西方所忽略,在東方卻被日本認真地採納了,而且從1987年起被成功地應用到他們自己設計的洗碗機、洗衣機、空調、電視、影印機甚至汽車上。,模糊邏輯模型在基於知識和決策支援的系統中應用的益處可以歸納為以下幾點:計算能力的提高:基於模糊規則的系統比傳統的專家系統運算速度快而且所需的規則少,模糊專家系統融合了相關規則,使其更為強大。Lotfi
25、 Zadeh確信用不了幾年,大多數的專家系統將會採用模糊邏輯來解決高階非線性和計算困難的問題。,認知模型的改善:模糊系統允許知識以反映專家對複雜問題的思考模式進行編碼,他們經常以一些不精確的例如高矮、快慢、輕重的術語思考。為了構建傳統的規則,我們必須定義這些術語明確的界限,從而將專門的知識分解成碎片,而這種碎片化導致傳統的專家系統在處理高複雜度問題時表現不佳。相反,模糊專家系統對不確定的資訊模式化,以更接近於專家心中的表達方式來捕捉專門的知識,從而改善了對問題的認知模型。,具有多個專家的表達能力:傳統的專家系統建立在非常狹小的經驗範疇裏,這使系統的表現完全依賴於對專家的正確選擇。當需要構建更為
26、複雜的專家系統或專門的知識無法很好地被定義時,就需要多位元專家的參與。但是多位專家往往很難達成一致,經常會有不同甚至對立的觀點,這些在商業和管理領域尤為突顯,當其中並不存在一個簡單的解決方案,而不得不考慮對立的觀點。模糊專家系統能幫助我們表達有對立觀點的多位專家專門的知識。,儘管模糊系統允許更自然地表達專家知識,但它們仍然依賴於來自專家的規則,因而可能是聰穎或愚鈍。有些專家可以提供非常明智的模糊規則,而有些專家只能提供猜測甚至可能弄錯,所以所有的規則都必須進行測試和調整,這是漫長和繁雜的處理過程。例如,日立公司的工程師們花了幾年時間來測試和調整用於仙台地鐵引導系統僅僅54條的模糊規則。,近年來
27、,一些基於神經網路技術的方法被用來為模糊規則尋找數值資料。自適應或神經模糊系統可以發現新的模糊規則,或者根據所提供的資料改良並調整現存的規則,換句話說是輸入資料輸出規則,或者輸入經驗輸出一般規律。,專家、神經和模糊系統已經誕生並已經廣泛地應用於解決不同的問題,主要是在工程、醫療、財經、商業和管理領域。每項技術處理著人類知識中不同的非確定和模稜兩可的特徵,每種技術也已經找到了它們在知識工程中的位置,它們不再競爭,而是實作互補。,總結,3,將模糊邏輯和神經計算相統一的專家系統提升了基於知識系統的適應性、健壯性、容錯性和執行速度。另外,利用文字進行計算使系統更“人性化”,現在構築智慧系統的通常做法是利用現有的理論而非提出一個新理論,並且應用系統去解決實際問題而非“遊戲”問題。,人工智慧歷史上的主要事件一覽表,