午夜精品人妻久久久-成年美女很黄的网站-在线看片免费人成视久网app-国产精品美女无遮挡一区二区-91精品国产综合久久久久-国产的免费视频又猛又爽又刺激-在线看片免费人成视久网app-久久香蕉国产精品视频-av一区二区三区高清

蘋果智能語音助手Siri初探 ?蘋果語音助手和siri區(qū)別

蘋果語音助手和siri區(qū)別(蘋果智能語音助手Siri初探)
來源:超天才網(wǎng)
作者:張耀寰
關(guān)鍵字:
摘要:近幾年,語音識別技術(shù)開始從實(shí)驗(yàn)室走向市場 。我們預(yù)計(jì) , 未來10年 , 語音識別技術(shù)將全面進(jìn)入工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務(wù)等多個(gè)領(lǐng)域,成為當(dāng)今最具顛覆性的技術(shù)之一 。本文將為您揭開蘋果智能語音識別系統(tǒng)Siri的神秘面紗 。

蘋果智能語音助手Siri初探 ?蘋果語音助手和siri區(qū)別

文章插圖
Siri的由來
要真正認(rèn)識Siri,我們還須先知道它是怎么來的 。當(dāng)我們追溯Siri的由來時(shí),我們發(fā)現(xiàn),Siri實(shí)際上源于美國國防部的一個(gè)人工智能項(xiàng)目,當(dāng)年五角大樓的一個(gè)叫做CALO的項(xiàng)目,其英文全稱是Cognitive Assistant that Learns and Organizes,如果按照其內(nèi)涵譯成中文就是:"善于學(xué)習(xí)并且能夠組織的認(rèn)知助理" 。該項(xiàng)目由美國國防部投資,旨在為軍方提供智能化服務(wù) 。美國國防部為這個(gè)項(xiàng)目安排了高達(dá)1.5億美元的預(yù)算,匯聚了本專業(yè)一大批頂尖的人工智能專家 , 期待他們能夠開發(fā)出在野外通過學(xué)習(xí),最終具備智能認(rèn)知的機(jī)器 。要做到這一點(diǎn),機(jī)器使用的算法需要被設(shè)定大量的數(shù)據(jù),然后軟件會根據(jù)這些數(shù)據(jù)來解決問題 。CALO項(xiàng)目團(tuán)隊(duì)經(jīng)過反復(fù)研究論證最后決定,必須讓虛擬助手具備自主收集信息的能力,并根據(jù)每一次的處理結(jié)果進(jìn)行自我訓(xùn)練和自我修正 , 以接近人類的思維判斷 。
2、動態(tài)本體系統(tǒng) 。siri最關(guān)鍵的組成部分叫動態(tài)本體(英文 Active Ontologies) 。什么是動態(tài)本體呢?所謂動態(tài)本體是由多元素合成的生態(tài)體系組合 。特定詞匯、數(shù)據(jù)庫、頁面服務(wù)、互動規(guī)則,機(jī)器可識別描述等,即所有這些要素的有機(jī)結(jié)合 。語言模式識別是對輸入的總體類型、語法、詞匯、慣用語等進(jìn)行模式匹配的模塊,匹配模式的代碼在Siri內(nèi)部采用正則表達(dá)式或者狀態(tài)機(jī)等方式 。
Siri的學(xué)習(xí)功能主要體現(xiàn)在記憶上,這個(gè)記憶可區(qū)分為長期記憶和短期記憶 。如果當(dāng)你心煩了 , 機(jī)器說出你該從事什么娛樂,這有可能是你之前把你的興趣愛好告訴了它,它對你的愛好分類記憶,后續(xù)在知識庫里找到了相關(guān)信息并保存下來 。Siri有兩個(gè)記憶系統(tǒng):長期記憶系統(tǒng)和短期記憶系統(tǒng)來實(shí)現(xiàn)個(gè)性化交流的 。長期記憶系統(tǒng)存儲了用戶的名稱、居住地址以及歷史偏好信息,短期記憶系統(tǒng)則將最近一段時(shí)期內(nèi)Siri和用戶的對話記錄及GUI點(diǎn)選記錄等登記下來 。對照這兩個(gè)記憶系統(tǒng),Siri可以在你需要時(shí)提醒你 , 然后調(diào)用知識體系幫助你解決疑難問題 。
智能語音助理的原理框架圖
蘋果智能語音助手Siri初探 ?蘋果語音助手和siri區(qū)別

文章插圖
Siri與人工智能的最大區(qū)別在于其功能不夠強(qiáng)大,計(jì)算機(jī)認(rèn)知與人類認(rèn)知目前還有天壤之別 。Siri對具體事物的理解力非常狹窄,例如就餐、體育運(yùn)動、休閑娛樂、旅行天氣等 。因?yàn)楦鱾€(gè)領(lǐng)域都有其特定語匯,且數(shù)據(jù)庫、頁面都需要關(guān)聯(lián)描述,這些集合構(gòu)成了我們所說的"動態(tài)本體" 。
例如 , 就餐的動態(tài)本體包涵參觀數(shù)據(jù)庫 , 目前美國餐飲評論站點(diǎn)諸如Yelp 和 Zagat,其調(diào)用方式通過API實(shí)現(xiàn) , 這就牽涉相關(guān)語匯和行為模型 。當(dāng)我們決定下一餐時(shí),我們會說我們訂什么樣的席位、如何預(yù)訂、如何點(diǎn)菜,這些需要事先錄入用戶此前的訂餐日歷,調(diào)用此前的餐飲會話、點(diǎn)餐說詞及預(yù)訂流程等,這些事情都在動態(tài)本體內(nèi)有積累和儲存 。當(dāng)我們要再次點(diǎn)餐,Siri會識別用戶意愿,追蹤"業(yè)務(wù)編排單元"(SOC ) , 這個(gè)"單元"會識別外部業(yè)務(wù)以滿足用戶請求,包括業(yè)務(wù)理解、命令編譯、信息收集并分類 , 最終向用戶提供行動導(dǎo)引 。
例如,用戶說了:"我要去意大利餐館享用美食" , "業(yè)務(wù)編排單元"會在Yelp 和 Zagat網(wǎng)站上進(jìn)行檢索,然后告訴你兩英里內(nèi)的意大利飯館名錄、具體地點(diǎn)、價(jià)位,供你選擇 。當(dāng)你作出就餐決策后,業(yè)務(wù)API 接口程序會為你預(yù)訂餐位、點(diǎn)餐和叫出租車 。所有這些都通過你過往的就餐習(xí)慣,由業(yè)務(wù)API 接口程序執(zhí)行 。
動態(tài)本體原理框架圖(以就餐為例)
蘋果智能語音助手Siri初探 ?蘋果語音助手和siri區(qū)別

文章插圖
SIRI系統(tǒng)中的"業(yè)務(wù)編排單元"擁有一個(gè)工具,此工具可定位各類外部業(yè)務(wù) APIs來完成相應(yīng)行為 。動態(tài)本體自身也有一套系統(tǒng),這套系統(tǒng)記錄了多個(gè)領(lǐng)域里人類的活動,以備調(diào)用 。這兩套系統(tǒng)允許接入外部相關(guān)模塊、業(yè)務(wù)和數(shù)據(jù)庫,這樣一來 ,  人們往往會感覺Siri無所不能 。
3、語音處理執(zhí)行系統(tǒng) 。Siri的核心執(zhí)行組件包涵:語言闡釋器、會話流控制器、任務(wù)控制器和服務(wù)系統(tǒng)等 。所謂語言闡釋器,簡言之,就是把人語輸入,轉(zhuǎn)化為機(jī)器可理解的規(guī)范意思 , 因?yàn)槿苏Z輸入與機(jī)器語言存在一個(gè)巨大的天然鴻溝 , 要讓機(jī)器知道人語的微妙內(nèi)涵,需要有一套系統(tǒng)不厭其煩的向機(jī)器闡釋,否則機(jī)器不會做出理智的回應(yīng) 。會話流控制器是將語言闡釋并解析之后的結(jié)果傳遞至控制系統(tǒng),根據(jù)相關(guān)參數(shù)判定涉及領(lǐng)域,或向用戶索取具體參數(shù) 。而會話流控制器之后還會對任務(wù)控制器進(jìn)行調(diào)用 , 以確定回應(yīng)內(nèi)容 。會話流控制扮演著一個(gè)協(xié)調(diào)溝通者的角色 。任務(wù)流控制器是確定所要執(zhí)行任務(wù)的邊界參數(shù)和完成任務(wù)各個(gè)步驟的邏輯關(guān)系 。任務(wù)流控制器常常會構(gòu)建出一些任務(wù)模型,將抽象概念定義具體化 。服務(wù)系統(tǒng),Siri展現(xiàn)給用戶的是其所能提供的具體服務(wù) 。Siri中有三個(gè)子服務(wù)模塊:服務(wù)模塊,服務(wù)能力模型和多服務(wù)集成模塊 。服務(wù)模塊包含了可供Siri使用的各種信息,服務(wù)能力模塊儲備了具體服務(wù)內(nèi)容可調(diào)用服務(wù)類型的映射關(guān)系 。服務(wù)集成模塊的功能在于可調(diào)用另外兩個(gè)模塊提供給用戶的具體服務(wù)內(nèi)容 。有時(shí),一項(xiàng)服務(wù)會涉及多個(gè)子服務(wù),分別調(diào)用時(shí)無論在先后順序還是內(nèi)容上都存在邏輯依存關(guān)系,這類似于智能調(diào)度 。
4、輸出系統(tǒng) 。與計(jì)算機(jī)系統(tǒng)相類似,SIRI系統(tǒng)所將接納的語音或其它輸入進(jìn)行處理,最終將以為用戶習(xí)慣的方式輸送給用戶 。SIRI系統(tǒng)的輸出包括語音、文本、甚至電郵等多模態(tài)展現(xiàn)輸出,以完成最后一站工作 。
蘋果在其產(chǎn)品iPhone4S首先展現(xiàn)出的智能語音控制功能,使其產(chǎn)品變身為一個(gè)智能機(jī)器人 。之后 , 蘋果陸續(xù)發(fā)布了siri新功能 。智能語音是否會成為未來智能手機(jī)發(fā)展的主流方向還有待繼續(xù)跟蹤觀察 。
蘋果智能語音助手Siri初探 ?蘋果語音助手和siri區(qū)別

文章插圖
更多精彩文章,敬請關(guān)注 超天才網(wǎng)
或關(guān)注搜索公眾號 天財(cái)評論
旗下?lián)碛刑熵?cái)評論、天才創(chuàng)業(yè)、天才AI等垂直板塊,主要以超天才思想和視角,為企業(yè)家、創(chuàng)業(yè)者、職業(yè)經(jīng)理人等解讀全球財(cái)經(jīng)事件,培育企業(yè)萌芽與發(fā)現(xiàn)并購商機(jī),并以顧雛軍團(tuán)隊(duì)的商業(yè)智慧 , 培養(yǎng)具有遠(yuǎn)見卓識、能屹立于世界之林的企業(yè)家和職業(yè)經(jīng)理人隊(duì)伍 。
【蘋果智能語音助手Siri初探 ?蘋果語音助手和siri區(qū)別】,