9.最容易破解的難題(1 / 2)

方治強知道,自己提出的這個方法是一個相對而言正確的方法。在語音識別方面,純粹基於語音與結構語法的識別方式或許比較適用於英語法語德語之類的語言,因為那些語種的語法結構一直都是比較完善的,有一個經過數百年反復研究的語言研究成果為基礎,比較容易進行語音識別方面的數字化。而中文則不是,中文的體系太復雜了文言文與現代漢語之間的斷裂遠遠比英語中古英語與現代英語的區別來得劇烈。而日常使用中,哪怕是再現代的人,也會不自覺地使用一些古文中的字詞句乃至語法,中學生在學古文的過程中最頭痛的倒置,在日常使用中比比皆是,要怎么樣才能建立一個相對完整的語法結構,才能匹配起語音識別後的處理呢?而從語義和語用出發,以智能程序為核心,以常識判斷為依托,應該可以解決漢語的機器識別的問題。但是,這同樣是一個幾乎不可能完成的任務。語義和語用,並不是可以簡單地體系化的內容,而是一個有固有規律可循,卻千變萬化的系統。全中國不知道有多少研究語義與語用的語言學家,那么多年來似乎也沒什么大成果,那么,呂振羽是不是能做出自己的成果來?雖說,隨著大學體制的變更,那些語言學家里大多數都是糊弄著寫論文混資歷的人,但基礎知識卻還是很扎實的,而呂振羽在這方面可以說是一無所知,僅僅憑著基本市面上容易找到的語言學教程,無論如何是不夠的。

方治強說:「小呂,你給我個地址,回頭我給你送一些資料過去。」

「嗯,那就謝謝伯父了。」

又聊了一會,呂振羽就急著告辭了。方治強的方法對於其他人來說或許是個大難題,而對於現在已經有了小羽的呂振羽來說,算不上什么大問題。小羽的智能,已經完全能理解比較復雜的語言環境了,語義和語用的判斷對於小羽來說不是什么大問題,而掛在網上連續泡魔獸的經歷,則讓小羽學到了很多現代漢語中比較特別的表達方式,尤其是在年輕人中間比較流行的一些語言。按照方治強的說法,呂振羽要做的就是將語音系統直接和小羽現在的平台掛接上,現有的語音識別系統雖然不完善,但大致的框架是不錯的,而小羽的自主判斷和學習,將很快提升整個語音系統的識別能力。

「小羽,我把這個語音識別軟件的前端分拆了,語音輸入以後,自動輸出和讀音相對的漢字的數據,但是不再自動選擇,選擇什么字,怎么組合字詞句,怎么標點,這些都由你來完成。」

「明白。」將原理解釋給小羽聽了之後,小羽自主運算了將近4個小時後,同意了呂振羽的方案。而小羽也按照呂振羽的提議,將語音識別可能用到的模塊分離出來,將自己積累了很久的常識方面的積累剝離,只保留了基本的交流環境,而將專業知識模塊分割了開來。於是,這一次試運行的語音系統,雖然仍然是小羽自己在主導,但已經有了一個普通的語音識別系統的基本構架。對小羽來說,這沒有什么意義,但是對於呂振羽來說,只要證明了這樣一個基本構架是可行的,那么基於這樣一個基本構架的程序模塊,就可以逐漸實現,只有最核心的智能判別系統,可能會用到小羽的部分功能。

「試聽,第一次:一,二,三。」掛接之後,小羽提示開始試聽。

「試聽,第一次結果:一,二,三。」小羽的界面對話框里,打出了正確結果,雖然這未免太簡單了。

「試聽,第二次:秋天來了,天氣涼了,一群大雁往南飛。」