23.搶所有翻譯的飯碗(1 / 2)

呂振羽深深吸了一口氣,腦子里回響著在家里的電腦上模擬各種翻譯的成果。掌握了大量知識的小羽才能真正發揮語義和語用為平台的語音和新的全部功能。其實,翻譯軟件,嚴格地說只是語音平台的一個相當高級的插件而已,只不過,這個插件的功能之強大,會掩蓋住語音平台的光芒。

語音平台是一個內外兩層的大型程序,外部是語音的輸入和輸出,但真正關鍵的則是以智能核心為基礎的語義和語用判斷機制。而這個機制,同樣是一個兩層的結構,一層是語義和語用的甄別,另一層則是按照具體語用和語境,進行組織,從而生成具有相當強的可讀性的句子,而作為這一層功能的底子,仍然是非常主流的結構語法學。結構語法學是有缺陷的,比如,在中文里,很多具體例子都無法用結構語法學去套用。比如「春風又綠江南岸」的這個綠字,語文老師們都會說這個綠字用得好,有色彩也有動態,但是從語法學上來說呢?綠是形容詞,怎么就能做謂語呢?如果翻譯成英語,大概會是make江南岸green的詞組來表示,但中文里怎么解釋?現代漢語的語法是從歐洲對結構語法學的方法里脫胎而出的,而古文似乎從來不講究什么語法。於是,老師們或許會說,中文就可以這么用,而到了後來,有一種解釋很有趣,老師不說是主語謂語賓語,而是說占據主語位置占據謂語位置占據賓語位置。……這個解釋算是通順了,但對於程序員來說,如果沒有一個出色的判斷機制,是沒有辦法好好處理中文的翻譯問題的,而其他語種之間,尤其是拉丁語系的語種之間,這個問題簡單得多。結構語法學的慣例是主流,而例外相當少,至少,在日常使用的方面,例外相當少。文學……尤其是詩歌,那就沒辦法了。

呂振羽的翻譯軟件的機制很簡單,同樣調用語義和語用的判斷機制,將輸入的語音或者文本變成一個意義串,然後套用另一個語種的結構語法和詞庫,以這樣的方法來完成翻譯。這種翻譯,已經能比較良好地進行整句/全文翻譯,而最恐怖的功能,則是這個軟件能進行同聲口譯。設想一下,高級口譯證書是一個怎么樣恐怖的東西,而那還只是中文與英文之間的口譯,而呂振羽開發的這個基於語義和語用判斷的翻譯軟件,只要需要,幾乎可以進行任何語種之間的同聲口譯。

在開發這個軟件的最初產品的時候,呂振羽將所有適用結構語法學的編程全部交給了小羽,而自己專心研究特例的處理,這項工程開始了沒幾天,已經取得了相當讓人驚異的成果。小羽已經完成了數十種語言的結構語法學編程,對於小羽來說,這些工作只用了不到一個工作日。而呂振羽還在拼命研讀各個語種的教材和字典,目前,英語的特例補充包基本完成了,法語完成了一部分,而中文……由於特例實在太多,只好一邊分析一邊建立這個庫了。

呂振羽仍然是不緊不慢地將自己已經取得的成果說給大家聽,當然,隱去了小羽在其中的極為重要的作用。看到大家看著他的目光漸漸變得狂熱和崇拜,呂振羽的臉在發燒。

「你的這個軟件什么時候能完成?」路德坤熱切地問。他知道,這個軟件只要一問世,肯定會掀起一陣狂潮,困擾中國人,尤其是中國學生多年的外語問題一下子就會變得不重要了。世界上的任何一個人,與素昧平生的任何一個外國人交流,也將變得輕松簡單。當然,這都要這個軟件足夠完美,完美到不因為語種差異而產生誤解。

「工作量太大了,所以我今天提出來,准備交給實驗室繼續完成阿。」呂振羽苦笑道,這種重復性的工作,小羽也已經出手幫忙了,但一方面,語言方面的數據處理量極大,而另一方面,呂振羽作為一個個人,能獲得的語言資料也有限,根據他在市場上東奔西跑買來的各種資料構建的這個平台,肯定存在不少問題。