第一百四十二章 更多問題(1 / 2)

AK小說 www.06ak .com,最快更新賽博英雄傳最新章節!

向山大概聽明白了。

或者說,唯一讓向山懵逼了一瞬間的,也就是英格麗德舉出的那個例子。

他沒想到會在這種場合聽到這種……奇怪的例子。

但是,除此之外,好像並沒有什么更有價值的東西。

只能說,任何專業人士,在超出自己專業領域之後,就不比一般人更加智慧吧。

雖然在英格麗德眼中,這些外星人的書寫方式有趣極了,但歸根結底,這就是一種壓縮算法。

而這無法解釋向山現在在琢磨的問題。

「所有外星機械的設計圖紙、裝配工藝、材料制造的參數,再加上它們自身運行的ai,加在一塊,是如何壓縮到兩三百mb這個水平的」。

外星人使用了兩種壓縮算法。

一種大致可以稱作「字典算法」,即「將高頻出現的排列組合用,做成對應字典,然後用字典內編號代碼來替代該組合」。這種手段人類也在使用。當然,如果「字典」做得很大,那么數據本體就可以壓縮得很小。但有些時候,又會形成「字典比數據本體還要大」的情況。

外星人大概是選擇了一個恰好的數值,保證「本體+字典」的大小最小。

另外就是英格麗德所說的這種二維的符號矩陣。

但不管怎么樣,信息的無損壓縮一定是有極限的。

而這種二維矩陣的算法,不管外星人將讀取規則設計得怎樣花里胡哨,它都存在一個「上限」的。

就如英嘉所說,如果多增加一個「下一個終止/方向符號無效」的符號,固然可以增加讀取路線的數量,但是卻會導致符號之中混入大量除了表示「下一個終止/方向符號無效」之外沒有其他任何意義的符號,「字典」的集合之中也要增加項目。

「讀取路線」的增加,會導致「摻雜過多只與讀取規則有關的符號」以及「字典」的膨脹。

同字典算法一樣,到最後,同樣也會出現「讀取規則」大小大於數據本體大小的問題。

這里面同樣存在一個平衡點。

按照向山估計,關於讀取規則的符號可能也就那么幾個,不會太多。

而二維的符號矩陣也存在另一個問題。就好像「填字游戲」一樣,一個空間坐標上的符號,要受到來自四個方向內容的制約。這反而使得信息的表達不像一維的文字那樣自由。

「就用你舉的例子來說吧……」向山是如此說的:「雖然那個古代詩人在八百四十字里面壓縮了七千九百五十八首詩,但是我敢肯定,這七千九百、將盡八千首的詩,單獨拆出來的話,沒有一首可以流傳千古吧,說不定還存在那個什么……格律啊韻腳不那么工整的情況。」

英格麗德有些好奇:「你看上去好像是剛剛才知道這玩意的……」

「如果那個文字游戲里面拆出來的詩足夠優秀的話,肯定會上課本。那我肯定會有印象。」向山在這一點上倒是非常確信:「仔細一想,古代多半沒有標點符號,斷句也得後人來猜……」

英格麗德捂臉:「我猜你想說『句讀』。」

向山無視了英格麗德的提示:「你看,從這一點來看,這種文字游戲,對信息的壓縮,損失很大,效率也就那樣。它甚至不是『壓縮任意八千首詩』,以壓縮算法的標注來看……嘶……」

向山好像意識到了什么……

——不是「壓縮了任意八千首」……不一定是壓縮……