一種新的檔案交換方法可以將下載速度提高到比流行的 BitTorrent 服務快三倍。卡內基梅隆大學、普渡大學和英特爾研究院的計算機科學家在上個月概述和演示了這種方法,它將允許尋求特定標題的檔案交換者從相似但不一定相同的檔案中下載部分內容。它有點像一位進取的機械師,他使用豐田的備件來修理舊福特。這個想法已經引起了商業內容分發公司的興趣,以及線上點對點社群的非正式討論。
CacheLogic 的首席技術官安德魯·帕克說:“這非常有道理”,該公司合法地線上分發電影和遊戲檔案。他補充說,該公司一直在獨立研究一個“非常相似”的概念。
隨著高畫質線上影片即將到來,加速下載和緩解網路流量的提議越來越受歡迎。充斥著影片、遊戲和音樂的檔案交換網路可以為更廣泛的網路提供一個真實的實驗室,從中吸取教訓。
關於支援科學新聞報道
如果您喜歡這篇文章,請考慮透過以下方式支援我們屢獲殊榮的新聞報道 訂閱。 透過購買訂閱,您正在幫助確保關於塑造我們今天世界的發現和想法的有影響力的故事的未來。
在追求速度的過程中,大多數現代點對點系統將檔案(例如,《無間道》的副本)分解成數千個塊,並允許單獨交換這些單獨的元件。例如,這允許只下載了半部電影的人充當該部分內容的輔助來源。
然而,許多檔案仍然可能需要數天才能下載,因為原始來源離線,或者來源的上行頻寬阻塞。
為了解決這個問題,卡內基梅隆大學的大衛·安德森和他的同事們推斷,今天線上的許多檔案實際上是近乎重複的檔案,只有細微的差異——標籤不同的相同歌曲、不同語言的電影或同一軟體程式的不同版本等等。
為了測試這一點,他們下載了他們能找到的 26 首歌曲和 26 部電影的所有版本,總共超過 6,000 個媒體檔案。他們發現,同一首歌的不同版本最終共享了大約 99% 的相同內容,而同一部電影的不同版本平均重疊了 15%。
為了使這些共享內容可以訪問,該團隊建立了一個“手印”系統,這是一種基於檔案確切內容的獨特數字識別符號。與通常用於識別或驗證文件的更傳統的數字“指紋”不同,該系統還允許快速比較有限數量的單個塊,如果發現相同,則可以交換這些塊。
每個手印都可以被認為是一串數字,不同的部分對應於不同的資料塊。因此,如果《無間道》的手印是“12 14 16 18 24”,而它的西班牙語翻譯《Los Infiltrados》產生了“13 15 17 18 24”,那麼第二個檔案就可以用作某些內容的來源。例如,沒有對話的場景在兩個語言版本中可能是相同的。
該團隊的名為“相似性增強傳輸 (SET)”的原型測試發現,當從相似和相同的檔案中透過 DSL 速度連線提取內容時,它比 BitTorrent 快三倍,電影檔案快約 30%。然而,如果已經有很多相同的副本可用,那麼優勢就會消失,使其可能對“那裡一半的內容”有用,安德森說。
這個概念可能很難新增到現有的檔案交換網路中,因為它的檔案分割方法可能會使啟用 SET 的更新與今天早期版本的交換軟體不相容。儘管如此,這個想法正在點對點論壇和郵件列表中被廣泛討論。帕克說,SET 或類似的東西“肯定”會在不久的將來進入 CacheLogic 的工具箱。
安德森說,他對將其商業化不感興趣。他和他的同事們釋出了詳細的技術規範和原型程式碼,並鼓勵其他開發人員借鑑這項技術。
安德森說:“我希望其他人會拿走並免費使用它。我真的希望看到它在那裡並被使用。”