互聯網信息分發簡明史

不懂技術怎么做產品?15天在線學習,補齊產品經理必備技術知識,再也不被開發忽悠。了解一下>

這是關于互聯網過去和現在的一個思考。

01 互聯網與世界的比特鏡像

我曾經和很多朋友探討過一個很樸素的問題,在你的眼中,互聯網是什么?

要回答這個問題,必須先回答另一個問題,互聯網為什么而出現?

在我看來,這個世界是由三個要素構成的,也即是:物質、能量、信息。那么什么是信息呢?

按照信息學祖師爺CE Shannon在《信息論》里給的定義,信息是對事物的運動狀態與存在方式不確定的描述

人類獲取信息的過程就是消除不確定性的過程。因為描述信息混亂與不確定性的概念是“信息熵”,所以你也可以把人類獲取信息的的這個過程看做是一個“信息熵減”的過程。

二元信源的信息熵

換成人話說就是:獲取信息能夠讓你從“不明白”到“明白了”

人類為了在這個世界生存下來,我們的基因把我們“設計”成了一個高效的信息獲取與處理信息的系統。比如我們(或者說所有的靈長類)進化出了色彩識別的能力,我們的眼球能夠識別380~780nm波段范圍的光譜,這讓我們擁有可以通過色彩分辨食物,尋找掩體,感知危險的能力。

當然,這還只是非常基礎的信息獲取能力,在人類數百萬年的演化過程中,為了滿足我們社會組織的需要,我們進化出了更復雜高級的對抽象信息的獲取與理解的能力,這也就是對文字、圖畫、音樂等信息的處理能力。

簡單說,獲取信息對我們很重要,但這和互聯網又有什么關系呢?

這里我們還需要理解兩個概念,一個是信號,一個是信道

信息的傳遞

信息發布者(信源)發布了一個信息,這個信息以某些物理介質承載(這就是信號),通過媒介傳遞了出去(這就是信道),被信息的接受者接收(信宿)。

舉個栗子就是,你說了一句話(這句話包含的就是信息),這句話轉化成了音波信號,通過空氣這個信道媒介傳到了我這里,被我聽到了,這就是個信息傳遞的過程。這個過程里,信道中會有“噪音”,噪音會干擾信號,信息傳遞就會出現偏差,最后甚至會導致信息傳遞失敗。所以不同的信號承載形式和不同的信道會有相對的信息傳遞的物理極限。比如你在1公里外說了一句話,我可能就聽不到了。

因此信號能夠不受干擾的傳遞距離對我們能維系多大的社會組織的效率產生了很大的影響。

所以為了最大程度的保存信號不受干擾,盡可能遠距離的傳遞/獲取信息,我們人類發明了各種科技。而迄今為止,傳遞信息的最先進的科技工具是“互聯網”

以上內容,如果你在大學本科讀過信息學的話,基本上第一課就講這個。

但如果只理解到工具的層面,我們對互聯網的理解就不夠深刻。因為互聯網傳遞信息的時候,不是單向的傳遞,實際上,互聯網保留了現實世界的讓每個人發布和獲取信息的能力,因此互聯網形成了一個“網絡”。這個網絡在盡可能的提取這個世界上已知的所有具象客觀的和抽象主觀的信息,把這些信息映射到互聯網上,然后以電信號(光速)傳遞這些信息。

所以,我經常說,互聯網是現實世界的比特(BIT,信息的單位)鏡像

而且這個比特鏡像上信息是以“光速”運轉傳遞的。

S=VT

我們都知道這個簡單的公式,意思就是距離=速度*時間。簡單說就是,如果信息被以光速的速度在傳遞,那么在同樣的時間里,我們獲取信息的半徑距離就非常長。長到什么程度呢?你肯定聽過“地球村”這個概念,在互聯網剛傳進中國的那十年里,人們特別喜歡說這個概念。雖然有點土,但這句話確實很形象。地球變成了個村。

一開始這挺好的,我們獲取信息的半徑擴大了,我們用計算機和互聯網完成了一次“進化”。但我們其實不一定能夠習慣這種變化,因為人類面對的環境從文明誕生的1萬年來,第一次從“信息匱乏”變成了“信息過載”。

實際上互聯網的發展過程,我們可以梳理出兩個主脈絡,分別是:

  1. 網絡上的信息越來越多;
  2. 上網的人越來越多

而這兩條主脈絡本身又互相促進構成了一個閉環,也就是越來越多的人上網制造、發布、卷入了越來越多的信息到互聯網上,互聯網上的信息越來越多也吸引越來越多的人去使用它。

我們都知道,到2019年的時候,全球的網民的數量大概正好是40億出頭點,其中大概有不到9億是中國網民。那么你知道互聯網上一共有多少信息嗎?

數據來源:IDC,2017年《數據時代2025》白皮書

2017年的時候IDC(國際數據公司)做過一次研究,他們估計當時互聯網上的信息大概20多個ZB(1ZB=1萬億GB),當時預測這個數據到2019年大概會翻一倍,達到40個ZB。

2019年的全球數據量

所以粗略計算一下,每個網民理論上平均被分配到1ZB的信息。當然,實際情況并不是平均主義,這里只是便于理解。我只想說,即便我們行使這樣的平均主義,你依舊沒可能在你短暫的一生里,把這些信息都完整的接受一遍。

更何況,在可以被重復消費的信息海洋里,實際情況是今天的你終其一生需要在40ZB的信息海域里找的,不過是需要的那幾十個TB而已。

你能獲取的信息超過了你能處理的信息的上限,這就是信息過載。

互聯網的先驅其實很早就意識到這個問題了。

世界上第一個網站

http://info.cern.ch/hypertext/WWW/TheProject.html

萬維網(WWW)之父Tim Berners-Lee在發明萬維網的同時,也發布了世界上第一個網站,這個網站用超文本(hypertext)技術把CERN(歐洲核子研究中心)各個實驗室連接起來,因為用了超文本(也就是后來的鏈接),所以人們可以方便的瀏覽聚合的信息。

1991年8月6日Tim Berners-Lee公開了這個項目,這一天也被認為是萬維網的誕生。這個網站介紹了超文本的規范、網站的建站細節、瀏覽器的安裝使用等信息,后來這個網站還收錄了一些其他的網站范例,所以也被認為是世界上第一個網站目錄。

也是從這一天起,每個接入萬維網的人(或者說,你熟悉的因特網),都有獲得了建立一個屬于自己的圖形化的網站和對應的http網址的權力。然后采用更自然的拼寫的http網址,已經比之前的FTP地址要容易訪問的多。

當然,在萬維網誕生的時代,盡管Tim Berners-Lee已經試著去做一些萬維網站的目錄工作,但http網址在后來發生如此巨大的爆炸式增長,以至于這個工作顯然已經需要專門的機構來服務。所以從那個時代開始,互聯網信息分發漫漫之路就被開啟了。

我們大概可以把互聯網信息分發的模式按照其主導的信息分發的模式流行的時期大致劃分成四個時代:

  1. 分類索引-門戶時代;
  2. 搜索引擎-搜索時代;
  3. 訂閱關注-SNS時代;
  4. 推薦算法-Feed時代;

在這四個時代以外還并行了一個長期存在的“高熱更新-社區熱帖”模式(這個模式在國內因為百度貼吧在搜索時代的崛起,一度也成為了非常重要的一種信息分發模式)。

有必要注意的是,以上的這些時代所誕生的信息分發模式,大多都隨著相應的技術變革應用所產生,而背后又都伴隨了商業模式的徹底升級革新而興起主導了一個網絡時代

這些信息分發模式的演化塑造了不同時代的互聯網巨頭。不過這些模式也并非完全的先后替代,更多的是新的信息分發模式向下兼容了早期的模式,然后通過商業模式的創新,后者主導的企業把前輩按在了地上摩擦(至少也是某種程度上的打破了前輩的領導者地位)。

02 分類索引-門戶時代& 搜索引擎-搜索時代

雖然BBS論壇和搜索引擎技術誕生的時間都要比萬維網誕生還早一些,但基于生產力的應用需要適應時代的發展的客觀規律,萬維網誕生初期,主導網絡世界信息分發的并不是搜索引擎技術和BBS論壇,而是基于超文本技術的分類索引。

盡管第一個互聯網分類索引服務并不是Yahoo,不過最知名與成功的案例確實是它。

1994年第一版的Yahoo!

這個由華裔企業家楊致遠創立的網站,用高效的管理、激進的市場策略,在上世紀90年代中期快速擊敗了他的主要對手成為了全球最重要的網絡門戶(沒錯,國內曾經所謂的四大門戶——新浪、搜狐、網易、騰訊,最初都是Yahoo!的copycat)。而所謂“門戶”這個概念,對于現在的年輕人可能有些陌生,但對于當時的人來說,這個詞匯很形象的描繪了,這是大多數人上網的第一步。

今天的人可能很難想象,在25年前萬維網剛誕生不久沒有搜索引擎的年代,如果人們要尋找什么“信息”,人們該如何開始開始。所以Yahoo!這個由手工歸納分類,手工錄入搜集的分類檢索目錄網站,就是你能最快捷發現又有什么新的網站出現在互聯網上的地方。

你可以把這類網站看做“黃頁”(收錄工商企業電話號碼的號碼簿),或者從某種程度上說,Yahoo!就是網絡黃頁(馬云最早想做網絡黃頁,后來又拿了楊致遠的投資,不是毫無理由的)。

人類的想象力并不是無中生有的。我們總是會基于已有的一些事物,結合一些變化的趨勢,對未來的做一些猜想。對于從未見過當今這個未來的人來說,把聚合所有網址信息的網站,參照已經存在的電話黃頁,“擬物化”的設計產品,是再合理不過的事情。

而Yahoo!的商業模式可以說非常粗暴簡單,就是販賣廣告,準確的說是販賣網站上的banner廣告。

1997年的Yahoo!搜索框上方明顯的汽車banner廣告

當時的Yahoo!想要增加收入,方法也很簡單,就是在首頁上(包括后來的各個索引目錄頁面的大分類頁面)上增加banner廣告位(增加Ad Loads),同時把單個廣告賣的更昂貴(提升Ad Price),為此Yahoo!愿意給廣告銷售極高的提成,同時大量投放市場廣告,以此激勵銷售與教育廣告主。

2002年的Yahoo!首頁上一堆廣告banner

早期的Yahoo!在做分類索引的信息分發模式大成功之后,快速進化了產品的形態,首先在1995年加入了搜索功能,不過這個搜索和后來的搜索引擎還不太一樣,主要是用來做分類檢索的快捷搜索的,搜索出來的結果往往直接指向某個網址(這個細節待會兒在講搜索引擎時格外重要)。

然后96年Yahoo!又開始了郵箱服務,再然后是把業務觸角擴張到了新聞資訊服務(這項服務等于對標了傳媒報紙的業務)。

作為當時全球最大的互聯網門戶、網絡目錄、電子郵箱和新聞資訊網站,伴隨快速增長的全球網民數量,雅虎市值一度超過1000億美金,以至于在今天的Google和中國的四大門戶身上,總有Yahoo!的既視感。

然后,在未來終結門戶時代的搜索引擎登場了。

嚴格的說,搜索引擎技術誕生的要比萬維網還早一年,現代搜索引擎的前身是誕生于90年的Archie,一種通過文件名從FTP主機中查找文件的技術。而到了1994年,第一款現代意義上的使用了蜘蛛爬蟲技術的搜索引擎Lycos誕生了(Lycos這個詞就是一種狼蛛的名字)。4年后,我們熟悉的Google也誕生了。

這些搜索引擎和分類索引的門戶最初的差異就是獲取網絡信息的方式不同。分類索引用人工錄入的方式,而搜索引擎則使用蜘蛛爬蟲程序全自動的爬取信息

另外,人工分類的目錄主要收錄的是網址,而蜘蛛爬蟲爬取的可以是每個具體的網頁。對于使用者來說,前者需要進入網站自己繼續找信息,后者可以一步到位,方便快捷。

顯而易見的,搜索引擎獲取網絡信息的效率要比分類索引高得多。那么為什么一開始人們并不那么愛用搜索引擎呢?因為早期的搜索引擎雖然可以爬到很多東西,但在大量的相關結果中,搜索引擎并不能準確的“猜到”哪個才是你要的結果。

Google之所以快速崛起的原因不僅僅因為他們孜孜不倦的快速爬取網頁或者是產品的簡潔設計。早期的勝負手來自Google創造性的重新定義了搜索結果的排序方式

Google的兩位創始人之一,Larry Page發明了PageRank算法——通過指向網頁的鏈接數量來衡量一個網頁的價值。Google在搜索結果的優化上發力,這讓他們獨樹一幟。

實際上包括PageRank算法和后來他們不斷加入的Hilitop算法、HITS算法、TrustRank算法以及用來處理一些不良網頁的SandBox(沙盒)等等技術,讓Google成為了2000年左右,最關注的信息分發效率的公司。

不過早期的Google雖然技術先進,但是作為一家技術公司,他們暫時還不能和擁有海量用戶和巨量現金的Yahoo!直接正面對抗。實際上他們不僅沒有對抗,Google在2002年-2004年甚至是Yahoo!搜索技術的獨家外包。采用了Google技術的Yahoo!的體驗迅速提升,點擊量飛速增長,巨頭Yahoo!樂得前仰后合,完全沒意識到這個小老弟未來成了自己的掘墓人。

作為Yahoo!的迷弟,Google的Larry Page曾經一度想把Google的前身BackRub賣給Yahoo!,而到2002年,Yahoo!也曾經試圖花30億美金收購Google,如果不是因為Google還價到50億美元,Yahoo!嫌貴放棄了這筆交易,世界互聯網史幾乎改寫(這樣的故事在互聯網真的不斷在上演)。

98年第一版的Google!模仿Yahoo!也有個感嘆號

Google早期團隊照片

真正讓Google完成對Yahoo!超越的是創新商業模式AdWords(關鍵詞廣告)。Google讓每個被搜索的關鍵詞都成為了潛在的廣告載體,讓每個搜索結果頁面都成為了廣告收入的來源。

我們前面說了,互聯網信息分發時代的王朝更替,主要是圍繞兩個因素:

  1. 信息分發技術應用的進步;
  2. 商業模式的革命性升級;

在Yahoo!,廣告最初是按照版面瀏覽熱度的banner位置熱度在賣的。這個商業模式其實和賣電話黃頁簿的廣告,或者和賣報紙廣告沒什么區別。賣廣告的收入上限主要取決于用戶能訪問多少個頁面,不同頁面的熱度決定了價格水平。

為了多賣廣告,就得在最好的位置加廣告區。而首頁就是最好的位置,這就會為什么所有的早期門戶網站的首頁看起來就像是寸土寸金的市中心一樣擁擠不堪。

然后為了進一步的增加廣告收入,每個廣告位縮短廣告的播放時間,加上輪播的廣告次數,再按照廣告位置的熱度,讓銷售把黃金廣告位置和時段的價格炒上去,這樣又和賣電視廣告差不多了。

在那個時代這已經能為Yahoo!賺到相當多的錢。但Google完全打破了這種商業模式。

AdWords的創新來自兩個方面:

  1. 全新的計價模式;
  2. 全新的廣告位設計;

Adwords計價方式是按照用戶搜索關鍵詞后,點擊搜索結果來計算廣告收益的(也就是大名鼎鼎的CPC計價)。這樣一來,廣告的投放效果變得可靠可監測,而單次支付的價格又非常低,讓投放廣告的策略變得非常靈活,這讓那些支付不起巨額廣告費的小型企業有了投放互聯網廣告的機會

而Adwords的廣告位不再是一個個亂入的廣告貼圖和彈窗,而是直接融合在搜索的結果里,這讓廣告的轉化效率得到了質的飛躍,讓廣告主萬分滿意。同時改變了廣告載體,廣告位的數量再也不和門戶網站的頁面數量掛鉤,世界上有多少個詞,理論上就有多少個詞的對應頁面的廣告位。

Google能賺多少錢,完全取決于用戶會用Google搜索多少次,而用戶搜索Google多少次又完全取決于Google搜索的體驗有多好,這樣一來廣告收入的模式和產品體驗不再是對立關系,而是完全一致的閉環。

2004年Yahoo!宣布與Google斷絕合作關系,兩者全面開戰。在搜索業務上Google完全碾壓的Yahoo!,然后Google推出了Gmail郵箱服務對抗Yahoo!的郵箱服務。技術全面領先的Google很快就把Yahoo!拋到身后,盡管財大氣粗的Yahoo!買了一大堆的互聯網公司組成了集團軍,但結果看毫無茶葉蛋用。如果不是當年Yahoo!在鼎盛時期投資了阿里巴巴,這個公司甚至會更早退出我們的視線。

就在人們以為互聯網信息分發的戰爭在這里就要告一段落的時候。新的模式又來了。

03 訂閱關注-SNS時代

2004年,Google大戰Yahoo!難解難分的時候,忽然在美國,有人提出了一個全新的概念——Web2.0。意思是第二代互聯網,第二代互聯網和第一代互聯網最大的區別是,Web1.0是由網絡信息服務商主導提供信息服務,而在Web2.0時代,會由用戶主導提供產品服務

說實話這個概念其實挺模糊也挺不靠譜的,但在2004年左右,真的誕生了基于這樣理念設計的全新一代互聯網產品,其中很多款產品在今天已經被廣泛熟知:Myspace(2003年9月)、Facebook(2004年2月)、flickr(2004年2月)、Reddit(2005年)、Google Reader(2005年)、YouTube(2005年12月)、twitter(2006年3月)、tumblr(2007年)等等等等。

這些信息服務產品的擁有一個共同的特征就是UGC(User Generated Content 用戶生成內容)。2004年左右,全球互聯網用戶的數量大概達到了8億左右。伴隨大量的互聯網用戶的接入,互聯網信息的產生正在面臨一次底層變革。

最早互聯網用戶主要是單向的獲取信息服務為主,但隨著網絡接入的用戶數增加和網絡帶寬的提升,互聯網開始能夠提供更多的服務了。

最早的BBS衍生出來的社區論壇,每個人都可以建立自己的個人主頁(沒錯,最早就是個人站的變種,個人homepage),可以分享喜愛圖片的網絡相冊服務,可以分享自己拍的沙雕視頻的網絡錄像廳……

互聯網開始轉變成更接近這個詞原教旨的含義——連接人與人,然后再瀏覽個人發布的信息。

因為信息的發布方式發生了根本的轉變,信息分發的方式也必須隨之改變。在Web1.0時代,接入互聯網獲取信息的最短路徑是通過聚合信息的門戶或者搜索引擎,而現在,用戶多了一個選擇——通過訂閱/關注的用戶列表

不管是接近媒體形態的門戶網站還是接近工具形態的搜索引擎,當用戶使用他們的時候,都是透過一個中介來獲取信息,而直接訂閱可以讓用戶越過信息的中介,直接從信息源頭獲取信息。

我們先講講信息的分發方式的變化,那就是RSS。

1999年,一種基于XML的全新協議RSS被開發了出來,最初這個協議代表的是RDF(Resource Description Framework,描述資源格式框架) Site Summary,也就是RDF站點摘要——一種可以把符合RDF規則描述的網站最新摘要推送給用戶的技術。

而后發明該協議的網景公司(Netscape,網景瀏覽器)把RDF語句格式拿掉了,這個技術進而變成了Rich Site Summary(富集站點摘要),也就是允許網站向用戶推送網站摘要的技術。

之后美國的互聯網用戶開始逐漸流行在個人網站上寫Weblog(網絡日志),或者換成我們更熟悉的一個名字,Blog——博客。當Blog遇到RSS技術,一種全新的訂閱服務就產生了——RSS集合閱讀器。

不同于之前的門戶和搜索,RSS閱讀器是完全個性化的,用戶會讀到什么完全由用戶的訂閱列表決定,這個設計是劃時代的。

國內用戶最熟悉的Google Reader

同時另一方面,在信息的發布方式一側,雖然當時已經有了向Wordpress這樣的快捷Blog建站工具,但是對于普通人來說,建立一個網站依舊是一件有些門檻的事情。

那么有沒有一款能夠滿足既能擁有屬于自己個人網頁,又不用搞懂技術建設一個個人網站的產品呢?于是在2002年,誕生了最早的個人主頁產品Friendster,這個產品也是世界上第一個社交網絡服務(SNS,Social Network Service)。

Friendster很快遭遇了自己最大的競爭對手——MySpace,并且在與MySpace的競爭中敗下陣來,盡管MySpace誕生之初是個像素級復刻Friendster的產品。最初的原因只是因為MySpace因為一個bug,允許用戶修改前端UI的HTML,因此用戶可以自定義自己的個人主頁的色彩、墻紙和背景。

這個“功能”受到大量青少年用戶的喜愛,因此瞬間成為爆款(沒錯,QQ空間就是MySpace的copycat)。然后在MySpace持續高速的產品與技術迭代下,孱弱的Friendster被打出了美國市場,而專注于服務海外市場(Friendster一度是東南亞最流行的SNS)。

不過MySpace也沒有機會笑太久,我們都知道,世界上最大的SNS——Facebook在2004年誕生。不過剛誕生的Facebook并沒有比Myspace更有太多優勢。實際上恰恰相反,當年的MySpace更潮更酷,總部設在洛杉磯好萊塢的MySpace更像流行文化的風向標(其實以當時人的眼光看,MySpce更有點2017年的抖音的感覺,而且起點歷程都很像)。

很多人都認為MySpace大戰Facebook,最后會敗下陣來和2005年他們的母公司Intermix被出售給了默多克的新聞集團有重大關聯。這個觀點或多或少有幾分道理,但如果我們深究的話,可能Facebook自己的努力是更主要的原因。

Facebook和MySpace組織分發社交信息的方式不一樣,Facebook在2006年上線了一個全新的功能:Newsfeed。這個功能當初的中文翻譯被叫做好友動態,不過隨著這個功能的進化,現在有個更出名的叫法——信息流(早期的信息流和今天的信息流差別其實很大,這點在后面會展開講)。

但發明這個“信息流”功能的其實并不是Facebook,而是twitter(雖然twitter自己最早可能都沒意識到)。前面講到,RSS做了訂閱功能,允許用戶訂閱blog列表查看blog的更新,而誕生在更晚一些2006年的twitter把這個設計更進一步,直接越過了“訂閱列表”的設計,直接在twitter站內實現了發布、訂閱信息、轉載信息的完整閉環。

信息的呈現形式是被限定在140字內的長度(因為足夠短,才能方便用戶閱讀和發布),并且按照時間順序(timeline),直接呈現訂閱信息流,用戶閱讀到什么同樣完全由用戶來決定,這就是最早的“信息流”設計的由來。

另外當時除了改造信息分發模式的設計創新,還有一些人因為帶寬提升,開始對信息發布的媒介做升級,其中包括做圖片分享的flickr和做視頻分享的YouTube。

這些SNS和訂閱關注服務對像Google這樣的搜索引擎產生最大的威脅來自Google沒有辦法像以前那樣方便的抓取網頁的內容了。如果我們把信息看做一個水,那么這些SNS和圖片、視頻分享站點就是蓄水池,而Google這樣的搜索引擎就是運水站。如果上游每有一個蓄水池把給運水站的輸送管道切斷,運水站就會失去一些價值

早年的商業網站自己沒有流量,服務也不高頻,每次服務用戶都會需要從搜索引擎走,但是像SNS這樣自己站內閉環擁有大量UGC動態信息的網站,用戶幾乎每天都要登錄,幾乎完全可以擺脫外部送水站的流量導入。對Google來說,流量賣給Facebook幾乎變成了一桿子買賣。而且新增的互聯網信息都在這些蓄水池的內容,如果Google不能夠想辦法掌控一些蓄水池,未來甚至很難說他們和Facebook之間,誰的話語權更大。

這件事直接導致了Google停掉了Google Reader業務,轉而全力研發Google+(Google自己的社交平臺,這件事看起來非常像騰訊當年做騰訊微博或者今天做微視)。以及不惜以巨資收購并且又連續十年補貼巨額虧損的YouTube(當今世界Top3的蓄水池)。

不過對搜索引擎的好消息可能是,在訂閱關注-SNS時代,雖然像SNS這樣的新玩家開始掌握增量信息的話語權,但是在商業模式的創新上,初生的他們還非常孱弱,創新不足。在商業模式上,SNS或者social media依舊采用廣告模式,但是他們在分發廣告的效率上,完全沒法和搜索引擎比,畢竟廣告也是一種信息。而搜索引擎的商業模式實在太先進了。當時的SNS和Social media除了使用時長完爆搜索引擎,在商業相關的數據上,完全沒有優勢。

這就是訂閱關注-SNS時代的這些新貴只沖擊了一些垂垂老矣的門戶新聞站和顛覆了傳統非互聯網媒體行業更多一些。搜索引擎的商業基本盤完全沒有撼動。

不過使用時長的優勢也給新貴們留下曙光,直到全新的時代來臨,新的大殺器被研究了出來。

04 推薦算法-Feed時代

現在的我們都知道,新的大殺器就是:推薦算法。不過應該出乎很多人的意料之外,這個大殺器其實相對它大殺四方的時代,并不能算多新的技術

所謂推薦算法這個東西,本質上就是“向用戶推薦信息的算法”。之前就說過,Google搞出了PageRank這樣一個排序算法,來分辨哪些網頁的價值更大,這本質上就是一個廣義的“推薦算法”,因為Google會把他們認為價值更大的的網頁排在搜索結果的前列,推薦給用戶。

而目前最流行的“協同過濾算法”其實早在90年代就誕生了,Amazon很早就在使用協同過濾算法,而當下使用基于“內容”的協同過濾算法大概是在2003年開始被Amazon使用的(當然,Amazon當時主要是基于“商品”做協同過濾,對推薦系統發展有興趣的朋友,推薦閱讀《推薦系統實踐》一書,作者項亮)。

要說推薦算法-信息流時代是怎么崛起的,還要從在2006年說起。

Facebook發布了全新功能NewsFeed,而最初的NewsFeed,就配備了“推薦算法”,當時的算法叫EdgeRank,最初的算法非常糙只是對不同內容類型做一些簡單的加權,但是隨著時間的推移,Facebook開始不斷優化他們的算法,比如采用更復雜的計算維度和加入機器學習,當時Facebook還抄襲社交網站Friendfeed的點贊設計(贊的設計對推薦算法來說是個劃時代的設計,有了贊機器學習的算法才有判斷推薦滿意度的重要參照物。當然最后Facebook09年收購了Friendfeed,抹除了各種意義上的威脅)。

被推薦算法加持的Newsfeed變得越來越好用,用戶不再按照單純的訂閱維度來消費信息。于是該功能上線不到兩年時間,Facebook就從日活躍用戶不到Myspace的一半迅速在活躍用戶的數據上迅速超越了Myspace。這是推薦算法第一次在信息分發中展現其驚人的威力。

于是最先進的互聯網信息公司都開始配置推薦算法這個武器。不管是YouTube、Twitter甚至做長視頻的Netflix。推薦算法一下子成為了當時互聯網產品的必備功能。此時的推薦算法-信息流,還只是一個附屬于產品的一個功能,完全基于圍繞推薦算法-信息流設計的產品這個時候還沒降臨。

說起推薦算法和信息流,其實feed這個詞被翻譯成流是一件非常奇怪的事情。雖然用“流”來形容feed確實挺形象的。

不過我查閱材料的時候發現,我的朋友潘亂的公眾號亂翻書上曾經記錄過一件事情,就是早在扎克伯格創立Facebook之前,他和他的同學德安杰洛(Facebook CTO,Qura創始人)一起寫了一款使用推薦算法的音樂播放器,然后為這個個性化推薦算法申請了一個專利,當時在專利申請文件中,他們用了Stream來稱呼這個算法輸出的推薦結果串。而Stream這個詞直譯就是“流”

有了推薦算法,信息流革新商業模式,甚至成為能夠獨立存在的產品形態,建立一個全新的時代只差一步之遙。這一步的啟發來自Pinterest。Pinterest誕生在2010年,它是一款圖片分享工具,誕生的時代移動互聯網即將進入全面爆發,盡管當時Pinterest還是一款網頁產品。

Pinterest和他的前輩flickr最大的不同有兩點:

  1. flickr的圖片主要來自用戶上傳,然后讓用戶分享、轉發和評論;而Pinterest的圖片除了來自用上傳,他們還會使用蜘蛛爬蟲爬取網絡上的圖片,然后通過標簽分類把圖片進行識別過濾分類(Pinterest最大的爬取源就是flickr);
  2. Pinterest呈現結果的頁面是采用了一個向下滾動無限加載的不用翻頁的交互設計,在中國國內人們管這個設計叫“瀑布流”(infinite scrolling)。

Pinterest的瀑布流設計成為了后來的圖片網站的標配

前者讓Pinterest擁有遠多于flickr的圖片儲備,而后者為之后的移動時代信息流產品的做了一個劃時代的設計范本

我曾經在2018年寫的《Gamification淺析》一文當中詳細闡述過推薦算法+無限瀑布流設計如何啟動人類的“斯金納強化”,使人進入“心流”狀態。而這個設計在加上一點點創新,就開啟了推薦算法-信息流模式能夠對抗搜索引擎的商業模式。

可以由推薦算法+無限瀑布流設計激發的心流

搜索引擎的理論廣告位的理論上限雖然非常高,但是搜索引擎有個致命缺陷,那就是一個人使用搜索引擎的次數其實非常有限。這個限制是由“人能清楚的知道多少自己不知道什么”決定的。

這句話聽起來有點繞,展開說就是,人必須知道自己現在要找什么,然后要找的這個信息,還得是自己不知道的,人才會有機會去使用搜索引擎。

換句話說,搜索引擎的使用場景就像詞典(Google在二級市場上的傘形公司殼公司也確實叫Alphabet,意思就是詞典),人查閱詞典和百科全書的機會和無所事事的時間比,實在是太微不足道了。

采用完全主動出擊思路的推薦算法型產品,是專門設計給用戶不知道自己應該找什么的場景使用的。也就是說,這個解決方案在分發長尾信息的效率不上,要比精確的搜索引擎高出好幾個數量級。

而采用這個設計最早最出名的互聯網信息產品,應該就是今日頭條了。這可能也是中國互聯網產品在這整個互聯網信息分發史當中,第一次有在產品理念的先進性上領先美國的案例。這款產品的誕生可能也是中美互聯網copy to China到copy from China的分水嶺,是中國互聯網綜合創新力的一種具象展現

在推薦算法時代,中國擺脫Copycat的位置

這里我們還要明確一件事情,很多人會把推薦算法當做推薦算法-信息流類產品的唯一能力。這種認知實際上是有很大問題的。

就像我前文說的,互聯網信息分發的演化過程,實際上有些類似生物的演化過程,隨著互聯網用戶的增長和網絡上信息總量的增加,我們不斷需要更高效更先進的信息分發解決方案。

但這個解決方案并不是覆蓋式的,新的技術應用出來,直接淘汰過去的技術。這個過程是疊加式的,新的技術應用出來,結合更新的商業模式創新,疊加成一個更先進的信息分發解決方案,這個方案會包含過去發明出來的有效解法,整體是個更完整復雜的體系

實際上像今日頭條這樣的產品,就是一個聚集了分類目錄、搜索、關注訂閱、推薦算法的綜合型信息分發產品。

我相信,在未來會出現更新更高效的互聯網信息分發產品,也會遵循這個“進化規律”,不論這個產品是在5G還是6G時代下的,是移動App還是個VR/MR應用。

互聯網這個比特鏡像的世界,一定會驅動我們人類不斷向前進

寫在最后的話

會寫這篇文章其實還是前幾天去參加了今日頭條的生機大會。頭條的新任CEO朱文佳在開場主題演講的時候,用了一張圖描繪了一下今日頭條的業務邊界擴展的邏輯。

今日頭條業務邊界的“一橫一豎”

當時我就想起來,我在2017年的時候寫《抖音的野望,快手的危機》的時候,我曾經也畫過一張描繪從社交到媒體的不同內容產品形態變化的圖。

這張圖基本反映了我對整個基于關系鏈的內容形態變化的理解。恰好這個軸與朱文佳所畫的橫軸有些近似,所以我就想寫一篇講講豎軸是怎么隨著時代發展過來的科普文。

不過我寫到一半的時候發現這東西越來越長,細節頗多,于是決定省卻一些細節,希望能把這個事情講個基本明白就算OK,希望讀完的各位還能滿意。

而關于屬于未來的互聯網信息分發會怎么進化,這類比較大的話題,歡迎大家私信我留言探討。

以上,感謝。

推薦擴展閱讀索引

  • 亂翻書:潘亂,《微信已經老了,頭條永遠年輕》
  • 亂翻書:潘亂,《推薦是利器,關注是鈍器》
  • 亂翻書:潘亂,《刷抖音,玩快手》
  • 亂翻書,朱星宇,《為什么MySpace會慘敗給Facebook?》
  • 筆下求生,朱時雨,《造水者與送水人》

#特邀作者#

金葉宸,微信公眾號:圓首金老漢(ID:chairmanJLH),古典互聯網觀察者

本文原創發布于人人都是產品經理。未經許可,禁止轉載。

題圖來自 Unsplash,基于 CC0 協議

給作者打賞,鼓勵TA抓緊創作!
評論
歡迎留言討論~!
  1. 洋洋灑灑一大篇,專業!!受教了

    回復
  2. 特別好的一篇文章,很有意義,忍不住專門注冊給個贊

    回復
  3. 百度投資知乎,是不是因為這個原因啊

    回復
  4. 按照這個思路,是可以有預測互聯網未來的一點能力

    回復
  5. 讀完這篇,發現金老哥認真起來的樣子真帥。。平時在jellow就知道發段子- –

    回復
  6. 請問,“以某些物理介質承載”怎么理解呀?能不能說,我唱了一首歌,變成了. mp3格式,這就是信號

    回復
  7. :idea:

    回復
马总会三肖中特