在互聯(lián)網行業(yè),尤其是在投資人心目中,往往存在一種 " 算法迷信 " 或曰 " 技術迷信 ":某公司的廣告變現做得好,一定是因為有算法;某公司的云計算業(yè)務開展的好,也是因為有算法;某公司的游戲用戶留存率高,還是因為有算法……
所以,一切用戶問題和變現問題都可以通過 " 技術中臺 " 解決,從 Google 或 Facebook 挖到的 " 算法專家 " 可以構成互聯(lián)網行業(yè)的核心競爭力。與此相對,如果一項業(yè)務出了問題,無論是用戶增長環(huán)節(jié)還是商業(yè)化環(huán)節(jié)出了問題,毫無疑問可以歸咎于算法不行。
遺憾的是,上述觀點是錯誤的。算法當然很重要??墒侨绻麤]有數據,你拿什么去 " 算 " 呢?如果把 Google、Facebook、字節(jié)跳動或阿里巴巴的算法團隊劃撥給某個路人甲,難道路人甲就可以 " 冷啟動 " 搞出一個全世界最厲害的互聯(lián)網平臺嗎?哪怕是沒有接觸過互聯(lián)網行業(yè)的人,也不會相信這種瘋話——沒有數據的算法,就像沒有球員的足球戰(zhàn)術,是不可能執(zhí)行的。
互聯(lián)網平臺的算法被嚴重神化了。算法固然重要,但我們可以毫不客氣地說:算法是可以在短期內砸錢搞出來的,但是數據無法在短期內搞出來;頭部互聯(lián)網公司在算法上不會有什么代差,但是在數據豐富程度和可用性方面可能產生代差(注:并不意味著一定有代差)。
在互聯(lián)網時代,數據堪稱土地、勞動、資本后的第四大生產要素,盡管我們常常忽略它,但其重要意義非同一般。更深一步,人工智能比拼的并不是算法,而是數據," 得數據者得天下,得數據者得算法 "。互聯(lián)網巨頭在過去十幾年呼風喚雨、取得了巨大的收入和利潤,不僅僅是因為它們掌握了用戶流量入口,更是因為它們掌握了基于用戶行為的海量數據。
(就像在《命運石之門》當中,發(fā)明時間機器不僅需要天才黑客橋田至,更需要狂氣科學家鳳凰院兇真、天才少女牧瀨紅莉棲等一整套實驗室體系的配合。)
為什么抖音如此適合游戲及電商廣告投放?廣告算法好,確實是一個核心因素。例如,抖音對游戲廣告主甚至可以以 " 單個付費用戶 " 為單位結算,甚至可以約定 " 若用戶流失則退款 ";抖音、快手均可以將廣告主的效果需求(CPA/ROI 等)高效地 " 翻譯 " 成前臺 CPM 需求,快速而靈活地響應廣告主的需求。但是,在" 算法好 " 的背后,更深刻的原因是數據積累龐大、可信度高:
抖音通過用戶的滑動、點贊、留言、轉發(fā),以及平均觀看時長,獲得了大量寶貴的用戶偏好數據,從而能夠貼上各種數據標簽。與傳統(tǒng)圖文信息流相比,短視頻給用戶貼上數據標簽的效率要高得多。
抖音從 2016 年開始就建立了一個龐大的內容生態(tài),各式各樣的內容非常健全,從而可以讓海量內容與海量用戶之間互動,產生天量級的數據。其實,抖音在內容運營方面的功力極深,只是往往被人忽視。
反觀還處在發(fā)展初期的微信視頻號,與抖音的差距與其說在于 " 算法技術 ",還不如說在于內容生態(tài)——目前視頻號的原生創(chuàng)作者很少,MCN 生態(tài)尚未建立,垂類內容運營也不發(fā)達(僅有直播取得了一些成果)。因為內容池太淺,所以無法與用戶產生有意義的互動,導致數據深度和可信度不足。要解決問題,恰恰要依靠良好的社區(qū)運營和激勵機制,去吸引更多、更有特色的創(chuàng)作者持續(xù)產生內容,而不是像某些人認為的那樣,把推薦算法調教好就夠了。
在中國這個特殊的(也是全球第二大的)互聯(lián)網市場,各大平臺對于用戶數據的掌握程度,還存在兩個微妙的因素:
首先,國內安卓平臺對用戶隱私的保護程度很低, 從而允許互聯(lián)網公司無節(jié)制地攫取數據。國內 80% 以上的用戶使用安卓手機,國產安卓生態(tài)的用戶保護機制幾乎形同虛設——如果你禁止某個安卓 APP 讀取你的通訊錄、調用你的相冊和攝像頭,很可能你就無法完成安裝,也無法使用大部分功能。在這方面,蘋果手機堪稱模范,甚至允許你像隱形人一樣使用各大 APP,讓對方完全無法辨認你的身份;所以很多互聯(lián)網平臺都討厭蘋果手機。你在媒體經常能看到關于蘋果手機如何差勁的黑文,不一定是其他手機廠商發(fā)的,很有可能是惱羞成怒的互聯(lián)網平臺發(fā)的。
很多安卓 APP 會定期截取用戶屏幕、讀取手機相冊、讀取輸入法數據,甚至在用戶不知情的情況下操縱攝像頭——還記得當年震驚全網的 " 手機攝像頭無聲無息升起事件 ",以及剛剛發(fā)生的 " 豆瓣刪除用戶相冊圖片 " 事件嗎?因為平臺可以肆無忌憚地收集用戶數據,當然就可以很精準地貼上用戶標簽。與其說這是算法的功勞,還不如說是侵犯用戶隱私的 " 功勞 "。當然,在國內主管部門強調用戶信息保護的今天,這一套玩法已經接近了極限。
其次,互聯(lián)網平臺內部各端、各業(yè)務的數據需要打通,否則就無法形成合力。 為什么字節(jié)跳動的算法推薦精準?因為它內部各個產品、各項業(yè)務的數據是高度分享的。字節(jié)跳動的廣告銷售人員,可以迅速了解到抖音的某個趨勢、某個流量洼地,然后立即對廣告主進行推薦,這樣廣告主當然有投放的積極性。與其說字節(jié)跳動是依靠算法崛起的,還不如說是依靠打通技術和銷售崛起的,以前的百度也是這樣。
這就是近年來互聯(lián)網公司紛紛強調 " 數據中臺 " 的原因:與其說 " 數據中臺 " 象征著一種技術創(chuàng)新,倒不如說它在削平內部山頭,把各部門的數據資源最大限度地打通。不過,數據中臺未必總能達到目的,因為規(guī)矩是人定的。對于歷史悠久、內部利益分配復雜的互聯(lián)網巨頭而言,要各個山頭分享數據是一個很艱難的任務。所以,像字節(jié)跳動、拼多多這樣歷史較短的公司往往能較好地打通數據,而歷史悠久的公司做不到。
諷刺的是,2021 年以來,監(jiān)管部門加強了對平臺商家獲得用戶數據的限制,卻反而造成了平臺對數據控制權的加強:
例如,對淘寶商家來說,以前可以獲得某個具體買家的電話、地址、身份信息,從而可以進行內部分析,還可以主動通過短信等方式拉回流。2021 年 8 月以來,淘寶商家看到的數據都被加密了(其他各大電商平臺也在跟進),只有快遞員還掌握用戶的真實聯(lián)系方式。雖然這樣確實保護了用戶隱私,卻也造成商家完全受制于平臺,很難繞開平臺運營私域流量了。
這里就涉及到一個平臺經濟監(jiān)管的核心問題:我們對互聯(lián)網平臺加強控制,歸根結底是為了有益于用戶,同時也應當有利于中小商家。有些事情可能對用戶有利,卻也加強了平臺在產業(yè)鏈上下游的話語權,從而使它們相對于中小企業(yè)居于更強勢的地位。如何避免這種現象出現?對于全世界的監(jiān)管者來講,都需要摸著石頭過河。
在本文的最后,我們想集中探討一下 5G 時代對數據的影響。坦白說,如果 5G 普及,互聯(lián)網巨頭對用戶數據的控制可能提上一個新的臺階:
首先,數據維度大幅提升,5G 將推動萬物互聯(lián),5G 時代連接數量達 100 萬 / 平方公里(即每平方公里有 100 萬對數據連接存在),是 4G 時代的 100 倍。根據 AT&T 的數據,2020 年全球物聯(lián)網的連接數達到 500 億,其中物與物(設備對設備)的連接數占比 80%。一方面,聯(lián)網設備數增加,將線上和線下數據進一步打通;另一方面,物物之間的連接數大幅提升,數據的維度和延續(xù)性都有了實質提升。
其次,5G 基站將實現更加精準定位。由于 5G 穿透性不如 4G,需要更多的 5G 基站完成原來 4G 信號塔的作用。在基站密度一定情況下,5G 可以將基站定位精度提升至 1m,并且更多 5G 基站在室內,室內定位效果也將增強。屆時,互聯(lián)網巨頭念念不忘的 " 對用戶位置的精確掌控 " 將成為現實,達到厘米級的掌控也不是不可能的。
可想而知,進入 5G 時代,互聯(lián)網行業(yè)的海量數據會變成天量數據,數據的精準度、可用性、靈活性也會大幅提升。舉兩個很簡單的例子:
如果智能家居真能成為主流,就無異于在移動互聯(lián)網之外再造了一個 " 家居互聯(lián)網 ",用戶從早上起床到晚上就寢,乃至睡眠中產生的數據,均將被納入互聯(lián)網平臺的體系。
如果 5G 基站定位精度達到 1 米以內,傳說中的 " 室內 LBS 服務 " 將成為現實,線下零售商將能夠繪制出精準的 " 零售熱力圖 ",從而進行一系列 O2O 數據合作(例如通過用戶的行動細節(jié)向其推送商品)。
由此產生的用戶隱私等法律、道德問題也是不容忽視的。這也就是各國監(jiān)管部門要趕在 5G 大規(guī)模商用的初期,紛紛加強對平臺經濟的控制、對用戶個人隱私的保護的原因。
當然,按照某些互聯(lián)網平臺的觀點,中國用戶不重視個人隱私,更愿意犧牲個人數據主導權去換取生活便利,所以主管部門也不應該嚴厲限制對用戶數據的刺探和使用。你贊成嗎?反正我不贊成。
來源:互聯(lián)網怪盜團