今年以來,搜索市場格外熱鬧。

在9月底舉辦的2023萬象大會上,百度告訴與會者,即便規?;鶖狄呀浐荦嫶?百度搜索的規模在過去一年仍同比增長了17%。

“有些人說用戶現在是不是不用搜索了,用其他形態的產品替代了搜索?其實恰恰相反,殊途同歸,最終搜索還是用戶表達需求的最主要入口。”百度集團副總裁、搜索平臺負責人肖陽說,搜索是互聯網的“水電煤”,是基石應用。最近這些年,用戶的搜索場景越來越豐富,搜索也遠未定型。伴隨人工智能在搜索上的應用,搜索演進的速度也越來越快。

一個多月前,華為發布了鴻蒙3.0,其背后的搜索技術也隨之浮出水面。而蘋果應用市場顯示,字節跳動近期對間接控股的“悟空搜索”進行了新的定位和改版,這是字節跳動幾年前入局全網搜索、先后推出頭條和抖音站外搜索后的最新進展。國內另一家短視頻公司快手也在去年推出搜索。

在今年5月谷歌I/O全球開發者大會上,前兩年一直大談人工智能的谷歌,今年將重點重新放在了核心業務“搜索”上。搜索業務仍占谷歌總營收的80%以上。

谷歌通過幾個有趣的案例,展現了搜索的最新變革。其中一個是在巧克力店尋找“不含堅果的黑巧克力”。用戶用手機鏡頭去掃描貨架,在移動的取景框內,對多個不同物體進行連續搜索,并通過AR疊加的方式,展現這些物體的相關信息,最終找到了需要的巧克力。

所以,不難發現,與PC互聯網的搜索不同,當前大廠加碼搜索的背后,是搜索的多元化演進,搜索也是人工智能技術落地的絕佳場景,在人工智能技術發展中發揮著巨大作用。

搜索的界面雖然非常簡單,但根據百度杰出研發架構師辜斯繆的介紹,任何一個現代搜索引擎,都需要上萬臺的服務器,才能提供一個基本的服務。所以,不斷優化整個系統,減小算力消耗是搜索的一個重要目標。這倒逼百度開發了人工智能芯片、飛槳深度學習平臺、人工智能大模型。百度也是首家將大模型應用于搜索的企業。搜索有了一套自主開發的高效基礎設施。

“這也讓百度成為一個AI平臺,這是搜索的價值所在。”肖陽告訴數智前線,“搜索是迄今為止從商業化、規?;?、技術難度、應用各方面,都可以支撐大規模人工智能的場景。人工智能能賺錢的大領域、復雜的領域不多,搜索是目前唯一的一個?!?/p>

實際上,百度很多技術體系也基于搜索。比如像自動駕駛,它就像狀態空間的搜索。搜索的內涵和外延都在不斷拓展,也產生很多“副產品”。

當然,除了能落地新技術,搜索本身也是大型互聯網企業非常賺錢的業務。從谷歌今年7月發布的第二季度財報看,亮點也來自其傳統搜索業務,收入同比增長14%,達到407億美元。即便其他業務不達預期,但外媒評價,搜索以一己之力滿足了華爾街投資人的胃口,谷歌股價當日上漲了5%。

02

搜索的演進遠未到終局

很多人都認為搜索是一個成熟的穩態業務,但實際上,大廠的動作恰恰也反映出,搜索正處在變革期。

“iPhone14和華為mate50誰更好?”、“姚明和奧尼爾誰高?”、“窗戶縫隙漏水怎么辦?”,從三四年前開始,用戶用更自然的方式進行搜索,從找東西變成問問題。

對于人的大腦來說,這些問題理解起來并不難,但對于搜索引擎卻是一個巨大的挑戰。這導致搜索引擎和自然語言處理出現了很大的技術變革,深度學習被廣泛采用,來進行語義訓練,從而讓搜索引擎更能理解用戶的問題和意圖。

用戶也在用語音、圖片和視頻等多元的方式隨時隨地進行搜索。比如,用戶上傳一張圖片、一段小視頻,甚至一段鳥鳴,問圖片里、視頻或音頻里是什么動物。

這里涉及多模態搜索,也是大廠紛紛發力的點。根據百度的數據,以語音搜索為例,其語音搜索的PV過去一年同比增加了22%,月活用戶數超過1.1 億。

但要實現多模態搜索并不容易。以視頻搜索舉例,搜索引擎要理解視頻中人們說了什么,手里拿著什么東西,身上穿的什么衣服......這些并不容易。

除了多模態搜索,視覺、語音和文本的跨模態融合搜索也是一個突破方向。用戶可以邊拍邊說,更清楚地表達他們的需求。

大廠都在推出跨模態模型。其中,百度推出了名為“知一”的模型,在原來語義模型基礎上,引入了跨模態,并推出了邊拍邊說的搜索。谷歌也推出了簡稱MUM的人工智能模型。谷歌CEO桑達爾·皮查伊稱,很快,谷歌將引入同時使用圖像和文字進行搜索的新方法。

多模態之外,“服務即搜索”也是各大廠正在競爭的賽道。抖音、快手的搜索與自身直播電商能形成閉環。百度從2023年開始打造小程序和本地店鋪這類基礎設施,目的也形成閉環服務。

“許多人在百度搜索是為了進行更好的決策。而且,我們看到這些搜索處于決策的更前端,他們還在對比品牌好壞?!毙り枌抵乔熬€說,“所以,我們這幾年聚焦打造決策類的技術和資源,我們發現用戶是買單的。”

這背后是建立電商知識圖譜,升級商品跨模態理解和匹配。以搜索“酒店”為例,它可以根據聚合的酒店介紹、定價、評價、榜單和對比信息,幫助用戶推薦性價比較高的酒店。

搜索正在進行快速的變化,大廠都在探索搜索內容消費的邊界,而業界認為,這個邊界還非常遠。

除了搜索即服務,一些用戶的搜索非常個性化,需要人腦的知識來解答。

比如,河南鄭州一位堵車用戶問前方堵車點的情況,百度為他實時匹配到在堵點附近的一位答主,答主立刻解答了問題,并同步了現場施工修路的照片。這是百度推出的“問一問”,它的5分鐘響應率是95%,每日響應咨詢次數在400萬以上。這背后的關鍵技術是動態答主匹配、海量答主畫像理解、實時對話理解等。

全球搜索大廠之間的技術競賽也如火如荼。“我們正在對谷歌AI和DeepMind等人工智能研發進行大量投資——我們將其應用到整個公司,尤其是在搜索的場景下?!鄙__爾·皮查伊稱,谷歌推出了BERT、MUM、Pathways 和 LaMDA 人工智能技術,“在人工智能團隊和包括搜索在內的核心產品團隊之間,建立了良好接口,以將其產品化?!?/p>

百度也在萬象大會上官宣了跨模態大模型“知一”和新一代索引技術“千流”。其中,千流主要用于解決,當下數據規模超前巨大,搜索引擎又要在毫秒級將檢索結果反饋給用戶的巨大矛盾。據悉,千流采用了基于柵格化索引的智能內容激發路徑,能讓更多長尾創作者和優質內容被搜索和看到。

03

搜索內涵的外延

搜索的內涵還在外延,其中一個是數字人。

數字人涉及一個很長的技術棧,包括了語音合成、3D、渲染,其中評判數字人質量的一個重要指標是它的交互能力?!芭畫z造人要注入靈魂,數字人最后拼的就是能不能注入數字人靈魂。”肖陽說。這背后的關鍵是對話模型。

有人認為與數字人交互式的方式,重新定義了搜索。肖陽則認為它是搜索的補充和升級。百度的數字人度曉曉除了聊天繪畫唱歌,更重要的作用是陪伴。

另一個延展是視頻內容的消費。比如窗戶縫隙漏水怎么辦,最好是搜索出一段生動的視頻去演示。根據數據,過去一年,視頻的搜索和消費在高速增長,比如百度的視頻分發同比增長170%以上。

關于視頻搜索,一個功能是直接定位在某個時段某一幀視頻,從而節省用戶的時間。這對視頻而言,難度陡然增加。搜索目前正在加強對視頻內容的理解,建立視頻內容的索引,對視頻結構化,以及深度視覺問答技術。

搜索的競爭力離不開算力、算法和生態。這次百度也推出了人工智能生成視頻的AIGC工具。因為很多搜索內容是長尾的,本來流量就不大,如果用人力生產,成本會較高。AIGC會賦能到更多知識生產場景中。這是視頻生態的舉措之一。

由于技術更新換代變快,算力和數據的井噴,算法在不斷迭代,現在搜索作為互聯網的根技術,演進正在提速。而用戶的需求也在不斷被激發,搜索和用戶之間正在上演“雙向奔赴”。