今年初,智能對話機器人模型ChatGPT引發(fā)了全球范圍的人工智能熱潮。面對這波浪潮,國內(nèi)的科技公司,尤其是搜索引擎領(lǐng)域的巨頭們紛紛加入,相繼發(fā)布自己的大模型。
作為國內(nèi)第二大搜索引擎廠商,360近期就官宣發(fā)布了360GPT產(chǎn)品矩陣“智腦”,成為針對搜索場景,國內(nèi)較先推出的應(yīng)用GPT技術(shù)的新一代智能搜索。
據(jù)了解,該產(chǎn)品已正式開放產(chǎn)品內(nèi)測。隨著越來越多的場景應(yīng)用,人工智能將帶來哪些新的生產(chǎn)力變革?但可以確定的是,人工智能真正走進我們工作生活的時代已經(jīng)正式開啟。
1.生產(chǎn)力迎來大變革時代,360落地新搜索應(yīng)用
隨著微軟將ChatGPT與Bing的融合,讓搜索引擎成為生產(chǎn)力改造的前沿陣地。
這種結(jié)合讓搜索引擎迎來了全新的發(fā)展方向,而ChatGPT正改變著信息生產(chǎn)、組織和獲取的方式。對此,我們與360相關(guān)業(yè)務(wù)的技術(shù)負責(zé)人張向征聊了聊,他表示,ChatGPT的出現(xiàn)證明了通過“大模型+搜索引擎”可以讓AI實現(xiàn)以往無法企及的 “智能”。這將對搜索行業(yè)產(chǎn)生深遠的影響,甚至引發(fā)生產(chǎn)力的變革。
在國內(nèi),有資格進行相關(guān)探索的公司不多。
360作為國內(nèi)第二大搜索引擎廠商,憑借多年的數(shù)據(jù)、算力和工程能力,以及在人工智能領(lǐng)域的深厚積淀,前不久推出了自研的360GPT產(chǎn)品矩陣“智腦”,同時也是頭一批落地到搜索應(yīng)用產(chǎn)品中,引起了業(yè)界的普遍關(guān)注。
傳統(tǒng)的搜索一般是以網(wǎng)頁鏈接形式為結(jié)果,用戶需要自己一個個翻找鏈接,進入網(wǎng)頁尋找答案。而結(jié)合了360GPT能力的360新搜索可以通過問答的形式,根據(jù)用戶提出的問題直接生產(chǎn)內(nèi)容。
針對“為什么淄博燒烤突然火了?”這個當(dāng)下的熱點話題,很快就給出了答案。列出了淄博燒烤最新的社會事件,還提煉分析直接給出了結(jié)論。不僅如此,回答中還顯示了援引來源,可以供用戶溯源確認??梢钥吹降氖牵?60新搜索的問答更符合人的自然表達,生成的內(nèi)容也遠比傳統(tǒng)搜索更直接、更豐富。
究其原因,張向征介紹說:“我們一直把理解用戶目的、便捷用戶使用當(dāng)成了重要的產(chǎn)品研發(fā)方向,基于360GPT的新搜索擁有更強大的閱讀理解能力?!?/p>
另一方面,人工智能相關(guān)內(nèi)容的生產(chǎn)離不開真實可靠的信息。通過聯(lián)網(wǎng)搜索能力,實現(xiàn)了于全網(wǎng)信息的高效互聯(lián),及時獲得準確、有效的信息,再憑借生成式大語言模型對信息的提煉、總結(jié)和生成能力,快速給出兼具時效性和可讀性的答案。
“大模型+搜索引擎兩者融合的產(chǎn)品更像用戶的個人助手,交互模式會更多樣,能力邊界也會顯著擴大”。張向征透露,以用戶需求為出發(fā)點,360GPT還將與瀏覽器、數(shù)字助理、蘇打辦公、智能營銷等場景應(yīng)用深度結(jié)合,為用戶提供多元化的智能服務(wù)。
2、多年布局人工智能,技術(shù)場景“兩翼齊飛”
早在2015年深度學(xué)習(xí)技術(shù)風(fēng)靡時,人工智能就已是搜索行業(yè)變革的重要推動力。
2017年,NLP領(lǐng)域劃時代的Transformer算法誕生。沿著Transformer的路徑,GPT、BERT等新技術(shù),將機器視覺領(lǐng)域的訓(xùn)練方式用于自然語言領(lǐng)域,實現(xiàn)了“智能化”的進一步升級。
對比GPT與BERT來看,GPT是一個單向模型,更擅長“寫作文”,而BERT是雙向模型,可以聯(lián)系上下文進行分析,更擅長“完形填空”。因此,相比較于GPT,對于圍繞已存在內(nèi)容展開業(yè)務(wù)的搜索引擎行業(yè)來說,BERT是更常用的模型。
BERT和GPT模型結(jié)構(gòu)對比(來源:BERT論文)
而ChatGPT的出現(xiàn)帶來了技術(shù)路線的大變動。
張向征表示,人工智能技術(shù)一直是360搜索不斷進化的關(guān)鍵,ChatGPT作為一種新形式的后端變革,將影響后續(xù)搜索引擎底層技術(shù)的調(diào)研和技術(shù)的應(yīng)用方式。
他介紹道,2015年,360搜索就開始用深度學(xué)習(xí)模型進行搜索的召回、排序以及Query意圖識別等關(guān)鍵環(huán)節(jié)。之后,360搜索又開始使用多模態(tài)檢索模型,來多元化搜索形態(tài),適應(yīng)圖片搜索等新需求。
到2019年,360搜索完成了對BERT模型的初版應(yīng)用,2020年完成BERT的全流量在線部署和應(yīng)用。此時,360搜索已經(jīng)開始做“閱讀理解”。不同于僅提供鏈接,針對某些已經(jīng)有明確答案的問題,360搜索可以抽取精準答案所對應(yīng)的段落和句子,并直接展示在搜索頁。
“也正是這些探索打下的基礎(chǔ),今天我們才有了自己的生成式大語言模型和產(chǎn)品矩陣‘智腦’”。張向征這樣說。
眾所周知,搜索引擎的核心是底層的技術(shù)能力以及優(yōu)質(zhì)的內(nèi)容和服務(wù)。因此,搜索引擎未來的產(chǎn)品形態(tài)、交互模式、展現(xiàn)方式等都將基于其核心能力,再根據(jù)用戶的習(xí)慣和偏好不斷變化。未來的搜索引擎將形成全新的入口,搜索能力會繼續(xù)存在,并承擔(dān)相應(yīng)的后臺支持功能。
人類獲取信息的方式的變革蘊含著巨大的機會??梢韵胍?,基于360GPT的新一代的智能搜索引擎將承載更多的用戶使用場景,也將迎來更大的想象空間。
3.“未來搜索引擎”已至,360搜索的底氣從何而來?
據(jù)了解,從2012年成立之初,360搜索就以其獨特的產(chǎn)品和技術(shù)實力,構(gòu)筑起了差異化的市場定位。
依托于360集團,360搜索在安全層面積累深厚。借助于旗下產(chǎn)品對于病毒、釣魚網(wǎng)站等的識別與攔截能力,360搜索可以及時過濾風(fēng)險,為用戶打造更安全、穩(wěn)定的上網(wǎng)環(huán)境。
另一方面,隨著各種垂直平臺的興起,互聯(lián)網(wǎng)內(nèi)容開始“孤島化”。作為全網(wǎng)搜索平臺,360搜索始終堅持開放的發(fā)展策略。
360搜索一直以來都重視對內(nèi)容生態(tài)的建設(shè)。目前,360已經(jīng)與多個內(nèi)容平臺達成合作,所有內(nèi)容提供方均參與收入分成,逐步形成了互惠共享的生態(tài)環(huán)境。
此外,360搜索還在搜索的數(shù)據(jù)、算法、工程化能力以及服務(wù)接口對內(nèi)對外雙向賦能,更大范圍地觸達用戶群體。
對內(nèi),360推出的日歷等訂閱產(chǎn)品,就融合了360搜索的功能,用戶一鍵訂閱,就能實時收到最新的信息更新。對外,360搜索入局SaaS業(yè)務(wù),通過為某些垂直領(lǐng)域的搜索平臺提供SaaS化的接口,來輸出其全網(wǎng)搜索能力。
與此同時,360搜索也在持續(xù)加筑自身護城河,緊隨GPT大語言模型,360搜索借助其人工智能技術(shù)的積累,利用360“智腦”探索產(chǎn)品邊界,推出新一代智能搜索。
業(yè)界有一個普遍的共識,那就是ChatGPT的性能卓越主要源于其預(yù)訓(xùn)練模型參數(shù)量巨大,人工反饋為主的標注強化學(xué)習(xí)手段,以及先進的思維模式訓(xùn)練方法。從GPT-1到GPT-3,模型訓(xùn)練的參數(shù)量呈千倍增長,已達到接近2000億的量級。在數(shù)據(jù)量達標,用大模型把知識容量、基礎(chǔ)通用能力做的足夠高之后,大模型研發(fā)就要面臨工程落地環(huán)節(jié)。這需要耗費巨大的訓(xùn)練和推理成本,也是“英雄折戟”之地。
模型規(guī)模不等于符合實際需要,為了避免無意義回答,還要為人工智能加上“傾向性”,這就用到RLHF新技術(shù),即基于人類反饋的強化學(xué)習(xí),通過人工標注來加入方向性引導(dǎo)。最后,思維訓(xùn)練也是人工智能的一部分,要使其具備推理能力,能進行高度擬人化的多輪對話。
除了以上難點,GPT大語言模型要真正落地,還要結(jié)合對實際業(yè)務(wù)的理解。這將是一個逐步改進,不斷摸索的過程。
在巨大的壁壘面前,360有著“先天優(yōu)勢”,360搜索的內(nèi)容涵蓋全網(wǎng)數(shù)據(jù),抓取過的網(wǎng)頁數(shù)已達上萬億,現(xiàn)存網(wǎng)頁數(shù)達數(shù)千億,索引的網(wǎng)頁達數(shù)百億,這能為技術(shù)開發(fā)提供足夠多的語料。
從數(shù)據(jù)多樣性上來看,360搜索不局限于某一類別的數(shù)據(jù),而是對電商、新聞、小說、問答、百科等各類數(shù)據(jù)均有覆蓋,保證了數(shù)據(jù)集的完整度。
360搜索基于圖像AI識別能力推出了“圖查查”平臺
文本數(shù)據(jù)之外,360搜索還利用多模態(tài)搜索技術(shù),通過識別文本和圖像間的映射關(guān)系,將語料信息延伸到更豐富的形態(tài)中。
據(jù)了解,360搜索已經(jīng)積累了數(shù)百億的圖片信息。2022年,360搜索還聯(lián)合360人工智能研究院與清華大學(xué),推出了中文圖文跨模態(tài)數(shù)據(jù)集Zero和圖文跨模態(tài)預(yù)訓(xùn)練框架R2D2。
其中,Zero包括兩個預(yù)訓(xùn)練數(shù)據(jù)集和五個下游任務(wù)數(shù)據(jù)集,預(yù)訓(xùn)練數(shù)據(jù)集包括2300萬和230萬兩個版本,該數(shù)據(jù)集也是國內(nèi)開源的首個中文圖文跨模態(tài)領(lǐng)域數(shù)據(jù)集。
360搜索聯(lián)合360人工智能研究院、清華大學(xué)推出的中文圖文跨模態(tài)數(shù)據(jù)集Zero
當(dāng)然,僅有大規(guī)模數(shù)據(jù)集還遠遠不夠。要形成有效的語料集,對各類信息進行篩選和清理同樣重要,這就需要扎實的人工智能工程能力。
張向征表示,任何人工智能技術(shù)的落地都離不開工程能力,也就是讓人工智能技術(shù)以低成本、高效率的方式落地實施的能力。
基于多年深耕,360內(nèi)部在模型訓(xùn)練平臺、預(yù)訓(xùn)練語言模型等方面,已經(jīng)積累了豐富的經(jīng)驗,能為GPT大語言模型的開發(fā)提供良好的工程支持,有效降低訓(xùn)練推理和業(yè)務(wù)落地的成本。
早在幾年前,360搜索就已經(jīng)把所有的底層文檔,以向量形式表達,能快速鎖定、提取內(nèi)容,進一步提高檢索和篩選的效率。同時,結(jié)合用戶的搜索反饋,360搜索能有效判斷不同信息的重要性,進一步提高語料集的質(zhì)量。
此外,人工智能的持續(xù)商業(yè)化落地,也離不開充足算力的支持。360內(nèi)部部署的數(shù)萬臺服務(wù)器、數(shù)百臺GPU,已成為相關(guān)研究所需算力的有力支撐。
從數(shù)據(jù)到算力,再到工程能力,正是360集團一直以來對人工智能的重視,形成了今天360搜索探索未來搜索引擎的充足底氣。
4、從基礎(chǔ)研究到上層應(yīng)用,360集團奔向人工智能的“星辰大?!?/strong>
平行于360搜索,360集團設(shè)立了360人工智能研究院。
據(jù)了解,360人工智能研究院專門進行人工智能基礎(chǔ)模型和前瞻性技術(shù)的研究,現(xiàn)階段主要聚焦于研發(fā)業(yè)界領(lǐng)先的計算機視覺、深度自然語言理解,語音語義交互等人工智能技術(shù),再將研究成果應(yīng)用于智慧物聯(lián)網(wǎng)(IOT)、智能安全大數(shù)據(jù),互聯(lián)網(wǎng)信息分發(fā)等多種場景。
其研究范圍涵蓋人工智能各主要領(lǐng)域,申請專利數(shù)接近400件。團隊核心成員還曾于2017年在有“計算機視覺屆世界杯”之稱的ImageNet比賽中獲得兩項冠軍,并刷新了谷歌、微軟保持的世界紀錄。在2019-2021年的中國人工智能大賽中,360人工智能研究院更是取得3連冠。
此外,團隊還參與了國家級重點大數(shù)據(jù)工程實驗室和國家新一代人工智能創(chuàng)新發(fā)展試驗區(qū)開放實驗室的建設(shè),其主導(dǎo)項目也已入選“科技部科技創(chuàng)新2030項目”和“吳文俊人工智能科技進步獎”。
張向征表示,人工智能研究院主要提供底層研究支持,360搜索在內(nèi)的各業(yè)務(wù)部門,則負責(zé)將人工智能與業(yè)務(wù)場景相結(jié)合,同時將實踐結(jié)果反饋給研究院,形成了基礎(chǔ)研究到上層應(yīng)用的生態(tài)閉環(huán)。
目前,360已經(jīng)搭建起了數(shù)百人的人工智能研發(fā)團隊,并廣招人工智能人才,每年的研發(fā)投入也均以億級計算。
接下來,360搜索將與360人工智能研究院緊密合作,不斷強化新一代搜索引擎的能力邊界,不斷探索人工智能技術(shù)在瀏覽器、數(shù)字助理、蘇打辦公、智能營銷等多場景的應(yīng)用結(jié)合,奔向GPT大語言模型的“星辰大?!?。
本文標題: 360搜索在人工智能時代何去何從
本文地址: http://www.fsbosswell.com/brand/news-38330b793b.html
內(nèi)容均來源于網(wǎng)絡(luò),錯誤糾正或刪除請發(fā)郵件,收件郵箱kefu@huangye88.com
2009-2024 黃頁88版權(quán)所有 京ICP備2023012932號-1 │ 京公網(wǎng)安備 11010802023561號 京ICP證100626
內(nèi)容均來源于網(wǎng)絡(luò),錯誤糾正或刪除請發(fā)郵件,收件郵箱kefu@huangye88.com