飛象網(wǎng)訊 9月7日正式啟動、以“新搜索·新奇點”為主題的第二屆百度搜索創(chuàng)新大賽,歷經(jīng)3個月的角逐,最終吸引了2800多人報名,涵蓋了95所雙一流高校,最終28支團(tuán)隊獲獎,5萬名同學(xué)直接參與相關(guān)課程學(xué)習(xí),宣傳覆蓋100萬開發(fā)者群體。
百度集團(tuán)副總裁、百度搜索平臺負(fù)責(zé)人肖陽在頒獎典禮致辭時表示,“在這次還遠(yuǎn)未到終局的大模型浪潮里,搜索的技術(shù)變革基因不僅要持續(xù)發(fā)揮作用,還需要自我進(jìn)化。而這次的進(jìn)化,更需要創(chuàng)新力量的支持。而得益于創(chuàng)新大賽這個平臺,搜索的技術(shù)變⾰基因,迅速和眾多年輕的血液產(chǎn)生了碰撞。 ”
NVIDIA 全球副總裁何濤在大賽頒獎典禮致辭中也表示:“作為百度搜索創(chuàng)新大賽的技術(shù)合作伙伴,我們非常高興的看到百度搜索大賽共吸引了超過兩千多名優(yōu)秀選手參賽。這一年里,各行各業(yè)都在經(jīng)歷從通用計算到加速計算和生成式AI的平臺轉(zhuǎn)型。也勉勵在場的各位同學(xué),順應(yīng)技術(shù)發(fā)展趨勢,把握機(jī)會,成為懂得使用AI的人,以掌握未來職業(yè)發(fā)展的主動權(quán)!
百度搜索創(chuàng)新大賽是百度搜索聯(lián)合NVIDIA英偉達(dá)、全國各大高校、社團(tuán)、科研組織共同舉辦的一項全國性AI科技競賽。本屆大賽設(shè)立了五大賽道,題目涉及搜索核心業(yè)務(wù)場景,如語義檢索、多模態(tài)、軟硬結(jié)合優(yōu)化等豐富的技術(shù)方向,并且開設(shè)了賽道三產(chǎn)品賽道,號召參賽者“洞察用戶在搜索場景的需求,并通過構(gòu)建AI應(yīng)用解決”,最終有28支隊伍站上了領(lǐng)獎臺。
賽道一“搜索答案組織”,來自中國科學(xué)院大學(xué)的“None”團(tuán)隊獲得了一等獎。該團(tuán)隊通過精細(xì)調(diào)整Lora微調(diào)LLM方案,精選公開問答數(shù)據(jù)增強訓(xùn)練,利用大模型蒸餾提升學(xué)習(xí)效果,并參照NEFTune進(jìn)行噪聲嵌入增加模型魯棒性,使測試數(shù)據(jù)結(jié)果更符合用戶需求。每一個技術(shù)選型均給出了合理動機(jī)、扎實分析和可信結(jié)論。這體現(xiàn)了團(tuán)隊對搜索答案組織問題的深度理解和出色的科研能力。
賽道二“基于向量交集的Topk搜索”,“晨曦”團(tuán)隊獲得了頭獎。這個團(tuán)隊只有一個人,還是位全職奶爸,不僅在機(jī)評結(jié)果中遙遙領(lǐng)先,在答辯中整體技術(shù)方案的創(chuàng)新性、通用性與先進(jìn)性上也獲得了評委們的一致認(rèn)可。
賽道三“設(shè)計一個解決搜索用戶需求的AI原生應(yīng)用”,來自南京航空航天大學(xué)的“肝到凌晨”團(tuán)隊?wèi){借AI簡歷助手“Linchance JOB”獲得冠軍。只需要回答幾個問題,就能生成個性化的簡歷,還提供優(yōu)化建議,安排AI模擬面試。
賽道四“基于GPU的近似最近鄰檢索算法挑戰(zhàn)”則由杭州電子科技大學(xué)的“HDU01”團(tuán)隊獲得一等獎。該團(tuán)隊在調(diào)研業(yè)內(nèi)的相關(guān)算法并深入分析開源版本的基礎(chǔ)上,做出了有意義的修改,使得最終版本的性能超過了開源版本的兩倍以上。
賽道五“可控圖片生成算法挑戰(zhàn)”,北京理工大學(xué)“幸運的深不見底的團(tuán)隊”奪得一等獎。他們通過對數(shù)據(jù)的精心清洗與增強為模型訓(xùn)練提供了穩(wěn)定基礎(chǔ),采取的多模型融合策略體現(xiàn)了較好的理論實踐結(jié)合能力,最終使得生成圖片的相關(guān)性和質(zhì)量有了顯著提升。
百度是全球最早推出生成式AI的大廠,3月16日發(fā)布文心一言內(nèi)測版,8月31日正式向全社會開放。在10月份舉辦的百度世界2023上,百度推出了眾多重構(gòu)后的產(chǎn)品與應(yīng)用,其中重構(gòu)后的百度搜索尤其引人關(guān)注。
被大模型重構(gòu)的搜索,目前已經(jīng)擁有極致滿足、推薦激發(fā)和多輪交互三個新能力。當(dāng)用戶提出一個問題時,新搜索不再是提供一堆鏈接,而是通過對內(nèi)容的理解,生成文字、圖片、動態(tài)圖表等多模態(tài)的答案,讓用戶一步獲得滿足,引領(lǐng)了搜索行業(yè)的代際變革。目前,在百度,每天已經(jīng)有超過3億次的搜索需求,被生成式搜索滿足。搜索在首位能給出滿意答案的比例已經(jīng)提升了近1倍。
NVIDIA 開發(fā)與技術(shù)部門亞太區(qū)總經(jīng)理李曦鵬也闡述了自己“新搜索”的理解,“從最早書籍檢索、數(shù)據(jù)檢索,到了數(shù)字化過后內(nèi)容的檢索,到現(xiàn)在如火如荼基于LLM生成式檢索,都在說明一個好的領(lǐng)域可以不斷地引領(lǐng)創(chuàng)新、不斷地產(chǎn)生創(chuàng)新、同時不斷地吸收創(chuàng)新。搜索業(yè)務(wù)本身是NLP、CV、語音這些最前沿Deep Learning的合集。基于此,大模型有創(chuàng)新,第一個落地場景就是搜索。對于大模型在搜索引擎里大放異彩,是非常值得期待的!
肖陽在致辭中表示,“面對遠(yuǎn)未到終局的大模型浪潮,搜索的技術(shù)變革基因不僅要持續(xù)發(fā)揮作用,還需要自我進(jìn)化。而這次的進(jìn)化,更需要創(chuàng)新力量的支持!眲(chuàng)新力量指的就是人才,百度搜索創(chuàng)新大賽所構(gòu)建的就是選拔人才的舞臺,就像業(yè)內(nèi)所說,打造“搜索界的奧林匹克”。
憑借百度搜索創(chuàng)新大賽這個平臺,搜索的技術(shù)變革基因,正在注入年輕的血液。肖陽稱,“在接下來的⼀段時間內(nèi),百度搜索都會持續(xù)擁抱年輕⼈的靈感,為自己的技術(shù)基因注⼊新的活力。 ”