1 引言
隨著移動互聯(lián)網(wǎng)的發(fā)展進入新的方向,移動互聯(lián)網(wǎng)中的智能化已經(jīng)成為新的發(fā)展趨勢和主要需求。智能化需求目前主要體現(xiàn)在兩個方面:
●一方面是促生新的智能化應用,如自動駕駛汽車、虛擬現(xiàn)實和增強現(xiàn)實應用等,拓寬移動應用領域為用戶提供更多應用選擇。
●另一方面是基于目前已有的大量應用數(shù)據(jù)進行智能化分析,在現(xiàn)有移動應用的基礎上分析用戶需求、明晰用戶目標、提供用戶感受,讓用戶在固有移動應用領域體驗提升。
在智能化引領發(fā)展的階段中,人工智能技術正在越來越廣泛地應用在移動互聯(lián)網(wǎng)領域,越來越多的人工智能技術更多地參與到移動互聯(lián)網(wǎng)發(fā)展中來。人工智能技術由于其特有的普適性、自主性以及迭代優(yōu)化等特性能夠在數(shù)據(jù)處理環(huán)節(jié)應對更加復雜的數(shù)據(jù)結構和數(shù)據(jù)環(huán)境,得出更加嚴謹和穩(wěn)固的模型和推演結果。人工智能技術正在不斷推動移動互聯(lián)網(wǎng)形態(tài)完成新變化,完成更自主的信息捕捉,更智慧的分析判斷,更自主的服務提供,更智能的云到端結合。本文將從人工智能技術為出發(fā)點,進一步研究移動互聯(lián)網(wǎng)領域的人工智能解決方案和應用現(xiàn)狀。
2 人工智能技術分析
人工智能技術研究范疇非常廣泛,包括專家系統(tǒng)、神經(jīng)網(wǎng)絡、啟發(fā)式算法、模糊邏輯、遺傳算法等。而目前廣泛使用的還以神經(jīng)網(wǎng)絡、模糊邏輯以及遺傳算法的各種擴展算法為主,例如神經(jīng)網(wǎng)絡擴展的深度學習算法即為百度智能搜索的核心算法。以應用場景分類時人工智能核心技術可以分為以下幾個方面:
(1)數(shù)據(jù)挖掘與學習
當面對大量的數(shù)據(jù)需要進行深度數(shù)據(jù)挖掘、明晰數(shù)據(jù)之間的聯(lián)系時,通常采用的方法是人工智能的一個重要分支——機器學習。機器學習是研究如何使用計算機模擬或實現(xiàn)人類的學習活動。它是繼專家系統(tǒng)之后人工智能的又一重要應用領域,是使計算機具有智能的根本途徑,也是人工智能研究的核心課題之一,它的應用遍及至人工智能的各個領域。學習是人類智能的重要特征,也是獲得知識的基本手段,而機器學習也是使計算機具有智能的根本途徑;谌斯ど窠(jīng)網(wǎng)絡的深度學習目前已經(jīng)廣泛應用,神經(jīng)網(wǎng)絡是對人腦或自然神經(jīng)網(wǎng)絡一些基本特性的抽象,通過模擬大腦的某些機理與機制從而實現(xiàn)功能。正是由于神經(jīng)網(wǎng)絡具有多神經(jīng)元、分布式計算性能、多層深度反饋調整等優(yōu)勢,才能夠針對海量數(shù)據(jù)進行計算和分析,通過數(shù)據(jù)訓練形成模型,其自主學習的特性,非常適用于處理復雜多維的非線性問題和基于智能關聯(lián)的海量搜索。
(2)知識和數(shù)據(jù)智能處理
知識處理時使用最多的技術是專家系統(tǒng)。專家系統(tǒng)是人工智能研究領域中的一個重要分支,它將探討一般的思維方法轉入到運用專門知識求解專門問題,實現(xiàn)了人工智能從理論研究向實際應用的重大突破。專家系統(tǒng)可看作一類具有專門知識的計算機智能程序系統(tǒng),它能運用特定領域中專家提供的專門知識和經(jīng)驗,并采用人工智能中的推理技術來求解和模擬通常由專家才能解決的各種復雜問題。發(fā)展專家系統(tǒng)的關鍵在于表達和運用專家知識,一個基本的專家系統(tǒng)通常由知識庫、數(shù)據(jù)庫、推理機、解釋機制、知識獲取和用戶界面6部分組成。作為開展最早的人工智能領域,隨著人工智能的進一步發(fā)展專家系統(tǒng)也促生了一些新的手段,不斷更新已有的研究領域,完成和其他人工智能技術的相互促進。
(3)人機交互
人與機器人的自然交互與合作就是要賦予機器人類似人類的觀察、理解和生成各種情感特征的能力,使機器人能夠完成像人一樣進行交互,并可以針對人類需求進行功能輔助合作完成既定工作任務。人機交互中主要應用到的技術包括機器人學習和模式識別技術。機器人是模擬人行為的機械,是當前智能化領域發(fā)展較為先進的技術。而人工智能所研究的模式識別是指用計算機代替人類或幫助人類感知模式,其主要的研究對象是計算機模式識別系統(tǒng),也就是讓計算機系統(tǒng)能夠模擬人類通過感覺器官對外界產(chǎn)生的各種感知能力。
3 人工智能技術應用分析
(1)移動應用性能分析
目前,移動應用軟件的爆發(fā)式增長帶來了種類繁多數(shù)量也劇增的眾多移動應用,用戶在選擇移動應用過程中并沒有可以參考的標準。在此情況下,移動應用的友好性分析和應用軟件排行對于用戶選擇移動應用具有一定的指導作用,同時也可以促進移動應用的良性發(fā)展,提升移動應用的整體質量。目前,對于移動應用性能分析主要集中在移動應用端到端QoE分析、用戶黏性分析、業(yè)務協(xié)同友好性分析等方面。而這些方面分析的共同點就是都要基于大數(shù)據(jù)分析,將大量的用戶和應用相關信息進行收集和計算得出結論。那么,在這個大數(shù)據(jù)分析計算的過程中通常使用人工智能算法進行解決。不同的機器學習算法是進行大數(shù)據(jù)分析的利器,目前廣泛采用的有加強學習算法以及基于神經(jīng)網(wǎng)絡的深度學習算法等。這些學習算法運作模式是將不同應用在不同應用場景下的能耗、時延、流量、速率按指標要求進行收集和存儲,作為神經(jīng)網(wǎng)絡體系的輸入端。然后,按照不同的應用種類區(qū)分社交應用、即時通信應用、音視頻應用、云應用、瀏覽器應用和游戲應用,將不同領域內(nèi)的應用對于能耗、時延、流量、速率等指標的需求度進行分析,并生成對應指標的加權值作為神經(jīng)網(wǎng)絡的權值。最后,通過大量數(shù)據(jù)的訓練和反饋計算形成神經(jīng)網(wǎng)絡模型。經(jīng)過學習的模型可以完成應用整體友好性結論輸出,也可以完成基于當前數(shù)據(jù)的應用排行,同時還能通過現(xiàn)有數(shù)據(jù)進行預測應用性能。目前,各運營商積極建立移動互聯(lián)網(wǎng)用戶行為分析系統(tǒng),在數(shù)據(jù)共享的基礎上實現(xiàn)對移動用戶訪問互聯(lián)網(wǎng)的行為進行分析,最終掌握用戶的上網(wǎng)習慣以及偏好,從而準確定位用戶對于移動互聯(lián)網(wǎng)的需求,為移動企業(yè)經(jīng)營分析決策提供數(shù)據(jù)支撐。
(2)移動應用身份認證
身份認證是應用人工智能算法的另一個重要應用方向。一直以來,使用最多的身份認證方法是用戶名和密碼的口令模式以及外設的U盾等設備。但是由于密碼存在被破譯風險和被遺忘的可能性,而U盾等外設又存在不便于保存的問題,所以目前多因子身份認證方式和生物識別身份認證方式正在廣泛的發(fā)展。多因子身份認證方式是采用兩種或兩種以上的身份認證方式結合起來進行身份認證,綜合多種方式的優(yōu)點,彌補不同身份認證方式的短板。目前,存在一種多因子認證是采用密碼結合用戶大數(shù)據(jù)圖譜分析進行認證分析,增強原有密碼登錄方式的安全性。用戶大數(shù)據(jù)圖譜是通過用戶在互聯(lián)網(wǎng)中的種種行為模式記錄數(shù)據(jù),進行基于機器學習算法的分析,完成用戶基本行為模型,可預測用戶行為并拒絕不符用戶行為模型的登錄或付款請求,是對普通密碼認證模式的良好輔助。而生物識別認證方式是采用用戶的生物樣本如指紋、人臉、虹膜、指靜脈等具有唯一性的特征進行比對識別的認證方式。生物識別認證方式安全性高,且隨著硬件的不斷發(fā)展在移動終端上搭載的生物識別模塊也越來越小,越來越方便使用。由于生物信息采集時數(shù)量巨大,且經(jīng)過特征提取后形成的比對數(shù)據(jù)庫更是龐大,所以生物識別認證的算法基礎都要依賴于人工智能算法進行模式識別和比對認證,最后將分析識別結果輸出。
(3)新應用發(fā)展
人工智能技術還促生了移動互聯(lián)網(wǎng)新應用和新產(chǎn)業(yè)。虛擬現(xiàn)實/增強現(xiàn)實技術就是基于人工智能技術的應用新拓展。虛擬現(xiàn)實/增強現(xiàn)實是需要通過收集用戶周圍的感知數(shù)據(jù)快速上傳服務器,并通過服務器計算將結果下發(fā)到用戶的眼鏡設備上。為了用戶的體驗考慮,從數(shù)據(jù)收集到結果呈現(xiàn),谷歌給出的時延閾值是20ms。也就是說,要完成快速的數(shù)據(jù)交換和計算不可缺少的除了傳輸帶寬還有就是數(shù)據(jù)計算算法。人工智能算法實現(xiàn)了大數(shù)據(jù)量的瞬時計算,解決了虛擬現(xiàn)實/增強現(xiàn)實的發(fā)展基礎。此外,依托于人工智能技術的(如自動駕駛汽車、智能家居、智能語音搜索等)一大批應用正快速發(fā)展。百度依托深度置信網(wǎng)、卷積神經(jīng)網(wǎng)絡、遞歸神經(jīng)網(wǎng)絡等人工智能算法解決了自然語音處理、智能語音識別與搜索、圖像搜索等應用。人工智能技術對于移動互聯(lián)網(wǎng)幾乎每一個領域都可以產(chǎn)生巨大的影響。
4 基于人工智能技術的數(shù)據(jù)處理架構
基于以上對于人工智能技術的研究,可以總結出一個通用的基于人工智能技術的數(shù)據(jù)處理架構,具體參見圖1;谌斯ぶ悄芗夹g的數(shù)據(jù)處理平臺一般包括數(shù)據(jù)采集模塊、數(shù)據(jù)訓練模塊和數(shù)據(jù)使用模塊。
圖1 基于人工智能技術的數(shù)據(jù)處理架構
(1)數(shù)據(jù)采集模塊要將涉及計算的相關數(shù)據(jù)全部進行采集和存儲,其中采集數(shù)據(jù)包括歷史數(shù)據(jù)和實時數(shù)據(jù)。數(shù)據(jù)采集模塊是整個數(shù)據(jù)處理平臺的數(shù)據(jù)輸入端。
(2)數(shù)據(jù)訓練模塊是采用人工智能技術將平臺存儲數(shù)據(jù)進行反饋和迭代計算,完成數(shù)據(jù)訓練的工作,進而形成數(shù)據(jù)處理模型。整個數(shù)據(jù)訓練部分是基于人工智能技術的數(shù)據(jù)處理架構的核心模塊。訓練模型的形成與前面數(shù)據(jù)采集的廣度和精度息息相關,同時采用何種人工智能算法進行訓練也在其中起到非常重要的作用。訓練模型的形成極大程度地影響了整個人工智能數(shù)據(jù)處理的結果。
(3)最后的數(shù)據(jù)使用模塊是基于訓練模型的成果輸出。一般在采用訓練好的模型時,可以得到基于歷史數(shù)據(jù)的預測以及實時數(shù)據(jù)的計算結果,是整個人工智能數(shù)據(jù)處理平臺的結果輸出部分。
隨著目前使用人工智能技術進行計算的范圍和數(shù)量不斷擴大,基于人工智能算法數(shù)據(jù)處理模型的計算量也在不斷增加。通常在進行人工智能相關運算時,會進行大量的反饋和迭代計算,這會對服務器產(chǎn)生較大的負荷。而當需要處理的數(shù)據(jù)量進一步增加時,數(shù)據(jù)量的負荷會拖慢服務器的性能,也會影響結果輸出的時效性。因此,目前廣泛采用分布式計算來配合人工智能數(shù)據(jù)處理。分布式計算模型如圖2所示,可以將計算任務分派給多個分布式服務器進行下發(fā),計算完成后再將結果通過不同的分布式服務器進行匯總,通過中央控制器合成展現(xiàn)。分布式計算架構與人工智能計算相輔相成,共同完成大數(shù)據(jù)處理和計算任務。
圖2 分布式計算結構
5 結束語
本文研究了人工智能技術在移動互聯(lián)網(wǎng)發(fā)展中的應用,分析了人工智能核心技術和應用場景,并著重研究人工智能技術在移動互聯(lián)網(wǎng)領域對于移動應用性能分析、用戶身份認證以及促生移動互聯(lián)網(wǎng)新應用方面起到的重要作用。本文在人工智能技術持續(xù)突破、產(chǎn)品創(chuàng)新不斷涌現(xiàn)的背景下探討了人工智能技術在移動互聯(lián)網(wǎng)領域的實現(xiàn)和發(fā)展,展現(xiàn)了人工智能技術在各個領域的滲透力和人工智能技術在產(chǎn)業(yè)界的推動力。
作者簡介
賀倩:中國信息通信研究院技術與標準研究所工程師。