雷鋒網(wǎng)按:這里是,油管Artificial Intelligence Education專欄,原作者Siraj Raval授權(quán)雷鋒字幕組編譯。
原標(biāo)題 How to Start an AI Startup
翻譯 | 李振 J叔 余杭 字幕 | 凡江 整理 | 廖穎
我們正處在一個(gè)AI大革命的開端,每周都有新的創(chuàng)新出現(xiàn)。例如Tetra利用語(yǔ)音識(shí)別技術(shù),從你的手機(jī)中生成詳細(xì)的筆記;Hyper Science通過利用OCR從表單中輕松提取數(shù)據(jù);Jet Lore利用消費(fèi)者行為作為一個(gè)模型的輸入,輸出結(jié)構(gòu)化數(shù)據(jù)。在本期視頻中,我將結(jié)合自己的創(chuàng)業(yè)經(jīng)驗(yàn),告訴你們?nèi)绾螁?dòng)一個(gè)AI的創(chuàng)業(yè)項(xiàng)目。
一、推薦的學(xué)習(xí)材料
現(xiàn)在是2018年,如果你希望今年加入創(chuàng)業(yè)大軍的話,首先就要學(xué)習(xí)AI。如果你自己不了解這個(gè)神奇的技術(shù)是怎么工作的話,你不可能創(chuàng)造出AI解決方案。如果你剛剛開始看教程,記得按照這個(gè)順序——先學(xué)習(xí)面向數(shù)據(jù)科學(xué)的python,然后是Tensorflow的介紹,接著是Deep Learning的介紹,最后是關(guān)于人工智能的數(shù)學(xué)知識(shí)。
另外,Andrew Ng的最新Deep Learning課程是必選項(xiàng),Jeremy Howard的Fast.Ai 課程也非常棒。我最喜歡的關(guān)于深度學(xué)習(xí)的書是lan Goodfellow著的Deep Learning。這本書的電子版是免費(fèi)的,它對(duì)你理解關(guān)于Deep Learning的數(shù)學(xué)知識(shí)非常有幫助.Deep Learning被證實(shí)在廣泛的范圍內(nèi),可以幫助每一個(gè)其他的機(jī)器學(xué)習(xí)模型。
所以,關(guān)于AI的炒作是有道理的。然而你需要確切地知道,其他機(jī)器學(xué)習(xí)模型是怎么工作的。在無法獲取大量數(shù)據(jù)的情況下,你只能建立一個(gè)簡(jiǎn)單的預(yù)測(cè)模型。這種情況下,支持向量機(jī),甚至一個(gè)簡(jiǎn)單的決策樹,都比深度神經(jīng)網(wǎng)絡(luò)更有用。
知道什么時(shí)候用什么模型的唯一方法是,建立關(guān)于AI的直覺——這種直覺在學(xué)習(xí)和掌握大量AI 知識(shí)資源后才能得到。當(dāng)掌握了構(gòu)建AI算法的全貌時(shí),你需要找到一個(gè)激發(fā)你濃厚興趣的問題去研究——世界上大多數(shù)成功的公司都是從解決問題開始的。
二、記錄遇到的問題
記錄你和你朋友面臨的問題,以及在生活中亟待解決的問題吧,這會(huì)是非常好的選擇。這些問題困擾著你關(guān)心的人,于是你就會(huì)有解決它的熱情。
如果沒有好的想法,你可以使用社交網(wǎng)絡(luò)主動(dòng)尋找想要尋找解決方案的人。利用關(guān)鍵字或關(guān)鍵詞,找到人們發(fā)布的遭遇很大挫敗感的話題,例如我該怎么做,尋找問題解決方案,或者關(guān)于這個(gè)工作做的不好等。你可以在Reddit或Twitter等社交媒體上找到這些信息。
三、讀萬卷書,行萬里路
我認(rèn)為最好發(fā)現(xiàn)問題的方法是旅行,和不同人接觸。我在前幾年曾歷時(shí)三個(gè)月環(huán)游歐洲,在倫敦偶然碰到了Alex macaw,他給了我啟發(fā),讓我在大學(xué)前幾年的主修方向,從商學(xué)轉(zhuǎn)為計(jì)算機(jī)科學(xué)。這是我這一生最重要的改變,才能讓我成立了機(jī)器人創(chuàng)業(yè)公司Lucid Robotics。
我在劍橋讀三年級(jí)的時(shí)候,在南亞和東南亞旅行了四個(gè)月。這次旅行幫助我以不同的角度看待同一個(gè)事物。離開硅谷以后,我會(huì)親自去發(fā)現(xiàn)人們面對(duì)的問題,他們?nèi)粘5纳顔栴},關(guān)系到基礎(chǔ)設(shè)施、商業(yè)活動(dòng),當(dāng)然還有教育,對(duì)我的影響非常大。當(dāng)?shù)厝诉M(jìn)行許多簡(jiǎn)單的交流,最終形成了我自己的想法,形成了一個(gè)大的計(jì)劃——即關(guān)于AI的教育。
四、前期調(diào)研
像馬斯克說過:“創(chuàng)業(yè)就像披荊斬棘,篳路藍(lán)縷”。如果你對(duì)解決一個(gè)問題沒有熱情,你就無法堅(jiān)持。當(dāng)遇到不論多少負(fù)面的評(píng)論。我總持保留意見,因?yàn)檫@不是針對(duì)我的,而是針對(duì)解決AI問題的。一旦你有了待解決的目標(biāo)問題,就該做一些市場(chǎng)調(diào)查,包括你的客戶,他們?cè)谀睦镔?gòu)買,他們的承受能力,這是產(chǎn)品還是服務(wù),配置的花銷,市場(chǎng)的歷史怎么樣等等。
這方面的內(nèi)容可以參考dot.com(互聯(lián)網(wǎng))和大數(shù)據(jù)分析公司。根據(jù)公布的關(guān)于一般AI創(chuàng)業(yè)公司的報(bào)告,AI型創(chuàng)業(yè)公司大致分為兩類:第一類是水平方向的AI創(chuàng)業(yè)公司,主要針對(duì)服務(wù)于不同行業(yè)的基礎(chǔ)問題,比如自然語(yǔ)言處理;第二類是垂直方向的創(chuàng)業(yè)公司,針對(duì)非常具體的客戶群體,為他們解決問題,屬于一類具體的行業(yè)。
每個(gè)主流的技術(shù)公司都非常注重AI,他們雇傭AI方面的大牛,從Hinton到LeCun都是天才。他們多年來從用戶那收集了大量數(shù)據(jù),而這些只對(duì)他們自己的研發(fā)團(tuán)隊(duì)開放,因此這些科學(xué)巨人擁有巨大的優(yōu)勢(shì)。他們建立水平方向的產(chǎn)品,可以被用在很多行業(yè),例如圖像識(shí)別,語(yǔ)言翻譯或者其他的基礎(chǔ)設(shè)施。
而你所擁有的優(yōu)勢(shì),是可以根據(jù)一個(gè)獨(dú)立的問題,針對(duì)垂直方向的領(lǐng)域展開快速的行動(dòng)。他們沒有時(shí)間去處理簡(jiǎn)單的小問題,但是你有。
總的來說, 他們關(guān)注客戶多過于關(guān)注企業(yè),你可以幫助企業(yè),建立個(gè)人主頁(yè),描述你的產(chǎn)品,注冊(cè)獲得發(fā)布版本,在社交網(wǎng)絡(luò)上發(fā)布它。一個(gè)提升你產(chǎn)品認(rèn)知度的方法,是提升你自己的形象,把自己包裝成一個(gè)AI思想領(lǐng)袖,建立博客或者其他形式回答AI的基礎(chǔ)問題。當(dāng)你注冊(cè)時(shí),讓觀眾看到,如果你做的非常好,你產(chǎn)品的價(jià)格也會(huì)跟著增長(zhǎng)——它和你可以提供的成正比,這至關(guān)重要。
五、尋找數(shù)據(jù)
如果你將AI從公司剝離,但如果在正確的軌道上的話,它仍是一個(gè)有價(jià)值的產(chǎn)品。如果AI是你唯一的東西,沒有消費(fèi)者或者投資者會(huì)滿意的。當(dāng)你開始市場(chǎng)調(diào)研,就是建立你產(chǎn)品的最佳時(shí)機(jī)。建立模型的時(shí)候,你需要盡可能地組織和標(biāo)注你的數(shù)據(jù)——高質(zhì)量的數(shù)據(jù)經(jīng)常是機(jī)器學(xué)習(xí)流水線中最重要的部分,重要程度甚至超過模型結(jié)構(gòu)——在垃圾中分析垃圾什么也得不到。
最簡(jiǎn)單的方法是尋找公布的數(shù)據(jù),Github上有非常棒的數(shù)據(jù)庫(kù),California Irvine有巨大的ML數(shù)據(jù)資源庫(kù),Kaggle也有很多很棒的數(shù)據(jù)。如果這些都不管用,用你已有的數(shù)據(jù)建立自己的數(shù)據(jù)庫(kù),例如當(dāng)你嘗試著對(duì)手寫字體進(jìn)行分類,你可以通過增加噪聲的方法,從已經(jīng)存在的數(shù)據(jù)中生成新的數(shù)據(jù)。如果你有未標(biāo)注數(shù)據(jù),通過Amazon的Mechanical Turk進(jìn)行眾包是一個(gè)好的選擇。你可以找人來標(biāo)注他們。另外還有像data circle這樣的數(shù)據(jù)市場(chǎng),你可以直接從其他人手中購(gòu)買或者交換數(shù)據(jù)。
最后,如果你夠有創(chuàng)意,可以利用scrapy庫(kù)或者web service來編寫python腳本實(shí)現(xiàn)自動(dòng)抓取數(shù)據(jù),就像在diggernaut.com 上一樣。當(dāng)你開始建立模型,Tensorflow仍然是最能經(jīng)受考驗(yàn)的機(jī)器學(xué)習(xí)框架。Tensorflow的生態(tài)圈有一大堆的工具,比如產(chǎn)品化的Tensorflow Serving。建議一個(gè)模型,用你的數(shù)據(jù)通過 AWS google cloud 或者 FloydHub 來訓(xùn)練這個(gè)模型。利用你的模型進(jìn)行預(yù)測(cè)——這就是你的產(chǎn)品。數(shù)據(jù)越多意味著算法越智能,同時(shí)也意味著產(chǎn)品更優(yōu)秀,用戶更多以及數(shù)據(jù)越多,這個(gè)環(huán)狀結(jié)果往復(fù)循環(huán)。
六、融資
融資是一個(gè)加速拓展業(yè)務(wù)的方法,或許ICO圈子現(xiàn)在非常熱門,但如果你長(zhǎng)時(shí)間處身其中,可能產(chǎn)生法律問題,這里就不談了。我的一個(gè)朋友——Aetherium的第一個(gè)設(shè)計(jì)者,他不希望給他的公司做ICO,于是采用眾籌的方法籌錢。
我們可以發(fā)現(xiàn)他的做法很具有啟發(fā)性,我有一篇文章,詳細(xì)地描述了這件事。風(fēng)險(xiǎn)投資(VC)是另一選項(xiàng),通過重復(fù)使用一些流行語(yǔ)來使VC投資人相信你的產(chǎn)品很棒。其中,最好的VC投資人可以很好地理解你的產(chǎn)品,所以你需要準(zhǔn)備好向他們解釋其中的技術(shù)。
如果你可以在一些高檔的地方和VC投資人交流,說明你已經(jīng)獲得了一些現(xiàn)金流;如果沒有,就不用。這就是我在紐約被那么多VC投資人拒絕的原因——我還沒證明我的機(jī)器人能夠有很好的銷售市場(chǎng),因此我并沒有得到很多的投資,我所做的是建立一個(gè)受眾群體。我可以接受被挑剔,但是我現(xiàn)在不關(guān)注融資。
七、招聘
接下來是招聘。極少數(shù)的天才分布在全球各地,所以從kaggle的全球排行榜招人是有道理的,即最招最有用的人——我很難找到適合幫助我編輯視頻的人。如果你真心喜歡一件事情, 是很難放棄的。如果你找到合適的人,事情變得簡(jiǎn)單了。
Steve Jobs說過,最高興的事情是你擁有一個(gè)核心團(tuán)隊(duì)——可能是10個(gè)優(yōu)秀的人。它是可以自控的,某種程度上,你可以選擇退出。不論之后是被Aqua或其他的大型技術(shù)公司雇傭,還是被IPO雇傭,如果都沒有,可以走咨詢公司這條路,只是沒有開發(fā)產(chǎn)品那么具有誘惑力,但是找?guī)讉(gè)朋友開一家咨詢公司總能填飽肚子,得到一些初始用戶,慢慢做好品牌,證明自己。
視頻原址 https://www.youtube.com/watch?v=9bbS-trc8ys
雷鋒網(wǎng)相關(guān)推薦
沒有博士學(xué)位和頂會(huì)論文,我如何拿到DeepMind研究員Offer?
更多文章,關(guān)注雷鋒網(wǎng)
添加雷鋒字幕組微信號(hào)(leiphonefansub)為好友
備注「我要加入」,To be an AI Volunteer !