存儲密度容量決定人工智能技術(shù)程度
人工智能技術(shù)的智能程度如何?這是與其平臺上存儲密度和容量有絕對正比的關(guān)系,這是今天上午9點(diǎn),筆者參加IBM在北京舉行了主題為“天工開物,人機(jī)同行”的2017 IBM中國論壇最大的收獲。 人工智能技術(shù)尚無統(tǒng)一定義標(biāo)準(zhǔn) 火了兩年的人工智能這一話題熱度目前依然在上升,盡管升級于IT行業(yè),但今天不論任何行業(yè)任何公司在討論未來發(fā)展時都只會強(qiáng)調(diào)人工智能技術(shù)的重要性。但人工智能技術(shù)的衡量標(biāo)準(zhǔn)是什么?各家都在說自己的人工智能技術(shù)比其他家好,但如果沒有統(tǒng)一的對比標(biāo)準(zhǔn),這種好又從何而來? 人工智能技術(shù)離不開大數(shù)據(jù) 人工智能技術(shù)離不開大數(shù)據(jù),而說到數(shù)據(jù)就不得不提到結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù)比較簡單,如果用數(shù)據(jù)模型來表示就是二維表(Excel表格就是典型的二維表)。而非結(jié)構(gòu)化數(shù)據(jù)則比較復(fù)雜,數(shù)據(jù)模型也種類繁多,比如樹形結(jié)構(gòu)圖。 非結(jié)構(gòu)化數(shù)據(jù)對技術(shù)要求極高 ? ? ? ? 舉個簡單例子,蘋果。蘋果的產(chǎn)地,價格,重量等這些可以量化的數(shù)據(jù)都可以很清晰直觀的存儲在數(shù)據(jù)庫中,這就是結(jié)構(gòu)化數(shù)據(jù)。那么味道該如何存儲呢?甜?酸?多甜?多酸?這些數(shù)據(jù)并不直接對應(yīng)某種屬性,因此需要多種方式來進(jìn)行解釋,也正因?yàn)槿绱嗽斐蓴?shù)據(jù)存儲量大幅上升,而這也給人工智能技術(shù)帶來極大的挑戰(zhàn)。 存儲密度與容量決定人工智能技術(shù)程度 以IBM的Watson(沃森)認(rèn)知系統(tǒng)為例,其中最為重要的就是通過神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)等多種技術(shù)讓機(jī)器盡量像人類一樣去理解非結(jié)構(gòu)化數(shù)據(jù),而若要實(shí)現(xiàn)這一切,首先需要擁有海量的數(shù)據(jù)來幫助機(jī)器判斷,畢竟在機(jī)器的世界中只有簡單的0和1,而若想實(shí)現(xiàn)最終的“智能”目標(biāo)還需要一個從量變引發(fā)質(zhì)變的過程,這對數(shù)據(jù)存儲技術(shù)有了新的要求。 以醫(yī)療行業(yè)數(shù)據(jù)為例,2011年的醫(yī)療健康數(shù)據(jù)量是 150 exabytes(EB), 1EB換算成我們常用的TB單位則是1024*1024=1048576 TB。而據(jù)數(shù)據(jù)分析機(jī)構(gòu)預(yù)測,到了2020年,每73天醫(yī)療數(shù)據(jù)量就會翻一翻。據(jù)陳黎明介紹按照目前使用的存儲技術(shù),每150萬個原子才能存儲一個比特(bit)的數(shù)據(jù),而今年2月IBM在《自然》學(xué)術(shù)期刊上發(fā)表的研究成果已可實(shí)現(xiàn)在單個原子上存儲1比特數(shù)據(jù)。直觀量化來說就是一枚硬幣大小的硬盤可以存下iTunes里的2600萬首歌曲,大幅縮小體積所帶來的好處顯而易見,除了可以節(jié)省大量存儲成本外,最為重要的就是更多的數(shù)據(jù)將為機(jī)器提供更多的參考實(shí)例,讓機(jī)器像模仿人類思考方向更進(jìn)一步。 本次大會上IBM大中華區(qū)董事長陳黎明、IBM全球高級副總裁Bruno Di leo等來自IBM的十余位高管攜手5位分別來自金融、營銷、法律、醫(yī)藥、材料、智能硬件領(lǐng)域的公司高管分享了關(guān)于人工智能技術(shù),云計算以及物聯(lián)網(wǎng)目前的技術(shù)發(fā)展?fàn)顩r和相關(guān)應(yīng)用案例。