劉德寰:標(biāo)簽推薦都是偽推薦,未來(lái)數(shù)據(jù)分析是分析人
目前很多的標(biāo)簽推薦都是偽推薦,未來(lái)數(shù)據(jù)分析應(yīng)該首先完善人的緯度,未來(lái)的數(shù)據(jù)分析就是分析人。
原創(chuàng)
2016-04-20 21:27:38

【釘科技訊】UBDC全域大數(shù)據(jù)峰會(huì)?2016在北京舉辦。北京大學(xué)社會(huì)學(xué)博士、北京大學(xué)新媒體研究院教授劉德寰在“無(wú)數(shù)據(jù)不智能”的主論壇上,圍繞“有效大數(shù)據(jù)運(yùn)算的兩個(gè)路徑假說及意義”進(jìn)行演講。他直言,目前很多的標(biāo)簽推薦都是偽推薦,未來(lái)數(shù)據(jù)分析應(yīng)該首先完善人的緯度,未來(lái)的數(shù)據(jù)分析就是分析人。

劉德寰提出了有效大數(shù)據(jù)運(yùn)算的兩個(gè)路徑假說:第一個(gè)路徑,未來(lái)數(shù)據(jù)分析就是分析人,完善人的緯度。第二個(gè)路徑,對(duì)物的緯度探測(cè),基于人的認(rèn)知習(xí)慣。

他進(jìn)一步介紹這兩個(gè)假設(shè):每個(gè)非人的事物都由一個(gè)確定的N維空間,而且N可以從人的認(rèn)識(shí)能力角度定義。他特別以tesco作為案例,這家企業(yè)不僅針對(duì)每一個(gè)商品都會(huì)進(jìn)行20緯度的打分,同時(shí)也會(huì)根據(jù)進(jìn)店顧客進(jìn)行全面的分析。

以下為劉德寰速記實(shí)錄:

非常高興跟大家分享,因?yàn)檫@個(gè)話題我考慮非常多的時(shí)間了。我今天要講的實(shí)際上有效大數(shù)據(jù)運(yùn)算的兩個(gè)路徑假說極其意義。因?yàn)楝F(xiàn)在大數(shù)據(jù)已經(jīng)跟我們?cè)谝黄穑覀冎挥胁蛔x書才會(huì)談那些,現(xiàn)在這個(gè)時(shí)候需要反思大數(shù)據(jù)的問題,這個(gè)題的起源于什么呢?

起源于幾個(gè)問題,第一問題是人類行為93%是可以預(yù)測(cè)的?我講的不好就低頭看手機(jī),我講的好就照相,這些預(yù)測(cè)的東西有多少我們可以做的呢?我在用另外一個(gè)科學(xué)數(shù)據(jù)來(lái)說,人和人之間的差異,DNA上差異,原來(lái)說是0.1%,現(xiàn)在是0.3%,大家記住99.9%和99.7%是一致的,這個(gè)問題實(shí)際上是特別本質(zhì)的問題,不要說我拿一個(gè)數(shù)就能夠算出來(lái)說對(duì)人的差異,個(gè)性化能夠算出來(lái),因?yàn)檫@是一個(gè)數(shù)列問題??吹诙€(gè)現(xiàn)象,兩個(gè)數(shù)這兩個(gè)人90%的相似度,但是人的行為有多少呢?按幾十億次來(lái)算,幾十億次幾百萬(wàn)億次的行為,當(dāng)中如果有90%的相似度,會(huì)如何?

日常生活當(dāng)中經(jīng)常有現(xiàn)象,兩個(gè)人的對(duì)話,這是前兩天的對(duì)話,審美疲勞不喜歡了,原來(lái)特別喜歡,現(xiàn)在有點(diǎn)煩,另外一個(gè)人說我也是,真的有點(diǎn)煩人,我們的數(shù)據(jù)去推斷人的時(shí)候我們考慮這些因素了嗎?

再看一個(gè),深度學(xué)習(xí),確實(shí)名詞都很炫,實(shí)際上集體學(xué)習(xí)分了層級(jí),層次不同而已,深度學(xué)習(xí)面臨本質(zhì)問題,實(shí)際上主要做的原來(lái)集體學(xué)習(xí)當(dāng)中,太隨意,我不斷優(yōu)化這個(gè)模型,但是深度學(xué)習(xí)一直在用于圖像、視頻,這些包括文字學(xué)習(xí)當(dāng)中,有誰(shuí)說過對(duì)人的學(xué)習(xí)了嗎?因?yàn)槟切┪锸遣蛔兊?。只要出?lái)了就放在那兒不變的,人是變的。所以我今天要談四個(gè)問題。

第一個(gè)問題是推薦算法及問題,第二個(gè)有效運(yùn)算的原則,然后我提出兩個(gè)假說??匆幌卢F(xiàn)在推薦算法當(dāng)中大數(shù)據(jù)運(yùn)算什么東西比較容易,已經(jīng)解決的問題都是比較容易的,抓取簡(jiǎn)單的運(yùn)算,簡(jiǎn)單表格的運(yùn)算,數(shù)據(jù)可視化這些都比較容易,只要把經(jīng)典算法學(xué)過來(lái),簡(jiǎn)單改進(jìn),現(xiàn)在多的不得了,改進(jìn)一下應(yīng)用到現(xiàn)實(shí)當(dāng)中不難。但是難的問題是什么?效果,如何改進(jìn)效果,這是一個(gè)天大的難題。

人們?yōu)g覽行為那么快,我們一定要在這個(gè)基礎(chǔ)問題上用MODElbased.我們現(xiàn)在習(xí)慣于打標(biāo)簽,以相似鄰居推薦而且算法絕對(duì)不是基于人性和生活,而是基于商業(yè),大量的過度泥和。

不要把一個(gè)變量理解為一個(gè)維度,一個(gè)變量是N個(gè)維度。這個(gè)時(shí)候我們?cè)跀?shù)據(jù)運(yùn)算的時(shí)候,任何一個(gè)人的行為都是無(wú)規(guī)律的,但是人的生活方式是很有規(guī)律的,我們發(fā)現(xiàn)十年后看到人一點(diǎn)都沒有變,生活方式、價(jià)值觀、表現(xiàn)形式一點(diǎn)都沒變,這是在常人的建立。但是人的態(tài)度、情緒、場(chǎng)景都不一樣,怎么可能規(guī)律呢?人是能變的,群的行為的規(guī)律是穩(wěn)定的,這個(gè)分群不是一個(gè)行為的迭加,它是一種生活方式的展現(xiàn)。在這個(gè)當(dāng)中,群是可感知,可評(píng)判,一個(gè)人可以處于N個(gè)。我們?cè)谠瓉?lái)發(fā)現(xiàn)中有一個(gè)小群體,在移動(dòng)互聯(lián)網(wǎng)里中,技術(shù)紅顏,35到45歲的女性,買手機(jī),消費(fèi)當(dāng)中都有技術(shù)最前面的手機(jī),追求技術(shù),我們這撥人引領(lǐng)了什么?技術(shù)紅顏的是從年輕果粉中出現(xiàn)的。大家可以看技術(shù)紅顏引發(fā)的技術(shù)旋風(fēng)。接下來(lái)他演化成了巨大的趨勢(shì)和族群,形成了新的潮流,這個(gè)潮流叫熟女經(jīng)濟(jì)之微博移動(dòng)化。他也引領(lǐng)了網(wǎng)購(gòu),他同時(shí)引領(lǐng)了整個(gè)產(chǎn)業(yè)潮流的變遷,他把整個(gè)安卓新的崛起,背后都跟這個(gè)小族群有非常大的聯(lián)系關(guān)系。

群的穩(wěn)定,一看蘋果的客戶一直是M型,它是穩(wěn)定的,它在運(yùn)算當(dāng)中是可行的。所以第一個(gè)假說對(duì)象是人,第二個(gè)假說對(duì)象于物。有兩個(gè)假說:每個(gè)非人的事物都由一個(gè)確定的N維空間,而且N可以從人的認(rèn)識(shí)能力角度定義。每一個(gè)不同的物品,N維不一定一樣,但是相似,只是一個(gè)數(shù)量的變化。TESCO把每一個(gè)產(chǎn)品都用20個(gè)維度打標(biāo)簽,這件事情有多簡(jiǎn)單,我在推送的時(shí)候,OK,新聞喜歡這個(gè)東西,這個(gè)東西在時(shí)尚上打分是39.2,同時(shí)他還喜歡這個(gè)東西,這個(gè)東西在技術(shù)產(chǎn)品當(dāng)中打分是90分,再找一個(gè)產(chǎn)品,大家說這個(gè)效率要高于多少其它的事情。真正在預(yù)算當(dāng)中,我自己認(rèn)為這種方式可以融入社科的所有思想,所有搞計(jì)算機(jī),便成的人,非常多的程序員整天說的話都不是人話,對(duì)其它的行業(yè)一點(diǎn)不了解,大家覺得這事靠譜嗎?這讓我想起了東方不敗。大家可以看看亞馬遜,亞馬遜在這方面也在進(jìn)行探索,這實(shí)際是運(yùn)算邏輯本身要反歸人性,我們要向社會(huì)學(xué)、經(jīng)濟(jì)學(xué)、法學(xué)、政治學(xué)、傳播學(xué),所有學(xué)科,我們要學(xué)習(xí)他們已有的知識(shí),把已有的知識(shí)穩(wěn)定到我們的計(jì)算當(dāng)中,我相信那種運(yùn)算規(guī)則不僅效率高,而且簡(jiǎn)單。所以我基本感覺在未來(lái)的運(yùn)算當(dāng)中,有兩個(gè)東西,就是剛才說的這兩條路徑可能是未來(lái)。之所以是假說,是因?yàn)闆]有大規(guī)模實(shí)施,但是它在邏輯和實(shí)踐上是有前提的。

第一個(gè)路徑分析人,完善人的維度。第二個(gè)路徑對(duì)物探測(cè),他必須是基于人的認(rèn)識(shí)和習(xí)慣,這兩條路徑不僅效率高,穩(wěn)定性高,同時(shí)能帶來(lái)未來(lái)的各自分析的可能性,同時(shí)可對(duì)可實(shí)現(xiàn)。

最新文章
1
都是科技的狠活?2024中國(guó)國(guó)際消費(fèi)電子博覽會(huì)即將全新亮相!
2
重磅!2024中國(guó)“冷暖智造”大獎(jiǎng)獲獎(jiǎng)名單揭曉
3
2024中國(guó)暖通空調(diào)產(chǎn)業(yè)發(fā)展峰會(huì)盛大召開
4
2024中國(guó)“冷暖智造”大獎(jiǎng)-冷暖百?gòu)?qiáng)榜公布
5
勵(lì)志與甜寵完美融合,快手星芒短劇《我在公司掃垃圾》歡樂開播
6
快手發(fā)布《磁力引擎雙11營(yíng)銷作戰(zhàn)圖》,賦能品牌、商家全域增長(zhǎng)
7
《打球嘛鵬友》探訪廣州與上海,明星達(dá)人對(duì)決燃動(dòng)城市籃球基因
8
電動(dòng)兩輪車:無(wú)智能,不增長(zhǎng)?
9
IFA2024上,德國(guó)總理到訪的唯一中國(guó)品牌有何魅力?
10
以舊換新多管齊下,TCL將“政策紅利”轉(zhuǎn)化為“市場(chǎng)優(yōu)勢(shì)”
11
“兩新”3000億國(guó)資下達(dá),助力家電行業(yè)十一實(shí)現(xiàn)高增長(zhǎng)
12
高通,憑什么收購(gòu)英特爾?
13
外賣都卷到9塊9了,京東為什么還來(lái)?yè)揭荒_?
14
vivo X200系列首發(fā)!索尼光喻LYT-818傳感器降臨
15
被小米超越成全球第三!iPhone中國(guó)出貨量同比下滑12.7%:蘋果還不降價(jià)換量嗎
16
追覓勇闖“無(wú)人區(qū)”
17
主力企業(yè)激戰(zhàn)100英寸+市場(chǎng)!電視越來(lái)越大,誰(shuí)是最大贏家?
18
清潔電器均價(jià)普遍下探的2024上半年,品牌更重創(chuàng)新還是營(yíng)銷?
19
追覓發(fā)布頭皮護(hù)理吹風(fēng)機(jī)D10 驅(qū)動(dòng)頭皮養(yǎng)護(hù)體驗(yàn)革新
20
引領(lǐng)行業(yè)多項(xiàng)技術(shù)革新,追覓科技重磅發(fā)布T40 Ultra洗地機(jī)
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512