一桶布丁提示您:看後求收藏(貓撲小說www.mpzw.tw),接着再看更方便。
對於寧爲來說並不認爲席捲而來的緋聞是件很困惑的事情。恰好相反,對於數論中的研究纔是最讓他頭疼的。
之所以他一直認爲自己只是有了階段性的進展,因爲相對於大數據的判斷跟分析來說,解決其移動跟交換能力只是最基礎的部分。
這涉及到更多基本的問題,比如數據在數學上的精確定義,並且要賦予它數學上的表達,比如其數域類型的數字跟其物理量綱。同時數據的抽象表達跟其關係模型也需要重建。
比如如果把大數據定義爲量和質、多樣性、存儲、檢索、提取、計算、語義認知、維護和處理諸方面有別於無類型離散數字的超大規模異構類型化量所構成的一個超結構。那麼在構建整個理論之前就需要對這個超結構有嚴格的定義,才能用數學語言去對整個大數據系統進行描述。
這其中蘊藏的難度是可以想象的。
大數據的基本特徵是非結構化、異構、單調增長、非描述性、混合/模糊語義,且一致性隨時間衰減或熵隨時間增加,這些固有的複雜性和極大規模的多維超結構對象,極難定義。
羅伯特教授的論文讓他想到了另一種可能。
既然從數學的角度來定義太過困難,爲什麼不能從機器的視角去解決這個底層難題。
如果代入機器的視角,寧爲總結出了通過類別跟來源定義數據的結構
觀察數據,可以包括事實,狀態,跟行爲;針對事實可以劃分爲特徵、序數、基數、計數、數量;狀態可以劃分爲存在形式、構造、狀態變化;行爲則可以分解爲互動、規範、週期、分佈、頻率。