知識MORE分享——科技篇
Big Data 大數據——大量的、種類繁多的數據陣列,使用特殊的計算機技術進行分析。
大數據來源——物聯網、社交網絡、博客、大衆媒體、設備和傳感器的讀數(例如來自氣象站的數據)、統計數據、檔案、數據庫。它們存儲在雲存儲器中的數據庫 - “數據湖”中。
大數據分析已經在許多領域得到應用——用于确保安全、診斷和預防疾病、預測事故和災害。在業務和營銷方面,基于大數據,預測客戶行為,優化成本和生産流程,評估償付能力,預測員工解雇。
“秘密”的使用示例“當你去看心理醫生時,他是根據自己的主觀意見給你診斷的,而不是大數據分析。這必須改變。順便說一下,教育領域也讓我感到驚訝。我們正在努力讓每個人都以同樣的方式學習。在我看來,大數據可以提高教育效率:例如,如果一個孩子有某種特殊的學習能力,我們可以為他優化和個性化學習。”
細微差别大數據的描述基于三個主要特征:
- 量——據估計,大數據包括每天超過 150 GB 的信息量;
- 速度 - 處理速度必須很高并在必要時增加,否則信息将變得無關緊要;
- 多樣性(variety)——不同性質的數據的集合:文本、音頻和視頻文件,結構化和非結構化。
“大數據”一詞出現在 1990 年代被廣泛使用。然而,信息量不斷增長的問題很早就開始提出。因此,作為 1880 年前美國人口普查的結果,獲得的數據量如此之大,需要 8 年的時間進行分析。然後工程師 Herman Hollerith 創建了一個制表器,可以自動處理數字和字母信息,并在紙帶上生成結果。
大數據分析
大數據分析,主要涉及到的事實,它的分析使用無法進行評估和驗證算法,不透明-目前還不清楚是采取什麼樣的數據考慮,為什麼和如何的結論作出。此外,大量不同信息的收集、存儲和處理為洩露和洩露機密創造了許多機會。
,