第757章 流形學習 (第1/3頁)

姚夢娜提出的這個問題,對於常浩南來說,不難理解。

只是很難解決。

真要說起來的話,這涉及到文字挖掘、資料視覺化、資訊檢索、資料探勘、機器學習乃至人工智慧等一系列問題。

如果真做到姚夢娜所設想的那樣全自動化生產,那就是工業4.0了。

在1999年這個時間點上,顯然不大現實。

但不可能完全實現這一整套東西,並不意味著其中沒有可以作為突破口的部分。

比如資料探勘和資訊檢索,就是千禧年附近很火熱的研究方向。

其核心目的是從海量資料庫和大量繁雜資訊中提取出有價值的知識,並進一步提高資訊的利用率。

實際上,在常浩南重生之前,飛機設計和製造領域已經開始應用這方面的技術,他本人也接觸過不少。

但當年的他作為一個工科出身的普通技術人員,並沒有太多理論功底。

而系統,則首先需要構建出一個完整且可行的思路出來。

這就導致如今他腦子裡空有一大堆名詞,但卻不知道哪個是破局的關鍵——

實際上,他此時就面臨著無法從大量繁雜資訊中提取出有價值資訊的困境。

“資訊……”

常浩南從旁邊扯過一張紙,在紙的最中間寫下了兩個字。

在理想化的模型中,最好是一個資料就可以精確且唯一地描述一個含義。

也就是一維資料。

小學和中學時候做的應用題,大體上就是這樣。

實際生活中面臨的,其實大多數也是這種問題。

而對於稍複雜一些的情況來說,要完全描述一個含義,往往需要一組資料。

但與此同時,這一組資料又往往不只能描述這一個含義。

要想在數學上描述這種一組(多個)資料對應多個含義的現象,就需要將一組資料在不同的維度上進行展開。

這是由數學理論推向現實的情況。

而反過來,現實中收集到的資訊,在多數情況下,本身就是已經展開過的高維資料。

而如果想要讓計算機處理這些高維資料……

常浩南思索半晌,又在紙上寫下了三個基本條件:

1、對原始高維資料進行壓縮,降低原始高維資料的維度,進而節省儲存空間,同時也降低高維資料的計算複雜度。

2、消除,或者至少降低隱藏在原始高維資料中的噪聲。

3、提取到高質量的資料特徵,提升後續的資料表示和分類任務的效果。

他在腦子裡把這三條內容過了一下,然後試圖讓系統給出一個結果。

沒有反應。

顯然,這並不能被算作是“完整且可行”的思路。

……

最新小說: 我竟然奪舍了域外天魔 快穿之炮灰她選擇種田 全球領主:開局成為沙漠領主 高天之上 昭昭我心 開局贅入深淵 全球輪迴:我的身份有問題 災變時代的熊 叮,恐怖速遞請查收 怪談模擬器 末日畸變:開局活吞眼鏡王蛇 狂傲為仙 從瑞克和莫蒂開始的次元之旅 兇萌萌的星際元帥是團傲嬌毛絨絨 元宇之決 我靠搓丸子成為星際首富 全民融靈:開局融合炎帝之靈 我的魅力只對壞女人有效 攤牌了,我就是一條龍 我造的機甲是大佬