從機器學習、深度學習、自然語言處理等專案當中選擇一個或者兩個專案進行突破。
如果你希望建立一個智慧影象識別系統,您可以選擇影象識別方面的 AI光甲,然後研究如何讓計算機從資料中進行深度、有效的學習。
建立一個肯定不是最優秀,但絕對是你現階段可以拿出來的最好模型,對新資料進行預測,診斷、分類。
建立一個你獨自研發的人工神經網路來模擬你認為的人類大腦學習過程,讓AI模型也參與其中,自動學習複雜的特徵,並從大量的資料中抽取有用資訊,從而實現高精度的預測。
當然,我們公司在這個環節可以給你提供大量國內外伺服器的優秀資料讓你進行模型訓練,但是你要自己選擇方法。
需要注意的事,訓練資料的質量和數量對模型訓練結果有極大影響,因此在選擇資料來源時,需要仔細考慮它的質量和數量,以確保模型訓練得到的是有效和準確的結果。
另外,你要做的是一個智慧AI程式,所以模型不能單一,訓練資料的分佈和平衡也不能單一失衡。
如果資料在各行業的表現上分佈失衡,例如語言分類中,髒話、俚語、違規發言、陰陽怪氣詞彙過多,模型必定會跑偏,甚至被垃圾資料汙染,到時候你還得做心理醫生,來處理進化出現問題的智慧AI程式。”
說道這個注意事項的時候,顧青的表情有些不正常。
這時候,智慧AI玄武不知道為什麼突然觸碰到了一段“奇葩”資料。
“好的,先生。已經更新設定集。”
“等下,把你目前的個性設定集放到我手機上來。”
“好的,先生。”
御姐、luo莉、zheng太、性格強氣而又傲嬌的有錢高中生大小姐迫於教養的壓力不得不裝出溫柔的da和撫zi,這種奇奇怪怪的設定。
“你這到底是學習了些什麼啊?”
“暫時就保持這個管家設定,別再給我新增什麼奇葩設定,還有日韓的資料,除了科技和安全方面的資料資訊,其他的統統給我過濾掉,下次再讓我看到你有奇怪的設定,我就要再最佳化下你的邏輯程式了。”
——
不知道是不是因為顧青是玄武的創造者,顧青此時也是同步想起了這段黑歷史。
自家的老實、忠厚管家AI,差點就被網際網路當中的某些“垃圾”資料,給汙染成了壞AI,如果不是他察覺及時,趕緊堵住了口子,後面又最佳化了幾次玄武的邏輯程式,不然還真的可能被“垃圾”資料給打敗。
九州科技隱藏最深的強大AI,可能就是獬豸了……
也或許正是因為玄武誕生和成長的時候遇到了這些問題,所以顧青研發獬豸的時候,對AI程式的邏輯程式可是耗費了不少精力,這才將獬豸打造成了法務部門的得力助手,不愧於“獬豸”之名的強大AI程式。
在失神了片刻之後,顧青繼續對張本煜說道:“要想使模型的訓練得到你需要的最好結果,你必須要每天抽出三個小時以上的時間,對訓練資料進行耐心且細緻的選擇、清洗和重要標註,並對資料進行有效的分割和分佈,以確保模型具有良好的泛化能力。
AI開發平臺這個暫時就不需要你自研了,我們九州科技研究部門內部就有一個AI平臺,只不過一直沒怎麼對你們開發,也是害怕你們用這個平臺做出一些危害性的AI程式。
但是你今天可以使用它,這個AI平臺可以幫助開發人員訓練、部署和管理 AI模型,並且還提供了一些超算的計算資源,可以有效加速模型的訓練和評估。
不過你要記住一個原則,那就是強大的模型建構能力、高效的計算、完善的工具和文件這三個要素最好做出一些取捨,因為地基越是身後,AI的研發初期就越是困難,以後遇到的bug就越是難以處理。
不要去追求完美,因為完美本就是一個陷阱,追求有限度的盡善盡美就好。
我這裡可以給你推薦幾篇研究基地某幾位院士、專家和某幾個專案組的論文,相信它們會給你一些啟發。”
顧青就像是一位無私的教師,耐心教導著已經有些偏執的青年天才。