用純粹的數(shù)據(jù)建模時,建議不要多于3個自變量,如果自變量超過5個就非常困難了。自變量多時,純粹的數(shù)據(jù)建模會遭遇組合爆炸問題。這時,成功的概率如同大海撈針。
?
對于一般的工業(yè)過程,超過10個自變量是非常常見的。這時,純粹的數(shù)據(jù)建模基本上不靠譜。但另外一個方面,無論問題涉及到多少個自變量,人類似乎總會有些辦法。這聽起來似乎很神秘,但確實如此。所以,數(shù)據(jù)建模一定要學(xué)會借助人的理論和經(jīng)驗。同時,我也發(fā)現(xiàn):基于人的經(jīng)驗和理論進(jìn)行數(shù)據(jù)建模,總會比人的經(jīng)驗強(qiáng)一點。對創(chuàng)新來說,強(qiáng)一點就夠了——然后可以持續(xù)改進(jìn)。一下子想得到理想的結(jié)果,基本上是不靠譜的。
?
但是,純粹的理論一般也不靠譜。我們注意到:科學(xué)原理很少有10個以上變量的。因為科學(xué)研究的都是本質(zhì)、都是簡單的東西。而在應(yīng)用科學(xué)原理的時候,人們往往卻會遇到10個以上自變量的情況——這是因為,科學(xué)原理中所需要的參數(shù),往往是不能直接測量的、而是受到其他因素的影響。所以,純粹的機(jī)理模型,也幾乎找不到好用的地方。
?
事實上,工業(yè)界的知識,往往不是理論推導(dǎo)出來的——而是實驗手段獲得的。理論的作用是給人以啟發(fā),少走彎路、少做實驗。一個辦法成功了,就記住這個辦法。然后,把這個辦法所用的參數(shù)盡可能地固定下來,以求得穩(wěn)定的產(chǎn)品質(zhì)量——這就是工業(yè)界真正的邏輯。
?
機(jī)理和數(shù)據(jù)方法的綜合應(yīng)用,往往就是基于這種知識的:所謂的知識,其實是知道一個工作點;工業(yè)界總想把生產(chǎn)過程的重要參數(shù)控制在這個工作點附近。但由于各種干擾粗暴在,總會出現(xiàn)偏離。出現(xiàn)偏離之后,就要設(shè)法糾偏。糾偏的時候需要找到辦法:可以用機(jī)理得到一個架構(gòu),然后用實際的數(shù)據(jù)來糾正機(jī)理模型。這樣,機(jī)理和數(shù)據(jù)就融合起來了。
?
科學(xué)家會告訴你:理想情況是怎樣的。而工程師的水平在于:條件不理想的時候,你知道怎么辦。