The Second Knowledge, Biology
卡爾‧皮爾生的啟示
創新‧困境‧再命名
卡爾‧皮爾生為何是20世紀人類最重要的思想家?因為他發現了第1類知識的局限,同時開拓了解決生理、生物問題的計量方法,他這一系的研究者,可能尚未完整領悟到「知識光譜」的存在,但已實質開創了對「生理對象」的「第2類知識」。 加入對 DNA 的發現、理解、與嘗試控制後,「神與人的關係」再度發生改變,在「生命形體」方面,許多第2類知識大師,有可能取代神在創造、與維護有形生命的地位。 |
科學知識誕生以後,有人逐漸發現這套知識體系的理論與測量方法,其實僅用於物理知識,似乎並不能妥適計量與解釋生理現象,從而有了「推論統計」的萌芽。為了區隔生理知識、建構不同的生物理論、發展針對生理現象的不同的計量方法,其起源或可視為Carl Friedrich Gauss(1809) 推廣常態分配觀念、與Gregor Mendel(1863)的豆子遺傳實驗,但把這方面研究建立為一個知識領域(廣義的Biometrics),可能還是要從卡爾‧皮爾生(Karl Pearson)的工作,與其創辦刊物Biometrika(1901)開始。
Biometrika的誕生,其實是少數志同道合者的「同仁誌」,背景是(1)他們發現並探索了一個不同的知識領域;(2)他們的努力不被大部分的當時學者認同。所以計畫乾脆「自己寫、自己編、自己登」。
倡議者之一Raphael Weldon在提出構想(1900)時說:「『在自然(生命)現象中不存在特殊計量方法』的觀點,是一個嚴重的錯誤,必須鬥爭矯正。人類對這個問題應該有不同的知識,但當前大部分的(生物)學者,卻沒有這樣的認識。(The contention "that numbers mean nothing and do not exist in Nature" is a very serious thing, which will have to be fought. Most other people have got beyond it but most biologist have not.)」。
這個領域的開拓者與後續主要貢獻者,並沒有使用過「第2類知識」的名稱,但在Weldon的發言中,可知先驅者已經體會,生理計量法是一種不同的思想方法。但歷經百年以上的流變,推論統計已經完全翻身變成「社會相信」以後,許多人又直接使用這種方法解釋各種問題,忽略了「對象」應與「計量工具」的配合。所以,我建議採用「第2類知識」的觀念,以區隔、辨別「生理知識」是「知識光譜」中重要的一段。
常態分配性質
第2類知識的限制
這套知識觀察對象並無「第1類知識」所必備的「反身性(Reflexive Property of Equality)、等加性(Addibility)」的性質。
但觀察對象卻必須具備「等機率」與「常態分配」性質,所以可以使用由皮爾生(Karl Pearson, 1857-1936)、與費雪(Ronald Fisher, 1890-1962)先後共同建立的「推論統計(非描述統計)」、原稱「生物計量法 Biometrics」作為計量工具,經由「中央極限定理」而可以達到「區間預測」的效果。具備「常態分配」性質的多是生理現象、也包括高能現象。推論統計雖然以微積分為基礎,但對觀察、計量所得數字的詮釋其實非常不同。
Weldon的發言中使用「鬥爭」一詞,反映了與當時頂尖學者們-皇家學院(Royal Society)的衝突;其實,Pearson 本人已經是皇家院士了,光環已經不小了,自己的研究成果還是「不能」、或是「不願」刊登在當時的著名學刊上,都反映了真正「創新的困境」。
Biometrika長期形同Pearson的個人刊物,更是少見的「父傳子繼」的學術刊物,是父子合計經營60年的小眾媒體。如果Pearson生在今天,他們極可能經營的就是個人研究網站。
但是Biometrika今天的形象卻是「頂尖中的頂尖」學術期刊,她的演變證實了真正創新活動在草創期不易被認同,但經過漫長的潛移默化,又會變成盲目的社會相信。這也是「取用行為模式(TX Adoption Model)」的一個歷史實驗。
現代統計
當前一般文獻所稱的「現代統計」,其實只是比爾生(Karl Pearson, 1857-1936)、與費雪(Ronald Fisher, 1890-1962)稍晚一點的研究者,其觀照其實與古典(即20世紀初)推論統計相差不大。
統雄老師建議之「現代統計」,係二戰之後陸續發展的「多變項分析」、與「多變項模型」建構,尤其是廣義線性模式 (generalized linear model),縮寫為GLM,但近來已有將縮寫改為GLZ的趨勢,它提供了整合線性與非線性多變項模型的基礎,脫離了古典推論統計原始框架的觀照,統雄老師-似乎零星西文文獻也有此議-因此提議,以此作為畫分「古典推論統計」與現代統計的界限。
而多變項模型分析的成果,反映了其各種應用,如 SEM 在人類行為研究上的不足,因此更有發展「第3類知識」計量方法的必要。
知識效力之辨:從「框架知識」到「基礎知識」
伽利略的啟示 牛頓的啟示 愛因斯坦的啟示 皮爾生的啟示 牛頓與蘋果 自然哲學的數學原理 簡介 |
知識的效力我們還是一貫採用以下的定義:對觀察對象解釋、預測、控制的程度。
「第2類知識」的源起是對生理、生物現象的分析興趣。歷經百年後的今天,知識成果為何呢?
我們可以問以下幾個「健康與飲食」的簡單問題:
牛奶對健康好嗎?
雞蛋對健康好嗎?
維生素對健康好嗎?
維骨力對健康好嗎?
深海魚油對健康好嗎?
…
如果再加上相對性的問題:
減肥不能吃肉?減肥要吃肉?
蛀牙要馬上補牙?蛀牙不要馬上補牙?
被蛇咬到要趕快放血?被蛇咬到不要放血?
…
我們輕易可以找到各式各樣、甚至完全相反的科學研究報告,主因就是生理、生命研究屬於「機率知識」,應變項與自變項如果產生關聯,可能是科學知識,但也可能是純粹的碰巧與運氣。
而一般人對「機率知識」的認識、測量、與驗證,經常不足,甚至誤解。
坊間許多對生理、生命的解說,只是「社會相信」,甚至是故意的詐欺行為,如流傳長達十數年的騙局「酸鹼體質論」。
這個現象說明,由於「第2類知識」只能實現「區間預測」的性質,使得這個領域中,存在較「第1類知識」更多的框架知識、甚至偽知識。
不過,近20年對 DNA 研究發現與應用的發展,使「第2類知識」從觀察生理外形:身高、體重、血壓…進入到可以觀察肉眼「看不見的特質」,使得「第2類知識」中基礎知識的建構,有極大助益。
統雄老師也可以預言,未來從「第2類知識」到「第3類知識」的連結, DNA 應扮演關鍵的角色。
定義之辨:從「第2類知識」到「第3類知識」
統雄老師建議的「第3類知識」,是解釋、預測人類長期行為的廣義領域。
當年Pearson發展Biometrics,字面已說明是「生物計量、生物統計」方法。而現代推論統計學的第二奠基者Ronald Fisher雖然用了「統計方法(Statistical Methods)」一詞,他的研究核心還是遺傳與生物現象。
但一旦「推論統計」的觀念被「社會相信」接受、跑進學校課程、教科書後,卻被概化為字面意義更廣的「統計」,而且不問前提-尤其是常態分配的前提,普遍應用到各個領域-尤其人類行為領域。
統計可以援用、但不盡適用於計量人類行為。舉一個淺顯例子如下:如果我們種豆子,灑水施肥,可以預測所有豆子的高度,會形成接近常態分配。但如果我們在課堂教微積分、教英文…教各種課程,教學經驗已經告訴我們,學生的學習成果幾乎不會是常態分配的。事實上,比較接近「TX取用模式(TX Adoption Model)」,亦即學生會因課程主題,而分成「有需求」「沒需求(包括跟隨社會集體行為而背誦者)」2群,而有不同成果。
當前的教育制度、教育理論發展出了以常態分配為基礎的各種「學習成就常模」如學測的「量尺」法…等等,其實是一種資料的扭曲、測量工具的誤用。
人類行為必須另行探索「第3類」的「行為測量的理論與方法」。
不過,現在也有Behaviometrics一詞。
Biometrics有廣義、狹義的定義,生理計量是廣義的;但在坊間,狹義的應用定義更常見,形同「人體工學」的同義字,如Biometric滑鼠(如圖)…等。
Behaviometrics當前似乎也偏向狹義,指人類「行動」的影像辨識或捕捉、使用搜尋引擎作網路行銷…等,和本網群的觀照差異很大。
所以統雄老師建議使用「第3類知識」一詞,英文方面,如果 Behaviometrics 容易引起誤解,就另創新詞,Behaviometrika 也許會是一個不錯的選擇。
計量方法之辨:工具應用與純數學
本網群注意到知識創新包括:理論建構與計量工具2部分,所以也致力於計量工具的發展。
這項發展著眼於設計工具、解決問題,正如牛頓是為了證明力學才發明微積分,希望不被專業數學家歸類為「業餘數學家」。
所以統雄老師強調:統計不是第1類知識(物理)中所認為的數學,雖然統計還是大量使用一般數學方法--如微積分的概念,但要測量的是區間值、追求的是不同的生理現象知識。
推論統計中的「樣本平均數的分配」是不存在實際世界中的,「標準誤」的計算方法,也沒有超過微積分。但統計是先觀察到生理現象的常態分配性質,才構想出虛擬的「樣本平均數的分配」,得以用比較的方法,測量對象的區間差異。
同理,統雄老師的「接龍實驗」要對n個隨機變項作預測。專業數學家一定會對這個問題投以冷笑,因為從純數學、純機率論來看,n個隨機變項作預測就是隨機的,除了碰運氣,是不可能預測的。
統雄老師主張:人類行為變項不是一般數學定義中的變項,不是相同隨機的變項,而是分為2類:SE變項、和SU變項,只要能夠區別變項性質,就能夠預測n個變項。就接龍而言,不是去對94張暗牌(或90%以上的未知事件)排序,而是對已知2張明牌排序,當然可以達到預測成果。
這個觀念可能比「樣本分配」的存在還要抽象 ,一般人不易瞭解,專業數學家更不相信,所以要有接龍實驗:證明給你看!(偏偏「取用模式」又可以預測:高比例的人,看了也不信,歷史上的創新者,也全部經過這個歷程。)
計量的工具必須與對象的性質相符,這也是統雄老師的評論:一般專業數學不能解決人類行為問題,推論統計方法也不能。譬如,當前行為研究盛行的線性結構模式(SEM),就不是適合的工具,必須探索新的、不同的計量工具。
便利模型之辨
統雄老師正在發展的「取用模式」,是一個可以作「類型預測」的便利模型。
什麼是便利模型?
常態分配就是便利模型。
歷史上可能從來沒有一個變項,被肯定為「完全常態分配」的。但發現許多生理現象、甚至高能現象,有具備常態分配的傾向,所以必須先建構「常態分配模型」的存在,許多統計測量分析才得以實施。統雄老師正在發展的「取用模式」,也是如此。
札根與開花之辨/實驗法與計量法/理論與應用
歷史上重大的知識創新,理論與應用是分立的,實驗法與計量法幾乎都是分不同階段完成的,兩者也不一定孰先孰後。
Galileo 先以滾球實驗法,發現了重力的存在,要等 Newton 發明計量法的微積分寸得到驗證; Einstein 打破 Newton古典物理框架的思想,由 Oppenheimer來證實。
而在生物科學方面,施滅了微屍(Ignatius Philipp Semmelweis,1818-1865,一般譯為伊格納茲.塞麥爾維茲),在行醫實驗中領悟了病菌的存在,一樣等到巴斯德才發現病菌理論。Mendel 的遺傳理論、 Galton 對「相關」的概念,分別都由Pearson 所發展的卡方檢定、積差相關完成計量方法。
統雄老師同時對2方面學習探索,負擔很重。雖然,這是創新嘗試歷史之必然,也期待有更多相同想法、對知識冒險有興趣的朋友參與。
前文提到Gauss(1809) 「『推廣』常態分配觀念」,一般認為Gauss是「發現」常態分配,但也有歷史學者發現,Gauss可能引用了比較不有名者的發現。微積分上有名的L'H ôpital 規則,後來發現其實他是引用他朋友的發現;Jean-Baptiste Lamarck可能是真正演化論的始祖,而後來被達爾文所發揮。…不註明來源,而引用他人成果的名人,似乎並不少。歷史的實驗,與「取用模式」均可預測:形象較亮者,有可能引用較淺者的貢獻,甚至吸收其他相關者的成果於一身,譬如,一般人只會以為Newton是微積分的創始者,而不知道Leibniz。
本網群統雄老師所探索的內容,還沒有被「社會相信」所認同,未來如果被更有名氣的人士所「引用」「吸收」,也是不能排除的或然。
參考連結
http://en.wikipedia.org/wiki/Biometrics
http://en.wikipedia.org/wiki/Biometrika
http://en.wikipedia.org/wiki/Carl_Friedrich_Gauss
http://en.wikipedia.org/wiki/Francis_Galton
http://en.wikipedia.org/wiki/Gregor_Mendel
http://en.wikipedia.org/wiki/Karl_Pearson
http://en.wikipedia.org/wiki/Stigler%27s_law_of_eponymy
http://en.wikipedia.org/wiki/Walter_Frank_Raphael_Weldon
http://episte.math.ntu.edu.tw/articles/mm/mm_07_4_01/index.html
http://inventors.about.com/od/ostartinventors/p/Oppenheimer.htm
http://journal.uii.ac.id/index.php/Snati/article/viewFile/1244/1044
http://www.alexa.com/siteinfo/behaviometrics.netabout.html
http://www.oxfordjournals.org/our_journals/biomet/about.html
喝弱鹼水能調整體質?「酸鹼體質理論」創始人被罰 1 億美元
https://technews.tw/2018/11/09/ph-miracle-dr-robert-young-was-fined-100-million-usd/