在很久已前,好像在雅策有看過相關性係數的文章。
剛剛花了很多時間在網路搜尋這方面的資訊。
算是有一點心得,應該吧!!
相關性係數,可以表示兩群資料的相關程度。
係數值在 -1 ~ 1 之間。
-1:表示兩群資料呈現負相關。
EX:(1,-1) (2,-2) (3,-3) (4,-4)....
1:表示兩群資料呈現正相關。
EX:(1,1) (2,2) (3,3) (4,4)....
0:表示兩群資料沒有關聯。
EX:(1,5) (2,-7) (3,-10) (4,999)....
負相關我對自己的解釋是"唱反調",資料1這樣,資料2完全不一樣...
正相關呢??我是自己說:這是"跟屁蟲"。資料1那樣,資料2也那樣...
用股票漲幅舉例會很明顯。
台灣兩大晶圓代工場,台積電和聯電。
這兩隻股票的走勢很一致吧,那相關性應該很高。
大家有不認同的嗎???
現在用Excel來算算兩股票漲跌福的相關性。步驟如下。
1.
如圖,利用日盛HTS匯出兩股票的月K線
留下日期和收盤價就好,其他用不著。
再來分別算出台積電和聯電每個月的股價漲跌福。
EX:台積電11月收39塊,10月收48塊。漲跌幅就是 (39-48)/48*100%
換成欄位變成 (B3-B4)/B4,複製貼上一下,就可以算出兩股票的漲跌福。
2.
對照日期,因為股票可能有減資的情況發生。
所以對照一下,看有沒有日期不同的欄位。
不然算出來的值不準。
3.
利用Excel內建公式CORREL
把股價漲跌幅輸入進去作運算。
用法:CORREL(array1,array2)
array1表示股票1的漲跌幅,array2就是股票2的漲跌幅
在圖中的公式是 =CORREL(C3:C170,F3:F170)
台積電股票漲跌幅在C3到C170欄位,聯電則是在F3到F170
注意,兩資料欄位數要相等,多的請砍掉。
所以在圖中可看到,兩股價的相關性係數是0.7735
算是有相關性而且挺高的。
再舉幾個例子。
如下圖,台塑和南亞。王老先生創辦的企業。
這個用眉毛想應該也知道,相關性很高。
實際上呢???比台積電和聯電還高,0.8842
來挑一個與台塑完全無關的股票看看。
如圖,台塑 vs 倫飛
倫飛電腦很久沒有在票面上了。
長年的雞蛋水餃股,與台塑應該是完全沒有關聯。
果然,相關性真的很低,係數隻有0.058左右。
以上是股票漲跌幅相關性係數的舉例。
那要怎麼用在程式上??
把月報酬率當成漲跌幅,然後計算兩程式的相關性係數。
如果,兩程式的報酬率相關性係數接近1。
是不是可以想成,程式1賺錢,程式2也跟著賺。很爽~
但是也要想想,程式1賠錢時,程式2跟著賠錢的機率也很高。
若兩程式相關性係數是負值。
應該可以表示,程式1賺錢,程式2賠錢。
程式1賠錢,程式2賺錢。
而且,值越小(約接近-1),越明顯。
所以,兩程式的相關性係數接近0是最好的。
表示兩程式越獨立。
以上...一點點淺見。
希望有研究的人可以分享一下