2008年11月27日 星期四

相關性係數

在很久已前,好像在雅策有看過相關性係數的文章。

剛剛花了很多時間在網路搜尋這方面的資訊。

算是有一點心得,應該吧!!

相關性係數,可以表示兩群資料的相關程度。

係數值在 -1 ~ 1 之間。

-1:表示兩群資料呈現負相關。

EX:(1,-1) (2,-2) (3,-3) (4,-4)....

1:表示兩群資料呈現正相關。

EX:(1,1) (2,2) (3,3) (4,4)....

0:表示兩群資料沒有關聯。

EX:(1,5) (2,-7) (3,-10) (4,999)....

負相關我對自己的解釋是"唱反調",資料1這樣,資料2完全不一樣...

正相關呢??我是自己說:這是"跟屁蟲"。資料1那樣,資料2也那樣...


用股票漲幅舉例會很明顯。

台灣兩大晶圓代工場,台積電和聯電。

這兩隻股票的走勢很一致吧,那相關性應該很高。

大家有不認同的嗎???


現在用Excel來算算兩股票漲跌福的相關性。步驟如下。



1.

如圖,利用日盛HTS匯出兩股票的月K線

留下日期和收盤價就好,其他用不著。

再來分別算出台積電和聯電每個月的股價漲跌福。

EX:台積電11月收39塊,10月收48塊。漲跌幅就是 (39-48)/48*100%

換成欄位變成 (B3-B4)/B4,複製貼上一下,就可以算出兩股票的漲跌福。

2.

對照日期,因為股票可能有減資的情況發生。

所以對照一下,看有沒有日期不同的欄位。

不然算出來的值不準。

3.

利用Excel內建公式CORREL

把股價漲跌幅輸入進去作運算。

用法:CORREL(array1,array2)

array1表示股票1的漲跌幅,array2就是股票2的漲跌幅

在圖中的公式是 =CORREL(C3:C170,F3:F170)

台積電股票漲跌幅在C3到C170欄位,聯電則是在F3到F170

注意,兩資料欄位數要相等,多的請砍掉。

所以在圖中可看到,兩股價的相關性係數是0.7735

算是有相關性而且挺高的。


再舉幾個例子。

如下圖,台塑和南亞。王老先生創辦的企業。

這個用眉毛想應該也知道,相關性很高。

實際上呢???比台積電和聯電還高,0.8842




來挑一個與台塑完全無關的股票看看。

如圖,台塑 vs 倫飛

倫飛電腦很久沒有在票面上了。

長年的雞蛋水餃股,與台塑應該是完全沒有關聯。



果然,相關性真的很低,係數隻有0.058左右。


以上是股票漲跌幅相關性係數的舉例。


那要怎麼用在程式上??

把月報酬率當成漲跌幅,然後計算兩程式的相關性係數。

如果,兩程式的報酬率相關性係數接近1。

是不是可以想成,程式1賺錢,程式2也跟著賺。很爽~

但是也要想想,程式1賠錢時,程式2跟著賠錢的機率也很高。

若兩程式相關性係數是負值。

應該可以表示,程式1賺錢,程式2賠錢。

程式1賠錢,程式2賺錢。

而且,值越小(約接近-1),越明顯。

所以,兩程式的相關性係數接近0是最好的。

表示兩程式越獨立。

以上...一點點淺見。

希望有研究的人可以分享一下
HEMiDEMi Technorati Del.icio.us MyShare?犖?貊惜 Yahoo