如何使用量化投資策略常用的回測平臺MATLAB從網頁中抓取金融數據?

  |  

用MATLAB從網頁中抓取金融數據

MATLAB不僅能用於數學計算,同時也能用於文本解析。


下面是用MATLAB從雅虎財經檢索股票歷史價格信息的例子:

clear;%刪除之前定義的變量

symbol='IBM';%股票代碼

%檢索網頁

historical PriceFile= ...

urlread(['http://finance.yahoo.com/q/hp? s=',symbol]);

%將日期存入單元格數組

dateField=…。

regexp(historicalPriceFile,…

'<td class= "yfnc_tabledatal”nowrap align="right">…

([\d\w-]+)</td>','tokens');

%將教值存入單元格數組

numField=regexp(historicalPriceFile,…

'<td class=”yfnc tabledatal”align=”right">…

([\d\.,]+)</td>’,'tokens');

%轉換爲字符串單元格數組

dates= [dateField {:}]’;

numField= [numField{:}]’;

%轉換爲雙精度浮點單元格數組

op=str2double (numField (1: 6: end));%開盤價

hi=str2double (numField (2: 6: end));%最高價

lo=str2double (numField (3: 6: end));%最低價

cl=str2double (numField (4: 6: end));%收盤價

vol=str2double (numField (5: 6: end));%成交量

adjCl=str2double (numField (6: 6 : end));%調整收盤價

這個程序文件可以從epchan. com/book/ example3_1.m下載,用戶名和密碼都是“sharperatio"。這個網頁抓取程序有一個侷限:每次只能抓取一個網頁上的信息。由於雅虎財經上的歷史數據顯示在好多頁上,所以使用MATLAB檢索IBM全部歷史價格數據並不十分有用。當然,這個程序只是MATLAB文本解析功能的簡單展示。

推薦閱讀

相關文章

KDJ指標的止損要則

止損要則KDJ指標的止損,關鍵是看指標中KD線的變化情況。如果行情出現買入信號,投資者根據信號的指示買入建倉,但是行情不久就出現了下躍走勢,且躍穿了10MA平均線,那麼通常KDJ指標的K線也會出現下穿50的情況。這個時候,通常預示着行情有可能中途夭折,所以投資者必須警惕危險信號。

2根均綫金叉買入法則

2根均綫金叉買入法則技術特徵第一,在周綫均綫交易係統裏,趨勢明確上行,短期均綫發生金叉。如下圖所示。 第二,這2根均綫一般選擇3周均綫和5周均綫,周綫金叉意味著上升的趨勢已經確立。 第三,周綫金叉是大級彆行情到來的重要信號,此時需要積極參與,韆萬不要錯過。

頂天立地K線形態?頂天立地形態的詳細分析及技術要點

當股市處於劇烈寬幅震盪行情中時,或者上市公司遇到突發消息時,個股會表現出劇烈震盪走勢,有些個股在某一交易日內出現振幅極爲巨大的陽線,有時最低價能夠接近跌停板,而當天最高價卻接近漲停。其中,K線實體的漲幅超過10%,這種K線形態被稱爲極度長陽線,出現極度長陽線的個股中將有相當一部分會在後市行情中出現急速機升的走勢。

1分鍾圖均綫止贏法則

均綫係統空頭排列止贏法則技術特徵第一、在1分鍾的分析周期上,股價反彈失敗後,拉齣一根大陰綫,如下圖所示。第二、隨後股價直接擊穿均綫係統所有均綫,均綫係統呈現為空頭排列。第三、此時,1分鍾的中長期的均綫組閤對股價的上行構成瞭反壓,製約著股價上行。

均線系統實戰股譜解密

如圖1 -9所示,2008年,當5周均線和13周均線向下發散形成空頭排列時,大盤明顯走進了可怕的下降通道,在此通道內持股風險巨大;;2009年,當5周均線和13周均線向上發散形成多頭排列時,大盤明顯走入了可喜的上升通道,在此通道內持股賺錢是必然的事情。

價升量縮的經典運用(拓維信息)

在衆多漲停基因中,“價升量縮”是唯一一個可以用單個基因來做預報的。對“上海物貿”這隻股票,我們用“價升復縮”這一個漲停基因來預報,這5次預報5次全部成功。此前我們於2013年6月7日、6月26日、8月20日對“中青寶”的多次盤前預引也都是採用了“價升量縮”這個基因。成功率也很高。

一年之中的不同月份案例說了什麼道理?有什麼影響?

表29是阿瑟.梅里爾的另-項研究成果一從1897年至1974年按月統計的市場季節性趨勢。我們將該數據更新到了1988 年。表29反映了1992年以來,某一月道瓊斯指數上漲的概率。如表29中所示,指數表現最好的分別是年底和夏天。

市值因子選股3等分?市值因子選股3等分是什麼意思?

圖5-6展示了將所有股票按照流通市值大小劃分爲3個等份,每-等分中的股票又按照等權重進行組合時,3個等份各自的平均月度收益,分別爲2.62%、1.46%和0.94%。由於同期的股市從整體上來說是上漲 0的,因此三個值均爲正值是一個合理的結果。

均綫死亡榖特殊形態實戰應用技巧分析

死亡榖是指股價或指數見頂迴落時,帶動5日均綫下穿10日均綫和20日均綫,10日均綫下穿20日均綫,三條均綫交叉形成的尖頭嚮下的不規則三角形。其中三個交叉中,至少有兩個是死亡交叉。因其外形像山榖,後市看跌,所以稱為死亡榖。死亡榖是與銀山榖、金山榖相對的一種技術形態,技術形態的構成和特徵相同,隻是方嚮和技術含義相反。

DIFF綫與DEA綫的死叉:低位死叉的賣點

MACD指標的死叉,是指DIFF綫自上而下穿過DEA綫所形成的交叉。與金叉相同,不同位置的死叉,會體現齣不同的市場含義。低位死叉的賣點低位死叉,是指發生在軍軸下方較遠地方的死叉。這種低位死叉,往往齣現在下跌趨勢中嚮上反彈結束時,因此低位死叉是反彈結束的賣齣信號。