女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

關于數據挖掘原理分析及其在量化投資中的應用介紹

MATLAB ? 來源:djl ? 2019-09-19 09:00 ? 次閱讀

一、什么是數據挖掘

數據挖掘(Data Mining),也叫數據開采,數據采掘等,就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。

數據挖掘基于的數據庫類型主要有關系型數據庫、面向對象數據庫、事務數據庫、演繹數據庫、時態數據庫、多媒體數據庫、主動數據庫、空間數據庫、文本型、 Internet信息庫 以及新興的數據倉庫(Data Warehouse)等。而挖掘后獲得的知識包括關聯規則、特征規則、區分規則、分類規則、總結規則、偏差規則、聚類規則、模式分析及趨勢分析等。數據挖掘是一門交叉學科,它把人們對數據的應用從低層次的簡單查詢,提升到從數據中挖掘知識,提供決策支持。數據挖掘在數據由數據庫轉化為知識的過程中,所處的位置如圖1所示。

關于數據挖掘原理分析及其在量化投資中的應用介紹

圖1 數據由數據庫轉化為知識的過程

數據挖掘與傳統的數據分析(如查詢、報表、聯機應用分析)的本質區別是數據挖掘是在沒有明確假設的前提下去挖掘信息、發現知識(也包括大量的不公開的數據)。數據挖掘使數據庫技術進入了一個更高級的階段。數據挖掘是要發現那些不能靠直覺發現的信息或知識,甚至是違背直覺的信息或知識,挖掘出的信息越是出乎意料,就可能越有價值。能夠比市場提前知道這種信息,提前做出決策就會獲得超額利潤。

二、數據挖掘的原理

數據本來只是數據,直觀上并沒有表現出任務有價值的知識。當我們用數據挖掘方法,從數據中挖掘出知識后,這種知識是否值得信賴呢?為了說明這種知識是可信的, 現在來簡要介紹一下數據挖掘的原理。

關于數據挖掘原理分析及其在量化投資中的應用介紹


圖2 數據挖掘與其他學科的關系

數據挖掘其實質是綜合應用各種技術,對于業務相關的數據進行一系列科學的處理,這這過程中需要用到數據庫、統計學、應用數學、機器學習、可視化、信息科學、程序開發以及其他學科(如圖2所示)。其核心是利用算法對處理好的輸入和輸出數據進行訓練,并得到模型, 然后再對模型進行驗證,使得模型能夠在一定程度上刻畫出數據由輸入到輸出的關系, 然后再利用該模型,對新輸入的數據進行計算,從而得到我們希望得到的新的輸出。所以雖然這種模型不容易解釋或很難看到, 但它是基于大量數據訓練并經過驗證的,所以能夠反映輸入數據和輸出數據之間的大致關系,這種關系(模型)就是我們需要的知識。這就是數據挖掘的原理。從數據挖掘的原理可以看出, 數據挖掘是有一定科學依據的, 數據挖掘的結果也是值得信賴的。

三、數據挖掘在量化投資的應用

1、宏觀經濟分析

股市的影響因素很多,但中國股市對宏觀政策尤其敏感,從根本上說,股市的運行與宏觀的經濟運行應當是一致的,經濟的周期決定著股市的周期,股市周期的變化反映了經濟周期的變動。其中經濟周期包括衰退、危機、復蘇和繁榮四個階段。按照一般常理來說,在經濟衰退時期,股價指數會逐漸下跌;到經濟危機時期,股價指數跌至最低點;當經濟復蘇開始時,股價指數又會逐步上升;到經濟繁榮時,股價指數則上漲至最高點。由此看來宏觀經濟走勢影響著股市的波動,但宏觀經濟走勢與股市趨勢的變動周期也不是完全同步的。所以無論從量化投資角度還是傳統投資方式角度,對宏觀經濟進行深入的分析是必須的。

在量化投資領域, 數據挖掘技術可以做以下幾個方面的工作:

分析GDP對股市及個股的影響。

分析分析貨幣供應量對股票價格的影響及對個股的影響。

分析利率對股市的影響及利率變化對個股的影響。

分析匯率對股市及個股的影響。

在宏觀經濟分析方面, 經常用到回歸、關聯分析、分類、預測等方法。比如利用回歸、預測等技術確定經濟周期, 并研究不同股票于各經濟周期的關聯性, 這樣就可以在不同的經濟周期,制定不同的投資策略,這樣不僅可以在不同的經濟周期實現持續盈利,還可以規避風險。 比如有的投資機構在2008年前就利用數據挖掘技術確認當時的經濟周期,提前減倉,改變投資策略,不僅避免了風險,而且實現了高額收益。 其實,如果將08年之前的宏觀經濟數據可視化之后(圖3所示), 就會發現這期間的經濟環境了。

關于數據挖掘原理分析及其在量化投資中的應用介紹

圖3 08年前后的宏觀經濟趨勢圖

2、估價

國內外大量實證研究結果表明:上市公司定期公布的財務報告具有很強的信息含量,但是當期會計盈余數據的信息會在披露前后在股票市價中迅速得以體現。因此對于中長期投資者來說,重要的是預見未來。質地優良且未來具有較高盈利增長能力的公司是中長期投資者(包括普通投資者,證券投資基金和券商)普遍關注的對象,因為只有這類公司才能給投資。

通過對上市公司的價值的評估,來進行股票的選擇。這是現在占據主流地位的基本面分析的基本方法。通過各種不同的方法對于上市公司的價值進行一個評估,然后結合股票市場上的表現來決定市場上的價格是否被低估或者高估。如果低估則買入,如果高估則賣出。當然,中國市場現在還沒有賣空的途徑,剛剛獲批的融資融券業務也只是在限定標的的情況下進行部分的賣空,所以中國市場還是主要以買入為主。于是,我們更多的是選擇那些價格被低估的股票。分析未來股票發行和上市價格的合理定位。

數據挖掘技術在估價方面的應用就是去挖掘價值被低估的股票, 比如可以用最近鄰方法確定基本面相似的股票的市場估價, 然后根據實際價格很容易確定哪些股票被低估或者高估。 該方法對于新股的認購策略也同樣非常有幫助, 因為可以用來評估新股的合理價格區間。

3、量化選股

量化選股是數據挖掘在量化投資領域研究和應用最多的課題,畢竟選股是量化投資的最重要的內容。像上面剛介紹的多因子選股模型,主要是靠數據挖掘中的回歸方法得到的。當然量化選股的內容不僅限于此,數據挖掘技術在選股上有多重應用,有時是為策略提供決策基礎, 有時是根據策略進行挖掘。 比如,可以用聚類方法對股票進行聚類,從而對股票進行分池, 選股的時候就2可以從上漲概率比較大的池子中選擇股票。 再比如,可以用神經網絡方法預測股票的漲跌概率,具體實現方法這里先不贅述, 這些內容在本書中將都會進行介紹。

4、量化擇時

量化投資領域中,一個好的選股策略是比較容易實現的。這是因為在長時間跨度里能夠跑贏市場的一些投資組合一般會滿足某種特性,例如低估值、例如高成長、例如小市值、例如隱形資產低估等等。 但擇時就不是那么簡單了, 這里會有一個簡單的問題:大盤明天是漲還是跌?

這個看似簡單的問題其實并不好回答,尤其是從量化的角度去處理,甚至我們從傳統的策略研究——技術面+基本面+政策面會更加好回答一些。為什么?因為量化擇時無法處理來自政策面的消息。還有就是量化擇時經常會有很強的時域特性,太短的時域預測例如一天,太長的時域預測例如一年,量化擇時是很難處理的。

正因為擇時比較難處理, 所以采用數據挖掘技術, 用大量的數據去尋找最佳的賣點相對顯得更理性些。 比如用上面剛介紹的SVM方法進行擇時, 或采用神經網絡預測近期的漲跌趨勢, 再或者采用分類方法判斷近期的最佳交易周期。

5、算法交易

算法交易(algorithmic trading),是指把一個指定交易量的買入或者賣出指令放入模型,該模型包含交易員確定的某些目標。 根據這些特殊的算法目標,該模型會產生執行指令的時機和交易額。而這些目標往往基于某個基準、價格或時間。這種交易有時候被稱“黑箱交易”。算法交易通過程序系統交易,將一個大額的交易拆分成數十個小額交易,以此來盡量減少對市場價格造成沖擊,降低交易成本,且還能幫助機構投資者快速增加交易量。

算法交易系統的核心是通過一套計算機程序,可以在一秒鐘內產生數千個交易指令,其中許多指令瞬間就可以被取消或被新的指令取代,從而把大額委托化整為零,減小對市場的沖擊,并且可以尋求最佳的成交執行路徑,減少交易成本。但程序的核心是交易算法,而這種敢于在市場上進行實操的算法往往都是在大量的歷史交易數據挖掘中得到的, 然后再經過嚴格的測試,確定算法的可靠且有效后方可投入實際的算法交易。 在算法交易方面,可用到的數據挖掘技術比較廣, 往往涉及到多種方法的綜合。 在算法交易方面,目前用的比較多的數據挖掘方法是集成決策樹, 其核心是當不同的指標(信號)出現不同的情況時,給出具體的交易操作(買入或賣出),采用這種方法不僅是穩定、靈活,而且還可以采用優化算法對其進行優化,提高收益, 圖4即為采用遺傳算法優化交易指標的迭代效果圖。

關于數據挖掘原理分析及其在量化投資中的應用介紹


圖4 遺傳算法優化交易指標的迭代效果圖

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據挖掘
    +關注

    關注

    1

    文章

    406

    瀏覽量

    24621
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    是否可以輸入隨機數據集來生成INT8訓練后量化模型?

    無法確定是否可以輸入隨機數據集來生成 INT8 訓練后量化模型。
    發表于 03-06 06:45

    數據可視化與數據分析的關系

    的含義。 數據分析的定義與作用 數據分析是一種使用統計和邏輯方法來分析數據集的過程,目的是發現模式、趨勢和關聯性。它包括數據清洗、
    的頭像 發表于 12-06 17:09 ?832次閱讀

    Prosus投資Swiggy獲利豐厚

    南非Naspers集團荷蘭子公司Prosus,同時也是騰訊的大股東,近期印度在線食品訂購和配送公司Swiggy的投資中取得了顯著的回報。據Prosus透露,該公司Swiggy的投資中
    的頭像 發表于 11-14 15:01 ?577次閱讀

    raid 數據分析中的應用

    RAID(Redundant Array of Independent Disks,獨立磁盤冗余陣列)數據分析中的應用主要體現在提高存儲系統的性能、可靠性和容量上。以下是RAID數據分
    的頭像 發表于 11-12 09:44 ?631次閱讀

    魯棒性分析方法及其應用

    魯棒性(Robustness)是指系統或方法對于外部干擾、誤差或變化的穩定性和適應能力。以下是對魯棒性分析方法的詳細介紹,以及其不同領域的應用實例。 一、魯棒性
    的頭像 發表于 11-11 10:21 ?8458次閱讀

    博世氫動力系統重慶項目入選央視財經“投資中國”年度案例

    中央廣播電視總臺與中國國際貿易促進委員會共同主辦的“投資中國·央視財經CBD跨國公司對話”活動北京舉辦。活動現場,由國家發展改革委、工信部、商務部、海關總署、市場監管總局以及中國貿促會聯合
    的頭像 發表于 09-29 10:00 ?677次閱讀

    RS-485:自動方向介紹及其系統中的作用

    電子發燒友網站提供《RS-485:自動方向介紹及其系統中的作用.pdf》資料免費下載
    發表于 09-12 10:35 ?0次下載
    RS-485:自動方向<b class='flag-5'>介紹</b><b class='flag-5'>及其</b><b class='flag-5'>在</b>系統中的作用

    5G輕量化網關是什么

    量化網關的定義、特點、應用場景以及其物聯網領域的重大意義。 定義與概述 5G輕量化網關,全稱為Reduced Capability(RedCap)網關,是5G技術的一種創新應用,旨
    的頭像 發表于 09-04 15:17 ?645次閱讀
    5G輕<b class='flag-5'>量化</b>網關是什么

    數據分析提高灌區管理水平中的作用

    數據分析提升灌區管理水平中扮演著至關重要的角色,它通過深度挖掘海量信息,為灌溉系統的高效運作、資源優化配置及可持續發展提供了科學決策的基礎。這一過程不僅涉及數據的收集、整理與
    的頭像 發表于 08-28 17:23 ?471次閱讀
    <b class='flag-5'>數據分析</b><b class='flag-5'>在</b>提高灌區管理水平中的作用

    英特爾成都入選央視財經“投資中國”年度案例

    日前,中央廣播電視總臺主辦的“投資中國·央視財經CBD跨國公司對話”活動上,英特爾產品(成都)有限公司(簡稱“英特爾成都”)憑借過去二十多年的持續投入、對進出口貿易的長期貢獻以及可持續發展等方面的卓越表現,入選央視財經“
    的頭像 發表于 08-16 15:38 ?789次閱讀

    StarRocks 與 AWS 合作持續深入,為全球245個國家企業用戶提供輕量化云服務

    。 隨著數據時代的到來,企業面臨著海量數據的挑戰,如何從這些數據挖掘出有價值的信息成為了關鍵。 StarRocks通過與亞馬遜云科技AWS的深度合作,為用戶提供低成本高效率的
    的頭像 發表于 08-12 17:29 ?593次閱讀
    StarRocks 與 AWS 合作持續深入,為全球245個國家企業用戶提供輕<b class='flag-5'>量化</b>云服務

    中科曙光受邀參加第十屆中國數據挖掘會議

    近日,國內數據挖掘領域最主要的學術活動之一—第十屆中國數據挖掘會議(CCDM2024)于山東泰安舉行,中科曙光參與并分享了曙光AI構建產學研用的生態實踐。
    的頭像 發表于 08-01 10:43 ?814次閱讀

    典型的數據采集系統設計及其核心元件

    本文簡要介紹了典型的數據采集系統及其核心元件。然后介紹 AnalogDevices Inc 的數據采集 (DAQ) 模塊,該模塊集成了許多關
    的頭像 發表于 07-18 10:28 ?2254次閱讀
    典型的<b class='flag-5'>數據</b>采集系統設計<b class='flag-5'>及其</b>核心元件

    數據分析除了spss還有什么

    Sciences)是一款非常流行的統計分析軟件,但除了SPSS之外,還有許多其他數據分析工具和方法。 引言 數據分析是一個跨學科的領域,涉及到統計學、計算機科學、數據
    的頭像 發表于 07-05 15:01 ?1093次閱讀

    esp-dl int8量化模型數據集評估精度下降的疑問求解?

    一 試著將模型進行了esp-dl上int16和int8的量化,并在測試數據集上進行精度評估,其中int16的模型精度基本沒有下降,但是int8的模型評估精度下降了很多,目前正在嘗試修改
    發表于 06-28 15:10