<span id="vww6j"><ruby id="vww6j"><blockquote id="vww6j"></blockquote></ruby></span>
  • <bdo id="vww6j"><ins id="vww6j"><menu id="vww6j"></menu></ins></bdo>
  • 2022/03/24

    【技術】DTEmpower核心功能技術揭秘(3) - HDDV高維數據可視化技術


    概述 

    機器學習技術結合工業場景需求是當前的研究熱點,但機器學習技術存在的諸如data-hungry數據規模依賴和dimension-curse維度詛咒問題影響著“AI+工業”落地的效率。為提高“AI+工業”建模的成功率,數據建模人員需要基于數據集特性選擇適配的算法和解決方案。

    天洑DTEmpower軟件為此提供了多方位的輔助工具,以幫助建模人員更高效、更充分地獲取當前數據的隱含模式,HDDV(High Dimensional Data Visualization)高維數據可視化技術便是其中富有特色的一項數據可視化功能。針對工業數據集特性,HDDV高維數據可視化技術擁有 1D/2D/3D散點圖、柱狀圖、平行圖等豐富的可視化圖表庫,用以輔助用戶對數據集進行直觀的分析,進而更好地發掘數據集中的隱含模式。

    為了更好地提高用戶對不同數據分布模式的認知能力,天洑DTEmpower軟件在HDDV高維數據可視化模塊中內置了實時交互的聚類模塊,如圖1所示。

    綜上所述,HDDV高維數據可視化技術,是繼HierarchicalStratify分層分類技術、AIOD智能異常點檢測技術等支撐技術的又一關鍵功能模塊。

    高維可視化圖1.png

    圖1 HDDV高維數據可視化模塊聚類效果圖,由圖可見某數據集可以明顯地被分割成兩個子類,借助HDDV可視化功能模塊可以幫助用戶在進行建模之前對于數據集本身有更深入的理解,做到“心中有數,對癥下藥”

    HDDV高維數據可視化技術模塊簡介

    為了更好地利用DTEmpower軟件中的HDDV高維數據可視化模塊,幫助研究人員呈現數據分布情況的視覺效果,用戶應該具體怎樣操作呢?

    如圖2所示,用戶進入HDDV高維可視化配置界面后,只需選擇相應的繪制變量、繪制維數、降維算法等參數,即可啟動高維可視化的繪制流程。

    圖2.png

    圖2 HDDV高維數據可視化參數配置界面,用戶可以按照需求選擇繪制變量、繪制維數、降維算法和數據變換等參數,操作流程清晰

    基于DTEmpower的HDDV高維數據集可視化建模實驗

    1. 實驗測試

    使用某測試數據集進行測試,該數據集的設計參數為x1、x2、x3,目標參數為y,有效維度為4(x1, x2, x3, y),通過設置不同的降維算法和不同的繪制維數,可以得到相應的可視化圖像及結論。

    圖3.png
    圖3 “降維算法=PCA,繪制維數=1”的箱形圖,發現數據集中存在少量離群點,正常數據集中分布在lower與upper之間,50%的數據分布在Q1到Q3之間

    圖4.png

    圖4 “降維算法=PCA,繪制維數=2”的散點聯合圖,可發現橫軸上數據分布并不滿足正態分布,說明數據集存在一定的非高斯模式
    圖5.png

    圖5 “降維算法=PCA,繪制維數=3”的3D可視化展示圖,可以發現數據集存在略為明顯的“稠密-稀疏”兩類數據分布模式

    圖6.png

    圖6 “降維算法=isomap,繪制維數=3”的3D可視化展示圖,可發現降維后數據集存在較為明顯的“稠密-稀疏”兩類不同模式

    圖7.png

    圖7 “降維算法=tSNE,繪制維數=3”的3D可視化展示圖,相比于線性降維方法,非線性降維方法可以發現數據集中兩種不同的子類模式,這時推薦用戶使用DTEmpower的HierarchicalStratify技術對數據進行訓練
    2. 實驗結果分析

    從上述實驗得出的可視化圖像,我們可以發現通過嘗試線性或非線性的不同算法、不同可視化維度,DTEmpower軟件中的HDDV高維數據可視化功能模塊可將抽象的數據轉換成直觀、美觀的圖像。這增強了數據的可讀性、協同性,從而輔助工作人員從更多元、直觀的角度對數據集內部分布情況擁有更透徹的認知。

    結合案例中的實驗結果,HDDV高維可視化模塊更是幫助用戶發現了測試數據集中存在兩種子類模式,這為后續有針對性的數據建模工作和提高建模的效率提供了有效的決策信息支持。 

    總結 

    面對形式多樣、種類繁多的工業數據集,幾乎沒有哪一種算法可以在數據建模中覆蓋所有的應用場景。因此,在開展具體的建模工作之前,對數據集進行細致、深度的挖掘,就顯得很有必要。DTEmpower的HDDV模塊提供了豐富的可視化圖庫模板,為用戶“可視化”探索數據模式提供了一條便捷可信賴的技術途徑。

    DTEmpower致力于為工業數據研究者掃清各種障礙、提供易用可信賴的技術支撐!該軟件平臺不僅提供了一站式的數據建模解決方案,還提供了功能強大的數據挖掘如異常點檢測、高維可視化、特征工程等支撐技術??梢詭椭脩艨焖?、便捷的深入挖掘數據,為建立高精度的數據模型提供了一條高效可落地的實現路徑。


    DTEmpower核心功能技術系列:

    【技術】DTEmpower核心功能技術揭秘(1) - HierachicalStratify分層分類技術
    【技術】DTEmpower核心功能技術揭秘(2) - AIOD智能異常點檢測技術


    爱如潮水高清视频,人妻中字视频中文乱码,老师好大好硬好深好爽想要小说
    <span id="vww6j"><ruby id="vww6j"><blockquote id="vww6j"></blockquote></ruby></span>
  • <bdo id="vww6j"><ins id="vww6j"><menu id="vww6j"></menu></ins></bdo>