講師介紹—— |
隨著大數(shù)據(jù)時(shí)代的來(lái)臨,集團(tuán)多元化、全球化的進(jìn)程,以及信息技術(shù)的全球普及,企業(yè)擁有的數(shù)據(jù)量越來(lái)越大,這些來(lái)源于生產(chǎn)、運(yùn)營(yíng)、研發(fā)、銷(xiāo)售過(guò)程中的海量數(shù)據(jù),不僅充分反映著企業(yè)當(dāng)前的經(jīng)營(yíng)狀況,也為企業(yè)未來(lái)的經(jīng)營(yíng)決策提供有力依據(jù),但是要分析如此龐大的數(shù)據(jù),只依靠傳統(tǒng)IT架構(gòu)已力不從心,舊系統(tǒng)逐步呈現(xiàn)出功能及性能方面的若干問(wèn)題。
所以,許多企業(yè)選擇基于 SAP HANA 平臺(tái),來(lái)推進(jìn)所有業(yè)務(wù)模式的數(shù)字化進(jìn)程,確保自己能夠與時(shí)俱進(jìn),并保持競(jìng)爭(zhēng)優(yōu)勢(shì)??蛻暨x擇 SAP HANA,不僅是為了運(yùn)行核心業(yè)務(wù)應(yīng)用,還會(huì)用于開(kāi)發(fā)動(dòng)態(tài)應(yīng)用,獲取實(shí)時(shí)洞察,進(jìn)而推動(dòng)業(yè)務(wù)增長(zhǎng),超越競(jìng)爭(zhēng)對(duì)手。而 SAP HANA 是市面上唯一一個(gè)能夠同時(shí)簡(jiǎn)化 IT、激發(fā)創(chuàng)新的平臺(tái),原因就在于只有 SAP HANA 能將內(nèi)存計(jì)算數(shù)據(jù)庫(kù)功能與內(nèi)置的應(yīng)用服務(wù)、高級(jí)數(shù)據(jù)處理和數(shù)據(jù)集成等功能集于一體。
以下內(nèi)容來(lái)自【迪森免費(fèi)微課堂】第六期課程分享,希望大家都能不斷充電不斷提高,在我們熱愛(ài)的SAP事業(yè)道路上持續(xù)加速前進(jìn)!
當(dāng)前是一個(gè)信息爆炸的時(shí)代,企業(yè)要正常運(yùn)轉(zhuǎn),需要各種系統(tǒng)互相配合。我們不僅有系統(tǒng)日常運(yùn)營(yíng)所需的數(shù)據(jù),還需要將數(shù)據(jù)單獨(dú)存放到數(shù)據(jù)倉(cāng)庫(kù)中進(jìn)行數(shù)據(jù)分析,日益增加的系統(tǒng)復(fù)雜性和數(shù)據(jù)復(fù)雜性成為企業(yè)信息化發(fā)展的新瓶頸。
在數(shù)據(jù)的管理變得越來(lái)越復(fù)雜的同時(shí),更加不能容忍的是,我們所分析的數(shù)據(jù)往往是幾天前甚至一個(gè)月前的數(shù)據(jù),在如今瞬息萬(wàn)變的世界中,不能夠?qū)Ξ?dāng)前的數(shù)據(jù)進(jìn)行快速分析會(huì)讓企業(yè)失去快速應(yīng)對(duì)市場(chǎng)變化的能力。
列存儲(chǔ)數(shù)據(jù)庫(kù)是一種不同于傳統(tǒng)數(shù)據(jù)庫(kù)的存儲(chǔ)結(jié)構(gòu)。列存儲(chǔ)數(shù)據(jù)庫(kù)把表拆分為不同的列,每列拆分為數(shù)據(jù)字典和列數(shù)組,數(shù)據(jù)字典按照數(shù)值的大小排序,列數(shù)組以整數(shù)的形式存儲(chǔ)對(duì)應(yīng)數(shù)值的索引號(hào)。如果有需要,我們還可以建立反向索引,用來(lái)加速數(shù)據(jù)的檢索。
列存儲(chǔ)的優(yōu)勢(shì):
1、數(shù)據(jù)壓縮存儲(chǔ),未經(jīng)任何優(yōu)化情況下數(shù)據(jù)壓縮7-10倍;
2、檢索快,數(shù)據(jù)字典相當(dāng)于對(duì)每一列都進(jìn)行了索引;
3、數(shù)據(jù)分析快,運(yùn)算只涉及被選到的列;
4、支持大列表,各列分別存儲(chǔ),表的列數(shù)增加不會(huì)顯著影響性能;
5、對(duì)并行處理支持較好。
列存儲(chǔ)的劣勢(shì):
1、更新數(shù)據(jù)可能需要重構(gòu)數(shù)據(jù)字典,也有可能大批量更新列數(shù)組;
2、數(shù)據(jù)輸出慢,輸出時(shí)需要將數(shù)組中的數(shù)值替換成實(shí)際值;
3、數(shù)據(jù)存儲(chǔ)不連續(xù),在硬盤(pán)數(shù)據(jù)庫(kù)條件下難以實(shí)現(xiàn)。
隨著硬件技術(shù)的發(fā)展,內(nèi)存速度已經(jīng)發(fā)展為是普通硬盤(pán)的10萬(wàn)倍,是SSD硬盤(pán)的2000倍,并且價(jià)格越來(lái)越低,容量輕易達(dá)到TB級(jí),使得把數(shù)據(jù)庫(kù)完全裝載在內(nèi)存中成為可能。
同時(shí),內(nèi)存的存儲(chǔ)模式為隨機(jī)存儲(chǔ),適合列存儲(chǔ)模型各列碎片化存儲(chǔ)的模式。內(nèi)存通過(guò)CPU尋址的方式訪問(wèn),能夠充分發(fā)揮多核CPU的性能,也能夠充分發(fā)揮列存儲(chǔ)模型中多列并行處理的模式。列存儲(chǔ)對(duì)數(shù)據(jù)壓縮存儲(chǔ),進(jìn)一步減少了數(shù)據(jù)庫(kù)對(duì)內(nèi)存的需求??梢哉f(shuō)列存儲(chǔ)和內(nèi)存數(shù)據(jù)庫(kù)的配合相得益彰,揚(yáng)長(zhǎng)避短。新的挑戰(zhàn)已經(jīng)變成如何更加有效地利用CPU緩存。
SAP HANA是基于當(dāng)前最新的軟硬件技術(shù)的集數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)分析、應(yīng)用程序、文本分析等功能的產(chǎn)品。從硬件上來(lái)看,SAP HANA與最新的Intel CPU研發(fā)緊密配合,充分利用新硬件的性能。
從軟件設(shè)計(jì)上,HANA采用列存儲(chǔ)和行存儲(chǔ)并行的引擎,滿足不同需求的數(shù)據(jù)存儲(chǔ),通過(guò)表分區(qū)技術(shù)將一個(gè)大表分布到不同的服務(wù)器上;同時(shí),HANA采用了表的二級(jí)緩沖機(jī)制,避免列存儲(chǔ)數(shù)據(jù)更新時(shí)大批量更新數(shù)據(jù)字典的問(wèn)題,在寫(xiě)入性能和讀取性能上取得了較好的折中。
HANA在SAP的產(chǎn)品架構(gòu)中具有多種應(yīng)用場(chǎng)景。最初HANA做為加速器,在現(xiàn)有系統(tǒng)架構(gòu)之外部署一個(gè)HANA數(shù)據(jù)庫(kù),將現(xiàn)有系統(tǒng)的數(shù)據(jù)實(shí)時(shí)同步到HANA,再把現(xiàn)有系統(tǒng)的查詢請(qǐng)求重定向到HANA數(shù)據(jù)庫(kù)。
隨后SAP推出了BW on HANA,用HANA做為BW系統(tǒng)的主要數(shù)據(jù)庫(kù),大大加快了BW報(bào)表的運(yùn)行速度,提升了用戶體驗(yàn),同時(shí)還提升了BW報(bào)表開(kāi)發(fā)和調(diào)整的速度。
最后HANA做為ERP產(chǎn)品的主要數(shù)據(jù)庫(kù),SAP推出了Suite on HANA的產(chǎn)品,實(shí)現(xiàn)了對(duì)ERP產(chǎn)品的速度全面的提升,為了能夠最大限度地發(fā)揮HANA的特性和優(yōu)勢(shì),SAP還推出了最新的S/4 HANA,在應(yīng)用設(shè)計(jì)時(shí)就考慮到應(yīng)用系統(tǒng)如何發(fā)揮HANA的優(yōu)勢(shì),減少HANA的劣勢(shì)對(duì)系統(tǒng)的影響。
HANA的系統(tǒng)當(dāng)中的核心引擎是行存儲(chǔ)引擎和列存儲(chǔ)引擎,對(duì)HANA數(shù)據(jù)的查詢和操作通過(guò)計(jì)算引擎的組合(包括Join引擎,OLAP引擎,計(jì)算引擎)執(zhí)行。此外,HANA還具有SQL引擎,存儲(chǔ)過(guò)程引擎,計(jì)劃引擎,MDX協(xié)議引擎等,用于解析各種指令和適配外部的接口協(xié)議。
HANA雖然是內(nèi)存數(shù)據(jù)庫(kù),在磁盤(pán)中也保留完整的數(shù)據(jù)副本。磁盤(pán)存儲(chǔ)分為日志盤(pán)和數(shù)據(jù)盤(pán),數(shù)據(jù)的更新實(shí)時(shí)寫(xiě)入日志盤(pán),日志盤(pán)會(huì)定期與數(shù)據(jù)盤(pán)進(jìn)行同步。
當(dāng)HANA服務(wù)器斷電恢復(fù)時(shí),會(huì)把數(shù)據(jù)盤(pán)的數(shù)據(jù)和日志盤(pán)的數(shù)據(jù)進(jìn)行合并,從而得到斷電之前最后時(shí)點(diǎn)的數(shù)據(jù)。為了保證HANA數(shù)據(jù)庫(kù)更新的性能,在實(shí)踐當(dāng)中,日志盤(pán)一般采用固態(tài)硬盤(pán)。
HANA Studio是最常使用的HANA管理和開(kāi)發(fā)工具,HANA Studio基于Eclipse,對(duì)開(kāi)發(fā)人員非常友好,具有Modeling,Administrator,Development和Planviz四個(gè),分別用于建模、系統(tǒng)管理、開(kāi)發(fā)和調(diào)試。
通過(guò)屬性視圖和分析視圖進(jìn)行結(jié)合,可以進(jìn)行多維分析視圖的創(chuàng)建。分析視圖負(fù)責(zé)提供分析數(shù)據(jù),并進(jìn)行分組,匯總等計(jì)算功能,屬性視圖對(duì)具體的分析維度進(jìn)行擴(kuò)展,與其他的表相連接。
將需要分析的數(shù)據(jù)和相關(guān)的維度數(shù)據(jù)通過(guò)不同的視圖實(shí)現(xiàn),有利于對(duì)維度進(jìn)行復(fù)用。一個(gè)分析視圖與多個(gè)屬性視圖結(jié)合,形成“星型模型”,該模型可以作為多維分析應(yīng)用的基礎(chǔ)模型。分析視圖一般適用于原始數(shù)據(jù)比較規(guī)范,不用額外的數(shù)據(jù)清洗,通過(guò)基本的過(guò)濾、表關(guān)聯(lián)、匯總,能夠直接進(jìn)行分析。
計(jì)算視圖通過(guò)不同的節(jié)點(diǎn),將數(shù)據(jù)處理過(guò)程形成流程圖,具有全功能的數(shù)據(jù)處理能力。數(shù)據(jù)以流程圖的形式展現(xiàn),清晰的體現(xiàn)了數(shù)據(jù)的處理過(guò)程。
計(jì)算視圖包括五種節(jié)點(diǎn),Projection節(jié)點(diǎn)用于過(guò)濾和選擇特定的列,Aggregation節(jié)點(diǎn)用于對(duì)數(shù)據(jù)進(jìn)行分組匯總,Union節(jié)點(diǎn)用于對(duì)數(shù)據(jù)進(jìn)行聯(lián)合查詢,Join節(jié)點(diǎn)用于表連接,Rank節(jié)點(diǎn)用于對(duì)數(shù)據(jù)進(jìn)行分組排序。計(jì)算視圖適用于需要從原始數(shù)據(jù)進(jìn)行實(shí)時(shí)的數(shù)據(jù)清洗,并直接生成最終結(jié)果的情形。
基于腳本的計(jì)算視圖能夠通過(guò)CE_PLAN操作符和SQL Script語(yǔ)句,編寫(xiě)更加復(fù)雜的視圖取數(shù)邏輯。
當(dāng)需要一個(gè)查詢返回多個(gè)結(jié)果集時(shí),我們還可以創(chuàng)建存儲(chǔ)過(guò)程,存儲(chǔ)過(guò)程同樣可以使用CE_PLAN操作符或SQL Script編寫(xiě)。
HANA建模的其他特性包括:
1、通過(guò)計(jì)算字段進(jìn)行數(shù)據(jù)輸出;
2、通過(guò)Restrict Column對(duì)同一字段進(jìn)行多角度不同分析;
3、進(jìn)行貨幣/單位的數(shù)據(jù)轉(zhuǎn)換;
4、使用Text Join根據(jù)用戶登錄語(yǔ)言輸出描述文本;
5、使用層級(jí)嵌套功能,為前端工具提供視圖的樹(shù)形層級(jí)信息;
6、使用全文檢索引擎進(jìn)行全文檢索查詢。
當(dāng)ABAP與HANA結(jié)合后,我們會(huì)更多的讓HANA完成計(jì)算工作,而非通過(guò)ABAP內(nèi)表操作,此外,我們還要盡量減少在應(yīng)用程序服務(wù)器和數(shù)據(jù)庫(kù)服務(wù)器之間的數(shù)據(jù)傳輸。
ABAP可以通過(guò)ADBC類(lèi),使用HANA原生SQL訪問(wèn)HANA數(shù)據(jù)庫(kù),并將HANA數(shù)據(jù)庫(kù)的查詢結(jié)果返回到ABAP變量。這種方式可以完全發(fā)揮HANA的性能。但是對(duì)應(yīng)的編碼較為復(fù)雜,難度較高,容易出錯(cuò)。
在ABAP 7.40當(dāng)中,可以使用新版OPEN SQL對(duì)數(shù)據(jù)庫(kù)進(jìn)行訪問(wèn)。新版OPEN SQL幾乎實(shí)現(xiàn)了SQL 92標(biāo)準(zhǔn),大大擴(kuò)展了原來(lái)OPEN SQL的功能。使得通過(guò)寫(xiě)幾個(gè)SQL語(yǔ)句就能夠編寫(xiě)報(bào)表成為可能。將邏輯下沉到HANA的最簡(jiǎn)單方法就是用新OPEN SQL替代ABAP的內(nèi)表操作。
CDS視圖是ABAP 740的新概念,可以使用新版OPEN SQL創(chuàng)建一個(gè)可存儲(chǔ)的視圖,該視圖可以通過(guò)SE11數(shù)據(jù)字典查看但無(wú)法修改。創(chuàng)建的視圖可以直接當(dāng)作數(shù)據(jù)庫(kù)視圖使用,可以用其創(chuàng)建數(shù)據(jù)類(lèi)型,也可以在OPEN SQL中直接查詢。CDS視圖是未來(lái)ABAP創(chuàng)建可復(fù)用的查詢邏輯的主要手段。
AMDP(ABAP Managed Database Procedure)也是ABAP740中的新概念??梢园涯承〢BAP的類(lèi)或方法設(shè)置為AMDP,編寫(xiě)這些代碼時(shí)不使用ABAP語(yǔ)言編寫(xiě),而是使用HANA SQL Script進(jìn)行編寫(xiě)。
在運(yùn)行時(shí),會(huì)在HANA數(shù)據(jù)庫(kù)中生成一個(gè)存儲(chǔ)過(guò)程,在HANA中執(zhí)行。這么做的主要目的是能夠使這些代碼和對(duì)應(yīng)的ABAP程序通過(guò)同一個(gè)傳輸請(qǐng)求去管理,避免應(yīng)用程序代碼和數(shù)據(jù)庫(kù)代碼的生命周期不同造成的潛在風(fēng)險(xiǎn)。
對(duì)于已經(jīng)創(chuàng)建好的HANA對(duì)象,可以在ABAP服務(wù)器中創(chuàng)建代理對(duì)象進(jìn)行導(dǎo)入。外部視圖可以導(dǎo)入HANA的視圖模型,導(dǎo)入后和普通的視圖一樣使用。存儲(chǔ)過(guò)程代理創(chuàng)建一個(gè)存儲(chǔ)過(guò)程代理對(duì)象,導(dǎo)入HANA的存儲(chǔ)過(guò)程,創(chuàng)建后可以通過(guò)CALL DATABASE PROCEDURE語(yǔ)句進(jìn)行調(diào)用。
HANA原生應(yīng)用也在SAP的技術(shù)框架中具有重要的地位。在S/4 HANA的系統(tǒng)框架中,我們通過(guò)HANA XS Engine,將HANA的信息模型發(fā)布成OData服務(wù),客戶端會(huì)繞過(guò)ABAP服務(wù)器,直接調(diào)用這些OData服務(wù),獲取所需的數(shù)據(jù)。這樣的模式廣泛的用在S/4 HANA系統(tǒng)的分析程序當(dāng)中。
HANA同時(shí)提供了基于云端的平臺(tái)HANA Cloud Platform,只要注冊(cè)一個(gè)賬號(hào),就可以獲得集HANA數(shù)據(jù)庫(kù),應(yīng)用程序開(kāi)發(fā),前端開(kāi)發(fā),表單開(kāi)發(fā),社區(qū)集成,門(mén)戶,系統(tǒng)集成等功能整體解決方案,簡(jiǎn)化了IT架構(gòu),也為中小企業(yè)選擇SAP產(chǎn)品提供了另一種選擇。
對(duì)于Basis顧問(wèn),需要從多個(gè)方面學(xué)習(xí)HANA,包括HANA系統(tǒng)的概況、日常管理、安裝、性能調(diào)優(yōu)、HANA升級(jí)等。SAP為學(xué)員準(zhǔn)備了豐富的課程,幫助大家掌握相關(guān)的技能,主要課程包括:
- HA100-HANA整體介紹(必學(xué)課程)
- HA200-HANA的日常管理與操作(必學(xué)課程)
- HA240-HANA安全管理
- HA250-使用DMO將傳統(tǒng)數(shù)據(jù)庫(kù)遷移到HANA
- ADM328-SAPEhp補(bǔ)丁安裝
其中,必學(xué)課程為每個(gè)HANA顧問(wèn)必須掌握的部分,其他課程可以根據(jù)個(gè)人發(fā)展和項(xiàng)目需求進(jìn)行選擇。
對(duì)于應(yīng)用與開(kāi)發(fā)顧問(wèn),主要需要掌握HANA的建模,以及HANA與現(xiàn)有的系統(tǒng)的結(jié)合。SAP為學(xué)員準(zhǔn)備了豐富的課程,幫助大家掌握相關(guān)的技能,主要課程包括:
- HA100-HANA整體介紹(必學(xué)課程)
- HA300-HANA實(shí)施與建模(必學(xué)課程)
- HA400-ABAP on HANA開(kāi)發(fā)
- HA150-HANA SQL語(yǔ)句
- HA450-HANA原生應(yīng)用程序開(kāi)發(fā)
- BC404-基于Eclipse的 ABAP開(kāi)發(fā)工具
其中,必學(xué)課程為每個(gè)HANA顧問(wèn)必須掌握的部分,其他課程可以根據(jù)個(gè)人發(fā)展和項(xiàng)目需求進(jìn)行選擇。
以上內(nèi)容均為【迪森】原創(chuàng)出品,版權(quán)歸迪森所有,嚴(yán)禁任何形式的抄襲行為,否則將追究其法律責(zé)任,敬請(qǐng)遵守!敬請(qǐng)各位維護(hù)好良好的SAP圈內(nèi)正能量環(huán)境,我們會(huì)分享越來(lái)越多的精華,謝謝!
服務(wù)指南
如需了解更多SAP課程資訊、項(xiàng)目咨詢運(yùn)維,請(qǐng)撥打迪森官方咨詢熱線: 400-600-8756
【迪森微課堂】
SAP圈內(nèi)最接地氣的純技術(shù)交流、純干貨分享平臺(tái),全球SAP顧問(wèn)與業(yè)界頂尖名師的聚集地,是SAP顧問(wèn)進(jìn)階的官方橋梁。
【如何加入迪森微課堂】
請(qǐng)即刻關(guān)注迪森官方微信公眾平臺(tái),第一時(shí)間獲得迪森最新動(dòng)態(tài),秒搶寶貴席位!