東方國(guó)信發(fā)布分布式圖數(shù)據(jù)庫(kù)CirroData-Graph布局?jǐn)?shù)據(jù)庫(kù)細(xì)分領(lǐng)域
摘要: 近日,東方國(guó)信發(fā)布了分布式圖數(shù)據(jù)庫(kù)CirroData-Graph,以滿足包括深度關(guān)系探索、關(guān)聯(lián)分析、路徑搜索、特征抽取、數(shù)據(jù)聚類(lèi)、社區(qū)檢測(cè)、知識(shí)圖譜等應(yīng)用場(chǎng)景對(duì)圖數(shù)據(jù)庫(kù)的需求。CirroData-Graph基于開(kāi)源項(xiàng)目HugeGraph研發(fā),并在HugeGraph的基礎(chǔ)上實(shí)現(xiàn)了分布式開(kāi)發(fā)集成。較單機(jī)版圖數(shù)據(jù)庫(kù)來(lái)說(shuō)CirroData-Graph提升了圖計(jì)算性能的同時(shí)還完美的解決了單點(diǎn)故障所帶來(lái)的高可用性問(wèn)題。目前CirroData-Graph已經(jīng)在實(shí)際生產(chǎn)環(huán)境中投入使用。
近日,東方國(guó)信發(fā)布了分布式圖數(shù)據(jù)庫(kù)CirroData-Graph,以滿足包括深度關(guān)系探索、關(guān)聯(lián)分析、路徑搜索、特征抽取、數(shù)據(jù)聚類(lèi)、社區(qū)檢測(cè)、知識(shí)圖譜等應(yīng)用場(chǎng)景對(duì)圖數(shù)據(jù)庫(kù)的需求。CirroData-Graph基于開(kāi)源項(xiàng)目HugeGraph研發(fā),并在HugeGraph的基礎(chǔ)上實(shí)現(xiàn)了分布式開(kāi)發(fā)集成。較單機(jī)版圖數(shù)據(jù)庫(kù)來(lái)說(shuō)CirroData-Graph提升了圖計(jì)算性能的同時(shí)還完美的解決了單點(diǎn)故障所帶來(lái)的高可用性問(wèn)題。目前CirroData-Graph已經(jīng)在實(shí)際生產(chǎn)環(huán)境中投入使用。
近十年來(lái)圖數(shù)據(jù)庫(kù)的關(guān)注度增速最高
圖數(shù)據(jù)庫(kù)(Graph Database,GDB)是使用圖結(jié)構(gòu)進(jìn)行語(yǔ)義查詢的數(shù)據(jù)庫(kù),它使用節(jié)點(diǎn)、邊和屬性來(lái)表示和存儲(chǔ)數(shù)據(jù)。
比起傳統(tǒng)的信息存儲(chǔ)和組織模式,圖數(shù)據(jù)庫(kù)能夠很清晰的揭示復(fù)雜的關(guān)系,尤其在錯(cuò)綜復(fù)雜的社交,物流,金融風(fēng)控行業(yè)效果更為明顯。
傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)做千萬(wàn)級(jí)的關(guān)聯(lián)(join)操作尚能應(yīng)對(duì),但當(dāng)計(jì)算量再大時(shí),很多關(guān)聯(lián)查詢就會(huì)達(dá)到瓶頸。
圖數(shù)據(jù)庫(kù)則為關(guān)聯(lián)數(shù)據(jù)(無(wú)論大?。┨峁┝俗吭降男阅?。圖模型提供了固有的索引數(shù)據(jù)結(jié)構(gòu),因此它不需要為給定條件的查詢加載或接觸不相關(guān)的數(shù)據(jù)。這使得它成為更好、更快的實(shí)時(shí)大數(shù)據(jù)分析查詢的絕佳解決方案。
互聯(lián)網(wǎng)時(shí)代新的應(yīng)用場(chǎng)景帶動(dòng)了圖數(shù)據(jù)庫(kù)的興起。在社交網(wǎng)絡(luò)的應(yīng)用中,傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)基本無(wú)法實(shí)現(xiàn)超過(guò)三層好友關(guān)系的查詢,而圖數(shù)據(jù)庫(kù)則能將數(shù)十億個(gè)關(guān)系查詢延遲降低到秒級(jí);在金融風(fēng)控場(chǎng)景的應(yīng)用中,基于圖數(shù)據(jù)庫(kù)可以提供實(shí)時(shí)用戶行為檢測(cè),識(shí)別敏感用戶,及時(shí)識(shí)別欺詐風(fēng)險(xiǎn);在推薦引擎的應(yīng)用場(chǎng)景中,使用圖數(shù)據(jù)庫(kù)使得平臺(tái)能夠通過(guò)用戶興趣、好友和閱讀歷史記錄等信息之間的關(guān)系,向用戶提供推薦。
據(jù)DB-Engines的數(shù)據(jù)顯示,近十年來(lái),圖數(shù)據(jù)庫(kù)的關(guān)注度增速遠(yuǎn)超其他類(lèi)型的數(shù)據(jù)庫(kù)。Gartner預(yù)測(cè)2020年以后,全球圖處理及圖數(shù)據(jù)庫(kù)的應(yīng)用市場(chǎng)都將以每年100%的速度迅猛增長(zhǎng)。
東方國(guó)信順勢(shì)而為,憑借開(kāi)發(fā)CirroData分布式數(shù)據(jù)庫(kù)多年積累的技術(shù)經(jīng)驗(yàn)和渠道優(yōu)勢(shì),在國(guó)產(chǎn)數(shù)據(jù)庫(kù)領(lǐng)域的細(xì)分領(lǐng)域進(jìn)行產(chǎn)業(yè)布局。CirroData-Graph分布式圖數(shù)據(jù)庫(kù)應(yīng)運(yùn)而生,以滿足公安、金融、互聯(lián)網(wǎng)等行業(yè)的客戶需求。
CirroData-Graph:功能完備的分布式圖數(shù)據(jù)庫(kù)
CirroData-Graph是基于開(kāi)源項(xiàng)目HugeGraph研發(fā)的一套分布式圖數(shù)據(jù)庫(kù),繼承了HugeGraph的所有功能和特性,并進(jìn)行了優(yōu)化,使其提供更為友好的用戶體驗(yàn)和便捷的運(yùn)維方式。
CirroData-Graph基于Apache TinkerPop3框架,支持Gremlin圖查詢語(yǔ)言;
支持屬性圖,使頂點(diǎn)和邊均可添加屬性,支持豐富的屬性類(lèi)型;
可對(duì)頂點(diǎn)和邊屬性建立索引,支持精確查詢、范圍查詢和全文檢索;
支持多頂點(diǎn)ID策略,CirroData-Graph支持主鍵ID,支持自動(dòng)生成ID,支持用戶自定義字符串ID,支持用戶自定義數(shù)字ID;
支持功能豐富、簡(jiǎn)單易用的HTTP Restful接口。提供頂點(diǎn)、邊、元數(shù)據(jù)等的基本操作接口;此外還提供各種高級(jí)查詢接口,包括最短路徑、多路徑、交叉點(diǎn)、N步可達(dá)鄰居等;
CirroData-Graph支持Java語(yǔ)言客戶端。
此外CirroData-Graph在圖數(shù)據(jù)庫(kù)周邊生態(tài)上提供圖形化的一鍵安裝部署、集群監(jiān)控、智能運(yùn)維工具,讓安裝部署和運(yùn)維完全實(shí)現(xiàn)圖形化操作。
CirroData-Graph采用先進(jìn)的分布式存儲(chǔ)技術(shù)及Loader模式
不同于單機(jī)版原生HugeGraph數(shù)據(jù)庫(kù),CirroData-Graph實(shí)現(xiàn)了分布式存儲(chǔ),有效的解決了單點(diǎn)故障帶來(lái)的宕機(jī)問(wèn)題,實(shí)現(xiàn)了系統(tǒng)高可用。
同時(shí),CirroData-Graph支持百億以上的頂點(diǎn)和邊的快速導(dǎo)入,并提供毫秒級(jí)別的關(guān)聯(lián)關(guān)系查詢
CirroData-Graph采用Multi-raft-group邏輯分區(qū)技術(shù),保證在批量插入數(shù)據(jù)時(shí),每個(gè)節(jié)點(diǎn)都會(huì)工作。并且保證高可用,只要服務(wù)集群中超過(guò)半數(shù)節(jié)點(diǎn)正常工作,系統(tǒng)即可正常對(duì)外提供服務(wù)。
使用PD(Placement Driver,PD服務(wù)需要單獨(dú)部署,主要負(fù)責(zé)整個(gè)集群的管理調(diào)度,Region ID生成等)集群來(lái)記錄各Store中的region信息和狀態(tài),客戶端訪問(wèn)時(shí),通過(guò)PD獲取region信息,然后向?qū)?yīng)region的leader發(fā)起請(qǐng)求。
此外,為了提升分布式圖數(shù)據(jù)庫(kù)的數(shù)據(jù)加載性能,CirroData-Graph新增了Loader模式。在分布式系統(tǒng)中,需要保證數(shù)據(jù)的一致性,數(shù)據(jù)加載是一個(gè)主要的性能瓶頸。在普通模式下,數(shù)據(jù)經(jīng)由API、計(jì)算引擎加載到一個(gè)節(jié)點(diǎn)的存儲(chǔ)引擎中,再通過(guò)JRaft同步到其它兩個(gè)節(jié)點(diǎn)中,效率低,加載慢。引入Loader模式后,數(shù)據(jù)經(jīng)由API、計(jì)算引擎先落地到RocksDB中,再將RocksDB的sst文件以異步任務(wù)的方式通過(guò)JRaft同步到所有節(jié)點(diǎn),這樣在保證了數(shù)據(jù)一致性的前提下,也讓加載性能有質(zhì)的提高。
從上圖可以看出,在Loader模式下的數(shù)據(jù)加載性能可達(dá)單機(jī)版HugeGraph性能的70%左右,對(duì)于分布式系統(tǒng)來(lái)說(shuō)這是一個(gè)非常不錯(cuò)的數(shù)字。之后我們還會(huì)繼續(xù)完善Loader模式,達(dá)到在加載性能方面與HugeGraph持平的標(biāo)準(zhǔn),此外通過(guò)擴(kuò)大集群規(guī)模也可能使CirroData-Graph超越HugeGraph的加載性能。
在國(guó)產(chǎn)化生態(tài)適配方面,目前CirroData-Graph分布式圖數(shù)據(jù)庫(kù)已經(jīng)與華為鯤鵬芯片完成了兼容性測(cè)試互認(rèn)證,獲得華為鯤鵬計(jì)算領(lǐng)域OpenLab授予的鯤鵬技術(shù)認(rèn)證書(shū)。雙方產(chǎn)品相互兼容,整體運(yùn)行穩(wěn)定,能夠滿足用戶的性能需求。
在產(chǎn)品應(yīng)用方面,CirroData-Graph已經(jīng)成功與東方國(guó)信“數(shù)據(jù)魔方”產(chǎn)品實(shí)現(xiàn)了兼容適配,完全替換其底層neo4j圖數(shù)據(jù)庫(kù),并與“數(shù)據(jù)魔方”一起在公安、電信、金融、工業(yè)等領(lǐng)域投入使用。
東方國(guó)信








阳西县|
神木县|
普安县|
章丘市|
阜宁县|
阿尔山市|
彰化市|
神农架林区|
普定县|
中方县|
萍乡市|
凤翔县|
循化|
曲水县|
怀化市|
文昌市|
白城市|
银川市|
光泽县|
扶风县|
新巴尔虎左旗|
虞城县|
桑日县|
山阳县|
河北省|
遂宁市|
遵义县|
获嘉县|
五河县|
普定县|
平远县|
青冈县|
尉犁县|
阳新县|
保康县|
年辖:市辖区|
德州市|
德惠市|
和林格尔县|
襄樊市|
桐城市|