隨著大數(shù)據(jù)的增加,給企業(yè)管理大量數(shù)據(jù)帶來(lái)了挑戰(zhàn)和機(jī)遇。我將向您介紹幾種用于信息管理的大數(shù)據(jù)工具:
1.ApacheHive
Hive是一個(gè)基于hadoop的開(kāi)源數(shù)據(jù)倉(cāng)庫(kù)基礎(chǔ)設(shè)施。通過(guò)Hive,可以方便地進(jìn)行數(shù)據(jù)的ETL,可以結(jié)構(gòu)化數(shù)據(jù),可以查詢和處理Hadoop中的大數(shù)據(jù)文件。Hive提供了一種簡(jiǎn)單的類似于SQL的查詢語(yǔ)言————HiveQL,為熟悉SQL的用戶查詢數(shù)據(jù)提供了方便。
2JaspersoftBI套件
Jaspersoft包是一個(gè)通過(guò)數(shù)據(jù)庫(kù)列生成報(bào)告的開(kāi)源軟件。行業(yè)領(lǐng)導(dǎo)發(fā)現(xiàn),Jaspersoft軟件是一流的,很多企業(yè)已經(jīng)用它把SQL表轉(zhuǎn)換成pdf了,讓大家可以在會(huì)上復(fù)習(xí)。此外,JasperReports提供了一個(gè)連接配置單元來(lái)代替HBase。
3.1010數(shù)據(jù)
1010data成立于2000年,是一家總部位于紐約的分析云服務(wù)公司,旨在為華爾街客戶提供服務(wù),甚至包括NYSEEuronext、游戲和電信客戶。它旨在支持可擴(kuò)展的大規(guī)模并行處理。它還有自己的查詢語(yǔ)言,支持SQL函數(shù)和多種查詢類型,包括圖形和時(shí)間序列分析。這種私有云方法減輕了客戶在基礎(chǔ)架構(gòu)管理和擴(kuò)展方面的壓力。
4.Actian
Actian,原名IngresCorp,擁有10,000多名客戶,并在不斷擴(kuò)大。由Vectorwise和ParAccel擴(kuò)展而來(lái)。這些發(fā)展分別導(dǎo)致了活動(dòng)向量和活動(dòng)矩陣的建立。它有Apache、Cloudera、Hortonworks等發(fā)行版可供選擇。
5.五大商業(yè)分析
從某種意義上來(lái)說(shuō),Pentaho相對(duì)于Jaspersoft來(lái)說(shuō),是從報(bào)表生成引擎開(kāi)始的,但是它通過(guò)簡(jiǎn)化從新來(lái)源獲取信息的過(guò)程來(lái)支持大數(shù)據(jù)處理。Pentaho的工具可以連接到NoSQL數(shù)據(jù)庫(kù),如MongoDB和Cassandra。PeterWayner指出,PentahoData有很多內(nèi)置模塊,你可以將它們拖放到一張圖片上,然后連接起來(lái)。
6.KarmasphereStudioandAnalyst
KarsmasphereStudio是在Eclipse上構(gòu)建的一套插件,是一個(gè)比較容易創(chuàng)建和運(yùn)行Hadoop任務(wù)的特殊IDE。配置Hadoop作業(yè)時(shí),Karmasphere工具將指導(dǎo)您完成每一步,并顯示一些結(jié)果。當(dāng)所有數(shù)據(jù)都在同一個(gè)Hadoop集群中時(shí),KarmaspehereAnalyst旨在簡(jiǎn)化過(guò)濾過(guò)程。
7.Cloudera
Cloudera正在努力為開(kāi)源Hadoop提供支持,同時(shí)將數(shù)據(jù)處理框架擴(kuò)展到一個(gè)全面的“企業(yè)數(shù)據(jù)中心”,可以作為管理所有企業(yè)數(shù)據(jù)的首選目標(biāo)和中心點(diǎn)。Hadoop可以作為目標(biāo)數(shù)據(jù)倉(cāng)庫(kù),高效的數(shù)據(jù)平臺(tái),或者現(xiàn)有數(shù)據(jù)倉(cāng)庫(kù)的ETL源。企業(yè)規(guī)??梢宰鳛镠adoop與傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)集成的基礎(chǔ)。Cloudera致力于成為數(shù)據(jù)管理的“重心”。
8.宜欣艾森軟件
銳信的一站式數(shù)據(jù)治理管理平臺(tái)銳智,為企業(yè)提供從元數(shù)據(jù)、主數(shù)據(jù)、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)質(zhì)量到數(shù)據(jù)處理、數(shù)據(jù)資產(chǎn)、數(shù)據(jù)交換、數(shù)據(jù)安全的一站式解決方案,開(kāi)啟了數(shù)據(jù)治理的全過(guò)程。睿智平臺(tái)的特色:全生命周期管理,先進(jìn)的產(chǎn)品技術(shù)開(kāi)發(fā),數(shù)據(jù)治理規(guī)劃咨詢,豐富的項(xiàng)目實(shí)踐經(jīng)驗(yàn)。主要用于:銀行、金融租賃、教育、衛(wèi)生、政府等機(jī)構(gòu)。
9.TalendOpenStudio
Talend的工具用于協(xié)助數(shù)據(jù)質(zhì)量、數(shù)據(jù)集成和數(shù)據(jù)管理。Talend是一個(gè)統(tǒng)一的平臺(tái),通過(guò)提供一個(gè)統(tǒng)一的、跨企業(yè)邊界的生命周期管理環(huán)境,使得數(shù)據(jù)管理和應(yīng)用更加簡(jiǎn)單方便。這種設(shè)計(jì)可以幫助企業(yè)構(gòu)建靈活、高性能的企業(yè)架構(gòu)。在子架構(gòu)下,可以集成和啟用具有100%開(kāi)源服務(wù)的分布式應(yīng)用程序。
10.亞太區(qū)
ApacheSpark是Hadoop開(kāi)源生態(tài)系統(tǒng)的新成員。它提供了比Hive更快的查詢引擎,因?yàn)樗蕾囉谧约旱臄?shù)據(jù)處理框架,而不是Hadoop HDFS服務(wù)。同時(shí),它也用于事件流處理、實(shí)時(shí)查詢和機(jī)器學(xué)習(xí)。
1.《大數(shù)據(jù)處理 大數(shù)據(jù)處理必備的十大工具》援引自互聯(lián)網(wǎng),旨在傳遞更多網(wǎng)絡(luò)信息知識(shí),僅代表作者本人觀點(diǎn),與本網(wǎng)站無(wú)關(guān),侵刪請(qǐng)聯(lián)系頁(yè)腳下方聯(lián)系方式。
2.《大數(shù)據(jù)處理 大數(shù)據(jù)處理必備的十大工具》僅供讀者參考,本網(wǎng)站未對(duì)該內(nèi)容進(jìn)行證實(shí),對(duì)其原創(chuàng)性、真實(shí)性、完整性、及時(shí)性不作任何保證。
3.文章轉(zhuǎn)載時(shí)請(qǐng)保留本站內(nèi)容來(lái)源地址,http://f99ss.com/guoji/1806549.html