当前位置:主页 > 数据分析 > 大数据分析常用工具汇总
201609/04

大数据分析常用工具汇总

 

作者:admin321 文章分类:数据分析 发布时间:2016-09-04 Comments 围观:

  大数据是一个含义广泛的术语,是指数据集,如此庞大而复杂的,他们需要专门设计的硬件和软件工具进行处理。该数据集通常是万亿或EB的大小。这些数据集收集自各种各样的来源:传感器,气候信息,公开的信息,如杂志,报纸,文章。大数据产生的其他例子包括购买交易记录,网络日志,病历,军事监控,视频和图像档案,及大型电子商务。
  
  在大数据和大数据分析,他们对企业的影响有一个兴趣高涨。大数据分析是研究大量的数据的过程中寻找模式,相关性和其他有用的信息,可以帮助企业更好地适应变化,并做出更明智的决策。
  
  那么在数据分析领域,都有哪些软件分析工具呢?如何选择呢?其实很多领域或者说分析方法都有相应的软件工具,只要你想找就应该能够找到!
  
  传统的数据可视化工具仅仅将数据加以组合,通过不同的展现方式提供给用户,用于发现数据之间的关联信息。近年来,随着云和大数据时代的来临,数据可 视化产品已经不再满足于使用传统的数据可视化工具来对数据仓库中的数据抽取、归纳并简单的展现。新型的数据可视化产品必须满足互联网爆发的大数据需求,必须快速的收集、筛选、分析、归纳、展现决策者所需要的信息,并根据新增的数据进行实时更新。因此,在大数据时代,数据可视化工具必须具有以下特性:
  (1)实时性:数据可视化工具必须适应大数据时代数据量的爆炸式增长需求,必须快速的收集分析数据、并对数据信息进行实时更新;
  (2)简单操作:数据可视化工具满足快速开发、易于操作的特性,能满足互联网时代信息多变的特点;
  (3)更丰富的展现:数据可视化工具需具有更丰富的展现方式,能充分满足数据展现的多维度要求;
  (4)多种数据集成支持方式:数据的来源不仅仅局限于数据库,数据可视化工具将支持团队协作数据、数据仓库、文本等多种方式,并能够通过互联网进行展现。
  
  下面介绍目前在打数据方法积累和分析方面使用较多的数据分析工具,大数据就好比是海洋中的水,而分析工具则好比是流水的管道,没有管道的梳理,再多的水都不能为你所需,所以好的分析工具能快速的将杂乱无章的数据整理成可视化你需要的数据和答案。
  
  目前常用的大数据分析软件有:
  
  一、Excel
  Excel作为一个入门级工具,是快速分析数据的理想工具,也能创建供内部使用的数据图,但是Excel在颜色、线条和样式上课选择的范围有限,这也意味着用Excel很难制作出能符合专业出版物和网站需要的数据图。
  
  二、Google Chart API
  Google Chart提供了一种非常完美的方式来可视化数据,提供了大量现成的图标类型,从简单的线图表到复杂的分层树地图等。它还内置了动画和用户交互控制。
  
  三、D3
  D3(Data Driven Documents)是支持SVG渲染的另一种JavaScript库。但是D3能够提供大量线性图和条形图之外的复杂图表样式,例如Voronoi图、树形图、圆形集群和单词云等。
  
  四、R
  R语言是主要用于统计分析、绘图的语言和操作环境。虽然R主要用于统计分析或者开发统计相关的软件,但也有用作矩阵计算。其分析速度可比美GNUOctave甚至商业软件MATLAB。
  
  五、Visual.ly
  如果你需要制作信息图而不仅仅是数据可视化,Visual.ly是最流行的一个选择。
  
  六、Processing
  Processing是数据可视化的招牌工具。你只需要编写一些简单的代码,然后编译成Java。Processing可以在几乎所有平台上运行。
  
  七、Leaflet
  Leaflet是一个开源的JavaScript库,用来开发移动友好地交互地图。
  
  八、Openlayers
  Openlayers可能是所有地图库中可靠性最高的一个。虽然文档注释并不完善。且学习曲线非常陡峭,但是对于特定的任务来说,Openlayers能够提供一些其他地图库都没有的特殊工具。
  
  九、PolyMaps
  PolyMaps是一个地图库,主要面向数据可视化用户。PolyMaps在地图风格化方面有独到之处,类似CSS样式表的选择器。
  
  十、Charting Fonts
  Charting Fonts是将符号字体与字体整合(把符号变成字体),创建出漂亮的矢量化图标。
  
  
  十一、Gephi
  Gephi是进行社会图谱数据可视化分析的工具,不但能处理大规模数据集并且Gephi是一个可视化的网络探索平台,用于构建动态的、分层的数据图表。
  
  十二、CartoDB
  CartoDB是一个不可错过的网站,你可以用CartoDB很轻易就把表格数据和地图关联起来,这方面CartoDB是最优秀的选择。
  
  十三、Weka
  Weka是一个能根据属性分类和集群大量数据的优秀工具,Weka不但是数据分析的强大工具,还能生成一些简单的图表。
  
  十四、NodeBox
  NodeBox是OS X上创建二维图形和可视化的应用程序,你需要了解Python程序,NodeBox与Processing类似,但没有Processing的互动功能。https://www.nodebox.net/code/index.php/Home
  
  十五、Kartograph
  Kartograph不需要任何地图提供者像Google Maps,用来建立互动式地图,由两个libraries组成,从空间数据开放格式,利用向量投影的Python library以及post GIS,并将两者结合到SVG和JavaScript library,并把这些SVG资料转变成互动性地图。
  
  十六、Modest Maps
  Modest Maps是一个很小的地图库,在一些扩展库的配合下,例如Wax、Modest Maps立刻会变成一个强大的地图工具。
  
  十七、Tangle
  Tangle是一个用来探索,Play和可以立即查看文档更新的交互工具。
  
  十八、Crossfilter
  Crossfilter既是图表,又是互动图形用户界面的小程序,当你调整一个图表中的输入范围时,其他关联图表的数据也会随之改变
  
  十九、Raphael
  Raphael是创建图表和图形的JavaScript库,与其他库最大的不同是输出格式仅限SVG和VML.http://raphaeljs.com/
  
  二十、jsDraw2DX
  jsDraw2DX是一个标准的JavaScript库,用来创建任意类型的SVG交互式图形,可生成包括线、矩形、多边形、椭圆、弧线等图形。http://jsdraw2dx.jsfiction.com/
  
  
  二十一、Pizza Pie Charts
  Pizza Pie Charts是个响应式饼图图表,基于Adobe Snap SVG框架,通过HTML标记和CSS来替代JavaScript对象,更容易集成各种先进的技术。
  
  二十二、Fusion Charts Suit XT
  Fusion Charts Suit XT是一款跨平台、跨浏览器的JavaScript图表组件,为你提供令人愉悦的JavaScript图表体验。它是最全面的图表解决方案,包含90+图表类型和众多交互功能,包括3D、各种仪表、工具提示、向下钻取、缩放和滚动等。它拥有完整的文档以及现成的演示,可以帮助你快速创建图表。
  
  二十三、iCharts
  iCharts提供可一个用于创建并呈现引人注目图表的托管解决方案。有许多不同种类的图表可供选择,每种类型都完全可定制,以适合网站的主题。iCharts有交互元素,可以从Google Doc、Excel表单和其他来源中获取数据。
  
  二十四、Modest Maps
  Modest Maps是一个轻量级、可扩展的、可定制的和免费的地图显示类库,这个类库能帮助开发人员在他们自己的项目里能够与地图进行交互。
  
  二十五、Raw
  Raw局域非常流行的D3.js库开发,支持很多图表类型,例如泡泡图、映射图、环图等。它可以使数据集在途、复制、粘贴、拖曳、删除于一体,并且允许我们定制化试图和层次。
  
  二十六、Springy
  Springy设计清凉并且简答。它提供了一个抽象的图形处理和计算的布局,支持Canvas、SVG、WebGL、HTML元素。
  
  二十七、Bonsai
  Bonsai使用SVG作为输出方式来生成图形和动画效果,拥有非常完整的图形处理API,可以使得你更加方便的处理图形效果。它还支持渐变和过滤器(灰度、模糊、不透明度)等效果。
  
  二十八、Cube
  Cube是一个开源的系统,用来可视化时间系列数据。它是基于MongoDB、NodeJS和D3.js开发。用户可以使用它为内部仪表板构建实时可视化的仪表板指标。
  
  二十九、Gantti
  Gantti是一个开源的PHP类,帮助用户即时生成Gantti图表。使用Gantti创建图表无需使用JavaScript,纯HTML-CSS3实现。图表默认输出非常漂亮,但用户可以自定义样式进行输出(SASS样式表)。
  
  三十、Smoothie Charts
  Smoothie Charts是一个十分小的动态流数据图表路。通过推送一个webSocket来显示实时数据流。Smoothie Charts只支持Chorme和Safari浏览器,并且不支持刻印文字或饼图,它很擅长显示流媒体数据。
  
  三十一、Flot
  Flot是一个优秀的线框图表库,支持所有支持canvas的浏览器(目前主流的浏览器如火狐、IE、Chrome等都支持)。
  
  三十二、Tableau Public
  Tableau Public是一款桌面可视化工具,用户可以创建自己的数据可视化,并将交互性数据可视化发布到网页上。
  
  三十三、Many Eyes
  Many Eyes是一个Web应用程序,用来创建、分享和讨论用户上传图形数据。
  
  三十四、Anychart
  Anychart是一个灵活的基于Flash/JavaScript(HTML5)的图表解决方案、跨浏览器、跨平台。除了图表功能外,它还有一款收费的交互式图表和仪表。
  
  三十五、Dundas Chart
  Dundas Chart处于行业领先地位的NET图表处理控件,于2009年被微软收购,并将图表产品的一部分功能集成到Visual Studio中。
  
  三十六、TimeFlow
  TimeFlow Analytical Timeline是为了暂时性资料的视觉化工具,现在有alpha版本因此有机会可以发现差错,提供以下不同的呈现方式:时间轴、日历、柱状图、表格等。
  
  三十七、Protovis
  Protovis是一个可视化JavaScript图表生成工具。
  
  三十八、Choosel
  Choosel是可扩展的模块化Google网络工具框架,可用来创建基于网络的整合了数据工作台和信息图表的可视化平台。
  
  三十九、Zoho Reports
  Zoho Reports支持丰富的功能帮助不同的用户解决各种个性化需求,支持SQL查询、类四暗自表格界面等。
  
  四十、Quantum GIS(QDIS)
  Quantum GIS(QDIS)是一个用户界面友好、开源代码的GIS客户端程序,支持数据的可视化、管理、编辑与分析和印刷地图的制作。
  
  四十一、NodeXL
  NodeXLDE主要功能是社交网络可视化。
  
  四十二、OpenStreetMap
  OpenStreetMap是一个世界地图,由像您一样的人们所构筑,可依据开放协议自由使用。
  
  四十三、OpenHeatMap
  OpenHeatMap简单易用,用户可以用它上传数据、创建地图、交流信息。它可以把数据(如Google Spreadsheet的表单)转化为交互式的地图应用,并在网上分享。
  
  四十四、Circos
  Circos最初主要用于基因组序列相关数据的可视化,目前已应用于多个领域,例如:影视作品中的人物关系分析,物流公司的订单来源和流向分析等,大多数关系型数据都可以尝试用Circos来可视化。
  
  四十五、Impure
  Impure是一个可视化编程语言,旨在收集、处理可视化信息。
  
  四十六、Polymaps
  Polymaps是一个基于矢量和tile创建动态、交互式的动态地图。
  
  四十七、Rickshaw
  Rickshaw是一个基于D3.JS来创建序交互式的时间序列图表库。
  
  四十八、Sigma.js
  Sigma.js是一个开源的轻量级库,用来显示交互式的静态和动态图表。
  
  四十九、Timeline
  Timeline即时间轴,用户通过这个工具可以一目了然的知道自己在何时做了什么。
  
  五十、BirdEye
  BirdEye是Decearative Visual Analytics,它属于一个群体专案,为了要提升设计和广泛的开源资料视觉化发展,并且为了Adobe Flex建视觉分析图库,这个动作以叙述性的资料库为主,让使用者能够建立多元资料视觉化界面来分析以及呈现资讯。
  
  五十一、Arbor.Js
  Arbor.Js提供有效率、以力导向的版面配置演算法,抽象画图表组织以及筛选更新的处理。
  
  五十二、Highchart.js
  Highchart.js是单纯由JavaScript所写的图表资料库,提供简单的方法来增加互动性图表来表达你的网站或网站应用程式。目前它能支援线图、样条函数图。
  
  五十三、Paper.js
  Paper.js是一个开源向量图表叙述架构,能够在HTML5 Canvas 运作,对于初学者来说它是很容易学习的,其中也有很多专业面向可以提供中阶及高阶使用者。
  
  五十四、Visualize Free
  Visualize Free是一个建立在高阶商业后台集游InetScoft开发的视觉化软体免费的视觉分析工具,可从多元变量资料筛选并看其趋势,或是利用简单地点及方法来切割资料或是小范围的资料。
  
  五十五、GeoCommons
  GeoCommons可以使用户构建富交互可视化应用来解决问题,即使他们没有任何传统地图使用经验。你可以将实社会化数据或者GeoCommons保存的超5万份开源数据在地图上可视化,创造带交互的可视化分析作品,并将作品嵌入网站、博客或分享到社交网络上。
  
  
  “运营那点事” 公众号(y445783237),一个从事多年传统行业运营的从业者的经验分享平台,目前负责某集团市场整体运营工作,公众号内容不定期更新,分享必有干货,欢迎来探讨交流。



转载请注明出处云天博客-大数据分析常用工具汇总 :


文章作者:admin321
本文地址:
版权所有 © 未注明“转载”的博文一律为原创,转载时必须以链接形式注明作者和原始出处!
如果你觉得文章不错,您可以推荐给你的朋友哦!

◇◇上一篇:数据分析法常用的那些方法技巧 下一篇:没有了 ◇◇