欢迎来到Doc100.Net免费学习资源知识分享平台!
您的位置:首页 > 程序异常 >

实时数据分析平台、大数据分析、mpp数据仓库 - vertica (3)高级库内分析

更新时间: 2014-01-05 02:29:46 责任编辑: Author_N1

 

实时数据分析平台、大数据分析、MPP数据仓库 - vertica (三)高级库内分析

        Vertica的提供了一个强大和不断增长的先进的数据库内分析功能,客户可以进行数据紧密的分析计算,并可以从一个地方立即得到答案,而不
需要把信息抽取到一个单独的环境。把数据保持在数据库中是特别关键的,因为数据集的大小从TB到PB级及以后的变化。

        更重要的是,Vertica的原生解析函数和UDF还专门设计可以充分利用我们独特的MPP并行机制,列存储和执行,比其他任何平台上执行得更快。
Vertica的提供完整的ANSI标准SQL的支持,SQL分析功能,规则的文本表达式,原生SQL的扩展和用户定义函数(UDF)框架。UDF正在迅速扩大,超出今天我们提供的SQL宏的UDF。所有这些提供给业务分析师,开发人员和管理员的灵活性和简单性,使他们能够利用大量的信息,在并行处理上而无需博士学位。他们
可以简单地使用他们喜欢的工具提问。

Vertica高级分析特性包括:

  • 原生空白填补
  • 插补
  • 事件窗口功能
  • 图形遍历
  • 序列化

Vertica的简洁SQL语法扩展,使用这些SQL语句的扩展是非常简单的,因此不存在需要学习和使用另一种语言。

        谈NoSQL的有很多,但真正的问题是不是SQL语法。传统的RDBMS性能表现不佳。就拿社会网络端点分析中图的遍历来说,传统的RDBMS会使用连接和痛苦多路自联接得到一个答案,这通常会使系统过载,且无法返回最终结果。另外,可以使用自定义的数据结构和程序语言,但不幸的是,这些往
往不是企业级的,缺乏简单,可扩展性和高效率的并行化。 另一方面,使用我们的MPP操作和有效的列链接,执行排序与标准的SQL语法,Vertica能够提供这些强劲的功能和简单性。最重要的是,Vertica的优化和执行引擎喂你处理所有的规划和并行。

基于事件的窗口

        您还可以使用Vertica基于事件的窗口,把时间序列数据放入运行的窗口中。特别是财务相关的数据分析可能会集中在特定事件触发其他活动。 sessionization,一个特殊的情况下,基于事件的窗口,是一种经常用来分析点击流的功能,如标识在一个特定的时间内从记录的Web点击web浏览的会话。暴力的过程方法,可以实现这一点,但Vertica简单,高效,大规模并行,Web会话以一个即席查询的方式与不同的运行窗口中确定的参数完成。举例来说,30秒可能就不会是一个平均的web访问会话。 Vertica可以自动地分析同一IP地址会话的时间间隔,以确定平均会话时间,然后根据这个参数或会话数据自动地进行标记。

    Vertica投入巨资研发更强大的数据库内分析,使我们的客户能够以执行额外的统计,地理空间,决策树和几个其他先进的分析。 让他们的数据以更多的方式,更快地使用SQL或他们喜欢的程序编程或脚本语言。

进一步阅读

更多Vertica库内分析, 在我们的博客上检查这些链接:

  • Sessionize with Style – Part 1
  • Sessionize with Style – Part 2
  • More Time Series Analytics: Event-Based Window Functions
  • Gap Filling and Interpolation (GFI)
  • Reading between the Lines with Vertica 4.0

 

上一篇:上一篇
下一篇:下一篇

 

随机推荐程序问答结果

 

 

如对文章有任何疑问请提交到问题反馈,或者您对内容不满意,请您反馈给我们DOC100.NET论坛发贴求解。
DOC100.NET资源网,机器学习分类整理更新日期::2014-01-05 02:29:46
如需转载,请注明文章出处和来源网址:http://www.doc100.net/bugs/t/10550/
本文WWW.DOC100.NET DOC100.NET版权所有。