程序员人生 网站导航

【快讯】放宽计算及内存限制,Aster提供R语言分析能力

栏目:互联网时间:2014-10-13 15:19:50

【快讯】时至今日,R语言几乎成为了数据科学领域的通用语言,被各个公司运用于数据分析产品中。经了解,CSDN云计算得知,Teradata公司近日亦将推出起基于R语言的大数据分析工具――Teradata Aster R,通过放宽内存和处理能力限制条件,扩展开源R语言分析能力。Teradata Aster R为R语言分析师提供企业级就绪(enterprise-ready)的商业分析解决方案,具有高度可扩展性、可靠性和易用性。

R是面向数据挖掘人员和数据科学家的一种开源统计语言及软件。Rexer Analytics咨询公司调查显示,使用R语言的数据挖掘人员越来越多,70%的调查对象称他们正在使用R语言。

然而在单服务器部署情况下,鉴于内存处理数据量大小的限制,复杂分析的性能必然会有所下降。本次推出的Teradata Aster R则通过在数据库内并行执行R语言分析,放宽了处理能力及内存限制。

Teradata Labs总裁 Scott Gnau 表示:“Teradata Aster R为企业提供R语言分析能力。而针对R语言分析师,Teradata开发出他们熟悉的R语言和工具,并提供强大的处理能力及丰富的分析方法。分析师还能够从多个数据源访问海量整合数据。”

Teradata Aster R主要包含以下三大组件:

Teradata Aster R Library: 该语言库预置100余种R语言功能,所有数据均支持并行运行,降低并行处理的复杂性。分析师无需花费数日进行并行算法编码,即可实时的访问R语言并行功能,如数据管理、访问、探勘与操作、机器学习算法等。此外,Teradata还通过拥有专利的Teradata Aster nPath等高性能分析能力,增强开源R语言的分析能力。

Teradata Aster R Parallel Constructor:该组件拥有超过5500个R语言分析工具包,支持所有开源社区开发的新分析功能,可帮助分析师开发并行分析方法。

Teradata Aster SNAP Framework集成:开源R语言引擎已被整合至Teradata Aster无缝网络分析处理框架(Teradata Aster SNAP Framework),可依据分析师特定探索需要,将多种分析引擎和文件存储无缝整合。多种分析能力的无缝整合增强Teradata Aster R的分析能力。借助图表、MapReduce、文本、统计、时序及R语言分析等多种分析功能,数据科学家可仅通过单一程序就能深度挖掘数据。

Teradata还为Aster R语言库添加高性能图表分析模块,支持先前发布的图形处理引擎Teradata Aster SQL-GR。数据科学家将能够利用图形分析能力,分析社交网络,监测欺诈行为,并运行可信传播(belief propagation)这一专业的可能性建模算法。

R语言分析用例

在线流媒体电影供应商必须预测未来收入,采取行动阻止潜在的消费者流失,并提升其视觉体验。电影供应商将该任务分派给R语言分析师,帮助他们了解客户的购买偏好及服务需求。但由于内存及处理能力限制,分析师无法访问并整合所有需要的数据。在单服务器内存环境下很可能无法及时完成分析,因此分析师无法及时响应商业用户的需求。

部署Teradata Aster R帮助分析师打破内存及处理能力限制,他们还可通过R语言控制台,协调整个分析流程。而通过部署Apache Hadoop及Teradata,分析师可在数据库内针对电影元数据、客户搜索、观看历史记录、账户信息等所有所需数据,轻松实现高速分析。基于这些客户洞察,在线电影供应商将能够针对客户服务及防止客户流失作出明智决策。据悉,Teradata Aster R计划将于2014年第四季度上市。


免费订阅“CSDN云计算”微信公众号,实时掌握第一手云中消息!

CSDN作为国内最专业的云计算服务平台,提供云计算、大数据、虚拟化、数据中心、OpenStack、CloudStack、Hadoop、Spark、机器学习、智能算法等相关云计算观点,云计算技术,云计算平台,云计算实践,云计算产业资讯等服务。

------分隔线----------------------------
------分隔线----------------------------

最新技术推荐