谈起大数据市场机遇,有企业从一体机切入,也有企业从数据分析解决方案切入,有软有硬。有观点认为真正的大数据方案是能得出以前没有过的结果,采用原先没有的方法。如果是前所未有之事,本土企业几无先例可循。而现实是很多企业纷纷宣称可做大数据,那么,他们如何在做?与领先方案差距多少?应用如何?
软件实力拉开一体机竞争力
本土企业软件能力比较弱,使得硬件的性能是否能很好地应用起来成为难题。
大数据概念很火热,业界也有很多人持“大数据市场正在爆发的临界点”的观点。在预期市场的诱惑下,本土厂商纷纷亮出自己的大数据发展路线图。
不久前,擅长服务器的曙光推出其新产品大数据一体机。据曙光公司总裁历军称,该一体机将数据存储单元和处理单元分离,存储系统采用大规模分布式技术。同时,曙光还提出自己的大数据一体化解决方案,声称是建立在其云计算战略和遍布全国的曙光云计算中心基础之上的。
大数据市场和硬件以及谈论比较火热的大数据一体机的关系有多密切?从硬件基础来说,赛迪智库软件与信息服务业研究所所长安晖告诉《中国电子报》记者,大数据相关硬件主要涉及数据总线、内存、CPU、显示设备等。大数据要求CPU的指令集更适合非结构化、半结构化数据的处理,内存速度更快,内存或主板的逻辑结构更适合进行内存计算等高速计算,硬件设备内部的数据总线带宽和硬件设备间的网络带宽更宽,显示设备能给用户更强烈的浸入感。同时,由于数据量的迅速增加,导致并行数据库的规模随之增大,带来成本的急剧上升。出于成本考虑,越来越多的企业级用户会将应用由高端服务器转向由中低端硬件构成的大规模机群平台。
国内外企业都在相继推出大数据一体机,和厂商高度的热情相比,市场反应其实并没有那么热切。IDC高级分析师潘永花在接受《中国电子报》记者采访时坦言,市面上的大数据一体机还是比较新鲜的事物,目前没有很多应用需要使用大数据一体机,相反是基于传统关系型数据库的一体机用户市场较大,成为一体机的主流市场应用。这些数据库一体机主要应用在分析型、对用户交易性能要求比较高的应用中。
正是因为大数据一体机面市并不久,而且市场也没有打开,国内外厂商的产品差距不大。潘永花认为,国外厂商在数据处理上积累较多;国内厂商主要从硬件角度切入,在软件积累方面和国外厂商差距较大。
软件方面的实力差距是拉开外阜大数据一体机和本土大数据一体机差距的主要因素。潘永花向《中国电子报》记者分析到,国外企业采取“软绑硬”的策略推出一体机,是将软件装在特定的基础硬件之上,对特定应用进行调优,使产品性能、可用性和可管理性有了一定的提升。本土企业的软肋是软件能力,这使得硬件的性能是否能很好地应用起来成为难题。另外,本土厂商推的大数据一体机,有些是基于hadoop的开源平台开发的,而开源平台在可用性、安全性、高可靠性方面都存在问题。开源软件的商业化问题是否能够很好地解决?是否真正能将软件硬件结合的优势体现出来?这几个层面的问题都是国内厂商需要考虑的。
产品化能力待考验
国内厂商需要在产品化方面下工夫,而不能仅仅是将软件工具绑定在自己的解决方案中去销售。
大数据产业链涵盖硬件、软件、服务3个层面。从市场规模来看,以服务和硬件为主,软件份额较小。大数据服务是众多软件厂商争夺的焦点。
同方股份有限公司副总裁周侠认为,让大数据产生它的大价值应该是每个大数据企业的目标,如何让这个数据产生价值?就是需要让数据变成有利的信息,在这信息中产生价值,这也是同方大数据的核心定位。
各项研究表明,行业市场的大数据价值密度值是最高的,经过浅度处理便可产生巨大价值,因此,行业用户已然成为了对大数据挖掘需求最迫切的市场目标用户。然而,虽然行业数据已然存在,蕴含的巨大价值也达成了共识,但由于普遍缺乏高等级技术人员,经验不足,很多行业对大数据的应用需求尚不明朗。“中国大部分企业认为大数据很热,但是对于用大数据能解决什么问题还比较困惑。本土企业需要找准需求、找准定位。”潘永花表示。
大数据解决方案需要分行业考虑。安晖告诉《中国电子报》记者,在行业领域不同、企业不同、业务不同时,由于所要分析的数据集合与分析挖掘的目标存在差异,所运用的大数据技术和大数据信息系统也可能有着相当大的不同。正由于与具体应用紧密联系,甚至是一对一的联系,才使得“应用”成为大数据不可或缺的内涵之一。同时,由于需要使用到一些通用型的软件和一些基础的分析模型,所以如果说解决方案可以分层的话,可以认为有通用层。而针对各行业领域、企业的个性化的软件、模型,则在此之上。
潘永花认为,国内厂商市场机会比较多的是针对垂直行业的解决方案,因为他们更了解中国用户的需求,将之融合到大数据解决方案中,才能体现出优势。对于通用工具市场,国内厂商可以选择某些窄众的领域,做出自己的特色,提高产品化的程度。虽然这个市场以外企的产品和开源软件为主,但是并不排除存在发展机会。例如数据可视化工具,国外就有创业型公司凭借该产品在美国成功上市的案例。
“国内厂商需要在产品化方面下工夫,而不能仅仅是将软件工具绑定在自己的解决方案中去销售。”潘永花强调。
从数据中心入手
那些急迫想建立数据资源体系的数据中心或信息中心是IT企业首选的大数据合作伙伴。
政府投资拉动智慧城市建设如火如荼,众多厂商也在智慧城市的机遇中获益颇多。如果说智慧城市的核心是什么,那么大数据处理应该是其中之一。大数据帮助政府部门或行业企业更好地做出决策,提升服务管理水平,让城市管理更加智慧。相对企业大数据精准营销市场的寡头发展趋势,由政府主导的智慧城市眼下机会似乎更多一些,这也是很多大数据厂商定位在政府行业市场的原因。
对于智慧城市的大数据市场,企业最先从何处入手?同方物联网应用产业本部总经理李小华告诉《中国电子报》记者:“政府部门都有数据中心或者信息中心,我们的第一对象就是数据中心或信息中心。根据其使命意识的深浅程度,我们将政府的数据中心分为两种类型:一种是意识到其承担的服务型政府的使命,认为需要用监测数据和分析结果来支撑管理和决策的数据中心,他们是我们首先要关注的对象;另一种是在这方面认识有差距的数据中心,我们目前主要是从理念上和他们做交流。”
大数据的信息资源十分庞杂,如何在这些庞杂信息中抽离出有用的信息?李小华透露,重要的是先建立一个数据资源体系,将数据分成层次,包括管理层的数据、决策层的数据,同时将数据和数据的相关性标注出来,不仅同形态的数据相关性需要加入,不同形态数据的相关性也应该加入,以此反映客观事物的相关性。有了这样的数据资源利用架构,再通过与管理、业务、社会的对接体系,形成数据资源体系,使数据能够真正在管理、决策、监测、评价、人的生活中产生价值。