悦岚数据CEO牛力:80%成本用在前期数据准备_证券要闻_顶尖财经网
  您的位置:首页 >> 证券要闻 >> 文章正文

悦岚数据CEO牛力:80%成本用在前期数据准备

加入日期:2014-11-9 4:06:12

牛力
  本报记者 滑明飞 上海报道

  “在国内,大数据忽略了数据的准备阶段。”悦岚(上海)数据服务有限公司(以下简称“悦岚数据”)创始人、CEO牛力接受21世纪经济报道记者专访时表示,在国外,大数据的发展比较脚踏实地,通过一个个项目落地的方式推动,不管叫大数据还是数据整合,在各行业快速推广。

  牛力认为,由于对数据准备阶段的忽略,国内大数据行业依然以概念炒作为主,大家都在关注大数据建模分析和应用,这对整个体系的搭建造成不良影响,因此无论在落地速度,还是范围方面,均相对落后。

  2013年初,牛力在上海成立悦岚数据,专注通用型大数据应用研发,并提供完整的大数据解决方案。他自称早在2000年便进入大数据行业,2005年赴澳洲攻读博士,毕业后进入当地一家大数据咨询服务公司工作。

  不同于大型互联网平台的大数据“自产自销”,作为一家独立的大数据创业公司,悦岚数据只提供工具和解决方案,为可以产生大数据的各个行业提供服务。目前,悦岚数据在智慧社区、智慧交通、科研、商业规划等多个领域已实现多个项目落地。

  牛力表示, 目前,企业都意识到大数据的价值,但在推进过程中,也存在一些问题,比如客户需求非常不明确,“很多人找到我,只说有数据,不知道如何通过大数据做决策”。此外,部分传统企业的信息化水平比较落后,导致原始数据不足或缺失,而一些信息化水平较高的企业也存在数据孤岛的困境。

  “两周内可生成模型”

  《21世纪》:从大数据运用的整个流程来看,涉及数据采集、整合、存储、挖掘分析和应用等,悦岚数据的业务主要集中在哪些环节?

  牛力:从原始数据采集、数据清洗整合到构建模型分析、形成可显示化结果,公司覆盖全产业链。通过一套软件,将整个流程体系搭建起来。

  《21世纪》:悦岚数据的大数据产品和市场上一些同类公司的产品有何不同?

  牛力:传统技术下,流程是分割的,由不同的公司提供的不同工具来完成每个环节,而悦岚数据的产品无需用户学习不同的工具使用,一个工具可以完成所有的事情。

  更为关键的是,传统技术下,大数据快速变现能力差。不是大家没有意识到,而是当真正去推动项目的时候,没办法将数据快速变成商业价值。周期很长,一个项目可能做半年甚至一年才呈现出数据分析结果,但这个结果可能还不是客户想要的,或者客户的需求可能已经发生变化,因此使得客户认为大数据解决不了他们的问题,导致落地很困难。

  比如采用Hadoop技术的公司,本身国内这方面的人才就少,组建团队需要时间,然后写代码、采集数据、建模等,都需要很长的时间,并且当需要重新调整模型时,又要耗费时间。而我们的产品则从需求出发,两周内便可以生成一个模型,形成报告。而一旦出现偏差,也能够快速调整,在下一个周期中及时改善,迭代进行。

  这个很关键,因为传统企业的管理方式处于变化之中,没有一个固定的模式。

  《21世纪》:目前做了哪些项目?怎么做的?

  牛力:很多,比较典型的比如上海科学院项目和湖北的一个交通项目。上海科学院需要出一些分析报告,了解市场对新科技热点的态度。之前只能通过人工的方式完成,派人到各大网站搜索,采集数据,汇总成报告。现在用我们的技术,实时监控200多个外部网站和科学院的数据库,通过内外部数据的同时采集,然后进行加工处理,清洗掉噪音数据、有冲突的数据和非完整信息,保证数据质量;然后存储起来形成大数据中心;接下来会分类进行建模,评判一个人的情感取向,最后形成报告。

  湖北的项目则是和交警部门合作,这个项目不关注外部数据,而是关注各个路口的车流量、车牌信息、行驶轨迹等,拿到这个数据后做很多事情,比如自动对出现异常情况的监控摄像头发出报警,以前是派人去看摄像头有无问题。

  解决数据采集与信息孤岛

  《21世纪》:你在国外待了7年,是否对比过国内和国外大数据产业的发展情况?

  牛力:国外比较脚踏实地,概念炒作相对较少 ,我在澳洲待了七年多,媒体和政府没有更多的推广,而是从项目落地的方式去一步一步推动。不管叫大数据,还是数据整合,只要有需求就做,根据需求在各个行业全面推进。

  国内很长一段时间则更多是概念,因此,大家都在关注建模分析 ,而忽略了数据准备阶段,对整个体系的搭建造成非常不良的影响,因此无论在落地速度,还是范围方面,均相对落后国外。

  相同的是,首先都离不开技术,无论国内外,模式都差不多,同样要通过技术做一个完整的项目,而整合不同技术问题很大,过程很难。

  《21世纪》:你认为国内大数据产业最近几年有没有什么变化?

  牛力:国内认为2011年是大数据元年,国外则在2009年左右就已经有了。都只是一个概念,其实很多底层支撑技术不是最近几年才提出来的,比如数据统计,在五六十年代就有了;可视化概念在80年代就提出了,当时只是数据样本较少。现在出现了超大数据处理分析技术,一个互联网公司,1秒钟的访问日志就是几个G,所以新老技术结合,共同推动大数据的发展。

  国内在2011年的时候关注概念,很少人思考如何落地,不知道如何将各类技术整合在一起形成落地方案。现在像我们这样的公司则开始实现技术融合,让概念落地到各个行业中。

  而从市场角度看,也有很大变化,我们近几年做市场调研,发现发生了翻天覆地的变化,很多行业都在推项目,两三年之内,业务量快速增长。

  《21世纪》:互联网和大数据有天然优势,那么传统行业如何去和大数据结合?

  牛力:巧妇难为无米之炊,传统行业和互联网一样,没有有效数据都做不了大数据。只是互联网通过IT系统的商业模式,自然实时获取数据。

  传统企业则要分为两类来看,信息化水平较高的行业,比如电信和金融都非常好了,但存在“孤岛”问题;另一类行业和企业则正处于信息化建设过程中,比如商超,你是会员,刷一下卡,商超就可以采集到数据,而非会员的数据则获取不到。

  因此,对第一类公司,要解决孤岛问题,打通企业内部各个孤立的系统,实现数据共享。我们目前就是把不同系统中的数据采集、整合、存储以形成统一的大数据中心。而第二类公司当然首先是搭建起完整的信息系统,解决数据采集问题。

  《21世纪》:传统行业在做这些的过程中,你有什么建议?

  牛力:传统行业拥抱大数据的前提就是完成信息化、数字化的过程,并且要有新的思维,构建分析型的信息系统,不要搞那么多信息孤岛。以前,企业做信息化系统,只是解决业务流程的问题,不考虑以后的分析,现在做信息系统的建设就要考虑采集哪些数据,如何设计数据结构类型,全面规划信息化建设。

  不同的行业改造的方式和过程也不同,比如商超,有些开始布局WIFI,即使不是会员,也可以获取部分用户数据。

  大数据时代 ,对信息系统还是有要求的,应该考虑得更长远一些。巨头公司有钱可以自己搭建;小型微型企业也希望做大数据,比如餐饮店,自己搞系统成本很大,那就可以通过云的方式实现,由我们这样的公司去采集相关数据,进行分析形成报告,通过云的方式推送给他们。

  投资者要有泡沫辨别

  《21世纪》:大数据在国内的落地过程中可能遇到哪些问题?

  牛力:客户需求不明确,非常不明确,很多人找到我只说有数据,不知道如何通过大数据做决策。另外两大难点在于数据的整合和业务认知。

  现在提大数据,很多人有一个错误的理解,认为大数据就是建模分析,其实这是一个老技术,就是一个统计软件分析一下,建模就出来了。

  建模的前提必须是数据没问题,如果有问题,结果肯定有问题,因此,前期数据准备非常重要。而这个过程中,技术最具挑战性,比如你有数据库,包括网络的数据、非网络的数据,类型不同,存储的地方、格式、结构非常复杂,如何整合到一起,形成统一的大数据中心,这项工作在整个过程中占到80%的时间和其他资源成本。

  另一方面,因为大数据项目涉及不同行业,如何对不同行业去建模,需要对行业进行深入了解,否则建模很难。

  《21世纪》:你认为目前国内的大数据生态是什么样的?还有哪些创业机会?

  牛力:可以简单分为几类:1、纯数据公司,通过各种方式搜集行业数据,以售卖数据为主要盈利方式,这类在大数据概念之前就存在了;2、针对不同行业推出产品和解决方案的公司,比如医疗健康行业的手机应用,由消费产生数据;3、咨询服务公司,本身没有技术产品,但有行业经验,利用数据工具做咨询服务 。我们是第四类,做工具的,是基础核心工具的开发厂商。

  相对而言,第一类有时间壁垒,后来者很难超越;第二类虽然是一个新的模式,但大部分通过开源技术去做,壁垒不高;第三类有业务知识壁垒,而我们这类公司则有很高的技术壁垒。

  《21世纪》:目前像IBM、英特尔这样的巨头也在推动其大数据业务,悦岚数据如何和巨头竞争?

  牛力:不同的策略和技术路线。巨头们是一个复合体,以服务为主,背后有强大的产品线,覆盖数据库、中间件、大数据处理和报表可视化等全产业链,但他们将这些服务打散到不同产品里,让客户单独去买,每个都要付费。而我们则是做产品的公司,通过一套产品搞定所有问题,而服务类公司和我们是合作关系。

  悦岚数据的主要商业模式是和咨询服务类公司合作,1、咨询公司为客户做分析时需要我们的工具;2、他们也可以作为代理商向企业推荐我们的产品;3、因为咨询类公司在业务方面比较专业,可以为我们提供很多帮助,比如模型的搭建。

  《21世纪》:资本目前对大数据创业公司是一个什么样的态度?

  牛力:资本的关注度不是一般的大,但相对国外的疯狂,国内的投资人比较谨慎。

  资本都看清楚了未来趋势,这个毋庸置疑,IBM、英特尔等都在大量投资相关的创业公司,国内资本也在密切关注。但由于环境不同,国内投资者需要有一个辨别的过程,一些公司只是做了一个硬件,加几套软件就号称大数据一体机,泡沫很大,资本需要时间吹掉一些泡沫才能落地。而从标的类型上看,以投资技术公司为主。

  作者:滑明飞

编辑: 来源:21世纪网-《21世纪经济报道》