中国大数据到底有没有前途
来源:原创 时间:2017-05-15 浏览:0 次一、大数据是怎么兴起的,在我国公司界究竟有没有需求土壤
大数据有许多类型,在我国公司软件人看来却只要一种(ERP结构化事务数据)。
大数据在互联网人眼里有许多种:即时通信IM数据、社交网络联系数据、相片数据、视频数据、大规划硬件的日志数据、地图数据和定位方位数据、智能硬件数据。许多都对错结构化数据,并且由所以集约的互联网所以数据海量。数据海量就会决定搜集、传输、紧缩、存储、核算、查询查找、展现,都需求有新的技能架构呈现。
所以啊,我们不要一提起大数据即是大数据剖析,由于许多大数据不具有剖析价值(但也许需求前史追溯查询价值)。可是你假如产生了上述的海量数据,你要么扔掉,你要么就需求搜集、传输、紧缩、存储、核算、查询查找这些大数据技能啊,不单单仅仅一个大数据剖析单点环节。
因而在国外产生了N多的技能基础设施来满足上述现状疑问:
搜集传输:BinLog、Kafka、Sqoop、Flume、Logstash
存储:HadoopHDFS、Hbase、Redis、influxDB、NEO4J、MongoDB
核算:MapReduce、Spark、Storm
查询查找:Hive、Presto、Flink、ElasticSearch
展现:Kibana
不少技能都是互联网公司自个为了应对自个的海量数据疑问,然后自个研制,然后开源。
我国的互联网公司因而也都许多拿来这些干流的大数据处理技能中间件来处理自个的海量数据疑问。
可是呢,我们都用开源技能建立,这么商用大数据技能商品就对比为难了。这也即是我国国内搞大数据技能商品的创业公司活的苦逼困难的因素。许多人老说国外状况,一说国外状况就笑的哈哈,一说国内状况就尿的唰唰。我说这里是我国,这里是他妈的我国,你们不要再当二十八个布尔什维克兵士了,你们要多读读毛祖的书,他才是登时我国实际,这即是我国实际。
我倒有个主张,即是把大数据技能商品藏在底层,应当卖的是事务场景价值运用。
许多搞大数据技能商品的创业公司不信我这个主张,期望的是自个供给大数据技能商品,寻觅合作伙伴来供给职业的运用处理方案。我对这种途径对比悲观。我想起了我前几天转的一句话:你们成天挂在嘴边的资本结合,很也许是个伪命题。真实的结合只要两类状况:一类是你把他人买下来(你有名贵的本钱资本);另一类是你有共同的资本,他人有必要和你交流。
二、我国公司软件界的大数据热
这股风也引发了我国公司软件界的大数据热。不过我国公司软件是做软件卖软件,软件是有作品所有权的,SaaS形式也使软件商具有的软件运营权,不像过去客户是买走了软件商品转移了商品所有权。可是,这里有个东西一向没有改动,那即是数据所有权还一向是客户的,不属于软件公司。
当然,软件公司可以洞悉数据,但不可以输出、生意、转让数据。
SaaS形式使SaaS软件公司敏捷积累起来许多的数据,这些数据虽然大多都是结构化事务数据,可是由于量大,软件公司也需求数据洞悉,所以SaaS软件公司也在测验用互联网公司运用惯了的开源大数据中间件来建立自个的大数据渠道。
SaaS公司的研制人员本来更需求大数据技能渠道的训练。不过我国公司软件公司一项苦逼,所以他们一般都是参与各种技能大会大拼盘来获得碎片的入门式的技能知识。
三、我国公司界的大数据热
我国公司都是一个个的单点,当然我国公司也分为巨型公司(如那些央企)、大型公司、中型公司、中小公司、小微公司和创业公司。
具有海量结构化事务数据的,通常都是那些巨型公司(央企),他们现已经历了多代数据层级存储、大数据仓库、可视化展现、计算报表门户的信息化建造。可是,他们也没有太多的非结构化数据的信息化建造和非结构化数据剖析。
不过如今发生了一些改变:
1、有公司开端测验晋级自个的商品为智能商品,可以搜集用户运用进程数据。为了展开售后服务引荐、定损、确诊、稳妥引荐、典当、二手转卖、租借。
假如你公司还未将商品晋级为智能商品,那么的确不需求大数据处理。
2、有公司开端测验工业互联网。给自个的机器设备加上传感器,给自个的出产车间加上各种传感器。这些传感器搜集的数据,也对错结构化数据处理
假如你公司还未展开工业互联网事务,那么的确不需求大数据处理。
3、有公司开端加强巡检和监理、提高质量和出产安全。许多需求经过手机、小程序、扫码、方位定位、拍照来进行巡检现场和监理现场的非结构化数据记载。
假如你不太注重巡检和监理这两种手法来提高质量和出产安全,那么你的确也许不需求大数据处理
4、有公司需求地图数据(如选址、商业地产招标建造、商铺租借)。如今地图承载的功用十分多,如交通拥堵状况,如商业经济数据(比方周边的人流量、周边的宾馆商铺数量/规划)
假如你不触及上述事务,你的确也许不需求大数据处理
5、有公司想记载线下商超商铺人流量、用户做法剖析。技能界的人脸辨认、人方位辨认、传感器辨认,都可以记载下来人流量、人群特征、用户做法。
假如你不没有上述需求,你的确也许不需求大数据处理
6、有公司开端进行网上事务(网上电子商务、网上用户社区)展开。所以需求点击流记载、流量计算、用户做法剖析。也需求内容爬虫来爬内容充满自个的内容网站(省得人工去寻觅去COPY转发,功率质量本钱太差)。如今大众号、微博这么发达,因而许多公司也展开了网上舆情监控,这也需求大数据技能处理。
假如你不怎么独立展开网上用户社区,你也不怎么介意网络舆情,你的确也不需求大数据处理
7、有公司开端进行进行网上电子商务的展开,所以需求爬虫比价、精准查找、精准引荐、最好仓储仓位、最好物流配送途径、智能客服机器人这些功用。
假如你不怎么独立展开电子商务和网上用户社区(也许你运用了京东、天猫、有赞的渠道),你的确也不需求大数据处理
8、有公司展开网上电子商务和网上用户社区的时分,最忧虑网上进犯、网上缝隙、网上被拖库,所以关于大数据驱动安全类的商品也十分重视,大数据驱动安全类的商品可以动态的、智能的进行安全危险辨认、报警、阻击。
假如你不怎么独立展开电子商务和网上用户社区(也许你运用了京东、天猫、有赞的渠道),你的确也不需求大数据处理
9、有公司在网上进行广告投进。怎么进行精准广告投进、怎么监测广告投进作用,这也需求大数据工具。
假如你在网上广告投进点并不多、投进量并不大,也许的确也不需求大数据处理
10、有公司对网上事务处理的安全保证请求较高(如电信、银行),所以关于长途人脸辨认、证照辨认、语音辨认、视频辨认、文字辨认特别介意。当然,在线下安全保证请求较高的范畴,这些辨认技能也十分需求
假如你对安全保证不高,的确不需求大数据处理
11、有公司想展开花费信贷金融(供应链金融还有标的财物在主导公司手中所以还不灵敏),可是花费信誉数据没有。所以需求结合许多花费者价值数据来历:如运营商方位及联系网络、微信联系网络;地产财物信息、车辆财物信息;工商公司开办信息、税收信息、交税社保信息;银行信贷信息、银行存款信息、股票证券理财出资信息。
假如你公司不展开花费信贷金融事务,那么你的确不需求大数据处理。
12、有公司服务器、交流机路由器、存储设备、网络接入较多较杂乱,所以许多公司为了监控这些设备和网络资本的安稳运转,也会寻觅大数据驱动运维的一些商品,保证运维危险提前辨认,设备扩容晋级收购可以提前精准猜测
假如你IT设备不多,那么你的确不需求大数据处理