数据流量分析心得体会(必备八篇)。
数据流量分析心得体会 篇1
介绍数据分析/挖掘的图书有很多,这些图书分为很多等级,有的是直接面向应用(business, academy or interplay between both two),有的是介绍理论背景(个人认为很重要,如果以20/80规则,这些图书将有助于解决剩余20%的问题,不过你可能要付出80%精力),有的是结合各类计算工具(例如SAS,Excel,R etc)。相信很多人对此都很头疼,到底应该如何选择呢?
现在先谈谈我个人在数据分析的经历,最后我将会做个总结。
大学开设了两门专门讲授数据分析基础知识的课程:“概率统计”和“高等多元数据分析”。这两门选用的教材是有中国特色的国货,不仅体系完整而且重点突出,美中不足的是前后内在的逻辑性欠缺,即各知识点之间的关联性没有被阐述明白,而且在应用方面缺少系统地训练。当时,我靠着题海战术把这两门课给混过去了,现在看来是纯忽悠而已。(不过,如果当时去应聘数据分析职位肯定有戏,至少笔试可以过关)。
抱着瞻仰中国的最高科研圣地的想法,大学毕业后我奋不顾身的考取了中科院的研究生。不幸的是,虽然顶着号称是高级生物统计学的专业,我再也没有受到专业的训练,一切全凭自己摸索和研究(不过,我认为这样反而挺好,至少咱底子还是不错的,一直敏而好学)。首先,我尽全力搜集一切资料(从大学带过来的习惯),神勇地看了一段时间,某一天我突然“顿悟”,这样的学习方式是不行的,要以应用为依托才能真正学会。然后呢,好在咱的环境的研究氛围(主要是学生)还是不错滴,我又轰轰烈烈地跳入了paper的海洋,看到无数牛人用到很多牛方法,这些方法又号称解决了很多牛问题,当时那个自卑呀,无法理解这些papers。某一天,我又“顿悟”到想从papers中找到应用是不行的,你得先找到科学研究的思路才行,打个比方,这些papers其实是上锁的,你要先找到钥匙才成。幸运的是,我得到了笛卡尔先生的指导,尽管他已经仙游多年,他的“谈谈方法”为后世科研界中的被“放羊”的孤儿们指条不错的道路(虽然可能不是最好地,the better or best way要到国外去寻找,现在特别佩服毅然出国的童鞋们,你们的智商至少领先俺三年)。好了,在咱不错的底子的作用下,我掌握了科研方法(其实很简单,日后我可能会为“谈谈方法”专门写篇日志)。可惜,这时留给咱的时间不多了,中科院的硕博连读是5年,这对很多童鞋们绰绰有余的,但是因本人的情商较低,被小人“陷害”,被耽搁了差不多一年。这时,我发挥了“虎”(东北话)的精神,选择了一个应用方向,终于开始了把数据分析和应用结合的旅程了。具体过程按下不表,我先是把自己掌握的数据分析方法顺次应用了,或者现成的方法不适合,或者不能很好的解决问题,当时相当的迷茫呀,难道是咱的底子出了问题。某一天,我又“顿悟”了,毛主席早就教育我们要“具体问题具体分析”,“教条主义”要不得,我应该从问题的本质入手,从本质找方法,而不是妄想从繁多的方法去套住问题的本质。好了,我辛苦了一段时间,终于解决了问题,不过,我却有些纠结了。对于数据发分析,现在我的观点就是“具体问题具体分析”,你首先要深入理解被分析的问题(领域),尽力去寻找问题的本质,然后你只需要使用些基本的方法就可以很好的解决问题了,看来“20/80法则”的幽灵无处不在呀。于是乎,咱又回到了原点,赶紧去学那些基础知识方法吧,它们是很重要滴。
这里,说了一大堆,我做过总结:首先,你要掌握扎实的基础知识,并且一定要深入理解,在自己的思维里搭建起一桥,它连接着抽象的数据分析方法和现实的应用问题;其次,你要有意识的去训练分析问题的能力;最后,你要不断的积累各方面的知识,记住没有“无源之水”、“无根之木”,良好的数据分析能力是建立在丰富的知识储备上的。
数据流量分析心得体会 篇2
一、渠道经销商亏损严重
根据中国汽车流通协会公布的数据显示,在经销商销量和收入均同比增加的情况下,连续两年入围百强的84家汽车经销商20__年毛利与20__年相比大幅下滑至25.79%。20__年,汽车经销商盈利面继续缩小,据统计,48.5%的经销商盈利状况持平,只有21.8%的经销商盈利,剩余的经销商处于亏损状态。当前,汽车产品已远远超出市场能够消化的程度,库存在不断地增加,目前全国共有20000多家经销商,按照当前的产销规模和经销商数量,经销商的压力可想而知。大面积的亏损,严重打击了经销商的信心,很多经销商纷纷退出汽车行业,转而寻找新的盈利机会,这种局面对于厂家来说也是无能为力,以“4S”店为主的营销渠道遇到了前所未有的危机。
二、“互联网+”时代下的渠道“短板”
一直以来,以“4S”店为主体的汽车品牌专营模式一直是汽车营销渠道的主流模式。不过随着互联网技术的发展,网络购物成为时下流行的生活方式,网络购物的商品也从小件商品延伸到了汽车产品领域。据J.D.Power调查,有80%的经销商认为在线购车将成为未来趋势,并且认为这将影响到传统汽车销售业务。这样一来,传统“4S”店作为目前较大的营销渠道而言就遇到了前所未有的挑战。相比新兴互联网汽车业务来说,传统“4S”店营销模式的“短板”很突出。
(一)消费者满意度差
“4S”店的背后是相对独立的经销商,作为经销商而言,追逐利润是第一位的。在市场火爆的情况下,会出现某款车型“加价提车”的现象,消费者甚至加价都提不到车的现象也时有发生,消费者对这种违背市场规律的行为已见怪不怪。虽心有怨言却也是无奈接受。在市场遇冷的情况下,经销商常常会以低于厂家指导价很多的促销价来博得销量,以得到厂家的年终返点,但是在这个促销价格中,包含着强制购买店内装饰和强制购买保险的捆绑销售行为,很让消费者反感。
(二)售后维修价格虚高
“4S”店总是着眼于销售业绩,对售后服务的管理和如何提高客户满意度、怎样加强售后服务、提高技术水平的动力不足,“前店后厂”式的售后服务体系并未健全。在具体的售后服务中,由于技术水平高低不一、人员素质参差不齐、经济利益诱导等现实因素,“4S”店习惯在工时费、零配件价格上做手脚,售后维修价格虚高。这也是“4S”店遭到消费者普遍诟病的重要原因之一。
(三)运营成本过高一家
“4S”店要达到标准化
经营需要经历选址、征地(租地)、建店、招聘店员、培训、试运营等诸多环节,期间发生的征地或租地费用、建店工程款、各种税费、人员工资等所有费用都要摊薄到利润里面,这样一来,“4S”店的初始经营就要面临巨大的压力。小规模的“4S”店一般占地几千平方米,大规模的则达到上万平方米,每年的租地成本就要几百万元。如果土地不是租用的,“4S”店第一年购买土地的成本投入还会高出更多。一家“4S”店平均有大约100名员工,每年的人工支出通常要400万至500万元。仅就人员工资来说,对“4S”店而言就是一笔不小的负担。如果再加上其他开销,一家“4S”店的年运营成本往往接近千万元人民币。
三、“互联网+”时代下如何实现营销渠道变革
据统计,目前全国近40家汽车经销商已签署了汽车经销商电商平台战略合作协议,依托现有的经销商线下渠道与线上资源相结合运营,40家经销商几乎涉及中国过半数经销商集团,规模可覆盖全国成千上万家汽车“4S”店及上亿汽车用户。同时,二手车业务以及汽车租赁业务的扩大,都将成为经销商利润提升的主要途径。在这种趋势下,传统“4S”店必须要做出变革。
(一)提升自身竞争力
商务部于20__年1月发布了《汽车销售管理办法(征求意见稿)》,并将在今年内正式实施。新《办法》鼓励汽车销售模式多样化。新《办法》明确提到推动汽车流通模式创新,积极发展电子商务。这意味着“4S”店模式作为唯一授权销售渠道的时代彻底结束,新兴销售渠道和传统销售体系的共生融合成为趋势。在这种情况下,“4S”店一方面要做好接受市场的冲击,不能再固步自封,必须提升服务水平,注重差异化服务,降低运营成本,从自身挖掘盈利点,另一方面,要及时跟上市场步伐,要提高对市场的信息灵敏度,在实体店的基础上大力发展互联网业务。只有逐步提高自身竞争力,才能在互联网时代下生存。
(二)注重“线上线下”业务融合
对于未来的互联网汽车营销,将不再是“4S”店来全部承担满足客户需求的重任,配套的有大量的城市展厅、体验中心甚至提供定制化服务的互联网平台。我们要建立一个在线上有智能终端,在线下以“4S”店为载体,能够实现线上和线下服务一体化的互联网销售体系,让用户能够在线上和线下之间自由选择。最终呈现给客户的是以汽车消费为主的“一站式”服务体验场景。汽车销售渠道的互联网化,一开始就是一个整体性的变化,不仅仅是新车、二手车,还包括后汽车市场,都在互联网化。未来有可能汽车电商和线下营销渠道是平行的,来让用户选择。目前来说,消费者最担心的是线上产品的质量和线下服务的承接能力,这就涉及到线上线下业务的融合。可以说,只有实现线上营销与实体经济的深度业务融合,汽车营销渠道“互联网+”的时代才算真正来临。
(三)重点打造智能终端APP软件
目前来看,在国内只有两种APP营销方式,一是利用现有社交媒体APP,比如微信、QQ等,另一种是自己开发APP。利用现有的社交媒体APP的好处是能够迅速将营销内容推广给客户,传播效率高;缺点是目标客户群不明确,客户体验感差,缺乏互动。而企业自己开发的APP的优势是能够独立掌控APP资源,拥有自主运营权,内容灵活,客户体验感强;缺点是开发成本高,推广率低,下载安装注册认证程序繁琐,一般需要从企业官方的网站下载,而且无附加功能,客户粘性差。如果我们将社交媒体APP和企业自己开发的APP的优点相结合,打造基于社交媒体APP的,这样一来用户的体验感更强,互动效果更好,客户粘度会更高。
四、结语
互联网正悄悄改变着人们的消费习惯。在汽车消费领域,用户对整车电商的接受程度也变得越来越高。据尼尔森近期数据显示,有92%的客户在购买汽车时,都希望通过互联网来了解产品及相关信息。该机构数据显示,在中国,有86%的客户愿意通过互联网来购买汽车。互联网已经成为用户获取信息的重要渠道和购买终端。与以往不同,如今的消费者对决定购买的车型已越来越熟悉,汽车销售顾问已不用费劲介绍车型信息。此外,消费者在购车之前都会在汽车网站上对各款车的配置、优缺点、和各地区的成交价格进行反复对比。现阶段,越来越多的企业已开展了对互联网汽车业务的探索,无论是汽车企业、综合类传统电商还是汽车媒体,都纷纷开始布局汽车电商平台。总之,对于传统的汽车经销商而言,互联网时代危险与机遇并存。现阶段传统“4S”店只有加快用互联网的思维武装自己、改造自己,才能在互联网时代的渠道竞争中立于不败之地,真正成为“渠道之王”。
数据流量分析心得体会 篇3
转眼间实习已去一月,之前因为工作原因需要恶补大量的专业知识并加以练习,所以一直抽不开身静下心来好好整理一下学习的成果。如今,模型的建立已经完成,剩下的就是枯燥的参数调整工作。在这之前就先对这段时间的数据处理工作得到的经验做个小总结吧。
从我个人的理解来看,数据分析工作,在绝大部分情况下的目的在于用统计学的手段揭示数据所呈现的一些有用的信息,比如事物的发展趋势和规律;又或者是去定位某种或某些现象的原因;也可以是检验某种假设是否正确(心智模型的验证)。因此,数据分析工作常常用来支持决策的制定。
现代统计学已经提供了相当丰富的数据处理手段,但统计学的局限性在于,它只是在统计的层面上解释数据所包含的信息,并不能从数据上得到原理上的结果。也就是说统计学并不能解释为什么数据是个样子,只能告诉我们数据展示给了我们什么。因此,统计学无法揭示系统性风险,这也是我们在利用统计学作为数据处理工具的时候需要注意的一点。数据挖掘也是这个道理。因为数据挖掘的原理大多也是基于统计学的理论,因此所挖掘出的信息并不一定具有普适性。所以,在决策制定上,利用统计结果+专业知识解释才是最保险的办法。然而,在很多时候,统计结果并不能用已有的知识解释其原理,而统计结果又确实展示出某种或某些稳定的趋势。为了抓住宝贵的机会,信任统计结果,仅仅依据统计分析结果来进行决策也是很普遍的事情,只不过要付出的代价便是承受系统环境的变化所带来的风险。
用于数据分析的工具很多,从最简单的Office组件中的Excel到专业软件R、Matlab,功能从简单到复杂,可以满足各种需求。在这里只能是对我自己实际使用的感受做一个总结。
Excel:这个软件大多数人应该都是比较熟悉的。Excel满足了绝大部分办公制表的需求,同时也拥有相当优秀的数据处理能力。其自带的ToolPak(分析工具库)和Solver(规划求解加载项)可以完成基本描述统计、方差分析、统计检验、傅立叶分析、线性回归分析和线性规划求解工作。这些功能在Excel中没有默认打开,需要在Excel选项中手动开启。除此以外,Excel也提供较为常用的统计图形绘制功能。这些功能涵盖了基本的统计分析手段,已经能够满足绝大部分数据分析工作的需求,同时也提供相当友好的操作界面,对于具备基本统计学理论的用户来说是十分容易上手的。
SPSS:原名Statistical Package for the Social Sciences(社会科学统计软件包),现在已被IBM收购,改名后仍然是叫SPSS,不过全称变更为Statistical Product and Service Solutions(统计产品与服务解决方案)。SPSS是一个专业的统计分析软件。除了基本的统计分析功能之外,还提供非线性回归、聚类分析(Clustering)、主成份分析(PCA)和基本的时序分析。SPSS在某种程度上可以进行简单的数据挖掘工作,比如K-Means聚类,不过数据挖掘的主要工作一般都是使用其自家的Clementine(现已改名为SPSS Modeler)完成。需要提一点的是SPSS Modeler的建模功能非常强大且智能化,同时还可以通过其自身的CLEF(Clementine Extension Framework)框架和Java开发新的建模插件,扩展性相当好,是一个不错的商业BI方案。
R:R是一个开源的分析软件,也是分析能力不亚于SPSS和Matlab等商业软件的轻量级(仅指其占用空间极小,功能却是重量级的)分析工具。官网地址:支持Windows、Linux和Mac OS系统,对于用户来说非常方便。R和Matlab都是通过命令行来进行操作,这一点和适合有编程背景或喜好的数据分析人员。R的官方包中已经自带有相当丰富的分析命令和函数以及主要的作图工具。但R最大的优点在于其超强的扩展性,可以通过下载扩展包来扩展其分析功能,并且这些扩展包也是开源的。R社区拥有一群非常热心的贡献者,这使得R的分析功能一直都很丰富。R也是我目前在工作中分析数据使用的主力工具。虽然工作中要求用Matlab编程生成结果,但是实际分析的时候我基本都是用R来做的。因为在语法方面,R比Matlab要更加自然一些。但是R的循环效率似乎并不是太高。
Matlab:也是一个商业软件,从名称上就可以看出是为数学服务的。Matlab的计算主要基于矩阵。功能上是没话说,涵盖了生物统计、信号处理、金融数据分析等一系列领域,是一个功能很强大的数学计算工具。是的,是数学计算工具,这东西的统计功能只不过是它的一部分,这东西体积也不小,吃掉我近3个G的空间。对于我来说,Matlab是一个过于强大的工具,很多功能是用不上的。当然,我也才刚刚上手而已,才刚刚搞明白怎么用这个怪物做最简单的Garch(1,1)模型。但毫无疑问,Matlab基本上能满足各领域计算方面的需求。
以上这些软件算是主流了,数据分析软件远不止这些,还有Eviews、S-plus等工具,因为没用过,所以也就不说了
数据流量分析心得体会 篇4
这本书里主要介绍的是大数据在现代商业运作上的应用,以及它对现代商业运作的影响。
《大数据时代》这本书的结构框架遵从了学术性书籍的普遍方式。也既,从现象入手,继而通过对现象的解剖提出对这一现象的解释。然后在通过解释在对未来进行预测,并对未来可能出现的问题提出自己看法与对策。
下面来重点介绍《大数据时代》这本书的主要内容。
《大数据时代》开篇就讲了Google通过人们在搜索引擎上搜索关键字留下的数据提前成功的预测了20xx年美国的H1N1的爆发地与传播方向以及可能的潜在患者的事情。Google的预测比政府提前将近一个月,相比之下政府只能够在流感爆发一两个周之后才可以弄到相关的数据。同时Google的预测与政府数据的相关性高达97%,这也就意味着Google预测数据的置信区间为3%,这个数字远远小于传统统计学上的常规置信区间5%!而这个数字就是大数据时代预测结果的相对准确性与事件的可预测性的最好证明!通过这一事以及其他的案例,维克托提出了在大数据时代“样本=总体”的思想。我们都知道当样本无限趋近于总体的时候,通过计算得到的描述性数据将无限的趋近于事件本身的性质。而之前采取的“样本<总体”的做法很大程度上无法做到更进一步的描述事物,因为之前的时代数据的获取与存储处理本身有很大的难度只导致人们采取抽样的方式来测量事物。而互联网终端与计算机的出现使数据的获取、存储与处理难度大大降低,因而相对准确性更高的“样本=总体”的测算方式将成为大数据时代的主流,同时大数据时代本身也是建立在大批量数据的存储与处理的基础之上的。
接下来,维克多又通过了IBM追求高精确性的电脑翻译计划的失败与Google只是将所有出现过的相应的文字语句扫描并储存在词库中,所以无论需要翻译什么,只要有联系Google词库就会出现翻译,虽然有的时候的翻译很无厘头,但是大多数时候还是正确的,所以Google的电脑翻译的计划的成功,表明大数据时代对准确性的追求并不是特别明显,但是相反大数据时代是建立在大数据的基础住上的,所以大数据时代追求的是全方位覆盖的数字测度而不管其准确性到底有多高,因为大量的数据会湮埋少数有问题的数据所带来的影响。同时大量的数据也会无限的逼近事物的原貌。
之后,维克托又预测了一个在大数据时代催生的重要职业——数据科学家,这是一群数学家、统计学与编程家的综合体,这一群人将能够从获取的数据中得到任何他们想要的结果。换言之,只要数据充足我们的一切外在的与内在的我们不想让他人知道的东西都见会在这一群家伙的面前展现得淋漓尽致。所以为了避免个人隐私在大数据时代被这一群人利用,维克托建议将这一群人分为两部分,一部分使用数据为商业部门服务,而另一群人则负责审查这一些人是否合法的获得与应用数据,是否侵犯了个人隐私。
无论如何,大数据时代将会到来,不管我们接受还是不接受!
我觉得《大数据时代》这本书写的很好,很值得一读。因为会给我们很多启发,比如你在相关的社交网站发表的言论或者照片都很有可能被“数据科学家”们利用,从而再将相关数据卖给各大网店。不过,事实就是我们将会成为被预测被引诱的对象。所以说,小心你在网上留下的痕迹。
我喜欢这本书是因为它给我展现了一个新的世界。
数据流量分析心得体会 篇5
有人说生活像一团乱麻,剪不断理还乱;我说生活像一团乱码,尽管云山雾罩惝恍迷离,最后却总会拨云见日雨过天晴。维克托迈尔舍恩伯格就把这团乱码叫做大数据,在他的这本书里,试图给出的就是拨开云雾见青天的玄机。
这玄机说来也简单,就是放弃千百年来人们孜孜追求的因果关系转而投奔相关关系。说来简单,其实却颠覆了多少代人对真理探求的梦想。我觉得作者是个典型的实用主义者,在美帝国主义万恶的压迫和洗脑下,始终追逐性价比和利益最大化,居然放弃了追求共产主义真理最基本的要求!不像我们在天朝光芒的笼罩下,从小就开始学习和追求纯粹的共产主义唯心科学历史文化知识啦!这或许就是我们永远无法获得诺贝尔奖、永远无法站在科技最前沿的根本原因吧。其实小学时候,我就想过这个问题,相信所有的人都问过类似的问题,例如现在仍然很多人在问,妈的从来没人知道我每天摆摊赚多少钱,你们他妈的那人均收入四五千是怎么算出来的。中国是抽样的代表,因为中国人最喜欢用代表来表现整体,最典型的例子莫过于公布的幸福指数满意指数各种指数永远都高于你的预期,你完全不清楚他是怎么来的,一直到最后汇总成三个代表,真心不清楚它到底能代表了啥。说这么多显得自己是个愤青,其实只是想表达“样本=总体”这个概念在科技飞速发展的今天,在世界的不同角落,还是会体现出不同的价值,受到不同程度的对待及关注。在大数据观念的冲击下,我们是不是真的需要将平时关注的重点从事物内在的发展规律转移到事物客观的发生情况上。
大数据的出现,必然对诸多领域产生极大的冲击,某些行业在未来十年必将会得到突飞猛进的发展,而其他一些行业则可能会消失。这是废话,典型的三十年河东三十年河西的道理,就像三十年前的数理化王子们,现在可能蜷缩在某工厂的小角落里颤颤巍巍的修理机器;就像三十年前职业高中的学生才学财会学银行,如今这帮孙子一个个都开大奔养小三攒的楼房够给自己做墓群的了;当然也不乏像生物这种专业,三十年前人们不知道是干啥的,三十年后人们都知道没事别去干,唯一可惜的是我在这三十年之间的历史长河中却恰恰选了这么一个专业,这也是为什么我现在在这写读后感而没有跟姑娘去玩耍的原因。其实乍一看这个题目,我首先想到的是精益生产的过程控制,比如六西格玛,这其实就是通过对所有数据的分析来预测产品品质的变化,就已经是大数据的具体应用了。
而任何事物都会有偏差,会有错误,也就是说,这全部的数据中,肯定是要出现很多与总体反应出的规律相违背的个体,但是无论如何这也是该事件中一般规律的客观体现的一种形式,要远远好过从选定的样本中剔除异常值然后得到的结论。换句话说,也大大减少了排除异己对表达事物客观规律的影响。就好比是统计局统计中国人民的平均收入一样,这些数怎么这么低啊,这不是给我们国家在国际社会上的形象抹黑么,删掉删掉;这些数怎么这么高啊,这还不引起社会不满国家动荡啊,删掉删掉。所以说,大数据至少对反应客观事实和对客观事实做预测这两个方面是有非常积极地意义的。而这个新兴行业所体现的商机,既在如何利用数据上,又在如何取得数据上。
先说数据的利用,这里面表达的就是作者在通书中强调的对“相关关系”的挖掘利用。相关关系与因果关系便不再赘述,而能够对相关关系进行挖掘利用的企业其实缺不多,因为可以相信未来的大数据库就像现在的自然资源一样,必将因为对利益的追逐成为稀缺资源,而最终落在个别人或企业或部门的手中。想想无论当你想要做什么事情的时候,都有人已经提前知道并且为你做好了计划,还真是一件甜蜜而又令人不寒而栗的事情。
而对于数据的获取,我觉得必然是未来中小型企业甚至个人发挥极致的创造力的领域。如何在尽可能降低成本的情况下采集到越多越准确的数据是必然的发展趋势,鉴于这三个维度事实上都无法做到极致,那么对于数据获取方式的争夺肯定将成就更多的英雄人物。
现在回头从说说作者书中的观点中想到的,P87中关于巴斯德的疫苗的事件,描述了一个被疯狗咬伤的小孩,在接种了巴斯德的狂犬疫苗后成功幸存,巴斯德成了英雄的故事。这是个非常有意思的案例,因为小孩被狗咬伤而患病的概率仅为七分之一,也就是说,本事件有85%的概率是小孩根本就不会患病。那么小孩的生命到底是不是巴斯德救的,而这疫苗到底是有效没效,通过这个事件似乎根本就没有办法得到验证。这就好比某人推出个四万亿计划,但实际上国际经济形势就是好转,哪怕你只推出个二百五计划,GDP都会蹭蹭的往上涨,而且又不会带来四万亿导致的严重通胀、产能过剩、房价泡沫等问题。那你说这四万亿到底是救了国还是误了国?回到我自己的工作领域上来,安全工作,我们一直遵循的方向都是寻找因果关系,典型的从工作前的风险评估,到调查事故的Taproot或者五个为什么,无一不是逻辑推理得到结果的产物。而事实上,如果能做到信息的丰富采集和汇总的话,找出事物之间的相关性,对提高工作环境的安全系数是极为有利的。这个点留着,看看可不可以在未来继续做进一步研究。
数据流量分析心得体会 篇6
《大数据时代》是英国维克托·迈尔—舍恩伯格教授的著作,这本书也被尊为国外大数据研究的先河之作。这本书最大的优点就在于作者利用上百个例子来对大数据的方方面面做了详细解说,让外行也很容易理解。结构上,作者通过大数据时代的思维变革、商业变革和管理变革三个角度依次阐述,条理清晰。
所谓"大数据",按作者的说法,就是"所有数据"。随着计算机运算速度和存储能力的发展,收集数据变得越来越简单,储存数据的成本越来越低。在过去,由于技术限制,人们做统计时只能收集有限的数据做样本,其中要考虑随机样本的选择,努力减小因样本问题出现的误差;统计结果往往不能重复使用,造成数据利用率低。而现在则可以做到"样本=总体"。数据的增多带来不可避免的精确性问题。"小数据"时代,一个样本的错误就可以造成对总体估计的失败,幸运的是,"大数据"时代对精确性不再那么要求苛刻——也无法要求太严格——数据的数量足以弥补这一缺陷。在对思维变革这一部分的阐述中,最重要也是全书的核心观点就是大数据时代,我们应该从追求"因果关系"的旧思维方式向追求"相关关系"转变。
在我看来,这实际上是通过大数据来透视一种事物的发展趋势,而很多精确学科领域依然需要探寻"因果关系"解决更有针对性的问题,所以,这局限了这一转变只能在特定的领域发生。作者自己也说,"大数据的相关性将人们指向了比探讨因果关系更有前景的领域。"
-
一起合同网(hc179.com)小编精心推荐:
- 心得体会 | 心得体会作文 | 教育心得体会 | 感恩心得体会 | 现金流量分析心得体会 | 现金流量分析心得体会
大数据时代的数据获取方式是多种多样,数据形式也是千变万化,任何文字、行为、万物都可以被数据化后用来分析。对这些数据的利用,不仅要考虑到其初次使用价值,更要放眼它未来可能的用途以提高数据的利用率。当然数据并不是无限使用,时效、环境的变化肯定会对数据提出新的要求,所以数据的折旧也是应当考虑的。这又引出了对数据这一无形资产的估值可能性。对于这样的公司来说,数据就是他们的核心,如何在资产负债表上给他们一个公正的体现正是我们需要考虑的。
大数据时代的价值链由三部分构成,我把它们简化为"生产—分析—使用"三个环节,这对应书中的三种类型公司:第一种是基于数据本身的公司,第二种是基于技能,第三种则是基于思维。在大数据早期,技能和思维最有价值,但作者认为,最终,大部分的价值还是必须从数据本身来挖掘。这是假定了一个成熟的市场,人人都了解了大数据的用途。
对于普通人来说,大数据时代最关心的`还是隐私问题。不知不觉中,个人的一举一动都暴露在政府甚至私人企业之下,还面临潜在的泄露风险。对此,作者提出了使用者承担责任的解决办法,而不是过去那种流于形式的使用授权。大数据甚至能预测一个人的犯罪动机,这给监管者带来的难题是,预测一个人要犯罪,惩罚还是不惩罚?在这点上,社会达成"个人仅需对行为而非动机负责"的共识非常重要。
大数据时代的风险控制靠的是"算法师",类似会计师一样的职业,对大数据的准确度或有效性进行鉴定。这能在一定程度上防止数据滥用的发生和数据独裁。当今的法律亦需对大数据监管进行修订补充。
当代大数据发展主要由科技公司推动,相信在不久的将来更多的传统领域会意识到大数据的重要性。但我们也应该保持清醒,大数据并不是万能药,对某些领域或环节,使用大数据是一种简单且实用的'选择;但对某些领域,盲目使用大数据只会适得其反。
数据流量分析心得体会 篇7
读了《大数据时代》后,感觉到一个大变革的时代将要来临。虽然还不怎么明了到底要彻底改变哪些思维和操作方式,但显然作者想要“终结”或颠覆一些传统上作为我们思维和生存基本理论、方法和方式。在这样的想法面前,我的思想被强烈震撼,不禁战栗起来。
“在小数据时代,我们会假象世界是怎样运作的,然后通过收集和分析数据来验证这种假想。”“随着由假想时代到数据时代的过渡,我们也很可能认为我们不在需要理论了。”书中几乎肯定要颠覆统计学的理论和方法,也试图通过引用《连线》杂志主编安德森的话“量子物理学的理论已经脱离实际”来“终结”量子力学。对此我很高兴,因为统计学和量子力学都是我在大学学习时学到抽筋都不能及格的课目。但这两个理论实在太大,太权威,太基本了,我想我不可能靠一本书就能摆脱这两个让我头疼一辈子的东西。作者其实也不敢旗帜鲜明地提出要颠覆它们的论点,毕竟还是在前面加上了“很可能认为”这样的保护伞。
近几十年,我们总是在遇到各种各样的新思维。在新思维面前我们首先应该做到的就是要破和立,要改变自己的传统,跟上时代的脚步。即使脑子还跟不上,嘴巴上也必须跟上,否则可能会被扣上思想僵化甚至阻碍世界发展的大帽子。既然大数据是“通往未来的必然改变”,那我就必须“不受限于传统的思维模式和特定领域里隐含的固有偏见”,跟作者一起先把统计学和量子力学否定掉再说。反正我也不喜欢、也学不会它们。
当我们人类的数据收集和处理能力达到拍字节甚至更大之后,我们可以把样本变成全部,再加上有能力正视混杂性而忽视精确性后,似乎真的可以抛弃以抽样调查为基础的统计学了。但是由统计学和量子力学以及其他很多“我们也很可能认为我们不再需要的”理论上溯,它们几乎都基于一个共同的基础——逻辑。要是不小心把逻辑或者逻辑思维或者逻辑推理一起给“不再需要”的话,就让我很担心了!
《大数据时代》第16页“大数据的核心就是预测”。逻辑是——描述时空信息“类”与“类”之间长时间有效不变的先后变化关系规则。两者似乎是做同一件事。可大数据要的“不是因果关系,而是相关关系”,“知道是什么就够了,没必要知道为什么”,而逻辑学四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明确规定”任何事物都有其存在的充足理由。且逻辑推理三部分——归纳逻辑、溯因逻辑和演绎逻辑都是基于因果关系。两者好像又是对立的。在同一件事上两种方法对立,应该只有一个结果,就是要否定掉其中之一。这就是让我很担心的原因。
可我却不能拭目以待,像旁观者一样等着哪一个“脱颖而出”,因为我身处其中。问题不解决,我就没法思考和工作,自然就没法活了!更何况还有两个更可怕的事情。
其一:量子力学搞了一百多年,为了处理好混杂性问题,把质量和速度结合到能量上去了,为了调和量子力学与相对论的矛盾,又搞出一个量子场论,再七搞八搞又有了虫洞和罗森桥,最后把四维的时空弯曲成允许时间旅行的样子,恨不得马上造成那可怕的时间旅行机器。唯一阻止那些“爱因斯坦”们“瞎胡闹”的就是因果关系,因为爸爸就是爸爸,儿子就是儿子。那么大数据会不会通过正视混杂性,放弃因果关系最后反而搞出时间机器,让爸爸不再是爸爸,儿子不再是儿子了呢?其二:人和机器的根本区别在于人有逻辑思维而机器没有。《大数据时代》也担心“最后做出决策的将是机器而不是人”。如果真的那一天因为放弃逻辑思维而出现科幻电影上描述的机器主宰世界消灭人类的结果,那我还不如现在就趁早跳楼。
还好我知道自己对什么统计学、量子力学、逻辑学和大数据来说都是门外汉,也许上面一大篇都是在胡说八道,所谓的担心根本不存在。但问题出现了,还是解决的好,不然没法睡着觉。自己解决不了就只能依靠专家来指点迷津。
所以想向《大数据时代》的作者提一个合理化建议:把这本书继续写下去,至少加一个第四部分——大数据时代的逻辑思维。
数据流量分析心得体会 篇8
一、 平台搭建
描述小组在完成平台安装时候遇到的问题以及如何解决这些问题的,要求截图加文字描述。
问题一:在决定选择网站绑定时,当时未找到网站绑定的地方。解决办法:之后小组讨论后,最终找到网站绑定的地方,点击后解决了这个问题。
问题二:当时未找到TCP/IP属性这一栏
解决办法:当时未找到TCP/IP属性这一栏,通过老师的帮助和指导,顺利的点击找到了该属性途径,启用了这一属性,完成了这一步的安装步骤。
问题三:在数据库这一栏中,当时未找到“foodmartsaleDW”这个文件
解决办法:在数据库这一栏中,当时未找到“foodmartsaleDW”这个文件,后来询问老师后,得知该文件在第三周的文件里,所以很快的找到了该文件,顺利的进行了下一步。
问题四:在此处的SQL server的导入和导出向导,这个过程非常的长。
解决办法:在此处的SQL server的导入和导出向导,这个过程非常的长,当时一直延迟到了下课的时间,小组成员经讨论,怀疑是否是电脑不兼容或其他问题,后来经问老师,老师说此处的加载这样长的时间是正常的,直到下课后,我们将电脑一直开着到寝室直到软件安装完为止。
问题五:问题二:.不知道维度等概念,不知道怎么设置表间关系的数据源。关系方向不对
解决办法:百度维度概念,设置好维度表和事实表之间的关系,关系有时候是反的——点击反向,最后成功得到设置好表间关系后的数据源视图。
这个大图当时完全不知道怎么做,后来问的老师,老师边讲边帮我们操作完成的。
-
我们精彩推荐数据流量分析心得体会专题,静候访问专题:数据流量分析心得体会