合同范本|大数据读后感(系列十七篇)_大数据读后感
发布时间:2017-10-11大数据读后感(系列十七篇)。
⧈ 大数据读后感
读了涂子沛先生的《大数据时代》(这是一本社科类书籍,想深入研究大数据原理的可以选择其他技术类专业书籍)。作者以美国为例,讲述了“数据不仅可以治国,还可以强国”的观点,对中国今后的大数据发展战略提出了建议。读完之后,主要有一下几点感想。
一、美国社会之所以发达高效,引领世界科技的发展,与其尊重数据,收集数据的传统是分不开的。数据被视为科学的度量、知识的来源。没有数据,无论是学术研究,还是政策制定,都寸步难行。“数据驱动决策方法”使得政府更有效率、更加开放、更加负责。
数据的积累需要时间,不能一蹴而就,美国在数据的收集方面历史悠久。美国联邦政府的取得数据主要有三个来源:业务管理的数据,民意社情数据,物理环境数据。例如1940年罗斯福引进的民意调查、1962年启动的海浪监测计划和1973年诞生的最小数据集。而中国取得类似的进步,是进入21世纪之后才发生的事情。2003年,中国开始着手制定医疗系统的最小数据集,创立了第一个全国性的大型社会调查项目,开始对社会的发展和变迁进行全方位、综合性、纵贯性的问卷访谈调查。2006年中国卫生部才出台了最小数据集的标准。几经周折,国家统计局才在2006年9月成立了社情民意调查中心。
中国的落后,根源之一是缺乏以数据为基础的精确管理,未来中国的进步,需要面对收集数据、使用数据、开放数据的挑战。
二、大数据是一柄双刃剑,数据虽然可以造福于民,但是也可能成为控制人民的工具。2013年的“棱镜门”事件揭露了政府对于人民的监控,引起轩然大波。在未来,每个人都可能存在一份数据档案,包括一个人的教育、医疗、福利、犯罪和纳税等等一切从摇篮到坟墓的数据记录,甚至包括电话、邮件等都可能被监听和记录。通过数据整合和信息加总,就可以再现一个人生活的轨迹和全景,各个系统之间的数据可以彼此印证、互相解释,个人隐私就无所遁形。英国作家乔治.奥威尔在其讽刺小说《一九八四》中描述了时刻被“老大哥”监视的零隐私的可怕情形:不论是睡着还是醒着,在工作还是在吃饭,在室内还是在户外,早浴盆里还是在床上,没有躲避的地方。除了你脑壳里几个立方厘米以外,没有东西是属于你自己的。
随着大数据科技的发展,我们的一举一动,每一通话,每一次上网记录都被监控、记录,分析,当这些数据被某一个人或组织掌握,将会是对我们隐私的莫大威胁,因此,对于数据使用的监管需要进一步的立法进行规范,我国目前对于数据的收集、利用处于野蛮生长阶段,任何商业组织都可以收集和分析用户的信息。政府需要立法对技术的使用进行监管,保障公民的安全。
三、数据是一种公共资源,政府使用纳税人的钱收集了数据信息之后,需要将数据进行公开,这样既可以集中大众的智慧,利用数据科学地治理社会;也可以让大众对政府的行为进行监督,避免政府的腐败。因为缺乏竞争,官僚体制与生俱来有一种僵化保守的本性,政府机关也往往固守不前。很多数据都被以机密为借口封存起来,人民就无从得知政府的各项举措是否合理,因此在黑暗中就滋生了腐败。
而且,现代社会中,掌握信息多的人,在社会竞争中处于有利的地位,而信息贫乏的人,则处于不利地位,数据不应该被少数人垄断,应该作为一种公共资源被普通百姓获取。
四、技术的进步离不开科学技术人员的不懈努力,知识分子应该承担促进社会进步的责任和使命。正如linux的开发者所说的:“一个人做事的动机,可以分为三类:一是求生,二是社会生活,三是娱乐。当我们的动机上升到一个更高阶段时,我们才会取得进步:不是仅仅为了求生,更是为了改变社会,更理想的是——为了兴趣和快乐。
。
⧈ 大数据读后感
读完《大数据》,我才意识到这并不是一本枯燥无味的书籍。作者运用案例和讲故事的方式,把美国数据开放、收集、使用背后的立法故事、公民故事、技术故事、商业故事娓娓道来,引人入胜,令我大开眼界。
我在想,大数据概念对于教育来说会产生什么样的实用价值呢?一直以来,中国教育在研究教育的数字化,比如数字化校园,这个思路就是把我们教育的内容进行数字化,其结果指向的就是电子教材的研发或者是教学过程的数字化。美其名曰,这是教育技术的重要内涵。在教学过程中,学生的行为表现都可以被数据化,而这项研究不是任何一个专业可以深入下去的,它的专业性太强,所以我才会想到,所谓教育技术与其研究教育的数字化,不如研究教育的数据化来得实在,来的有意义。长期以来,我们并不了解教育对一个人的影响具体会如何表现,我们有的只是一个轮廓,我们也并不确定一个教师的行为对学生具体产生了哪些影响。所以,人们对教育一直有一个深深的质疑,它是不是科学的?大数据概念至少提出了关注“是什么”比“为什么”要有实际意义得多。而我们的教育恰好需要把注意力从“为什么”转移到“是什么”上面来,只有如此,才能把教育从为什么发展成“可能成为什么”上来,这会是一次思想上的革命。而对于现在地位岌岌可危的教育技术来说,把研究的重点从数字化转移到数据化上面,这才是它的出路。
如何将数据融入教学,教育者首先通过标准化全科教学处方,实现了教师授课模板和教学内容的标准化,保证每个教学过程和内容是可控的,然后结合每天的教学内容,处理好面对的数据,处理好数据,自然也就处理好了课堂的反馈,最终形成了既注重教学体验又以教学结果为导向的教学体系。
与此同时,不仅要注重课上的学生资源,在课后还要对这些资源进行跟踪处理。这与过去的教育教学显然是不同的,面对大数据时代的到来,教学有所改变是必然的。所以,无论环境怎么变换,数据如何复杂,我们都不能不去改变自己的教学去迎合将来的这个大数据时代。
⧈ 大数据读后感
人,大多时候是后知后觉的。正因如此,才会有古圣、先贤和庸人的差别,才会产生由于对市场、社会的判断的不同而导致的公司发展速度和财富积累的差别。
翻开《大数据时代》首先给我冲击的不是内容本身,而是译者周涛的序和周涛其人。27岁的天才教授及其谦虚的提到翻译本书以110%的目标,达成90%的结果,原因就是“如果再给我一个月的时间,就可以达到我预想的110%甚至更好!”而他这样做的原因就是书中的核心思想之一“大数据时代,允许一点点的错误和不完美。
”回到我们的实际生活与工作中,反问自己:我们在运营公司包括人际交往中,是不是有太多的时候固执于某一个数据的准确性而导致报表不能及时准确?我们是否有太多的时间纠结于某个无关紧要的细节,从而导致整个公司运营效率的下降?
我们是否有太多的时间要求我们的朋友做到完美,却发现自己很少有玩伴可以依靠和交谈?诞生于互联网时代的我们,应该以更高的效率、更快的响应速度和更多的学习新知识、新思想、新逻辑、新环境来交换存在的缺陷。
回到这本书本身,申伯格将大数据分为三个部分:思维变化、业务变化和管理变化。
思维变革,舍恩伯格旗帜鲜明的亮出他的三个观点:
一、更多:不是随机样本,而是全体数据;
二、更杂:不是精确性,而是混杂性;
三、更好:不是因果关系,而是相关关系。
这种思维方式的转变我理解为“道”的层面,只有意识中如此认为,行为才会为之改变。当我们能够如此方便地获取行业数据,甚至一些标杆企业和公司的数据时,我们的智慧就在于如何有效地分析数据,做出决策。我们要提醒自己:
在我们仍致力于随机抽样、精确计算和原因分析的同时,我们的竞争对手也根据混合大数据的计算做出了相应的决策,从而引领市场,赚取超额利润。
商业变革:大数据研究的一大驱动力就是商用,舍恩伯格在第二部分里讨论了大数据时代的商业变革。舍恩伯格认为数据化就是一切皆“可量化”,大数据的定量分析有力地回答“是什么”这一问题,但仍然无法完全回答“为什么”。
多年前一本书《只有偏执狂才能成功》风靡一时,让很多的职业经理人和操盘者患上了“偏执”的传染病。读完本书以后,我认为读者都应从“这是为什么,为什么这样做”的偏执中走出来,在商业模式跟随环境不断变化的今天,改变对行业的看法,做出有悖于自己初衷的决策,即使艰难,更显得尤为重要。
管理变革:
这是我们读这本书的出发点和落脚点。书中关于大数据时代管理应产生改变的建议和案例,是我不敢苟同的。这种不认同可能产生于学院派和实战派的思维方式的不同,也许是自身对商业、管理的理解不够,格局不高导致。
我的观点如下:
针对已经拥有海量用户数据的大企业,如中国的腾讯、阿里巴巴,在应用大数据的道路上拥有得天独厚的条件,但是我想马化腾、马云创业之初,并没有想到他们目前最大的竞争力是他们的平台和终端所拥有的客户数量,一路走来,他们考虑的更多的是融资策略、用户体验、平台推广和那几张财务报表。这种大数据优势的积累是公司发展的结果。不可否认,目前这种先发优势很难再被超越和实现。
从我公司目前的经营情况来看,机票销售行业是一个小圈子,但数据是专业和保密的。我们只能重视而不能坚持大数据对我们发展的帮助。目前,公司需要以传统的方式获取客户资源,以确保生存和发展。其次,需要借助大数据平台和互联网时代的思维,在商业模式创新上寻找突破口,类似于基于现有航空公司数据和携程提供支持的电子商务产品试点。
总之,古语说:开卷有益。《大数据时代》在一定程度上改变了我一些固有思维模式,我相信随着自己管理经验的丰富和实战的累计,或许,再翻开它,还会给我别样惊喜。
⧈ 大数据读后感
“大数据”一词不知何时在我们的生活悄然出现,为了一**竟,我便选择了《大数据时代》一书。
作者先从全局简单地描述大数据对我们的生活、工作与思维的影响,再从三方面具体地用上百个学术和商业的实例展开写作。样本=总体、追求精确性和相关关系等大数据时代具体特点一一现出。同时,笔者也从个人和企业的角度分析了大数据中隐藏的隐忧。
书中内容繁多,在此不能各方面概括。此书中虽有许多专有名词,但作者以其通俗的语言以及许多实例让我嗅到大数据时代中一抹清新之气。
为什么是新鲜的?因为这本书的内容似乎打开了一个对我来说有点熟悉和陌生的世界。我们现在正处在网络时代,在我们日常的简单操作中,产生了大量的数据,但一开始我们只是用很多技术来解决手头的问题,那些大数据就像沙子里的金子,价值是找不到的。
到目前,每当我们网上购书时总会看到“猜你喜欢”的栏目、出现谷歌搜索与流感**、farecast与飞机票价**系统等,这些事情的达成全来自于那些曾被忽略的大数据同时也在证明“**,大数据的核心”这句话,为我们的生活创造了前所未有的可量化的维度。看到书中这部分内容时,我不禁感受到自己的生活已在享大数据带来的福利,就像“猜你喜欢”栏目让我触到更多合我口味的书,让我看到了以前无法发现的细节。谷歌、亚马逊等拥有大量数据的公司正在大力发展与大数据相关的新型产业和研究项目。
利用网络时代大数据的便利性成为当今商业中最有价值的东西,使得所有可量化的趋势都出现了。“本质上世界是由信息构成的”,面对这句话时,大数据时代仿佛就在眼前。
在感受惊叹着大数据能为我们做到以往无法想象的事和它巨大的价值时,我认同大数据能极大优化我们的生活,但又不禁为这时代感到担忧。一旦大数据时代来临,不仅我们的隐私可能不再是隐私,就如书中所言“我们时刻暴露在‘第三只眼’下:亚马逊监视着我们的购物习惯,谷歌监视着我们的购物习惯,而微博似乎什么都知道”,而且利用大数据我们可以**许多事情并且十分高效,一旦人们依赖大数据极少运用人类自身的创新等能力被数据束缚住,世界只会沦落为一个极少活力的机械环境。
我认为最大的担忧是大数据时代对人类自身思维、思维、信仰等精神领域的影响。如今我们都生活在数据中,大数据时代说不定在几年后就会逐步来临,这使我不禁发问:我们一直坚信着信仰着的究竟是什么?
我觉得世界说变就变实在令我想不通这个问题。事情都有好坏,我也不知道自己是否杞人忧天。
于是我继续去探索作者对这问题的思考。“更大的数据在于人本身”,作者还说“我们是在创造更好的未来”,也说“在一个**的时代里,人类的自由意志不可侵犯,这一点不可轻视。我们在使用大数据时,应当怀有谦恭之心,铭记人性之本”。
人类学家克利福德吉尔兹曾说:“努力在可以应用、可以拓展的地方,应用它、拓展它;在不能应用、不能拓展的地方,就停下来。”这些话语仿佛是阳光,驱散我心中对大数据时代的担忧以及内心对其的恐惧。
我认为,只有我们坚守自己的内心和自由意志,大数据才能造福于我们的人类世界,才能充分发挥其背后的温暖之光。
面对时代的变革,我会为坚守内心深处的自由意志而努力并“拥抱大数据”。
⧈ 大数据读后感
《大数据》一书,到开学伊始的分组沙龙,再到今日的阅读共享,现已圆满告一段落。相信本次活动将增强全校教师的数据意识,掌握大数据,用大智慧把学校的教育教学提升到一个新的水平!
[第一条:在阅读了大数据时代的书籍后]我对畅销书、热门话题和时尚科技不太感兴趣。书刊,喜欢有一定年份的;话题,钟情于务虚的观点;新奇的产品于我无缘,***用成熟的科技产品。
它既不崇高也不冷漠。就是要与现实保持一定距离,留一点思考的空间。这一***近破了例。由于工作的原因,耳濡目染,“大数据”这个新兴概念开始频繁步入我的视野。
按捺不住内心的好奇,网购《大数据时代》,手不释卷,三天读完,颇有收获。此书有如下特点。
首先,作者站在理论的制高点上,条理清楚地阐述了大数据对人类的工作、生活、思维带来的革新,大数据时代的三种典型的商业模式,以及大数据时代对于个人隐私保护、公共安全提出的挑战。其次,本文的例子贴近现实生活和时代,既给读者留下深刻的印象,又能使读者感同身受。另外,作者没有使用很多专业术语,也没有装出专业的面孔。
纵观全书,遣词造句,均通俗易懂。
作者认为大数据时代具有三个显著特点。
1、 当人们研究和分析一个现象时,他们将使用所有的数据而不是抽样数据;
2、 在大数据时代,我们不应盲目追求数据的准确性,而应适应数据的多样性、丰富性,甚至接受错误的数据。
3、 理解数据之间的相关性比探索因果关系要好。“是什么”比“为什么”重要。
作者指出,随着技术的发展,数据存储和处理的成本大大降低,人们现在已经有能力从零碎的、看似无关的数据渣中提取真实的知识。在大数据时代,三类公司将成为时代的宠儿。一是拥有大数据的公司与组织。
如**、银行、电信公司、全球性互联网公司(阿里巴巴、**网)。第二,拥有数据分析和处理技术的专业公司,如亚马逊和谷歌。第三,具有创新思维的公司可能不掌握大数据,也不具备专业技术,但他们善于利用大数据,从大数据中找到自己的理想世界。
面对即将到来的大数据时代,个人将如何自由应对?这是个严肃的问题。
【篇二:大数据时代读后感】“除了上帝,任何人都必须用数据来说话。”——这是《大数据》中出现的让人印象深刻的一句话,也是全书力图传递的信息。
在数字信息时代,数据和空气无处不在。对某些人来说,数据是没有意义的,而对某些人来说,数据是真理。
美国是《大数据》的主角,全书通过讲述美国半个多世纪信息开放、技术创新的历史,以别开生面的经典案例——建设“前所未有的开放**”的雄心、公共财政透明的曲折、《数据质量法》背后的隐情、全民医改法案的波澜、统一身份证的百年纠结、街头警察的创新传奇、美国矿难的悲情历史、商务智能的前世今生、数据开放运动的全球兴起,以及云计算、facebook和推特等社交**、web3·0与下一代互联网的未来图景等等,为读者一一细解数据创新给公民、**、社会带来的种种挑战和变革。
通过这本书,一个三维的美国和美国人民的思想呈现给我们。美国人民致力于保护个人隐私,但不遗余力地促进**信息的透明度和公开性。
读完这本书,我突然对生活中的数据和数据处理产生了浓厚的兴趣。如果有一天,我们到处用数据说话,那么政治、制度和生活就会更加清晰,事故也会降到最低点。
作为信息技术教师,是有必要阅读此书的!有智慧的教师将能够从书本中挖掘出独特的信息技术文化和可用于教学的新鲜案例。
每天能用来阅读的时间很少,总是要等到夜深疲倦时才有空打开书本,总是在眼睛极不舒服的情况下坚持阅读,《大数据》就这样在坚持中溶入我的思想……
【篇三:大数据时代读后感作文】读完《大数据》,我才意识到这并不是一本枯燥无味的书籍。笔者运用案例和故事的方法,讲述了美国数据开放、收集和使用背后的立法故事、公民故事、技术故事和商业故事,令人着迷,也让我大开眼界。
我在想,大数据概念会给教育带来什么实用价值?长期以来,我国教育界一直在研究教育的数字化,如数字化校园。这一理念是将我们的教育内容数字化,其结果指向电子教材的研发或教学过程的数字化。美其名曰,这是教育技术的重要内涵。
在教学过程中,学生的行为表现都可以被数据化,而这项研究不是任何一个专业可以深入下去的,它的专业性太强,所以我才会想到,所谓教育技术与其研究教育的数字化,不如研究教育的数据化来得实在,来的有意义。长期以来,我们不知道教育对一个人的影响会如何表达。我们所拥有的只是一个轮廓,我们不确定老师的行为对学生有什么影响。所以,人们对教育总是有很深的怀疑。科学吗?
大数据概念至少提出了关注“是什么”比“为什么”要有实际意义得多。而我们的教育恰好需要把注意力从“为什么”转移到“是什么”上面来,只有如此,才能把教育从为什么发展成“可能成为什么”上来,这会是一次思想上的革命。而对于现在地位岌岌可危的教育技术来说,把研究的重点从数字化转移到数据化上面,这才是它的出路。
如何将数据融入教学,教育者首先通过标准化全科教学处方,实现了教师授课模板和教学内容的标准化,保证每个教学过程和内容是可控的,然后结合每天的教学内容,处理好面对的数据,处理好数据,自然也就处理好了课堂的反馈,最终形成了既注重教学体验又以教学结果为导向的教学体系。
同时,我们不仅要关注课堂上的学生资源,还要在课后跟踪这些资源。这与以往的教育教学明显不同。面对大数据时代的到来,教学变革势在必行。因此,无论环境如何变化,数据如何复杂,我们都不得不改变教学,以适应未来的大数据时代。
⧈ 大数据读后感
财税1301
***黄晓晴
当我非血肉,而是数字
读《大数据时代》有感
当我的电脑接上宽带,我的手机连上wifi,当我使用百度搜索一条词条,当我用微博发布一条状态,当我在**上流连忘返,当我打开一个网页进行注册,我的鲜活的血肉之躯在信息时代里俨然变成了一堆冷酷无情的数据,可以被明码标价地**,可以被输入先进的数据分析系统和其他千千万万和我一样的人被分析为公司带来巨额收益,而自己,却全然不知这些悄悄的改变。
读完这本书,我发现我眼中的世界发生了巨大的变化。我开始学会审视身边的一切,重新审视互联网,重新评估自己的价值。这本书解释了我们正处于大规模生产、分享和应用数据的时代,告诉我们如何科学地应用大数据,开启新的思维模式,新的生活方式与新的工作形态,以应对正在发生着的利益与风险。
大数据开启了一次重大的时代转型。当我们进入信息时代,数据在不断增长和膨胀,信息**,我们曾经鄙视它们,然后量变导致质变,人们发现了数据得内在价值。以“样本=总体”的更多数据分析,让我们更清楚地看到了以前无法揭示的细节信息;以微观的精确度沉迷向宏观的洞察力延伸,让我们更有大方向上的把握;以热衷于寻找因果关系向寻找事物之间的相关关系转变,让我们注意到以前从来没有意识到的联系的存在。
同时,大数据正逐渐成为巨大的经济资产。大数据发展的核心动力在于人类对世界的测量、记录和分析欲望。当文字、方位、沟通,甚至世间万物都变成数据,可量化一切时,就能创造新型价值,渗透到并服务于所有生活领域的方方面面。
大数据一旦得到有效利用,可以改变公司的赢利模式和传统的沟通模式。大数据的利用,可以重新定位生产商与**商的关系;可以通过商品本身收集数据并传回制造商进行研究与开发;可以通过用户交互提高服务;当文字变成数据,不仅人可以用之阅读,机器也可用之分析……个人也好,公司也好,都需要与时俱进;大数据的多样性有待于更全面的开发,更好地服务于人们的生活。正如那些商业巨头们:
亚马逊,谷歌和微软公司,分别利用大数据的不同价值为自己的公司创造前所未有的财富,同时,也带动了很多新兴产业的出现,大数据主导着企业的转型和思维的转变,谁能抓住大数据带来的创新价值,谁就能快速拥有财富。
让我感触最深的,是书中所提到的在大数据下,人们越来越关注“相关性”,而不再去**“因果”,因此,大数据改变着我们理解世界的方式。我们通过去探求“是什么”而不是“为什么”,相关关系帮助我们以全新的视角更好地了解与审视这个世界。更好,不是因果关系,而是相关关系。
知道“是什么”就够了,没必要知道“为什么”。在大数据时代,我们不必知道现象背后的原因,而是让数据发出自己的声音。这是大数据赋予我们的彻底颠覆我们传统认知的创新思维,尽管我们无法一下子接受,甚至发出质疑,刨根问底,不是社会发展进步的动力吗,不是几千年来人们不断认识地球,探索宇宙的源动力吗?
现在大数据时代,却将这抛弃了。
然而,如果每件事都有因果关系,那么我们就没有决定任何事情的自由。如果说我们所做的每一个决定或者每一个想法都是其他事情的结果,而这个结果又是由其他原因导致的,以此循环往复,那么就不存在人的自由意志一说了——所有的生命轨迹都只是受因果关系的控制了。相关性并不能取代因果关系,但两者的重要性是不同的。
在大数据时代,相关性强于因果关系。正如书中谈到的**性分析。通过对大量数据的收集和分析,我们可以找出事物之间的关系,从而通过另一个相关事物的变化来判断一个事物的变化。
正如桥梁和建筑物上被安装了传感器来监测磨损程度,大型化工厂和提炼厂也装了传感器,因为一旦设备的某一个零件有问题,就只有在更换了零件之后生产才能继续进行。收集和分析数据的成本远低于停产损失。**性别分析不能解释故障的可能原因,只能告诉你出了什么问题,也就是说,它不能告诉你为什么发动机过热,风扇皮带磨损?
没拧紧的螺帽?没有答案。在以规模化生产的经济效益为主导的社会生产方式中,关联性尤为重要。如果我们必须调查因果关系,就会增加沉默的成本。
但因果关系并不重要。的确,这对企业家来说并不重要,因为它不需要被人知道。然而,对科学家来说,因果关系大于相关性。
思维的转变,从一小部分人开始。然而,这一小部分人却掌控着世界。他们如何认识世界,如何改变世界,不知不觉中,我们普通人正在慢慢地改变。
“不需要知道为什么”,我们也在被动的接受这样的改变,因为世界正在朝着这个方向改变着。在我们的潜意识里,自然地,我们觉得这个世界应该是这样的。至于为什么,我们不知道。况且,也真的不需要知道。
可见,大数据正在挑战着我们的理解范围。大数据是用规模剧增来改变现状的,同时它加深了对我们隐私的威胁,甚至会把个人未来行为的**与惩罚相联系,导致失去自由意志和自由选择权,让我们盲目信任数据的力量和潜能而忽略了它的局限性。
大数据并不是一个充斥着冷算法的机器世界,人类的角色是不可完全取代的。大数据给我们的不是最终答案,而是参与。帮助只是暂时的。在不久的将来会有更好的方法和答案。不要让我们成为数据的奴隶,*如何让数据真正提供给我们,提供最好的参与,帮助人们做出最明智和正确的选择才是最终的意义所在。
在未来,这将是一个工作,生活和思想的变化。未来,迎接挑战,抓住机遇,我们准备好了。
⧈ 大数据读后感
金融学院实验班
王骁义***
《大数据时代》读后感
这个学期伊始,在事实与政策老师的建议下我选择阅读了《大数据时代》,这本书主要描述的是大数据时代到临人们生活、工作与思维各方面所遇到的重大变革。读完这本书,我对书中描述的大数据时代有了更深的理解。
本文明确阐述了大数据的基本概念和特点,并列举了清晰的观点。不管对于产业实践者,还是对于**和公众机构,都非常具有价值。作者将本书分为3个部分。
第一部分提出了大数据时代处理数据理念上的三大转变:抽样等于全体;要效率不要绝对精确;要相关不要因果;第二部分作者从万事万物数据化和数据交叉复用的巨大价值两个方面,讲述驱动大数据战车在材质和智力方面向前滚动的最根本动力;最后一部分,作者描绘了大数据帝国前夜的脆弱和不安,包括产业生态环境、数据安全隐私、信息公正公开等问题。
导言提出,大数据将给生活、工作和思维带来巨大变化。一个例子是2009年h1n1流行病毒背景下谷歌通过检测检索词条,处理了4.5亿个不同的数据模型,通过**并与2007年、2008年美国疾控中心记录的实际流感病例进行对比后,确定了45条检索词条组合,并将其用于一个特定的数学模型后,**的结果与官方数据的相关系数高达97%。
根据传统的信息返回程序,新流感病毒病例的通知将延迟一至两周。对于一种迅速蔓延的疾病,两周的信息滞后是致命的。谷歌使用大数据技术,以前所未有的方式分析海量数据,找出流感传播的范围,这为全球的**流感提供了一个更快的工具。
此外,我联想到原**董事长马云通过大量数据分析得出2008年经济疲弱,为其商家提前做好迎接经济危机提供了时间缓冲。(补充并清晰描述详细)关于大数据在商业领域的应用, farecast公司是一个成功的典型范例。该公司由oren ezioni创立,利用机票销售数据**未来机票**,旨在帮助用户在购买机票时**制作**,并将机票趋势**的可信度标记出来,供消费者查询。
farecast系统利用近十万亿条**记录**的准确度达75%,使得使用farecast票价**工具购买机票的旅客,平均每张机票节约50美元。而处理如此多的数据离开了大数据技术将无法进行。
正是因为我们进入了一个前所未有的信息时代,人们拥有如此多的数据,我们才能利用大数据的分析和处理手段创造新的价值。也许有人以为我们大数据时代的还未来临。事实上,大数据技术已经渗透到我们当中。它已应用于垃圾邮件过滤、新浪微博技术平台、谷歌翻译和输入文本的自动纠错。
本文提出的一点是**是大数据的核心。其实从过去的时代人们就利用掌握的数据进行各种分析,从而对经济等各方面进行**、矫正。只是进入了大数据时代人们掌握的数据**性的速度在增长,从而数据的存储和分析数据分方法成了释放大数据能量的关键。
关于不是随机样本而是整体数据中。指出在小数据时代,随机抽样是用最少的数据获得最大值的方法。作者使用大数据和乔布斯的癌症**来说明使用所有数据而不是样本的重要性。
乔布斯成为世界上第一个对他所有的dna和肿瘤dna进行测序的人。乔布斯曾开玩笑说“我要么是第一个通过这种方式战胜癌症的人,要么就是最后一个因为这种方式死于癌症的人”。虽然他最终死于癌症是不可避免的,但这种获取所有数据而不是仅仅获取样本的方法延长了他几年的寿命。
同样,从事跨境汇款业务的xoom公司侦破一起犯罪集团的诈骗也是由于使用了整体数据。初此之外,他还列举了日本“相扑”等来证明使用全体数据的重要性。
作者同时也指出随着数据使用的越来越多,其得出的结果并一定能越来越精确,毕竟数据不能保证百分之百的正确,特别是大数据时代各种结构化与非结构化类型的数据聚集在一起难免导致结果的不太精确。大数据时代要求我们重新审视准确性的优缺点。作者特别举了谷歌翻译成功的例子。
google translate优于ibm的candide系统,并不是因为它有更好的算法机制。和微软的班科和布里尔一样,谷歌翻译增加了各种各样的数据,并且接受了有错误的数据。(它的语言库来自未过滤的web内容,它将包含一些不完整的句子、拼写错误、语法错误和各种其他错误。)
在不是因果关系,而是相关关系的篇章中。作者指出,在大数据时代,了解大数据时什么比为什么会出现更现实。作者列举了林登亚马逊推荐系统的成功案例,证实了大数据在相关性分析和销售成功方面的优势。
沃尔玛也是充分利用并挖掘各类数据信息的先锋和代表,从以前广为人事的啤酒和尿布的案例,以及作者举的有关蛋挞和飓风天气的案例,都说明了掌握了相关关系对于其策略的帮助。基于相关性分析的**是大数据的核心。aviva insurance利用数百种生活方式的数据,如兴趣爱好和长时间的网络浏览,间接确定谁更容易患高血压、糖尿病和抑郁症。
ups国家快递公司通过使用**性分析检测其全美6万辆车队。进行防御性的修理,节约巨大得的成本。这些都充分显示了**大数据的优势。
本书的第二部分是关于大数据时代的业务转型。作者用莫里绘制导航图的例子告诉我们,远在信息数字化之前,对数据的运用就已经开始了。莫里用大量的人力分析了他保存多年的航海记录,从这些大量的数据中获得了新的利用价值。
绘制的图表帮助商人节约一大笔钱,使年轻的海员们间接获取了成千上万名经验丰富的航海家的指导。日本先进工业技术研究所崇臣教授通过安装压力传感器,将人体臀部特征数字化,进而形成乘客身份识别。这项技术为汽车防盗系统提供了方案。
公司,致力于为顾客**商品的**,通过收集处理海量的**信息,**准确率高达77%,帮助顾客在购买一个产品时节约了大约100美元。mastercardd.advisor部门通过分析来自210个国家的15亿信用卡用户的650亿条交易记录,分析得出商业发展和客户消费趋势,如通过分析发现如果一个人下午四点左右给汽车加油的话,他很可能在接下来的一个小时内去购物或者去餐馆吃饭,且在这一小时里大约花费35到40美元。
商家正可以利用这个分析结果,在加油的小票背面附加上附近商店的优惠券。
这些例子都证明了大数据蕴藏着巨大的商业价值。根据提供价值的不同**,大数据价值链包括三大构成部分。包括第一种是基于数据本身的公司。
这些公司拥有大量数据或者至少可以收集到大量数据,却不一定有从数据中提取价值或者用数据催生创新思想的技能。第二种是基于技能的公司。它们通常是咨询公司、技术**商或者分析公司。
它们掌握了专业技能但并不一定拥有数据或者提出数据创性用途的才能。比如说,沃尔玛和pop-tarts这两个零售商就是借助天睿公司的分析来获得营销点子,天睿就是一家大数据分析公司。第三种是基于思维的公司。
皮特.华登,jetpac的联合创始人,就是通过想法获得价值的一个例子,他通过用户分享到网上的旅行**来为人们推荐下一次旅行目的地。对于某些公司来说,数据和技能并不是成功的关键。
挖掘数据的新价值的创新思维才是这些公司脱颖而出的优势所在。
大数据成为许多公司竞争力的**,未来可能整个行业的结构会发生改变,大公司和小公司最有可能成为赢家。如今的核心竞争力在于快速而廉价地进行大量的数据存储和处理。当然公司要根据自己的情况进行调整。
大数据向小数据时代的赢家以及那些线下大公司(如沃尔玛、联邦快递、宝洁公司、雀巢公司、波音公司)提出了挑战。同时,大数据也为小公司带来了机遇。大数据也将会影响国家竞争力。
当制造业已经大幅转向发展中国家,而大家都争相发展创新行业的时候,工业化国家因为掌握了数据以及大数据技术,所以仍然在全球竞争中占据优势,但这个优势很难持续。随着技术的发展,西方世界在大数据技术的优势将会慢慢消失。对于大公司而言,好消息是大数据技术可以加剧优胜劣汰。
一旦公司掌握了大数据,它不但可能超过对手还可能遥遥领先。
文章第三部分讲了大数据带来无数好处的同时带来的不良影响以及如何面对这些影响。包括如数据的收益的处理问题以及数据中用户资料的隐私和决策过程带来的影响。作者在保护个人隐私方面提出了几种想法。
一种是使用数据时征询数据所有个人的知晓和授权。第二个技术途径就是匿名化。作者同时也指出了这两种方式的难度。
一方面收集到的数据可能会被后续的多次利用。另一方面,匿名化会在数据收集越来越多和数据的相互结合关联使用时变得无效。作者列列举电影《少数派报告》的情节说明越来越依赖数据时,大数据可能将我们禁锢在可能性之中。
当然通过分析犯罪的常发地与常发时间,合理安排警力会对治安防范提供不小的帮助。作者还指出不能尽信数据的分析结果,因为不能保证获取分析结果**的数据准确性。大数据在给我们生活提供便利的同时,也让隐私保护的法律手段失去了作用。
我们必须杜绝对数据的过分依赖。
在高速迈进大数据时代的同时,人类信息管理准则需要重新定位,将带动社会核心价值观的转变。大数据时代,对原有规范的修修补补已经不足以抑制大数据带来的风险。保护个人隐私就需要对个人数据处理器对其政策和行为承担更多责任。
同时必须重新定义公正的概念,以确保人类行为的自由。作者提出了解决这些问题的方向。如个人隐私保护方面,可以让使用者承担更多的社会责任。
将责任从民众转移到数据使用者有很多意义,也有充分的理由。因为他们更清楚将如何使用数据且是数据应用最大的受益者。关于公正方面简单的讲就是个人可以并应为他们的行为而非倾向负责。
就像公司有内部会计和外部审计人员一样,大数据时代,公司将设置专门的人员--内部和外部算法师对大数据活动进行监督。还有可能出现第三方的机构对大数据行为进行监督和衡量。作者甚至考虑到对大数据存在的垄断情况进行分析并在反垄断反面给了建议。
最后结语中作者提出大数据提供给人们的只是参***,提醒我们在利用这个工具时要铭记人类的作用是无法完全替代的。
大数据时代是信息化社会发展必然趋势,我们只有紧紧跟随时代发展的潮流,在技术上、制度上、价值观念上做出迅速调整并牢牢跟进,才能在接下来新一轮的国际竞争中摆脱受制于人的弱势境地,才能把握发展的方向,冲破与西方国家的差距。对于一个国家如此,对于一个企业亦是如此。在如此快速的到来的大数据时代,我们还有很多知识需要学习,许多思维需要转变,许多技术需要研究。
公司的规划中,也需充分考虑到大数据对于公司的未来发展所带来机遇和挑战。对于掌握大量数据的公司,需要考虑有多少数字化的数据,又有哪些可以通过大数据的分析处理而带来有价值的用途?比如国内目前的社交**,购物**等都掌握了用户的大量的数据信息。
在大数据时代制胜的良药也许是创新的点子,也许可以利用外部的数据,通过多维化、多层面的分析给其他企业或个人带来价值。
⧈ 大数据读后感
在0和1构筑的数据之网内,保护好隐私才是你的智慧。
茵茹怀孕了,她压抑不住心中的喜悦,产检、购置孕婴用品、咨询月子中心、令各种孕妇礼包、并高调晒朋友圈。可是突如其来的车祸,让她失去了孩子,她悲痛万分。可是这种情况下,各种针对孕妇的广告推销将她折磨得苦不堪言,一遍遍揭开的伤疤让他处于崩溃的边缘。
这种故事就是我们生活在大数据的时代经常发生的事情。我们在享受大数据制造的便捷生活和网络社交,虚拟的网络社会和真实世界早已密不可分,但同时我们的隐私也在不知不觉中泄露。关于我们对大数据的依赖和困惑,作家夏予川所作的长篇小说《大数据时代》为我们进行了全面的分析解读。《大数据时代》这本书不仅仅是一套小说,它更是一套解析大数据的工具书,它还是一套处事哲学书和科学幻想书,这本书讲的是我们的现在和未来。
⧈ 大数据读后感
天罗地网,无处可逃的是数据还是我们?
在世界千万年的历史进化过程中大概再也不会有一个时代的变革会如同互联网大爆炸年代一般彻底颠覆现今人类的基本生存方式,也再不会有一种生存状态会把所谓的个人生活属性从隐匿在世界的任何一个可能的角落随时展现到普罗大众的眼前,任人观测和解读。
当所谓的大数据技术创造伊始,它就注定不再仅仅会是人类自我的提高生产力生产方式的生产工具,转而会以最快的速度凌驾于任何一种社会群体以及个人模式之上,成为笼罩于整个虚拟和现实交错的空间之下的上帝视角的观察者角色。技术宛如是一种自我繁殖的生物,没有人知道当它野蛮生长后所呈现出何种惊人模样。
本书《大数据时代:信息围城》所讲述的就是这样一个关于人类被大数据技术包围下的生存故事。一位从事大数据技术的跨国公司高管,在竞争公司高层的最后时刻,遭到竞争对手编造的一个虚拟VR技术捏造的私密视频而功亏一篑;一位遭遇不幸车祸致使流产的准妈妈却时刻笼罩在信息外流后近乎无孔不入的相关母婴公司的嘘寒问暖,导致精神崩溃,最终不得不选择退回到最原始的生存模式,来一场与世隔绝的社会隐身;只要有足够多的基础观察数据,人工智能就可能模拟出任何一个行为人的行为特点,哪怕是最高水平的艺术创作,画家杜眠风在自己艺术创作人生的最后阶段却遭到技艺上的对手解码,从而怀疑自己的艺术价值所在;红极一时的明星陆浩川同样在彻底泄露自己个人信息后,会被自己的妻子翻手为云覆手为雨,并且以谣言网暴的方式来彻底将其压垮,利益资本趋势下渺小个人的如履薄冰;幼儿园扎针这种社会敏感话题下,李零可以通过大数据排查和比对,找寻到事件的真相。五个故事,五场遭遇,兵困一隅,无处可逃。
作者夏予川是一位在互联网科技公司,从事多年民生大数据应用领域的工作人员。在本书中,她把自己的专业领域知识演化成五个故事向读者展示了互联网之于个人信息的脆弱保护,和个人信息之于个人生命财产安全的恐怖破坏力。事物的两面性在互联网时代体现的尤为极端,非黑即白,正反分明,从积极意义来看,但凡能够接入网络的行为事物,作文例如支付,外卖,出行,医疗,乃至个人信用,只要涉及到人类的衣食住行,一旦成为了网络中节点的某一部分,就可以大幅度提高操作效率,降低生活成本。但从消极一面来看,个人一旦成为了网络信息中的某个接入节点,也同样意味着他的所有信息都将不再属于自己,伴随着无限便利而来的可能是对症下药的陷阱,处心积虑的诱导,还有别有用心的欺骗。至于我们是应该因噎废食,还是逆风而行?
曾经有种技术无罪论的说法,会用菜刀的用途说事,但我更想说,技术有罪无罪应该区别于菜刀的设计之初是更适合切菜还是更适合行凶,技术亦然。
当我们身处于天罗地网的信息围城时,总会去思考,文明的进步到底依附于科技的发展,还是精神世界的丰富,我想说,人类文明进步总是伴随着发现问题到解决问题的迭代推进,黑格尔的否定之否定定律告诉我们,事物进展也同时伴随着前进性和曲折性,在人类不断探索未知领域的同时,并且对曾经过往进行不断地反思纠正,唯有如此,才能从中找寻到真正使得文明得到整体进步的最佳答案和方法。
⧈ 大数据读后感
大数据时代下的变革
员工编号**徐敏2015-12-10
现在全社会都在热议互联网+概念,各领域针对“互联网+”都会做一定的论证与探索。我对大数据一直好奇已久,阅读了很多资料仍不得其解,直到读完《大数据时代》才有了粗略的认识。
《大数据时代》是由英国作者维克托麦尔·舍恩伯格等所著,由胜杨燕和周涛翻译。作者是大数据研究的大师,翻译家也很擅长翻译。本书从思维、业务和管理三个方面阐述了大数据时代的变化。这些变化涉及我们生活的方方面面,其影响几乎可以与两次工业革命相提并论。
在第一部分中,作者提出了三个更令人震惊的观点。首先,不是随机抽样,而是所有数据。这里需要更多的数据。第二,不是精确性,而是混杂性,这里要求数据更杂。第三,这不是因果关系,而是相互关系。它需要更好的数据。
在第二部分中,笔者从数据的巨大价质和数据的交叉重用两个方面,论述了大数据战车在物质和智能方面向前推进的最根本动力。第三部分阐述了大数据时代的弊端和管理措施。我认为这本书的精髓是第一部分。第一部分的三个观点涉及面很广,包括统计学、逻辑学、哲学等。
后两部分基于第一部分的三点。
细细咀嚼,有几点我深受启发。首先,社会是一个相互联系的整体,所以我们需要对我们的工作目标有一个整体的看法。各个行业和细分领域可能会有更多的趋势,但总的来说,它们与社会和产业环境密不可分。
其实无论大家身处哪个行业,在书中所述及的这些趋势之外,更要与自身行业相结合,可能会对企业将来发展有一个更好的预判。
第二,要效率不要绝对的精确。作者说,对准确性的痴迷是缺乏信息和模拟时代的产物。只有5%的数据是结构化的,可以应用于传统的数据库。如果不接受混沌,剩下的95%的非结构化数据就不能被利用。
作者是基于数据不可能百分之百正确的考虑而做出这样的判断的,如果采用小数据一个数据的错误就会导致结果的误差很大,但是如果数据足够多、数据足够杂那得出的结果就越靠近正确答案。在大数据时代,要求我们重新审视准确性的利弊,甚至说大数据不仅使我们不再期待准确性,而且使我们无法实现准确性。谷歌翻译的成功很好地证明了这一点,谷歌的翻译系统不像candide那样精确地翻译每一句话,它谷歌翻译之所以优于ibm的candide系统并不是因为它拥有更好的算法机制,和微软的班科和布里尔一样,谷歌翻译增加了各种各样的数据,并且接受了有错误的数据。
第三个观点,不是因果性,而是相关性,这是这本书中争议最大的一个观点,不仅是读者,就算是本书的译者也在序言中明确地说到他不认同“相关关系比因果关系更重要”的观点。作者觉得相关关系对于**一些事情已经足够了,不用花大力气去研究他们的因果关系。林登亚马逊推荐系统的成功证明了大数据在相关性分析和销售成功方面的优势。
沃尔玛也是充分利用和挖掘各种数据和信息的代表。从啤酒、尿布、蛋挞和飓风天气的情况来看,笔者有助于掌握他们之间的相关关系。一句话,知道是什么就足够了,不知道为什么。很明显作者所举的例子都是属于商业领域的,但是对于其他领域来说这个观点就值得商榷了。
例如,在科学研究领域,你需要知道它是什么和为什么,并找出事件的原理。用文中的一个例子说明,乔布斯测出整个基因图谱来**癌症,但是你**癌症你必须知道癌症发病的原理,知道哪一段基因导致了这种疾病,不可能只是说收集各种数据,然后利用其相关性来判断**出现了问题。
⧈ 大数据读后感
数据,对于我们现代社社会来说,已经是再熟悉不过了。大量化(volume)、多样化(variety)、快速化(velocity)和大价值(value)。这四个v就是大数据的基本特征。每天我们都不得不和数据打交道,比如我们平常所说得“眼观六路,耳听八方,”就是生活中一个很好的的收集数据的例子。还有,在我们平时的学习中,我们对于一些学习上的数据的整理等等。可以说,数据已经成为了我们的影子一样,无时无刻的在我们的身边活动。
拿到《大数据》这本书时,吸引我的不是书评的内容,而是书的封面上的一句话“除了上帝,任何人都可以用数据说话。”也就是说,上帝可以不用数据来说话,但是,作为一个平常人,我们做事,言论等都必须用数据来说话。用数据论来证我们的观点正确性。
那么数据真的就是那么重要吗?其实不然,数据果真有那么的重要。作者在书中大量应用世界头号强国美国的例子来说明美国是如何利用数据以及数据在美国人的利用下,是如何造福美国人的。使得美国人走上了民主、发展的道路。书中还引用了大量的利用数据的案例,以及利用数据会有什么样的后果。当然,作者在书中也很明确的表达了自己观点,也就是数据要被人利用,利用的好了,造福人类,否则,祸害无穷。
毫无疑问,我们正处在一个真正意义的大数据时代。但是,大数据浪潮的来龙去脉如何?数据技术变革何以能推动政府信息的公开、透明和社会公正?又何以给我们带来无限的商机,既便利又危及我们每个人的生活?《大数据》给了我们一个很好的答案。在拿到徐子沛《大数据》时,与其说这是个新概念,还不如说就是一个现实。信息技术的迅速发展和普遍应用,存储能力的膨胀,网络传输的便捷,必然产生巨大的数据量。即使是一个公司,经过多年的积累,产生的数据也是惊人的。每天繁多的数据,这就是要求企业要很好地存储数据,利用数据通过数据,使得数据说话,提升企业的业绩和知名度。
对于一个企业来说,比较实际的倒是关注一下企业微观大数据,如何充分利用现有的、能够得到的和自己创造的数据,采用《大数据》里提及的新技术、新方法、新理念,筛选、组织、关联、分析,精细化管理和挖掘数据,探索规律性的东西,指导企业活动。尽可能多的获取数据,首先是要有心,对于公司员工来说,随时随地注意收集客户数据、需求数据、产品数据、市场数据、资源数据等,经过整理,把它变成公司的数据资产;然后是要有据,信息与数据最大的不同,就是数据是能够度量或者确定的信息,不能“毛估估”,收集数据要精细化,要准确;其次要有序,数据需要存储,更加需要整理,单个数据没有很大意义,静止的数据也没有很大意义,有价值的数据是流动的、与其他数据交互作用的。一个大杂烩的数据库,在需要时让人找不到北,没有任何意义。再次,需要技术支持,大量的数据如何检索,如何关联,单靠人脑是不行的,需要建立基于特定理论的数据处理系统来分析管理。对于一个企业,最理想的是建立一个类似人类神经系统的数据管理系统,采用各种信息终端采集内部和外部信息,通过分析、归纳、筛选,形成管理数据,某些数据可以成为系统的“本能”,一旦触发能够自动做出反应;某些数据可以成为组合信息提交大脑综合分析,作出决策和反应。数据应该为人服务,这是一条基本原则。在大数据时代始终发挥人的主观能动性,采用先进的理念和技术驾驭数据,让人们生活更方便,工作效率更高,劳动强度降低,为社会创造更多的物质财富和精神财富。
在中国,统计部门提供的数据,是各级政府部门和广大人民群众了解国家社会经济发展和人民生活状况主要渠道。只有真实可靠统计数据,才能使政府决策有的放矢,人民了解国家经济与人民生活的真实状况。如果统计数据虚假不实,就会误导政府和人民,让政府失信于人民。因此,我们一定把握好数据的生命线—质量关,确保给国家和人民提供准确、真实、可靠、无误的数据。
二、如何高效有序地收集数据?
收集数据的目的是为分析利用数据。通过数据分析挖掘数据背后隐含的经济规律及有利于提高效率、改进工作的因素,提高政府管理、决策和人民生活水平,实现“用数据改进管理”。因此,作为统计人,不仅要做好数据收集的及时有效和真实正确,更重要的是要善于分析利用数据,写好专业分析报告,发现问题、支撑决策、评估绩效的目的。
此外我们还可以看到不少政府机构或者其他一些组织也在开始大数据解决他们遇到的一些问题。在本书的最后一章,作者告诉了我们大数据可能带来的坏处。如:通过大数据可能我们的个人各种信息、隐私会很容易地被大数据的拥有者找到,这些信息,可能被政府用来监管我们等;通过大数据可以预测可能发生的事,或者预测我们人个人本书即将做的行为,书中有个例子:警察通过大数据分析得出一个人即将可能犯罪,并把它逮捕了,但事实上这个人现在并没有犯罪。也许这就限制、约束了我们个人的自由。
看完这本书,颠覆了自己之前的一些想法:以前我们认为错误的数据是没有用,我们需要保证统计的数据的准确性,但是在大数据中,错误的数据也是有用的,它和其他所有相对正确的数据一起构成了整体,也就算不了什么了。我们同样可以从这些数据中得出比较正确的预测和分析。google利用人们搜索的关键字来预测和判断某个地区是否发生流感,google通过分析这个地区的人们搜索和流感有关的词的数量等来分析得出。google从互联网抓取数以亿记的各种语言、各种翻译水平的翻译结果,使用其翻译出来的准确率比那些微软使用正确的词库翻译出来的句子准备率更高。我自己的感想是,其实大数据无处不在,只要我们细心,我们就可以挖掘出身边的那些大数据,并做一些有意义的是,就像书中说的那样,我们不需要强求每条数据都那么真实准确,但是从大量的数据中我们就可以得出相对准备的结果。未来成功的公司必定是是那些拥有大量数据、并使用那些数据为大众提供服务的公司。
⧈ 大数据读后感
对于畅销书、热门话题、时尚科技,一直不是很感兴趣。书刊,喜欢有一定年份的。话题,钟情于务虚的观点。
新奇的产品于我无缘,***用成熟的科技产品。它既不崇高也不冷漠。就是要与现实保持一定距离,留一点思考的空间。这一***近破了例。
由于工作的原因,耳濡目染,“大数据”这个新兴概念开始频繁步入我的视野。按捺不住内心的好奇,网购《大数据时代》,手不释卷,三天读完,颇有收获。此书有如下特点。
首先,作者站在理论的制高点上,条理清楚地阐述了大数据对人类的工作、生活、思维带来的革新,大数据时代的三种典型的商业模式,以及大数据时代对于个人隐私保护、公共安全提出的挑战。其次,本文的例子贴近现实生活和时代,既给读者留下深刻的印象,又能使读者感同身受。此外,作者没有使用很多专业术语,也没有装出专业的面孔。
纵观全书,遣词造句,均通俗易懂。
作者认为大数据时代具有三个显著特点。
1、 当人们研究和分析一个现象时,他们将使用所有的数据而不是抽样数据。
2、 在大数据时代,我们不应盲目追求数据的准确性,而应适应数据的多样性、丰富性,甚至接受错误的数据。
3、 理解数据之间的相关性比探索因果关系要好。“是什么”比“为什么”重要。
作者指出,随着技术的发展,数据存储和处理的成本大大降低,人们现在已经有能力从零碎的、看似无关的数据渣中提取真实的知识。在大数据时代,三类公司将成为时代的宠儿。一是拥有大数据的公司与组织。
如**、银行、电信公司、全球性互联网公司(阿里巴巴、**网)。第二,拥有数据分析和处理技术的专业公司,如亚马逊和谷歌。第三,具有创新思维的公司可能不掌握大数据,也不具备专业技术,但他们善于利用大数据,从大数据中找到自己的理想世界。
面对即将到来的大数据时代,个人将如何自由应对?这是个严肃的问题。《大数据时代》读后感2
去年的“云计算”炒得热火朝天的,今年的“大数据”又突袭而来。仿佛一夜间,各厂商都纷纷改旗换帜,推起“大数据”来了。于是乎,各企业的cio也将热度纷纷转向关注“大数据”来了。
有一张来自《程序员》微博的漫画很形象。我认为这幅图真实地反映了当前中小企业云计算和大数据的现状。
不过话又还得说回来,《大数据时代》是本好书。
当然,很多it知名人士也大力推荐,写了好多读后感来表述对这本书的喜欢没看此书之前,对所谓大数据的概念基本上是一头雾水,虽则有了解关注过现在也比较火热的bi,觉得也差不多,可能就是更多的数据,更细致的数据分析与数据挖掘。看过此书后,感觉到之前的想法,只能算是中了一小半吧---巨量的数据,而另一前:着眼于数据关联性,而非数据精确性,或许才是大数据与现时bi的不同,不仅仅是方法,更多的时思想方法。
不过坦白讲,到底是数据的关联性重佳,还是数据的精确性更好,还真的需要时间来检验一下,至少从现在的数据分析方法来论,更多的倾向于数据的精确性。
看完此书,我心中的一些问题:
1、什么是大数据?
查了查百度百科,是这样定义的:大数据(bigdata),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。大数据的4v特点:
volume、velocity、variety、veracity这个好像是ibm的定义吧。
从个人角度来看:海量数据和海量存储是大数据的基本原型。
2、大数据适合什么样的企业?
确实,大数据的前提是海量数据。只有拥有大量的数据资源,才能发现数据的相关性,通过专业化的处理,使其为企业创造价值。对于电信运营来说,像互联网应用这样拥有海量用户数据的大企业在应用大数据的道路上也有着独特的条件,但是对于中小企业来说呢?销售订单数据?
若非百年老店,估计数据也是少得可怜,能用的可能只有消费者数据了吧。貌似大多数厂商,用来举例的也就是消费都购买行为分析为最多。
同样,在公共事业类的**机构,大数据的作用也许也能很好的发挥。相反,大数据在大多数中小企业的应用似乎有点小题大做。书中说:
大数据是企业竞争力。诚然,数据是企业的核心无形资源(如果使用得当的话),但所有的数据,还是换句话说:所有的企业与大数据竞争真的合适吗?
是否在中小企业中,会显示得小题大做呢?
3、大数据带来的影响
当一波又一波的it技术热潮源源不断地向我们铺面而来的时候,你甚至都没有做好准备,你都要开始迎接它所给你带来的影响了。借助物联网和云计算,大数据开始出现。但它到底给我们带来了什么呢?
1)**未来书中以google成功**了未来可能发生流感的案例来开篇,表明通过大数据的应用,可以为我们的生活起一个保驾护航的指向标。实质很简单,技术改变世界。
2)变革商业大数据所带来的商机,同时会衍生出一系列与大数据相关的商业机遇与商业模式,数据的潜在价值会源源不断地发挥作用可以容易想到的是未来有专门的数据收集,数据分析,数据生成的一条数据产业链产生。影响的,当然是it公司
3) 正如《变革思维》一书所述:因为有大量的数据作为基础,在未来,我们可能会更加关注数据的相关性,而不是精确性。对这条,本人还是持保留意见的。《大数据时代》读后感3
现在说到新的**和互联网,有必要提及大数据,而大数据似乎是不言而喻的。而且人云亦云的居多,不少谈论者甚至还没有认真读过这方面的经典着作——舍恩佰格的《大数据时代》。维克托·迈尔舍恩伯格何许人也?
现任牛津大学网络学院互联网研究所治理与监管教授,曾任哈佛大学肯尼迪学院信息监管研究项目负责人。他的咨询客户包括微软、惠普、ibm和其他全球企业。他是欧盟官方互联网政策的真正制定者和参与者。他还曾担任多国**的高级智囊团。这位被誉为:
大数据时代的预言家“的牛津教授真牛!那么,这位大师说的都是金科玉律吗?并不一定,读大师的作品一定要做些功课才好读懂,才能能与之进行一场思想上的对话。
舍恩伯格从三个方面论述了大数据:思维变革、业务变革和管理变革。
在第一部分”大数据时代的思维变革“中,舍恩伯格旗帜鲜明的亮出他的三个观点:
一、更多:不是随机样本,而是全体数据。
二、更杂:不是精确性,而是混杂性。
三、更好:不是因果关系,而是相关关系。对于第一个观点,我不敢苟同。
一方面是对全体数据进行处理,在技术和设备上有相当高的难度。另一方面,是否有必要为简单事实的数据分析收集所有数据?
我曾与香港城市大学的祝建华教授讨论过。祝教授是通信科学研究方法和数据分析方面的专家。他认为,可以找到一种数理统计方法进行分析,并非所有的数据都是必要的。联系到舍恩伯格第二个观点中所说的相关关系,我理解他说的全体数据不是指数量而是指范围,即大数据的随机样本不限于目标数据,还包括目标以外的所有数据。
我认为大数据分析不能排除随机抽样,但抽样的方法和范围应该扩大。
我同意舍恩伯格的第二观点,我认为这是对他第一个观点很好的补充,这也是对精准传播和精准营销的一种反思。”大数据的简单算法比小数据的复杂算法更有效。“更具有宏观视野和东方哲学思维。
对于舍恩伯格的第三个观点,我也不能完全赞同。”不是因果关系,而是相关关系。“不需要知道”为什么“,只需要知道”是什么“。
传播即数据,数据即关系。在小数据时代人们只关心因果关系,对相关关系认识不足,大数据时代相关关系举足轻重,如何强调都不为过,但不应该完全排斥它。大数据从何而来?
为何而用?如果我们完全忽略因果关系,不知道大数据产生的前因后果,也就消解了大数据的人文价值。如今不少学者为了阐述和传播其观点往往语出惊人,对旧有观念进行彻底的否定。
⧈ 大数据读后感
历史的演化总是带有着不可逆性,无可阻挡,浩浩荡荡。于是人类总是在惴惴不安中被裹挟上路,不曾停留。危险降临,变化无序,不确定性激增让眼中的“将来”显得如此昏暗不明,而即便如此,我们依旧需要勇往直前至死方休,任何一种试图想要回到从前,或者怀念过往的想法都不过是偶尔为之的略微感慨和不可忤逆的倒行逆施。总之,时代洪流呼啸而过,人类的现今不过是文明乘风破浪继往开来的一段微尘片段,谁都不曾足以停留驻足,哪怕顺之者昌,逆之者亡,哪怕天地不仁,以万物为刍狗。
如果第一部的《信息围城》是作者讲述大数据如影随形地和所有社会人相互的牵扯关联,并且影响着人类的一举一动,过去将来的话,那么《大数据时代2虚拟之战》是把观察视角调整到更加广阔的社会活动中去,用更加精湛的大数据技术去尝试破解人类的各种社交模式,包括理财,职业,婚恋。事实上,这两本小说,作者还是对当前的科技技术做了一部分的预言幻想,要知道,截止目前为止并不存在如此精准的商业化预测和虚拟能力,但随着科技在资本趋势下的突进速度,总有一天能够超乎人类的想象边缘,随之而来的改变亦会因为不断升格的科学技术而大步前行。预言终会成为现实,作者笔下的世界也终会到来,同样,到得那时,科技又会以何种方式横冲直撞,横扫一切。
小说中有个关于移动支付的事件,大概已经很多人无法回忆起上次使用现金的真实场景,同样,也已经有很多人习惯了把手机作为身体的一个重要部分而随身携带,当互联网进化到第二个阶段“移动互联网”之后,移动支付成为了大多数情况下交易手段,同时,这也意味着我们已经把“资金”这种私有财产彻底委托给第三方加以保护和运营。在事件中,一套作为移动支付的核心技术惨遭瓦解,并产生巨大亏空。但当真相解谜是,方才发现问题背后所产生的人性思考,作为一家以逐利为目的的互联网公司,依托大数据做出来的员工个人判断真的是一种唯一的价值判定准则嘛?在这样的判定之后,人和公司之间是否还存在着有更加人文主义关怀的羁绊和牵连。
在另一个关于互联网相亲的事件中,读者同时看到了一切皆数据背后的本质驱动力。首先一边是被工作侵占所有精力,毫无社交资本的社会普通人,作文另一边则是完全掌握针对目标的各类生活化信息,并且可以将其数据化,模式化,规范化,从而找寻到严丝合缝的社交对象。计算,陷阱,诱捕,投其所好,达到骗人钱财的目的。这时候我们要思考的是,何以曾经号称无可言表的个人好恶,会在社会结构进步和对方精心算计下变得如此固化刻板,这是人类自我意识觉醒的倒退,还是科学技术研究的进步?
本书给读者最大的感慨在于,仿佛一切都如同身边所发生的的真实事件?又或者好像自身的数据也同样被赤裸裸的暴露在网络之中,自己的行为模式又或者亦同样如此书中人物一般漏洞百出,而同样无奈的是,知易行难,谁都不愿意倒退回更加不方便的世界。
随着移动互联网的日趋深入全民的生活,网络安全这个崭新的命题也需要不断的被提上大众的视线中,大概只要彻底解决世人存在于斯的生存安全问题,才能让更加强大的技术更加深入和发扬。道德,法律,观念,集体自律,在此期间,每一样都必不可少,这才是一种文明得以进步的基石所在。
⧈ 大数据读后感
离不开大数据的时代
这些年,“大数据”这个词频繁地出现在人们的视野中,它不仅写入阿里巴巴、谷歌等互联网公司的战略规划中,同时在我国国务院和其他国家的**报告中也多次提及。这让我对大数据产生了浓厚的兴趣,我将从2015年5月参观苏宁总部开始。
苏宁是南京本土品牌。幸好离我们学校不远,所以成功地参加了一次参观企业的活动。“苏宁云商”,是它现在主打的品牌,大家都知道,而且很常用的苏宁易购,正是旗下之一。讲解人员不断地在参观中反复提到的o2o、p2p等技术模式,而且向我们展示了其后台强大的统计数据,根据某消费者对于购物的偏好分析,来定时推送一些互补商品,往往这些推送也会被买家加入到其购物车中。
更新颖的是“模拟试衣”,通过扫描试穿者的身材、相貌来量身打造,在大屏幕中显示出你穿戴某件衣服的模样。这些都让我对“大数据”这个词更加好奇不已。什么样的运营模式能给我们带来这么多的便利?
本书的作者向我们阐述了一个奇妙的“云时代”。他认为在抽样研究调查的时期,由于研究的条件欠缺,只能以少量的数据获取最大的信息,而大数据时代我们可以获取海量的数据,以样本=总体的更多数据分析让我们更清楚地看到以前无法揭示的细节信息。从历史的角度来找寻,“全体”似乎是人们一直所追逐的,国外的托勒密为“收集全世界的书,实现世界知识总汇”而建立了亚历山大图书馆,国内的乾隆汇编四库全书,都认为可以收集全部的书籍,然而每个收集过程都有主观因素在其中,就算统计也不能做到完全“全体抽样”,如果是有破坏性的,例如灯泡是否耐摔,不可能将所有灯泡都摔碎,所以只能使用抽样。
大数据改变着我们理解世界的方式,通过探求“是什么”而不是“为什么”,了解相关关系帮助我们以全新的视角更好地了解与审视这个世界。通过大数据的运用,效率极大的增加。我看过一个管理科学的例子,通过数据分析得出结论:
周末加班去买婴儿用品的爸爸通常会去啤酒区买啤酒,而其他产品很少出现在他们的购物车上。通过这一分析,超市管理者将婴儿用品和啤酒分开放置在最远的距离区域,消费者往往会在来回之间对这些产品给予一定的关注,从而增加了购物量和超市的利润。无独有偶,就拿身边的苏果超市举例,将上下两层购物区以需要人手动推车缓步慢行的坡道连接,而取代了运行快速的电梯,这样就能在路的两侧放一些冷门的商品,会让更多的消费者能够看到它们,进而购买、创收。
然而,这本书也存在一些争议,如效率和不精确性。笔者认为,对准确性的痴迷是信息匮乏时代和模拟时代的产物。“通过找出一个关联物并监控它,我们就能**未来。
”这句话当然是正确的,但是效率取得的同时,我们也是不可以放弃精确的,如果我们一味容忍混杂性的话,结果当然是不能接受的。所谓“差之毫厘,谬以千里”,在这样的大数据时代,云计算中肯定显得更为重要。
现在有很多国际500强企业,他们都关注云时代的魅力,也看到了这项技术能给他们带来的巨大利润空间。例如享誉世界的ibm公司,就创新地将这项技术发展成面向世界用户的**——称之为“认知商业”,其平台正是 ibm watson。这个平台最初的创想是我们在创作文字、编写方程、记录笔记、拍摄**,在各种社交软件平台上发布信息状态时,传统的编程计算机无法完全解读和处理这海量的信息,而watson善于认知,专于理解、推理和学***计,可以帮助行业领导者重塑产业格局。
这就让我们战胜从前无法逾越的挑战与阻碍。
⧈ 大数据读后感
《大数据时代》一书,让我们在观念上有了三大转变:要全体不要抽样,要效率不要绝对精确,要相关不要因果。该书介绍了“大数据”时代的三大变化:
思维变革,商业变革和管理变革。在这些巨大变革如洪水一般的"冲击"之下,现代社会的运作方式必将有重大的改变,若不顺应这种变革的潮流,就像古中国固步自封,最终被坚船利炮打开国门而自己还用着长钩铁戟抗争一样,不可避免被掠夺,被落于世界进程之后,所以我们必须转变我们的思想。
“我们不再有兴趣寻找因果关系,而是应该寻找事物之间的关联”,我认为这句话是本书的核心思想。大数据时代,信息与数据已成为了一切的本源,我们生活在各种数据构成的海洋之中,如果从另一种视角看,就好像无数条"看不见的线"将我们与这些数据联系到一起,这是我们以前从未有过、从未想过的。大数据改变了我们以前的通过因果关系了解世界的方法,而提供了几种新的途径,因为,在大数据时代,我们可以分析更多数据,有时甚至可以处理和某个特别现象相关的所有数据,也就是:
样本=总体;而且,当研究数据如此之多时,我们已不热衷于"精确",而是"混乱",若不接受"混乱",那么有95%的非结构化数据无法利用,这将无法使我们构建完整的数据世界,在分析更多、更全面的数据之后,我们就可以从这些数据之中发掘它们的相关关系,即以"是什么"而不是"为什么"的角度看待数据,不用管其从何而来,只要分析其如何影响其他事物既可,即"让数据自己发声",这些,彻底推翻了人类以前探索数据的方法,展现了一个全新的世界。
这一概念以惊人的力量给当前的知识状况带来了巨大的冲击。通过对海量数据的分析,我们可以获得巨有巨大价值的产品和服务,或者是深刻的见解。例如,当h1n1在xx流行时,google通过检测搜索关键词并处理了34个。5亿个不同的数据模型,通过**并与xx、xx年的美国疾控中心记录的实际流感病例进行对比后,确定了45条检索词条组合,并将其用于一个特定的数学模型后,**结果与官方数据相关系数高达97%,这种大数据技术,以前所未有的方式,通过海量数据分析得出流感所传播的范围,为**流感提供了一种更快速、高效的工具。
同时,虽然大数据可为人类造福、对抗病症,但这仅限于掌握这门技术而言,若不重视这种技术,当我们的对手早于我们一步构建这种数据网络之时,便是我们的灾难,想想,大数据虽核心的在于**,当敌人通过这种手段**我方下一步的行动,将是可怕的—比如你的导弹将从何处发射,将飞往哪,你的军队动向、目标,总之所有一切"未来"将掌控于敌手,敌方甚至可以借此发现那些将来有"大作为"的人,从而进行渗透或扼杀,这对我们的发展无疑是致命的,所以,尽快加速大数据系统的构建进程是必须的。
对于我们国防生,也必须顺应这种发展趋势,未来的时代必将是数据极易获取,数据网络共享化的时代,通过这些数据,建立数据模型,可以准确分析并给出适合每一个人的计划,如运动量、训练强度,可以"先知、先觉",及时发现一个人的负面情绪前及时疏导,这些必将成为现实,我们必须跟进时代,做好准备,去应对大数据时代的一切!
《大数据时代》是英国维克托·迈尔-舍恩伯格教授的著作,这本书也被尊为国外大数据研究的先河之作。这本书最大的优点是作者用数百个例子详细解释了大数据的方方面面,使外行容易理解。在结构上,笔者依次从大数据时代的思维变革、业务变革和管理变革三个角度进行阐述,清晰有序。
作者认为,所谓的“大数据”就是“所有数据”。随着计算机运算速度和存储容量的不断提高,数据采集变得越来越简单,数据存储的成本也越来越低。过去,由于技术上的限制,人们在进行统计时只能采集有限的样本数据,在统计中应考虑随机样本的选取,以减少样本问题带来的误差;统计结果往往不被重用,导致数据利用率低。
而现在则可以做到"样本=总体"。数据的增多带来不可避免的精确性问题。在“小数据”时代,样本的误差会导致整体估计的失败。幸运的是,在“大数据”时代,准确度不再那么严格——也不能太严格——数据的数量足以弥补这一缺陷。
在对思维转换的阐述中,本书最重要、最核心的一点是大数据时代。我们应该从追求“因果”的旧思维模式转向追求“关联”。 在我看来,这实际上是通过大数据来透视一种事物的发展趋势,而很多精确学科领域依然需要探寻"因果关系"解决更有针对性的问题,所以,这局限了这一转变只能在特定的领域发生。作者本人也说,“大数据的相关性使人们看到了比因果关系更具前景的领域。
“在大数据时代,获取数据的方式多种多样,数据形式也在发生变化。任何文本、行为和一切都可以在数字化后进行分析。对于这些数据的利用,我们不仅要考虑其最初的使用价值,还要考虑其未来可能的用途,以提高数据的利用率。当然,数据的使用并不是无限的,而且时间效应和环境的变化肯定会对数据提出新的要求,所以数据的折旧也应该考虑。
这就导致了对数据(一种无形资产)进行估价的可能性。对于facebook和twitter这样的公司来说,数据是他们的核心。如何让他们在资产负债表上得到公平的反映是我们需要考虑的问题。
大数据时代的价值链由三部分构成,我把它们简化为"生产—分析—使用"三个环节,这对应书中的三种类型公司: 第一种是基于数据本身的公司,第二种是基于技能,第三种则是基于思维。在大数据出现的早期,技能和思维是最有价值的,但笔者认为,归根结底,大部分价值必须从数据本身挖掘出来。
这假设一个成熟的市场,每个人都了解大数据的使用。
对于普通人来说,隐私是大数据时代最重要的问题。不知不觉中,个人的每一个行为都暴露在**甚至是民营企业的面前,也面临着潜在的信息披露风险。对此,笔者提出了解决用户责任的办法,而不是以往的正式授权使用。
大数据甚至可以**一个人的犯罪动机,这就给监管部门带来了**一个人是否想犯罪、惩罚与否的问题?在这方面,社会必须达成一个共识,即“个人只需对其行为负责,而不是对其动机负责”。
大数据时代的风险控制靠的是"算法师",类似会计师一样的职业,对大数据的准确度或有效性进行鉴定。这在一定程度上可以防止数据滥用和数据**的发生。今天的法律也需要对大数据监管进行修正和补充。
如今的大数据发展主要是由科技公司推动的。相信在不久的将来,更多的传统领域会认识到大数据的重要性。但我们也应该保持清醒。大数据不是灵丹妙药。对于某些领域或链接,使用大数据是一个简单使用的选择。但对一些地区来说,盲目使用大数据只会适得其反。
⧈ 大数据读后感
1买回来看完的感觉是平平而已。个人看法,在五分制下,大概也就是最多打三分。这本书可以买来读。比较完整全面。有很多情况。具有一定的参考意义。写ppt和吹牛是有用得,但没有什么重大意义。
很多观点不能同意。
一、主要观点上可以探讨的地方
作者提出了关于大数据的“掷地有声”的三个原则。这三个原则凡讲大数据必被提及,很多人奉为圭臬。但是我觉得每一点都值得探讨。
这三点是:不是随机样本,而是全部数据;不是准确性,而是混合性;不是因果关系,而是相关性。
看完之后感觉都有点不是那么回事。
1.不是随机样本,而是全体数据
这个说得好像人类从来就不知道使用全体数据可以得到更全面的结论,而非要去煞费苦心发展出一套抽样技术一样。人类早就知道处理全尺寸数据的好处,而进行抽样分析的原因无非是两个原因:一是处理能力跟不上数据采集能力。
作者认为人类之前主要受限于数据的处理能力而不去处理全量数据,但在目前机器处理能力有了巨大的提升的时代,限制绝大多数应用的瓶颈不是计算能力而是数据采集能力(不要去提那些极少数需要超级计算机的场合,那个和多数人无关、和本书的商业主题也无关)。但是即便如此,抽样所要针对的很多应用场景是不太可能收集全量数据的情况。比如人口普查,不管计算机有多强大,目前仍有很多数据需要人工采集,所以这次人口普查仍需要抽样进行。
有意思的是,作者用人口普查是抽样分析来说明非“全量”时代我们被迫采用了抽样,而最终也没法说我们是否已经可以用全量数据来做人口普查了。事实上,至少就目前而言,抽样仍是人口普查的必然选择(好吧,你可以想象,未来每个人都会安装芯片,你可以在ppt中告诉你的客户和老板)。再比如我们统计里的经典问题:
怎么估算一批零件的使用寿命?怎么去分析一批奶品里的三聚氰胺?在过去,我们不能做一个完整的测试,因为这意味着这批零件将被丢弃,而这批牛奶将用于测试,所以测试结果是没有意义的(嗯,你也可以说:
让我们收集历史上所有这些部分的用法,以便分析。。。。好吧,来吧,雄心勃勃的索年)。现在呢,还是必须依赖抽样。
即使没有提到这些例子,也只是从逻辑上讲:收集和处理数据本身的行为不断地产生新的数据。我们又怎么证明这些数据不是你需要的“全量”的一部分呢?
作者的行文中,关于什么是“全量”,处于不断的摇摆之中。有时指“我们需要的所有数据”,有时指“我们能收集到的所有数据”。作者举了人口普查的例子,这个全量显然指前者。
而在很多商业案例中,又显然指后者。我们有能力处理越来越多的、在以前不敢想象的大量数据,但是至少目前看,我们还没不可能说我们处理了“全量”。我们最多可以说我们能处理我们能搜集到的“全量”,但如果据此产生了我们已经没有遗漏数据了的感觉,认为所有数据尽在掌握了,那我认为是一种很可能导致错误的错觉。
2.不是精确性,而是混杂性
这个么,说得好像以前的人类在使用“抽样”数据时竟然都认为取到的数据是“精确”的一样。在使用采样数据时,我们知道要容忍某些错误。我们甚至知道在就算取得了“全样”数据的时候,也可能因为有各种原因而导致的不精确,统计实践中对此有相当多的案例。
人类从来不指望我们通过数据分析得出的大多数结论是准确的。我们从来都要在信息混杂的情况下做出大多数的决策。
3.不是因果关系,而是相关关系
这是许多人(包括作者)认为的最有价值、最有意义的发现,但实际上也是最收批评的观点。就连翻译周涛教授也在前言中说,他不能继续下去了。至于他,他认为如果他放弃因果关系的分析,那将是人类的堕落。我不想谈这么高层次的哲学,只想从逻辑和技术的角度来讨论。
计算机能给我们的结论(到目前为止,在可预见的将来)都是相关的。计算机从未提供过明确的因果关系给人类。因果关系是否是基于数据的人类判断。
已经有相当多的应用,但也只是考虑相关性,而不是因果关系:确定因果关系需要更多的精力和投资。所以只看相关性而不看因果性也不是什么新的结论(实际上已经是个很旧的结论了)。
而这个相关性是不是可以作为决策的基础呢?这个一样离不开人的判断。有一个这样的故事:
通过大量的数据分析,慈善组织得出结论:一个国家、地区的电视机的普及率与发达富裕程度很有关系(冰箱、洗衣机、空调、高跟鞋、牛仔裤,etc.,也会和发达程度有这样的相关性),于是他们就向贫困国家赠送了很多电视,认为此举可以促进改过的经济发展。
可以说,电视的普及与经济、文化息息相关,但是实上,经济的发展更可能导致电视的普及,反之亦然。所以,我们真的不需要因果分析吗?说得玩笑一点:
这个世界真的不需要脑子了吗?
作者举了一个例子:google分析搜索关键字,以确定流行病可能发生在哪里。认为这就是利用了相关性而不是因果性。
这是没有利用因果判断吗?现在,在投资巨大的机器资源进行分析之前,分析人师已经**,疾病的症状可能会导致人们上网搜索(影响搜索行为)。谷歌存储的用户上网信息肯定远远不止一个搜索关键字,分析师为何不开足马力把“全量”数据、各个指标都分析一遍呢?
比如用户上网地点?上网时间?上网频率?
上网语言?浏览器版本?客户端操作系统?
等。。。为什么它会像导弹一样把机器资源放在关键词上?
总之,为了展示新的思想,作者对这些原则过于绝对。而排除掉绝对的成分后,这些观点也就不显得是创新了。作者把三个数据分析人员一直秉持的原则,当做全新的东西讲了出来。
时代在变,我们应该经常重新审视这些原则,以确定我们的思想是僵化的还是过时的。我同意作者重新审视这些观点,但我认为没有必要这么做。
二、细节论据上可以探讨的地方
除了三大原则不够令人信服外,在一些细节上,笔者的引用也不是很严谨。
如第51页,对于拼写检查的算法的优化。作者提到,通过输入大量的数据,四种常用的语法检查算法的准确性有了很大的提高,说明大数据起到了一定的作用。这是一个很有启发性的例子,可以进一步分析和研究,但是
仅仅4个例子,够得出很有力的结论吗?4个算法,作者没注意到这是一个非常小的样本吗?不能因为这是4个用了大数据的采样,就认为这是一个支持大数据的有力结论了吧。
(顺便问一下,我想问他们:为什么不测试几十个几百个算法呢?是不是面对如此“大量”的计算,也只好折中选择了一个抽样的小样本呢?
甚至连样本数量是否合格都不顾上了吗?)
三、这本书有什么用处?
对于这样一本书,我不明白周涛教授为什么在前言中建议你每本买一本。为什么要买?难道作者理清自己脑子的过程很值得我们关注吗?
译序里说:“作者渴求立言立说的野心”,但是我恐怕作者是达不到这个目标的。关于作者的简介为:
“《大数据时代》是国外大数据系统研究的先河之作,本书作者维克托·迈尔·舍恩伯格被誉为‘大数据商业应用第一人’,....早在2010年就在《经济学人》上发布了长达14页对大数据应用的前瞻性研究。”
总的感觉是作者有很多想法,看过很多案例(这些案例在书中有丰富的反映,也有参考价值)。但并不是一个人真的在与数据搏斗(这是我的猜测,我还没有证实他的经验)。请不要告诉考生他做过哪些咨询案例,这远没有真正体验到数据的折磨。
)。第183页说道:“...执行官们信任自己的直觉,所以由着它做决定。
然而,随着管理决策越来越受到**分析和大数据分析的影响和控制,依靠直觉决策的局面将彻底改变。..."真的会么?如果你面对某一家企业做咨询,那可以这样讲。
采用一项新技术有可能大大提高企业的战斗力,超越竞争对手。但作者是希望与业界对话的人。面对整个社会,我们这样做并不严谨。引用一个例子:
在中国国际象棋学院的一次训练会后,主教练马晓春对第二天要去各自主队参加围攻的队员们说:祝大家周末都能赢。棋手们笑了:
我们只有一半的人能赢啊。同样,如果每个人都采用大数据技术,那么总会有企业在竞争中落后。而既然我们实际上无法真正分析“全量”数据,那ceo们还是会有很大的决策空间,哪怕很多决策实际上“不科学”。
最起码,他们需要决定将有限的企业资源投入到对什么样的大数据进行分析,并如何应用分析出来的结果。嗯....我认为,这多少还是要依赖一些直觉的。
那么大家是否应该看一下这本书呢?我的答案是应该看一看。既然大数据是当前的潮流、相关的研究/商务活动层出不穷,那么做it工作、数据工作的人对于“最好的”专著无论如何都必须看一下。
书中集中展示了很多案例,值得作为参考和启发思维。此外,为了作为谈资、为了在写大数据ppt时有所依据,大家也得看看这本书。根据不同情况,可以对内容进行复制、粘贴、理解和重写。
这些内容,我相信买一版也就够了。需要提醒ppt人员的是,演示前请想清楚如何回答可能被提及的质疑。
2今天看完了舍恩伯格的《大数据时代》。如果抛开对翻译人员的赞誉不谈,我会说,这本定价50元、介绍互联网前沿趋势的书,价值不大,其中的一些例子在我看来不能完全归因于大数据领域。
舍恩伯格提到的三个趋势中的前两个我倒是非常赞同:
1.样本渐趋于总体;
2.精确让位于模糊;
至于第三点,“关联比因果更重要”,这与周涛教授的观点是一致的,我不太同意。作为一个理工科学生,我相信一切事物背后都有原理,人类终究是要找到并且搞明白世界之所以如此运行的原因的。否则,科技发展到后来,岂非变成了巫术一般的存在?
当然作者在文中提到了人类有急于寻找因果性的冲动,而有时候找到的所谓「因果」也并非真正的因果。表面理性的人常常被非理性所迷惑,满足于想当然的解释。在这种情况下,片面甚至错误的因果性还真的没有相关性靠谱。
但我们也不可忘了,相关性始终只是暂时的途径,我们的终极目标还是因果性,否则,人之为人的一项根本属性就不存在了。
这本书的另一个值得称赞的地方就在于作者作为大数据的倡导者,并没有一味大加褒扬,而是深刻洞察到了新的技术趋势会带来哪些问题。诸如个人隐私和数据**等在数据主导时代可能发生的严重后果,作者都给予了足够的考虑。并且难能可贵的是,针对未来可能出现的危机,舍恩伯格还给出了具有建设性的应对之道——看了他的个人履历后,你不得不佩服这样一位在技术和公共政策都具有独到见地的跨领域专家。
3两年前,还是社会学专业的我最喜欢翘的课叫做”社会统计学”,与其听着传统死板的抽样调查与回归分析,我更喜欢和一个做数据挖掘的数学系同学四处溜达。“数据挖掘(data mining)是什么?”她跟我举了一个最简单的例子:
“沃尔玛通过对超市里人们购买行为的大量数据分析,发现男人们来买啤酒的时候,通常也会买尿布。这样的发现就让超市将尿布和啤酒摆放在一起出售,从而提高利润。”
“严谨的社会学训练”让我几乎在当时就开始思考“为什么?”“尿布和啤酒的销售量为什么会有关联呢?是因为男人们买啤酒的时候,会‘顺便’购买尿布?
还是因为买“尿布”的时候会联想到‘’啤酒’?”——这使我立刻意识到在社会科学的学习中,因果关系已经成为了一种极其普遍的范式——甚至夸张一点说,所有社会科学的研究都只是为了解答一个问题——“为什么?”它面向过去,面向所有已经发生的事实,试图通过信息收集和逻辑假设来说明一个道理:
”人类社会中**事情的发生,是因为**及**因素的作用。“
我意识到,这与《大数据时代》中所提出的”大数据思维“的三个层面正好截然相反:
1、不是因果关系,而是相关性。大数据思维只关注”相关性“,而不再关注因果关系。也就是说,沃尔玛知道尿布和啤酒、手电筒与pop-tarts蛋挞的销量具有正相关性,就足够做出将两个物品摆放在一起销售的决策了。
它并不需要去分析原因,因为只要知道这件事情”正在发生“或者”即将发生“,企业就完全能够做出正确的决定。
2、“样本=全部”——不是随即样本,而是全部数据。《大数据时代》也对传统意义上的统计学构成了冲击。在这样一个我们有足够强大的数据搜集和数据处理能力的时代,样本不再是万分之一,而转变成了”样本=全部“,样本,就是万分之一万。
传统意义上的统计学的随机抽样方法中有一条极其明智的真理:”采样分析的精确性随着采样随机性的增加而大幅提高,但与样本数量的增加关系不大。”可以说,“样本分析”奠定了绝大多数科学研究的基础。
而大数据时代,全数据分析的模式将全面替代“样本分析方式”。正如《魔鬼经济学》(freakonomics)中,作者关于相扑运动员的研究,其创造性的观点正式通过使用了11年中超过64000场摔跤比赛的全数据记录来寻找到了异常性。这样的洞见,恰恰是样本分析所无法提供的。
3、不是精确性——而是混杂性。数据量的显著增大也必然会让我们付出一些代价——一些不准确的数据会混入数据库,结果也可能不准确。这就是大数据时代的另一种思维——“不是精确性,而是混杂性”。
对“小数据”而言,最重要的要求就是减少错误。而在大数据的采集里,在技术尚未达到完美无缺之前,混乱是无可避的。虽然我们得到的信息不再那么准确,但收集到的数量庞大的信息让我们放弃严格精确的选择变的更为划算。
从谷歌翻译系统中可以看到,它收集了上万亿的语料库,来自未经过滤的网页内容,可能会含有不准确的用法、语病,未必每一条语料库都非常“精确”,然而这个语料库是布朗语料库的几百万倍大,这样的庞大规模优势完全掩盖了它的缺点。也就是“大数据的简单算法,比小数据的复杂算法,更加有效”。
总体而言,大数据时代透露出三个特征——更多、更杂与更好。它面向未来,要做的事情是关于“**”。正如作者所说"大数据要求我们有所改变,我们必须能够接受混乱和不确定性。
精确性似乎一直是我们生活的支撑,就像我们常说的‘钉是钉,铆是铆’,但认为每个问题只有一个答案的想法是站不住脚的,不管我们承不承认。一旦我们承认了这个事实,甚至拥护这个事实的话,我们离真相又近了一步。“
当我们用”物联网“去开始测量、记录、分析,世界,并将我们的世界”数字化“的时候,information technology,信息技术的变革,就将聚光灯转向了information的身上。
从三千多年前会计学的诞生开始,人们将大量的经济活动”数字化“。然而,”数字化“只是为”数据化”拉开序幕。
在google的数字图书馆中,”文字“也已经被“数据化”,人们可以检索、对比、发现不同的词组在几十年来中含义和运用的沿革。人可以阅读,机器也可以分析。
在foursquare和街旁网中,“方位”也已经被“数据化”,在我们喜爱的地方”check-in“,我们通过忠诚度计划、酒店推荐和其他计划得到好处。
在facebook或twitter的里,"沟通"也已经被“数据化”,伦敦的金融公司通过分析每天的twitter的大量数据,以作为股市的投资信号。
而更令人兴奋的是,”数据"作为一种资源,本身是一种非竞争性的资源,它的价值并不会因为被使用而减少,相反,它可能被通过不断地重复使用而产生出更高的价值。数据本身的价值,是它所有能够产生的可能选择的价值的总和。书中提到了几种数据创新:
1、数据再利用。数据的运用者常常不是那些拥有大量数据的机构,却是那些恰好可以用这些数据来支持其商业模式的机构,这就是“再利用”
2、重组数据:将多个数据集的总和重组在一起时,充足总和本身的价值也比单个的总更大。丹麦的癌症研究就是将所有的癌症患者和手机用户的数据结合起来,从而揭示两者是否有关联性——幸运的是,全数据显示并无关联。
3、可扩展数据。譬如,零售在店内安装的监控摄像头,不仅能认出把手,也能跟踪经过商店的客户流和他们停留的位置。
4、数据的折旧值:随着时间的退役,大部分的数据都会失去一部分基本用途。然而,即使数据用于基本用途的价值会减少,但选择的价值却依然强大。
从这个角度,组织机构应收集尽可能多的使用数据,并保存尽可能长的时间,同时也应当与第三方分享数据,保留所谓的“延展性”权利。
5、数据废气:在拼写检查中,用户会有大量的错误拼写。这些数据看起来是废品,但收集在一起却能够锻造成一块闪亮的金元宝。
例如,当couresa这样的网络平台中一个班级数量超过万人时,教授发现2000个学生在作业中犯了同样的一个错误。修正后,系统将会提醒以后犯同样错误的学生。通过这些’错误“,我们改变了教育的方式。
6、开放数据:**只是收集信息的托管人,而数据应当对全球开放。
在大数据价值链上,会有三种不同的大数据公司,第一种是基于数据本身的公司,第二种是基于技能,第三种则是基于思维。从我的理解来看,第一种人,拥有金矿的矿山。第二种就是数据分析师,也可以说,拥有开采、提炼金矿的技术。
第三种则是加工金矿的人,把金矿做成金元宝、首饰,通过创新思维让数据具有商业价值。在大数据时代的早期,思维和技能是最有价值的,但作者认为,最终,大部分的价值还是必须从数据本身来挖掘,也就是说——金矿本身才是最值钱的。
然而,大数据背后带来的也是重重隐忧——从我们的隐私不断暴露,个人在网络上留下的千丝万缕的踪迹似乎让人们又回到了”老大哥在看着你“的那种担忧。”“数据统治”的登峰造极从哲学上会抹杀人的自由意志和选择的可能性,正如,基于你以前的各类数据分析,陪审团断定你以后将会犯罪。那将是人性面对技术的一次溃败。
阅读《大数据时代》的过程,总是让我不断地想起库恩《科学革命的结构和范式》。毫无疑问,大数据带来的是思维范式的根本性变革——我们将不再沉湎于历史和过去,试图解释某种联系,而是更好地觉知当下,与正在发声的未来。
4大数据这个概念现在可说是红得发紫,有谣传说连**的大领导们都上了大数据的贼船,寻思着要从维克托迈尔舍恩伯格的《大数据时代》中学习如何治国理政。
笔者却对大数据充满了吐槽的欲望,部分是因为笔者曾经遇到过一位大数据的狂热鼓吹者,名言是“是不是科学就看有没有大数据,有大数据就是科学,没有大数据就不是科学,”以及“我觉得宇宙应该是什么什么样的,这样比较符合我的审美。”笔者觉得此人实在是个妄人,手里有把锤子就把一切都当成钉子……
笔者也读过维克托迈尔舍恩伯格的《大数据时代》,也并不认为大数据全都是胡扯——大数据肯定是有用的,不过有些鼓吹者恐怕吹得有点过了。而且,大数据还是个出现没两年的新领域,今天认为确凿无疑的东西明天也许就会被发现是错误的。
笔者也读过一些吐槽大数据的文章,比如纽约时报专栏作者大卫布鲁克斯(david brooks)的《大数据不能做什么?》大卫布鲁克斯说,大数据不懂社交。数据分析擅长于分析社会关系的数量而非质量。
社交网络的数据科学家可以分辨出6个你的同事,你一天中有76%的时间会见他们。而却很难发现你一个一年只见两次面的童年伙伴。更别说发现像但丁对贝特丽丝的爱情那样,只见过两次面就深爱上对方的情况了。
这说明并非所有的信息都能被大数据所利用。大数据会忽略很多信息,有时还是十分重要的信息。
与之类似的是,大数据不懂得背景。我们说一句话究竟是认真的还是开玩笑,是为了表达愤怒还是善意,这些都要放在复杂的背景中来理解,数据分析很难搞清楚这些。
第三,大数据会带来大量毫无意义的伪相关。有人说,现有的数据,多的可以让你想要分析出什么结果,就能分析出什么结果。想像一下,如果领导们发现冰激凌的销量和****件的数量呈正相关会怎么样?
随着数据的增长,这种伪相关将呈指数级增长。
第四,大数据不能处理真正的大问题。大卫布鲁克斯说,如果你想看一下哪些邮件对推广活动最有效,你可以进行随机抽取对比组样本。进行比较。
可是,如果我们想模拟一个衰退期的经济体。我们没办法去找这样的一个对比组。我们经常会看到人们争论什么是最好的经济刺激政策。
而我从来没有看到争论的双方能够用数据分析说服另外一方的。而治理国家所面对的恰恰是这些大问题。另一方面,大数据也不擅长**小概率事件,像**什么时候会发生**,什么时候会发生恐怖袭击,什么时候会发生革命这种事,数据分析是无能为力的。
第五,数据偏爱潮流,忽视创新——这对领导们来说倒是无所谓的,因为领导们本来就不想要创新。创新对官僚体制来说是件很糟糕的事,有创造力的官僚体制往往会把自己搞垮掉。
最后,原始数据其实并不原始,原始数据往往会被扭曲。对领导们来说,他们所面对的一大问题就是:他们不可能一边封网一边还能收集到真实客观的原始数据。
封网和收集真实数据是彼此矛盾的。封网本来是想欺骗别人,最后却可能只是骗了自己。
上面是大卫布鲁克斯的吐槽和笔者的评论。笔者也有自己的话要说,主要是关于大数据中不管因果只看相关的数据分析方法。
《大数据时代》说,我们知道什么药能治什么病就足够了,不必知道为什么。从这句话中,我们可以看出该书的作者对因果关系的理解有误:统计学上说知道因果关系是指我们高度确定(>95%)某一件事导致了另一件事的发生,而不是说我们知道这种关系背后的原理。
换句话说,我们说某药能治某病,这本身就是一种因果关系,无论我们是否知道治病的原理。如果二者之间只有相关关系,我们恐怕就只能说些类似“某种药物的摄入量与某种疾病的发病率之间存在负相关”的话。
因果关系还是相关关系,对我们来说有什么区别吗?区别就在于如果我们只知道两组数据(例如冰激凌销量和****件数量)之间存在相关,那么我们或许可以利用这种相关(例如一旦发生****件就赶紧推车上街卖冰激凌),但是如果想要改变现状,恐怕还是需要知道因果关系才行(禁止冰激凌就能够把****件消灭在萌芽状态吗?谁知道?!
只知道相关关系并不能保证这一点)。企业一般只需做到前者就能赚到钱,可是想要管理社会的话,只知道相关大概是不够的。
说到底,大数据是一座矿山,我们能够从中挖到些什么东西是不确定的。对企业来说,只要挖到了东西,赚到了钱,它们也就满意了;如果什么都挖不到,它们也只能怪自己运气不好。但是如果**想要大数据给它提供“不发生任何意外事件”的安全保证,那么这种保证恐怕是大数据无法提供的。
另一方面,大数据也解决不了官僚体制内部沟通不畅、派系斗争和动机缺乏等等问题。
最根本的问题恐怕还在于**的脆弱性:**想要稳定,因为变化几乎肯定会对它有害;而市场拥抱变化,因为它总是能够从变化中获益。这两种不同的心态或许决定了数据所能给它们带来的意义。
5 第一部分:精彩句子赏析
第1句:世界的本质就是数据。(pⅴ)
感悟及喜欢的原因:现今的我们正处于一个时代转型中,有谁会想到富士、柯达胶卷这样的百年企业会被时代所淘汰,因为科技的发展与互联网的日益强大,数据将逐步取代旧事物,创造出新事物。
第2句:这是当今社会所独有的一种新型能力:以一种前所未有的方式,通过对海量数据进行分析,获得巨大价值的产品和服务,或深刻的洞见。(p4)
感悟及喜欢的原因:数据可以反映出很多项指标,特别是海量数据的处理下,如何挖掘获得价值更是需要一种具有新型的复合能力人才,而得以用数据改变对世界的认知、改变市场、改变关系。
第3句:大数据的核心就是**。(p16)
感悟及喜欢的原因:以前单纯依靠人类判断力的领域都会被计算机系统所改变甚至取代,运用大数据的处理与分析,为我们的生活创造出前所未有的可量化的维度。
第4句:大数据是指不用随机分析法这样的捷径,而采用所有数据的方法。(p39)
感悟及喜欢的原因:“总体=样本”以前是做不到的,现在对于数据的储存、处理能力、统计技术与数据资源等各方面都有了飞速的发展,信息总量的变化也导致量变到质变的飞跃,并在其中去捕捉随机抽样所无法揭示的细节。
第5句:要想获得大规模数据带来的好处,混乱应该是一种标准途径,而不应该是竭力避免的。(p60)
感悟及喜欢的原因:处理海量数据会不可避免地导致部分信息的缺失,错误并不是大数据固有的特性,而是一个亟需我们去处理的现实问题。目前,我们正经历着从数据的精准性到总体即样本的关注焦点转变,分析其多样式与相关关系是这种缺陷的弥补方法。
第6句:局限于狭隘的小数据中,我们可以自豪于对精确性的追求,但是就算我们可以分析得到细节中的细节,也依然会错过事物的全貌。(p66)
感悟及喜欢的原因:寻找数据间的关联并利用,才是大数据超过小数据时代的真正价值。
第7句:大数据的相关关系分析法更准确、更快、而且不易受偏见的影响。建立在相关关系分析法基础上的**是大数据的核心。(p75)
感悟及喜欢的原因:只用知道是什么,不用知道为什么,相关关系帮助我们更快、更好地了解了这个世界。
第8句:数据化是指一种把现象转变为可制表分析的量化形式的过程。数字化指的是把模拟数据转换成用0和1表示的二进制码。(p104)
感悟及喜欢的原因:计量和记录一起促成了数据的诞生,它们是数据化最早的根基。数字化带来了数据化,但是数字化无法取代数据化,因为数字化是把模拟数据变成计算机可读、可处理的数据,和数据化有本质上的不同。
第9句:**给我们知识,而知识赋予我们智慧和洞见。(p117)
感悟及喜欢的原因:虽然数据的使用还远未成熟,但是从潜在的数据中挖掘出巨大的价值,然后揭示出新的深刻洞见,是我们思维方式的发展,同时也是智慧的开启。
第10句:“现实挖掘”这里指的是通过处理大量来自手机的数据,发现和**人类行为。(p118)
感悟及喜欢的原因:麻省理工学院**实验室通过分析每个人去了哪里、见了谁,成功地区分出了感染了流感的人群,而且在感染者还完全不知道自己已经患病之前就做出了区分。比如,伊格尔通过研究关注家庭主妇平均每周去几次洗衣店,来试图回答疾病如何传播和城市如何繁荣。
再比如twitter通过创新,让人们能轻易记录以及分享他们零散的想法从而使情绪数据化得以实现。这种种都说明,通过读取、分析数据,我们可以找出很多相关关系,让我们对世界、对生活有更深刻的理解。
第11句:将世界看作信息,看作可以理解的数据的海洋,为我们提供了一个从未有过的审视现实的视角。它是一种可以渗透到所有生活领域的世界观。(p126)
感悟及喜欢的原因:随着时代的发展,数据逐渐可以量化一切。数据的价值也从最基本的用途转变为未来的潜在用途。
另外数据不同于物质性的东西,它的价值不会随着它的使用而减少,而是可以不断地被处理、再利用,挖掘出更大的未来价值。
第12句:数据的潜在价值有三种最为常见的释放方式:基本再利用、数据集整合和寻找“一份钱两份货”。而数据的折旧值、数据废气和开放数据则是更为独特的方式。(p135)
感悟及喜欢的原因:通过数据处理、创新再利用来发挥出现实价值,如搜索关键词、推荐引擎、**住宅的价值、设计店面的最佳布局、判断营销活动的有效性等等,从战争中学习战争,从数据中学习数据。
第13句:他们思考的只有可能,而不考虑所谓的可行。(p166)
感悟及喜欢的原因:内行与外行最大的区别在于思维不受限,它让思维方式有更好的延展性、多样性与丰富性。
第14句:一旦得以有效利用,大数据就可以变革公司的赢利模式和传统交流方式。(p170)
感悟及喜欢的原因:大数据的利用,可以重新定位生产商与供应商的关系;可以通过商品本身收集数据并传回制造商进行研究与开发;可以通过用户交互提高服务;当文字变成数据,不仅人可以用之阅读,机器也可用之分析……充分说明,第一,个人也好,公司也好,都需要与时俱进;第二,大数据的多样性有待于更全面的开发,更好地服务于人们的生活。
第15句:大数据公司的多样性表明了数据价值的转移。(p176)
感悟及喜欢的原因:随着数据价值转移到数据拥有者手上,传统的商业模式同时也被颠覆了。数据不仅能够优化生活和服务,甚至还能催生新的行业,催生新时代的人才。
第16句:行业专家和技术专家的光芒都会因为统计学家和数据分析家的出现而变暗,因为后者不受旧观念的影响,能够聆听数据发出的声音。(p180)
感悟及喜欢的原因:学会聆听数据发出的声音,第一需要与时俱进,跟上时代进步的步伐。第二改变了我们怎样看待知识的价值。
第三了解到,如今不只是专业技能的深度很重要,大数据的广度也变得很重要。
第17句:卓越的才华并不依赖于数据。(p212)
感悟及喜欢的原因:大数据的风险是数据主宰一切的隐忧,但是个人的直觉、对市场的敏锐度等独特个体所展现出来的才华同样重要,它所呈现出来的强有力的创造力不亚于大数据。
第18句:变革并不止于规范。(p219)
感悟及喜欢的原因:大数据的运作是在一个超出我们正常理解的范围之上的。大数据需要被监测并保持透明度,加上使这两项得以实现的新型专业技术和机构。
我们要发展,就必须先有其规模,在规模中去寻找规范的操作手法,才能让变革立于不败之地。
第19句:莎士比亚曾写道:“凡是过去,皆为序曲。”(p244)
感悟及喜欢的原因:过去的每一点每一滴是为明天的开始打下坚实的基础,一贯如是地坚持下去才有效力。
第20句:大数据提供的不是最终答案,只是参***,为我们提供暂时的帮助,以便等待更好的方法和答案出现。(p247)
感悟及喜欢的原因:大数据是一种资源,也是一种工具,这里引用一句话“混乱构成了世界的本质,也构成了人脑的本质,而无论是世界的混乱还是人脑的混乱,学会接受和应用它们才能得益。”
第二部分:读后感
这本书解释了我们正处于大规模生产、分享和应用数据的时代,告诉我们如何科学的应用大数据,开启新的思维模式,新的生活方式与新的工作形态,以应对正在发生着的利益与风险。
★大数据开启了一次重大的时代转型。
⧈ 大数据读后感
沂源四中田玉才
有人说生活像一团乱麻,剪不断理还乱;我说生活像一团乱码,尽管云山雾罩惝恍迷离,最后却总会拨云见日雨过天晴。维克托迈尔舍恩伯格就把这团乱码叫做大数据,在他的这本书里,试图给出的就是拨开云雾见青天的玄机。这玄机说来也简单,就是放弃千百年来人们孜孜追求的因果关系转而投奔相关关系。
说来简单,其实却颠覆了多少代人对真理探求的梦想。我认为作者是一个典型的实用主义者。在美帝国主义的压迫和洗脑下,他始终追求成本效益和利益最大化,甚至放弃了追求共产主义真理的最基本要求!这不像我们从小就在中国之光的影响下开始学习和追求纯粹的共产主义理想主义的科学、历史和文化知识!
这也许是我们永远无法获得诺贝尔奖、站在科学技术前沿的根本原因。事实上,在我上小学的时候,我就想过这个问题。我相信所有人都问过类似的问题。比如,现在很多人还在问,妈妈从来不知道我每天摆摊赚多少钱,你怎么计算4500的人均收入。中国是样本的代表,因为中国人最喜欢代表整体。最典型的例子是,公布的幸福指数满意度指数总是高于你的预期。你不直到他是怎么来的,直到最后总结成三个代表,真的不直到它能代表什么。
说这么多显得自己是个愤青,其实只是想表达“样本=总体”这个概念在科技飞速发展的今天,在世界的不同角落,还是会体现出不同的价值,受到不同程度的对待及关注。在大数据概念的冲击下,我们真的需要把注意力从事物的内在发展规律转移到事物的客观发生上吗。
大数据的出现必将对许多领域产生巨大影响。一些行业在未来十年将迅速发展,而另一些行业可能会消失。这是废话,典型的三十年河东三十年河西的道理,就像三十年前的数理化王子们,现在可能蜷缩在某工厂的小角落里颤颤巍巍的修理机器;就像三十年前职业高中的学生才学财会学银行,如今这帮孙子一个个都开大奔养小三攒的楼房够给自己做墓群的了;当然也不乏像生物这种专业,三十年前人们不知道是干啥的,三十年后人们都知道没事别去干,唯一可惜的是我在这三十年之间的历史长河中却恰恰选了这么一个专业,这也是为什么我现在在这写读后感而没有跟姑娘去玩耍的原因。实际上,乍一看,我想到了精益生产的过程控制,比如六西格玛。这实际上是通过对所有数据的分析来预测产品质量的变化,这是大数据的具体应用。
而任何事物都会有偏差,会有错误,也就是说,这全部的数据中,肯定是要出现很多与总体反应出的规律相违背的个体,但是无论如何这也是该事件中一般规律的客观体现的一种形式,要远远好过从选定的样本中剔除异常值然后得到的结论。也就是说,它也大大降低了排斥对事物客观规律表达的影响。就好比是统计局统计中国人民的平均收入一样,这些数怎么这么低啊,这不是给我们国家在国际社会上的形象抹黑么,删掉删掉;这些数怎么这么高啊,这还不引起社会不满国家动荡啊,删掉删掉。
所以说,大数据至少对反应客观事实和对客观事实做预测这两个方面是有非常积极地意义的。这个新兴产业所蕴含的商机,不仅在于如何使用数据,更在于如何获取数据。
-
需要更多的大数据读后感网内容,请访问至:大数据读后感