细细品味一本名著后,相信你心中会有不少感想,这时就有必须要写一篇读后感了!那么你真的懂得怎么写读后感吗?这次为您整理了读《大数据时代》有感【优秀6篇】,希望大家可以喜欢并分享出去。
咋一看题目,最初的想法是数据只不过是人们在日常工作过程中产生的那些数据,而大数据无非就是数据量庞大,在我们日常处理的数据类的基础上上一个台阶,仅此而已。
我的这个想法无疑是天真的,简单的就像一个孩童刚刚学会咿呀学语,完全不知道语言的广博和意义的深刻。读罢此书,虽说谈不上能跟上作者那天马行空的思想境界,但也简单地总结一些读书的心得,以求得一定的学习成果,便于打开自己的眼界,拓展自己的思维方式。
大数据开启了一次重大的时代转型。它和望远镜、显微镜一样,能客观上改变我们对世界的认知,并从其他多种角度让我们了解精彩纷程的世界。在过去十几二十几年的时间里,大数据不仅改变着公共卫生、商业,更重要的是正改变着我们的思维,使我们能从全新的思维出发去感知、去洞见未来,这无疑是大数据最有价值所在。
大数据时代的到来,正在改变着我们的思维模式。以下三个部分的应用证据,说明我们正在经历着这样的`与以往不一样的变革,这种变革将打破传统思维的束缚,向着更高更复杂的层面演进。
第一,大数据强调认为,不是随机样本,而是全体数据。我们知道,对历史数据进行研究的初衷,是我们想得出历史数据之间的运行变化规律,进而能更精确地推测数据未来的走向,以求对未来发展的事项进行能动的控制。那这里所认为的全体数据,到底什么才是全体数据呢?究竟是“我们需要的全体数据”,还是“我们能收集到的全体数据”,亦或是“我们认为的全体数据”,每个人对数据集合的范围可能存在不同,在某种情况下,个别选定的“全体数据”可能也是局部数据,甚至可能是随机数据。只是数据的广度范围、精细程度可能存在不同而已。因此,大数据选认定的全体数据仍然是一个相对的概念,是相对于传统的随机样本而提出的,但是,其数据量、质都与传统随机样本具有本质区别,这将导致得出与随机样本完全不同的结论。现代计算机技术的发展解决了巨大数据运算的各种问题,使我们得出问题的结论更贴进于事物的本像。
第二,大数据强调认为,不是精确性,而是混杂性。书上讲,执迷于精确性是信息缺乏时代和模拟时代的产物。需要加工的数据可能只5%是结构化式的,其他95%部分需要通过加工,或组合、或移动、或裁剪等加工方式,加工成适合我们利用的方向,最终将在加工的数据之上进行分析,得出结论。由此得出待加工的原始数据具有混杂性,而非精确性,以前传统分析是这样,现在大数据下更亦如此。另一个层面,指的是加工出来的数据的精确性,这个就需要人为定义了。提出“精确”这个概念,是基于有相对容差数据的,即大数据如何控制或者说评定“输出品质”。一个东西要出故障,不会是瞬间的,而是慢慢地出问题,通常,我们需要找到问题的几个关键点,进行监控,我们才可能可以预测未来。在这过程之中,设定监控问题越精密,监控的效果越好。如果我们容忍混杂性程度越高,可能效果越不尽理想。
第三,大数据强调认为,不是因果关系,而是相关关系。在大数据时代,知道“是什么”就够了,没必要知道“为什么”。我们不必非得知道现象背后的原因,而是要让数据自己“发声”。这是区别于以往思维方式的最重要的事项之一,想想过去,言必出,行必果,感觉这个言行必须要因果结果,没有因,就没有果,同样,没有果,原因也没有存在的必要和意义。大数据时代拓宽了看待事物的层面,从各个角度去看问题,之前的因果关系被弱化,甚至无关紧要,从相关的角度去度量、预测事物的发展、内源等取向,则会得到无数条通往事物发展方向的道路,势必将使事物呈现更加立体、更加多源的格局,使我们更清楚地认识事物或现象的本质。那么如何在大数据时代运用相关关系“开发”事物或现象更多层面的发展或内源供人们利用呢?找到关联物,是运用大数据进行有效预测的关键。相关关系的核心是量化两个数据值之间的数理关系,相关关系强是指当一个数据值增加时,另一个数据值很有可能也会随之增加,而相关关系弱是指当一个数据值增加时,另一个数据值几乎不会发生变化。当然,严格地讲,即使没有相关性,另一个数据值也可以大幅变化,只是没有趋势可循罢了。相关关系是通过识别有用的关联物来帮助我们分析一个现象,而不是通过揭示内部的动作机制。通过给我们找到一个现象的良好的关联物,通过计算机的大量运算,相关关系可以帮助我们捕捉现在和预测未来,而且分析数据更加准确、更快,不易受偏见的影响,这点非常重要。因此,建立在相关关系分析法基础上的预测是大数据的核心。
以上三人方面的“应用证据”在商业变革、管理变革方面普遍运用,百且取得了意想不到的效果,开拓了想象的“蓝海”、管理更趋多元,手段更加精准和独到。
但是大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然是无法被完全取代的。大数据为我们提供的不是最终答案,只是参考答案,人类在众多参考答案的基础上,运用自己对现象的“职业判断”,得出更靠谱的方法和答案,并在实践的检验下,越趋完善的方法和答案反过来又作为充斥大数据成员的一部分,使大数据构架基础更加科学并充分展示事物的性质,以方便我们随时获取。这是一个没有终点,循环往复的不断进化的过程。
这本书介绍了大数据时代来临后,接踵而至的三项变革——商业变革、管理变革和思维变革。
其实,这场变革已经打响。商业领域由于大数据时代的到来而推陈出新。前几年,一家名为farecast的公司,让预订到更优惠的机票价格不再是梦想。公司利用航班售票的数据来预测未来机票价格的走势。现在,使用这种工具的乘客,平均每张机票可以省大约50美元,这就是大数据给人们带来的便利。
大家应该都知道2009年出现的h1n1型流感,就拿美国为例,疾控中心每周只进行一次数据统计,而病人一般都是难以忍受病痛的折磨才会去医院就诊,因此也导致了信息的滞后。然而,对于飞速传播的疾病,google公司却能及时地作出判断,确定流感爆发的地点,这便是基于庞大的数据资源,可见大数据时代对公共卫生也产生了重大的影响!
在我看来,如果想在在大数据时代里畅游,不仅要学会分析,而且还要能够大胆地决断。
在美国,每到七、八月份时,正是台风肆虐之时,防涝用品也摆上了商品货架。沃尔玛公司注意到,每到这时,一种蛋挞的销售量较其他月份明显增加。于是,商家作了大胆的推测,出现这样的结果源于两种物品的相关性,便将这种蛋挞摆在了防涝用品的旁边。这样的'举措大大增加了利润,这就是属于世界头号零售商的大数据头脑!
大数据时代的`到来,可以让我们的生活更加便利。但是,如果让大数据主宰一切,也存在一定的风险。
大家应该都知道电子地图,它可以为人们指引方向。但大家应该还不知道,它会默默地积累人们的行程数据,通过智能分析可以推断出哪里是自己的家,哪里是工作单位。我们的隐私就这样被不为人知地收集着。
大数据时代的到来,让我们的生活更安全,更方便,但与此同时,我们的隐私不再是隐私,数据的收集变得无所不包、无孔不入。世界已经向大数据时代迈进了一小步,一个崭新的时代正向我们走来。让我们用知识武装大脑,做好准备,迎接新时代的到来!
读了《大数据时代》后,感觉到一个大变革的时代将要来临。虽然还不怎么明了到底要彻底改变哪些思维和操作方式,但显然作者想要“终结”或颠覆一些传统上作为我们思维和生存基本理论、方法和方式。在这样的想法面前,我的思想被强烈震撼,不禁战栗起来。
“在小数据时代,我们会假象世界是怎样运作的,然后通过收集和分析数据来验证这种假想。”“随着由假想时代到数据时代的过渡,我们也很可能认为我们不在需要理论了。”书中几乎肯定要颠覆统计学的理论和方法,也试图通过引用《连线》杂志主编安德森的话“量子物理学的理论已经脱离实际”来“终结”量子力学。对此我很高兴,因为统计学和量子力学都是我在大学学习时学到抽筋都不能及格的课目。但这两个理论实在太大,太权威,太基本了,我想我不可能靠一本书就能摆脱这两个让我头疼一辈子的东西。作者其实也不敢旗帜鲜明地提出要颠覆它们的论点,毕竟还是在前面加上了“很可能认为”这样的保护伞。
近几十年,我们总是在遇到各种各样的新思维。在新思维面前我们首先应该做到的就是要破和立,要改变自己的传统,跟上时代的脚步。即使脑子还跟不上,嘴巴上也必须跟上,否则可能会被扣上思想僵化甚至阻碍世界发展的大帽子。既然大数据是“通往未来的必然改变”,那我就必须“不受限于传统的思维模式和特定领域里隐含的固有偏见”,跟作者一起先把统计学和量子力学否定掉再说。反正我也不喜欢、也学不会它们。
当我们人类的数据收集和处理能力达到拍字节甚至更大之后,我们可以把样本变成全部,再加上有能力正视混杂性而忽视精确性后,似乎真的可以抛弃以抽样调查为基础的统计学了。但是由统计学和量子力学以及其他很多“我们也很可能认为我们不再需要的”理论上溯,它们几乎都基于一个共同的基础——逻辑。要是不小心把逻辑或者逻辑思维或者逻辑推理一起给“不再需要”的话,就让我很担心了!
《大数据时代》第16页“大数据的核心就是预测”。逻辑是——描述时空信息“类”与“类”之间长时间有效不变的先后变化关系规则。两者似乎是做同一件事。可大数据要的“不是因果关系,而是相关关系”,“知道是什么就够了,没必要知道为什么”,而逻辑学四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明确规定”任何事物都有其存在的充足理由。且逻辑推理三部分——归纳逻辑、溯因逻辑和演绎逻辑都是基于因果关系。两者好像又是对立的。在同一件事上两种方法对立,应该只有一个结果,就是要否定掉其中之一。这就是让我很担心的原因。
可我却不能拭目以待,像旁观者一样等着哪一个“脱颖而出”,因为我身处其中。问题不解决,我就没法思考和工作,自然就没法活了!更何况还有两个更可怕的事情。
其一:量子力学搞了一百多年,为了处理好混杂性问题,把质量和速度结合到能量上去了,为了调和量子力学与相对论的矛盾,又搞出一个量子场论,再七搞八搞又有了虫洞和罗森桥,最后把四维的时空弯曲成允许时间旅行的样子,恨不得马上造成那可怕的时间旅行机器。唯一阻止那些“爱因斯坦”们“瞎胡闹”的就是因果关系,因为爸爸就是爸爸,儿子就是儿子。那么大数据会不会通过正视混杂性,放弃因果关系最后反而搞出时间机器,让爸爸不再是爸爸,儿子不再是儿子了呢?其二:人和机器的根本区别在于人有逻辑思维而机器没有。《大数据时代》也担心“最后做出决策的将是机器而不是人”。如果真的那一天因为放弃逻辑思维而出现科幻电影上描述的机器主宰世界消灭人类的结果,那我还不如现在就趁早跳楼。
还好我知道自己对什么统计学、量子力学、逻辑学和大数据来说都是门外汉,也许上面一大篇都是在胡说八道,所谓的担心根本不存在。但问题出现了,还是解决的好,不然没法睡着觉。自己解决不了就只能依靠专家来指点迷津。
所以想向《大数据时代》的作者提一个合理化建议:把这本书继续写下去,至少加一个第四部分——大数据时代的逻辑思维。
广州风神焊装二科主拼A班 史伟
"大数据"听起来已经不是个新鲜词汇了,在如今这个时代,毫无疑问的是,大数据技术的应用已经充斥在我们的生活之中了。可以说,我们已经走引进了一个"大数据时代".
大数据分析极大的改变了我们解决问题的方式。所谓大数据是区别于传统的仅取原数据的少量样本进行分析的数据处理方式。大数据旨在对全部原数据进行分析与处理。但由于实际情况中的计算能力与时效性等客观条件的限制,很多时候还不能实现"真正"的大数据分析。尽管如此,通过分析比以往更多的数据,人们仍然发现了看待事物与解决问题的新思路,而这些新思路正是大数据的`主要价值与灵魂。
相信大家一定听说过一种说法:"在大数据中,因果关系将不复存在。"事实上,在一定程度上,这种说法是成立的,但不够准确。因果关系不是消失不见了,只是它没以前那么重要了。通过分析大数据,人们找到了很多看似毫不相干的事物之间的相关关系,并且通常在其中得到了收益。显然,这些相关关系是利用传统的逻辑推理难以得出的。在这种情况中,不去探究因果关系,而仅仅利用分析得到的相关关系就可以达到目的。需要注意的是,虽然在这里并没有得到因果关系,但并不是说无法推理得出;恰恰相反,当得知了相关关系后,更容易得到相对合理的因果关系。
"因果关系不如相关关系可靠。"在大数据的支持下,直接通过数据得到的相关关系能极大程度上代表事物的规律,也就是说准确率很高。但通过逻辑推理出的因果关系则常常会失误,因为这本质上是我们为了解释事物所想象出来的。然而,发现因果关系仍然是相当重要的,尤其是在各个领域的理论分析中,这样可以使知识体系逻辑清晰且趋于完整。
书中举例了大量大数据分析的实际应用;例如通过机票的交易数据来预测最低票价出现的时间;通过搜索词条发现传染病的发生区域,从而控制疫情等。
大数据给我们的生活、工作与思维带来的变革是巨大的,是机遇也是挑战。随着大数据的发展,许多行业将会发生改变,一些新的角色会加入,一些老的角色将被淘汰。抓住机会,积极改变才能乘风破浪!
悦读愉悦身心,悦读陶冶情操,悦读改变生活。
悦读,翻开我们手中的书,书是桥梁,让人思接千里;书是翅膀,让人心游万仞。摩挲书页,捧卷而读,聆听文化的钟鸣,啜饮文化的甘露,我们每个人都能遇见一个不一样的自己。
本书《大数据时代》出自维克托·迈尔-舍恩伯格,是最早洞见大数据时代的发展趋势的数据科学家之一,也是最受人尊敬的权威发言人之一。舍恩伯格教授在《大数据时代》中提出:“大数据是指不用随机分析法这样的捷径,而采用所有数据的方法。”阐述大数据是一个比较的概念,它是在人类过去运用小数据库随机抽样获得分析结果比较而来,它的关键是在“大”,数据存储量越大,价值越显著。大数据的核心作用在于“预测”,引申出“规划”与“解决方案”,也就是我们说的“算法”。书中展示了谷歌、微软、亚马逊、ibm、苹果、facebook、twitter、visa等大数据先锋们最具价值的应用案例。
在现今的社会,大数据的应用越来越彰显他的优势,它占领的领域也越来越大,电子商务、o2o、物流配送等,各种利用大数据进行发展的领域正在协助企业不断地发展新业务,创新运营模式。有了大数据这个概念,对于消费者行为的判断,产品销售量的预测,精确的营销范围以及存货的补给已经得到全面的改善与优化。就我个人体会。大数据产生最直观的价值:一是时间,二是金钱。要知道“时间就是金钱,效率就是生命。”
采样数据向全部数据转变;精确制导向方向引领转变;因果关系向相关关系转变。
1.不再局限随机样本,而是全体数据:在大数据时代,我们有更多的数据可以分析,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样,这也是通过大数据打通的'传统壁垒。
2.不再局限精确性数据,而是混杂性数据:以前需要分析的数据很少,所以我们必须尽可能精确地量化我们的记录,随着数据的积累,数据库的完善,我们不再需要对一个现象刨根问底,只要掌握了大体的发展方向,适当忽略微观层面上的精确度,会让我们在宏观层面拥有更好的洞察力。
3.不再局限因果关系数据,而是相关关系数据:在大数据时代,我们无须再紧盯事物之间的因果关系,而应该寻找事物之间的相关关系,相关关系虽然不能准确地告诉我们事件发生的原因,但是它会提醒我们事件的发生。
近年来,我国数字农业发展方兴未艾,从北大荒千里沃野的无人驾驶农机作业,到浙江乌镇的刷脸入住农家乐、西安阿里的智慧大脑,数字农业正在悄然地助推传统农业发展。从理想状态来说,我认为数字农业就是有一块地,你种什么,种多少,施什么肥,打什么药,卖给谁,都用数据来表达,以大数据来支撑决策,通过信息化、数字化提供全程社会化服务。具体讲,数字农业是指以数据为关键要素,以数字技术与农业融合发展为重点,以数字产业化、产业数字化为路径,实现农业生产过程及全产业链数字化表达、数字化设计、数字化管理的新兴农业形态。
当前,我国已进入加快发展数字农业的新时期,发展数字农业有条件、有需求,恰逢其时,势在必行。人类社会经历了农业革命、工业革命,如今正在经历信息革命。现代信息技术日新月异,全球数据爆发增长、海量集聚,数字经济高歌猛进。互联网、物联网、大数据、云计算等数字技术加速向农业全方位渗透,让传统农业插上数字化的翅膀,培育了经济新增长点和发展新引擎,数据对农业发展的放大、叠加、倍增作用正在快速释放。这将为农业发展带来深刻的变革,创造千载难逢的历史机遇。
数据已经成为一种商业资本,一项重要的经济投入,可以创造新的经济利益。事实上,通过对海量数据进行分析,我们可以获得巨大价值的产品或服务,或者深刻的洞见。
大数据时代的思维变革
(1)不是随机样本,而是全体数据:在大数据时代的第一个转变就是利用所有数据,而不再仅仅依靠一小部分数据。采样分析的精确性随着采样随机性的增加而大幅提高,但与样本数量的增加关系不大。因此样本选择的随机性比样本数量更加重要。大数据的方法不采用随机分析法,而是采用所有数据,即样本=总体。
(2)追求数据的混杂性而不是精确性:大数据为了扩大数据规模允许不精确。大数据的简单算法比小数据的复杂算法更加有效。大数据要求我们接受纷繁性,放弃对精确性的追求,在大数据时代我们无法获得精确性。
(3)大数据追求相关关系而非因果关系:通过监控一个现象的良好的关联物,相关关系可以帮助我们捕捉现在和预测未来。大数据的相关关系分析法更加准确、更快,而且不易受传统思维模式和特定领域里隐含的固有偏见的影响。建立在相关关系分析法上基础上的预测是大数据的核心。
大数据时代的商业变革
(1)一切皆可量化:量化是数据化的核心。我们要的是数据化而不是数字化。数据化是指一种把现 象转变为可制表分析的量化形式的过程。数字化指的是把模拟数据转换为0和1换算表示的二进制码。
有了大数据的帮助,我们不再会将世界看作世界是一连串我们认为或是自然或是社会的现象,我们会意识到本质上世界是由信息构成的。将世界看作信息,看作可以理解的数据海洋,为我们提供了一个从未有过的审视现实的视角。它是一种可以渗透到所有生活领域的世界观。
(2)数据的绝大部分价值都隐藏在表面之下:数据的价值不仅限于特定用途,它可以为同一目的而被多次使用,也可以用于其他目的。数据的基本用途是为信息的收集和处理提供依据。不同于物质的东西,数据的价值不会随着它的使用而减少,而是可以不断地被处理。
数据的创新包括:数据的再利用(采集用户的搜索数据判断用户的偏好或发展趋势)、重组数据(多个数据集的总和重组在一起时比单个数据集更有价值)、可扩展数据(使得某种方式收集的单一数据集有多种不同的用途)、数据的折旧值(随着时间推移,大多数数据都会失去一部分基本用途但潜在价值依然强大)、数据废气(使用用户在网上留下的数字轨迹,如在线交互痕迹,来改善旧服务)、开放数据(开放政府数据让私营部门和社会大众访问)。
(3)数据、技术与思维的三足鼎立:大数据价值链的构成为大数据采集掌控、大数据挖掘技术、大数据思维。现今我们处在大数据时代的早期,思维和技能是最有价值的。但最终大部分的价值还是必须从数据本身中挖掘。大数据公司的`多样性表明了数据价值的转移。随着数据价值转移到数据拥有者手上,传统的商业模式也就被颠覆了。
未来行业专家和技术专家的光芒都会因为统计数学家和数据分析家的出现而变暗。因为后者不受旧观念的影响,能够聆听数据发出的声音。
大数据决定企业的竞争力。规模很重要,大规模的公司拥有大量数据以及采集更多数据的能力,而小规模公司则更加灵活,因此中型企业将会逐渐消亡。
大数据时代的管理变革
(1)让数据主宰一切隐忧:大数据的核心思想是用规模剧增来改变现状,这会给我们带来更多威胁。
在大数据时代,不管是告知与许可(很多数据在收集时并无意用作其他意图,而最终却产生了很多创新的用途)、模糊化(有意识的模糊化可能起到反作用)还是匿名化(大数据促进了内容的交叉检验),这三大隐私保护策略都失效了。
大数据被滥用于因果分析可能导致罪责的判定是基于对个人未来的预测。进行个人罪责推定需要行为人选择某种特定的行为,他的选择是造成这个行为的原因。而大数据并不是建立在因果关系基础上的,而是相关关系!所以大数据绝不可以用来进行罪责推定!
(2)责任与自由并举的信息管理:大数据时代要借助限制信息滥用的规范而不是最初的审查来防止其泛滥。要想保护个人隐私就需要个人数据处理器对其政策和行为承担更多的责任。
个人隐私保护从个人许可到让数据使用者承担责任:为了实现数据二次运用的优势与过度披露所带来的风险,监管机制可以决定不同种类的个人数据必须删除的时间。再利用的时间框架则取决于数据内在风险和社会价值观的不同。公司可以利用数据的时间更长,但相应的必须为其行为承担责任以及负有特定时间之后删除个人数据的义务。我们还可以开发新的技术促进隐私保护。如“差别隐私”:故意将数据模糊处理,促使对大数据库的查询不能显示精确结果。
在依据大数据技术作重大决策时必须保证特定防护措施的到位:(a)公开原则。用来进行预测分析的数据和算法必须公开。(b)公正原则。具备由第三方专家公证的可靠、有效的算法系统。(c)可反驳原则。明确提出个人可以对其预测进行反驳的具体方式。(d)确保对人的评判依据真实行为而非大数据分析。
大数据的运作超出我们正常理解范围。为了防止大数据的预测、运算法则和数据库变得不透明、不可解释、不可追踪,大数据需要被检测并保持透明度,当然还有使这两项得以实现的新型专业技术和机构,大数计算法师将会崛起。
为了保护极具竞争力的大数据市场,必须防止垄断。政府也应该公布其数据。