• 企业400电话
  • 微网小程序
  • AI电话机器人
  • 电商代运营
  • 全 部 栏 目

    企业400电话 网络优化推广 AI电话机器人 呼叫中心 网站建设 商标✡知产 微网小程序 电商运营 彩铃•短信 增值拓展业务
    "大数据"这词不火了 是不是因为没当年说的那么好
     

    网易科技讯10 月 19 日消息,国外媒体Slate刊文指出,“大数据(Big Data)”一词已经变得没有以往那么红火了,为什么会这样呢?“大数据”的问题并不在于数据或者大数据自己很糟糕,而是在于盲目迷恋数据,不加批判地使用,那会引发灾难。数据也不必然完全反映你想要了解的事情的实际情况。

    以下是文章主要内容:

    5 年前—— 2012 年 2 月——《纽约时报》刊文高呼人类的一个新纪元的到来:“大数据时代”。该文章告诉我们,社会将开始发生一场革命,在这场革命中,海量数据的收集与分析将会改变人们生活的几乎每一个方面。数据分析不再局限于电子数据表和回归分析:超级计算的到来,陪同着可持续记录数据并将数据传送到云端的联网传感器的不停普及,意味着迈克尔·刘易斯(Michael Lewis) 2003 年的棒球书籍《Moneyball》所描述的那种先进数据分析有望被应用于各行各业,从商业到学术,再到医疗和两性关系。不但如此,高端的数据分析软件还有助于鉴定完全意想不到的相关性,好比贷款方用尽额度和他债务违约的可能性之间的关系。这势必将会催生会改变我们思考几乎一切事物的新颖见解。

    《纽约时报》并不是第一个得出这一结论的企业机构:它的文章引用了麦肯锡咨询公司 2011 年的一份重大陈诉,其不雅观点也得到了 2012 年瑞士达沃斯世界经济论坛题为“大数据,大影响”的官方陈诉的支持。但这种宣言仿佛就是标识表记标帜大数据时代开启的里程碑。在之后的一个月里,巴拉克·奥巴马(Barack Obama)的白宫成了一个 2 亿美元的国家大数据项目,疯狂热潮随即袭来:学术机构、非盈利组织、政府和企业都争相去探究“大数据”究竟是什么,他们可以如何好好利用它。

    事实证明,这种疯狂没有持续很长时间。 5 年后,数据在我们的日常生活中饰演重要很多的角色,但大数据一词已经不再流行——甚至让人觉得有些讨厌。我们被允诺的那场革命究竟发生了什么呢?数据、分析技术和算法现在又在往什么标的目的发展呢?这些问题值得回头去思考。

    科技咨询公司Gartner在它 2015 年相当有名的“技术成熟度曲线”陈诉中不再使用“大数据”一次,之后该词再也没有回归。该公司澄清道,这并不是因为企业放弃挖掘巨量数据集获得洞见的概念。而是因为那种做法已经变得广为流行,以至于它不再符合“新兴技术”的定义。大数据帮手驱动我们的动态消息、Netflix视频保举、自动化股票交易、自动校正功能、健康跟踪设备等不可胜数的工具背后的算法。但我们现在不大使用大数据一词了——我们只是将它称作数据。我们开始将数据集能够包罗无数的不雅观察结果,先进软件能够检测傍边的趋势当做理所当然的事情。

    大数据引发的严重错误

    虽然该词仍有被使用,但它更多地带有一种欠好的意味,好比凯茜·奥尼尔(Cathy O’Neil) 2016 年的著作《数学杀伤性兵器》(Weapons of Math Destruction)或者弗兰克·帕斯夸里(Frank Pasquale) 2015 年的《黑箱社会》(The Black Box Society)。匆忙执行和应用大数据,即进行所谓的“数据驱动型决策”,带来了严重的错误。

    有的错误相当惹人注目:塔吉特(Target)曾向一位没跟任何人说过本身怀孕的少女的家庭派送婴儿用品优惠券;Pinterest曾恭喜一位单身女性即将结婚;谷歌照片(Google Photos)也曾引发轩然大波,该公司被大肆吹捧的AI将黑人误以为是大猩猩,原因是它的训练数据不够多元化。(值得指出的是,至少在该事件中,“大数据”还不够大。)

    其它的错误更为微妙,或许也更加阴险。傍边包孕奥尼尔在她的重要著作中记录的那些不透明的数据驱动式制度性模型:被法庭用来判决罪犯的、带有种族偏见的累犯模型,或者那些基于可疑的测验分数数据解雇备受爱慕的教师的模型。大数据出错的新案例可谓层出不穷——好比Facebook算法明显帮手俄罗斯通过针对性的假新闻影响美国总统大选的结果。

    盲目迷恋数据与误用

    “大数据”的问题并不在于数据自己很糟糕,也不在于大数据自己很糟糕:谨慎应用的话,大型数据集还是能够揭示其它途径发现不了的重要趋势。正如茱莉娅·罗斯·韦斯特(Julia Rose West)在比来给Slate撰写的文章里所说的,盲目迷恋数据,不加批判地使用,往往导致灾难的发生。

    从素质来看,大数据不容易解读。当你收集数十亿个数据点的时候——一个网站上的点击或者光标位置数据;大型公共空间十字转门的转动次数;对世界各地每个小时的风速不雅观察;推文——任何给定的数据点的来源会变得模糊。这反过来意味着,看似高级另外趋势可能只是数据问题或者方法造成的产物。但也许更重大的问题是,你所拥有的数据通常只是你真正想要知道的东西的一个指标。大数据不能解决阿谁问题——它反而放大了阿谁问题。

    上一篇:厉害了!纽约近八成出租车接入支付宝 网友:占领地球
    下一篇:时代公司又裁员 约200名编纂可能被淘汰
  • 相关文章
  • 

    © 2016-2020 巨人网络通讯 版权所有

    《增值电信业务经营许可证》 苏ICP备15040257号-8

    "大数据"这词不火了 是不是因为没当年说的那么好 大,数据,这词,不火,了,是,