柠檬学院:有关大数据的6大误区.docx

柠檬学院:有关大数据的6大误区.docx

ID:59702930

大小:12.45 KB

页数:3页

时间:2020-11-13

柠檬学院:有关大数据的6大误区.docx_第1页
柠檬学院:有关大数据的6大误区.docx_第2页
柠檬学院:有关大数据的6大误区.docx_第3页
资源描述:

《柠檬学院:有关大数据的6大误区.docx》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、你的组织是否在考虑分析数据的最佳方式?以下是在你采用大数据分析之前,需要注意的有关大数据的6个误区。云计算的应用,更快的数据处理速度,以及从物联网输入大量的数据,这些意味着,企业现在正在收集前所未见的数据量。现在大数据比以往任何时候都大。但是如何组织、处理和理解数据仍然是许多组织面临的一个主要挑战。你的公司是否仍然在努力理解大数据是什么,以及如何管理吗?这里有6个关于大数据的误区,行业专家将帮助你把真相从虚构的大数据领域中分离出来。1.大数据意味着“很多”数据目前,大数据已经成为一个流行词。但人们通常对它真正的含义还是

2、不清楚。有些人将大数据简单地认为是大量的数据。但是,这并不完全正确,它比这稍微复杂一些。大数据是指一个数据集,无论是结构(如数据表)或非结构化(如元数据从电子邮件)结合的数据,如社会媒体分析或物联网数据,形成一个更大的故事。大数据故事说明组织很难用传统的分析技术来捕获发生的趋势。丰田研究院的数据研究总监吉姆•阿德勒表达了一个很好的观点:“数据也有质量。这就像水一样:玻璃容器中的水是非常易于管理。但是,如果混杂在洪水中,这将是压倒性的灾害。”他说,“在数据分析系统中,工作在一台机器的的数据将被冲走时,其数据规模将增长10

3、0或1000倍。所以,当然,原型虽小,但其架构却很大。”2.数据需要清洁“最大的误区就是你必须要有干净的数据进行分析。”BeyondCore公司首席执行官阿里吉特•森古普塔说,“没有人有干净的数据,必须将数据进行清理,否则分析是行不通的。这是一个疯狂的想法。你要做的就是进行一个足够好的分析。你要分析所有的数据,尽管这些数据是肮脏的,这只说明你有数据质量问题。我可以告诉你一些模式,尽管数据存在质量问题,但完全可以进行正常分析。现在,你可以集中进行数据质量工作,只是提高数据可以得到稍微好一点的洞察力。”InOutsourc

4、e商业智能和分析总监梅根•布茨梅因对此表示赞同,“很多时候,企业就会将这些工作能拖就拖,因为他们认为数据是不干净的,这是没有必要的。部署的分析应用程序将可以找到数据的薄弱环节,”她说。“一旦这些问题已经确定,清理计划可以投入到位。然后,分析应用程序可以利用一种机制,加大清理力度,并监测进展情况。”布茨梅因说。“一旦你把这些数据整合在一起,你将在一个应用程序中赋予它生命的视觉,你可以看到这些汇集在一起的数据的关联,你会很快看到你的资料不足。”她说,“你可以看到数据的问题在于要提供一个清理数据的基准。”3.等待,让你的数据

5、完美你不应该等待清理你的数据,这里还有一个原因,森古普塔说,“在你完全清除数据之后,这可能需要三个月的时间,然而三个月后,这些数据已经陈旧过时了。”因此,这些信息将不再适用。森古普塔表示,第一州际银行的乔希•巴特曼在会议提出了一个重要观点。乔希展示了他是如何运行分析,发现问题,分析变化,重新运行分析的。他说,“你看,我的分析时间只有大约四到五分钟。所以,如果我可以运行分析,发现问题,解决问题,再重新进行分析,并在四、五分钟后查看报告,改变如何处理分析的方法。”森古普塔用编码来比喻那些旧方式。“我的一切都是正确的,然后我

6、进行编码。但现在,每个人进行编码都不太灵活。”他说。“你写好程序之后,你必须要测试它,并查看如何能使它更好,那么等它变得更好之后。世界发生了变化,人们仍然采用的是旧的做事方法。”4.数据湖数据湖是持有大量的原始结构化和结构化数据的松散的存储库,经常在大数据的背景下提到。唯一的问题是,尽管他们是如何经常被引用,但它们却不存在,阿德勒说,“一个组织的数据不被倒入一个数据湖中。这是精心策划的一个部门的数据库。鼓励集中使用专业知识。他们还提供了良好的数据治理和合规性所需的问责性和透明度。”5.分析数据是昂贵的如果假定在数据分析

7、工具涉及一些费用的话,你可能会害怕获得数据。而可以告诉你的有好消息是,如今有许多免费的数据工具,任何人都可以开始使用这些工具来分析大数据。同时,森古普塔表示,当今云计算的低成本意味着“你真的可以做那些以前从来不可能实现的的事情。”6.机器算法将取代人类分析森古普塔认为在分析大数据方法有一个有趣的二分法。“有人说,解决这个问题需要成千上万的数据科学家来分析解决,随后,又有人说,采用机器学习就可以做到这一切。这将是完全自动的。”但是,桑古塔并不认为这些都是合适的解决方案。“没有足够的数据科学家,成本将快速上升。”他说,“此

8、外,企业用户有多年的域名登录经验,并有着对他们业务的直觉。当你请来一个数据科学家,并认为他会搞定这些工作,并告诉你该怎么做。这实际上创造了一个确切的错误,数据科学家们往往无法无法足够了解企业的业务。”“完美”的数据科学家,是那些准确理解具体业务如何运作,以及其数据是如何工作的,这是一个误区。森古普塔说,“这样的人根本不存在。”在现

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。