首页 网站首页 商业资讯 数据 查看内容

数据的五个特征、三道难题、一种自大

私域流量网 数据 2023-7-25 21:02 1039人围观

数据是新石油”(Clive Humby,2006)。假如一定要找出一样,数据最像的还真是石油。两者都是重要的计谋资本,都是驱动天下的动力。但数据只是数据,它不是别的任何工具。


五个特征

数据是一种客观存在,是关于事物的究竟描写,可经过丈量、记录、发现等方式去获得。数据具有无穷性、易复制性、非均质性、易腐性和原始性五个特征。

(1)无穷性。与实物分歧,数据不会因利用而耗尽,反而是因利用而发生,会不竭被缔造,会越来越多。“数据将成为最根基的客观产物,不管做什么,我们都在发生数据”(Paul Sonderegger,2017)。按照DASA R&T《2016-2045年新兴科技趋向》,全球新发生的数据量大约每两年翻一番。这可谓大数据摩尔定律,数据大爆炸是必定。


数据的五个特征、三道困难、一种自豪

(2)易复制性。数据可以快速地以近乎零本钱的方式停止复制,可供多人同时利用,可屡次循环利用,一小我的利用可以不排挤和故障他人对其利用,分歧人之间在利用上不存在间接的好处抵触。易复制性使得数据具有一定水平的非合作性和非排他性,但数据不是公共品,有公共数据、企业数据和小我数据之分。

(3)非均质性。《潜伏》中谢若林有句话:“现在两根金条放在这儿,你告诉我哪一根是高尚的,哪一根是龌龊的?”这说了然一个事理——金条是均质的,两根金条有着同等的代价表示。均质性普遍存在,例如出厂的商品、油电气等能源。而数据是非均质的,一比特数据跟另一比特数据所包括的代价完全分歧,同一份数据对分歧人的代价也纷歧样。正如王钦敏(2023)所说:“数据代价因利用工具而异,因利用处景而异,因专业化数据质量标准而异。”

(4)易腐性。数据是一种易腐品,会随着时候的流逝而敏捷贬值。按照IBM(2015)数据,60%的非结构化数据在几毫秒内就落空真正代价。这意味着,数据的代价很洪流平表现在时效性上,跨越一半的数据在发生的那一刻就不再有代价,我们可称之为“一秒钟定律”。能获得分析处置并发生现实功效的数据则更少。全球90%的数据从未获得分析利用(IBM,2015;DASA R&T,2016)。2020年被建立或复制的数据中,只要不到2%被保存并保存到2021年(来历:IDC)

(5)原始性。数据是原始的,自己并没成心义,只要对它停止处置分析,才能转酿成对人们有用的信息。假如说数据是新石油,那末分析就是内燃机。信息是数据提炼后的产物;信息经人脑加工后构成常识,常识具有主观性;数据、信息和常识是历史的,而聪明是关于未来的,是人们应用常识做出决议和判定的才能。

对数据、信息、常识和聪明之间的关系,福特汉姆大学Zeleny教授(1987)提出了DIKW金字塔模子(以下图所示),从底层到顶层依次是:

  • 数据(Data):Know nothing,一无所知;
  • 信息(Information):Know what,晓得是什么;
  • 常识(Knowledge):Know how,晓得怎样做;
  • 聪明(Wisdom):Know why,晓得为什么。

数据的五个特征、三道困难、一种自豪

图 DIKW金字塔模子


三道困难

一小我和四周人的差异首要在于把握信息、了解信息和应用信息的才能分歧。数据和信息相当重要。但当下有三道困难困扰着数据健康有序成长,即数据确权、数据买卖和数据要素。我们要迎难而上、勇于作为,以极大的勇气和聪明破解一切困难。

(1)数据确权。关云长身在曹营心在汉。对物理存在的身材之归属,我们比力轻易判定;而心里和灵魂是缥缈不定的,具有不肯定性、隐蔽性和多元性,不乏同时属于多个主体的情况。数据与之类似,人们很难清楚判定它属于谁,很难对其停止有用的物理切割和公道的权利分派。确权的复杂性与数据自己的特征有关,也与权利主体的多样性有关。数据链条触及多个介入者,他们缺一不成且没法零丁发挥感化,具有分歧的诉求。加上,数据的代价密度低,所发生的效益难以清楚权衡,这使得数据确权的本钱极高。

(2)数据买卖。买卖是一种互利互惠的行为,是人类社会中最具自觉性和最具积极性的活动。惟有双方都从中获益,买卖才会发生。对数据而言,买卖则是一个困难。结合国贸发会议(2019)指出:“数据具有重要的利用(或滥用)代价,但不像大大都经济商品那样具有交换代价。”现实中的买卖一般具有明白的价格,是可反复、可预期的。例如,商铺把明码标价的奶茶反复售卖给分歧的消耗者,消耗者获得的功效是可预期的——止渴、美味、交际。数据非均质、代价不易权衡、定价困难、预期功效难以治理、有“搭便车”风险……这都是数据买卖中要面临的题目。


数据的五个特征、三道困难、一种自豪

(3)数据要素。生产要素是人们用来生产商品和劳务所必备的根基资本。它促进生产,但不会成为产物和劳务的一部分,也不会因生产进程而发生明显变化。新古典学派开创人马歇尔在其名著《经济学道理》(1890)中提出了生产要素四元论,即地盘、劳动、本钱和企业家才能。梅宏院士指出(2023):“把数据建立为重要的生产要素是中国的初创。”但是,在经济学上界说数据生产要素是一件困难的工作,尚未看到有影响力和压服力的功效,迫切需要经济学家们抓紧研讨。


避免大数据自豪

提起数据挖掘的典范案例,很多人会想到“啤酒加尿布”和谷歌流感趋向。现实上前者是一个故事,早在1992年就已出现,并没有真正发生过;后者曾提早猜测出流感应来,不外因后来的正确性太低而早已被封闭。

数据的重要性毋庸置疑。人们喜幸亏“数据”之前加一个“大”字,以彰显非同平常。人们也经常堕入“大数据自豪(big data hubris)”的误区。数据能处理很多题目,但有范围性,经过数据难以猜测突变。一只光阴静好的猪,没法经过既往数据猜测出春节的黑天鹅;马车的出行数据,可以使人们获得“一匹更快的马”,但不能使人们发现出汽车。数据是企业的合作上风,但不是万能的。一个好的APP不会因有历史数据就能高枕无忧,它时辰遭到创新者的应战,只能“各领风骚仅几年”;创业者哪怕没稀有据、没有堆集,也可以推出创新产物,获得用户,获得成功。从这个角度上说,没稀有据也不是不可。


数据的五个特征、三道困难、一种自豪

大数据时代,“要相关,不要因果”被奉为圭臬。“关键是人的分析推理找出为什么两件事物同时或相继出现,找对了来由才是新常识或新发现的纪律,相关性自己并没有多大代价”(李国杰,2015)。只信“数”不如无“数”。我们要综合应用尝试观察、逻辑归纳、归纳提炼等科学方式,探讨事物之间的关系和纪律,才能挖掘出有代价的信息和结论。

我们重视数据,底子上不是由于数据自己重要,而是尊重客观天下和客观纪律的实事求是精神重要,数据即究竟。正如李国杰院士(2015)所言:“重视数据就是夸大用究竟措辞、按理性思维的科学精神。”

文章来历:腾讯研讨院

高端人脉微信群

高端人脉微信群

人脉=钱脉,我们相信天下没有聚不拢的人脉,扫码进群找到你所需的人脉,对接你所需的资源。

商业合作微信

商业合作微信

本站创始人微信,13年互联网营销经验,擅长引流裂变、商业模式、私域流量,高端人脉资源丰富。

我有话说......

相关推荐

各领域公开数据集下载

各领域公开数据集下载

整理了网上的公开数据集,分类下载如下,希望节约大家的时间。1.经济金融1.1.宏观经济

快速找到论文数据的19个方法

快速找到论文数据的19个方法

在这个用数据说话的时代,能够打动人的往往是用数据说话的理性分析,无论是对于混迹职

有哪些可以获取数据的网站?[大数据]

有哪些可以获取数据的网站?[大数据]

做数据可视化或者数据分析的朋友可能经常会碰到的问题就是有想法没有数据。想到我有几

Detectron2训练自己的数据集手把手指导

Detectron2训练自己的数据集手把手指导

Detectron2训练自己的实例分割数据集This article was original written by Jin Tian,

数据增强(Data Augmentation)

数据增强(Data Augmentation)

我们常常会遇到数据不足的情况。比如,你遇到的一个任务,目前只有小几百的数据,然而

数据迷思2:辛普森悖论下的香港死亡数字

数据迷思2:辛普森悖论下的香港死亡数字

如果有两名篮球手A和B,本来,无论是两分球还是三分球,A都要比B投得准,但是一个赛季

数据看中国vs世界:2021世界各国/地区薪资排名

数据看中国vs世界:2021世界各国/地区薪资排名

数据源:NUMBEO自从我的“randy77:数据看中国vs世界:2020年世界各国人均GDP最新排名

数据可视化:打造高端的数据报表

数据可视化:打造高端的数据报表

本文是《如何快速成为数据分析师》的第五篇教程,如果想要了解写作初衷,可以先行阅读

最通俗易懂的理解什么是数据库

最通俗易懂的理解什么是数据库

1.什么是数据库呢?每个人家里都会有冰箱,冰箱是用来干什么的?冰箱是用来存放食物的

数据可视化:深入浅出BI

数据可视化:深入浅出BI

本文是《如何快速成为数据分析师》的第六篇教程,如果想要了解写作初衷,可以先行阅读

数据分析师这个岗位,可能近几年会消亡

数据分析师这个岗位,可能近几年会消亡

近期成为月入两万的数据分析师的广告遍地都是,可能会对一些未入行的同学造成错觉。我

没数据分析项目经验,找工作也别太慌!

没数据分析项目经验,找工作也别太慌!

1. 你问不少同学加了微信,第一句往往类似这样: 在校或刚毕业的学生,没有实习经验,

Excel函数公式大全(图文详解)

Excel函数公式大全(图文详解)

我把每个函数的中文名都制作成了目录,通过目录能够快速定位到相应的函数。如果这篇文

18个超实用的神级免费网站,找论文和文献必备!

18个超实用的神级免费网站,找论文和文献必备!

写论文至关重要的一步就是查文献,为了让小伙伴们能够在查文献的路上少走弯路,顺利写

30个值得推荐的数据可视化工具(2020年更新)

30个值得推荐的数据可视化工具(2020年更新)

30个数据可视化工具(2020年更新)目录摘要• 零编程工具◦ 图表(9个)◦ 信息图(2

从三次人口普查的公开数据看兵源人口的变化与“征兵难”问题 ... ...

从三次人口普查的公开数据看兵源人口的变化与“征兵难”问题 ...

最近很多人私信询问如何看待出生人口或人口总量减少对征集兵员和国家安全的影响。这可

数据看中国VS世界:世界各国人类发展指数排名-2020

数据看中国VS世界:世界各国人类发展指数排名-2020

人类发展指数:Human Development Index(HDI),是联合国开发计划署从1990年开始发布

GIS数据免费下载网站

GIS数据免费下载网站

刚学习GIS和RS的同学肯定很困惑于数据的问题,因为没有数据,就没法分析,那么GIS最基

2022新数据出炉:透过性别比例与出生人口,我看到两个残酷的现实

2022新数据出炉:透过性别比例与出生人口,我看到两个残酷的现实

2022重磅数据公布,全年出生人口956万人,死亡人口1041万人。从性别构成来看,男性人

数据中台(一)什么是数据中台

数据中台(一)什么是数据中台

本文从数据中台的定义、核心能力、优点出发阐述企业数据中台建设的意义与必要性。一、

TA还没有介绍自己。

最近内容

数据治理框架
电话咨询: 15924191378
添加微信