01 太古时代的数据「数据」自己是存在的,就像空气,只要出现雾霾使它显式地显现在我们脑海里。在百万年前,推及上亿年前,在人类没有出现在这个蓝色星球之时,数据这个事物一向在那边,它期待着的是人类那灵光乍现的聪明赋予它正真的寄义。 在没有计较这个高真个家伙之前,人们为了让「数据」加倍具象,便于统计,停止了至今数万的摸索。在身旁坚固的物体如石器、骨片以及树干为载体,刻下纹理来代表对现实事物的表达,似乎成为了一个理所固然的起头。 1960年在非洲乌干达与扎伊尔交界处的伊尚戈渔村挖掘的一根记数刻骨“Ishango Bone”(伊尚戈骨头),这是距今一万前伊尚戈人新石器时代早期的作品,是最早的刻符记数实物。太古部落群众利用这些凹痕记录平常的买卖活动、物资储备和大事小情,并用他们来停止根基的算术计较。 伊尚戈骨头 02 现代化的数据在本日计较机提高的社会里,数据更是显得很是有存在感,身处于大数据时代的我们已然意想到数据的重要性。那末什么是数据呢?看起来简单的题目,常常是最复杂的。 当下对数据更普遍的界说常常是从计较机原居民的视角。我们对客观事物停止观察、怀抱、猜测,依照同一大概分歧一的标准标准将成果予以记录,这些记录或多或少,都是数据。这些数据期望是未经加工的,它们能很是杰出地代表原始事物原本的面孔和形状。 国际数据治理协会(DAMA)也以为,数据是以文本、数字、图形、图像、声音和视频等格式对究竟停止表示。也就是说,数据要表示究竟,受限于数据的收集技术以及数据解读才能,这也许这是一种理想。 数据表征存在,存在是不以人的意志为转移,包括物资的和精神的。物资方面有大自然中的风、雨、雷、电、人和动物等实体,这些是有明白感知的,很是方便数据化。在精神方面,人的欢乐、哀怨等情感可以被大量屡次主观怀抱,终极也可以构成数据。 数据似乎常常利用于实体,实体是大大都据刻画的工具。在刻画实体时常常需要系统数据,单一的数据似乎不那末受接待。在具有了大量的对一个实体的刻画数据后,经常会从量变发生量变。 集结数据成为「信息」,加工信息成为「常识」,应用常识发生「聪明」,数据成为低层的驱动者;它们之间环环相扣、循序渐进,组成了「DIKW 金字塔」。 数据-信息-常识转化模子 我们再来看看东方聪明。中文词语「数据」临时非论其词源,容我们从字面窥测一二。 「数」有两层寄义,一个是数据常常用数字来记录究竟,如一小我的年龄,一座山的高度;另个一个层面是它用数学的方式来停止统计终极获得记录成果,如一群人的均匀年龄和群峰的均匀高度,都利用了数学中的均匀数概念。 再看「据」,我将据了解为平常生活中的票据,票据是证实,证实发生过此事,是人类大脑弱点的补充,是对时候的凝固,是以「据」是究竟。所谓数据就是究竟的数字化根据。 03 展望未来正如开首所讲的一样,对于数字时代的我们,数据也许真的和空气一样,已经不需要我们再去思考其概念。 当我们天天生活稀有字化加持的小区里,工作在富贵的智能办公贸易区,享用着数字生活的便那时,这一切显得是那末自然,而这也正是物联网时代下新的数据生态。 物联网时代下的数据 更多的思考,是为了更好地震身。在对数据概念的了解上我们还需要继续摸索,接待列位数据人在批评区留言,谈一谈你以为的数据是什么。 作者:李庆辉(新芭)数据产物专家,数据产物团队负责人;擅长数据治理、数据分析、数据化运营;Python书籍《深入浅出Pandas》作者; 本文由@一个数据人的自留地 原创公布于大家都是产物司理。未经答应,制止转载 题图来自Unsplash,基于CC0协议 |