小我简介:非科班双一流硕士,CAE仿真偏向转行大数据,现杭州某大厂大数据工程师! 前言本文针对非科班生转行大数据所碰到的题目,提出一些实在的倡议,免得小伙伴在进修进程中走弯路。 我根据自己转行所走过的一些弯路,总结了我自己大数据进修的具体线路,保举一些我看过的大数据课程以及技术书籍,帮助列位小伙伴做一个资本挑选。 我可以了解每一位行将转行和正在转行的小伙伴,你们能够焦虑自己能否可以学好这么多的大数据常识,也能够正在担忧35岁后的自己该怎样办? 已经的我,也曾堕入一样的焦虑和苍茫情感。这些情感美满是由于自己在进修进程中,你所期望的高度和自己今朝所处的高度的落差而至使的,都是一般的情感。 可是我感觉我们也不要过于担忧,由于未来总是不成猜测的,谁也不晓得35岁今后的我们会做什么,我们不要过早的庸人自扰,也不要过早的限制自己,我们现在所挑选的工作,未来纷歧定就得干到老。 所以,当前我们应当要先沉淀自己,打造自己在未来的焦点合作力,先攒到自己的第一桶金才是霸道,有本钱了,就有更多的挑选和更大的能够。 1大数据成长远景我按照我国公布的《第十四个五年计划和2035年远景方针纲领》,带大师看看以下一个目标。 在创新驱动这个种别中,数字焦点产业增加值占GDP比重要从2020年的7.8%,到2025年要增加到10%。这个概念大师能够还不是很敏感,随着小林继续看下面另一张图。 我国在大力成长的数字经济焦点重点产业中,其中包括大数据范畴,以下图所示。政府大力鞭策大数据范畴技术成长创新,实现数字化转型,大数据在未来有较大的成长潜力! 2020年是我国5G的元年,国家在大力扶植 5G 的根本设备。2021年,5G手机能够会逐步增加,将会是大数据爆发的1年。5G收集所发生的数据速度:每秒 10G 的数据量,这会使得各个公司的数据量爆发式增加。 此外,我国第一批大数据专业在2017年开设,2021年第一批大数据专业门生才结业。是以,大数据范畴人材紧缺,需要大量的数据研发、数据分析以及数据挖掘工程师。 2进修线路泛论未来想在互联网成长,应当怎样学?就大数据偏历来说,我小我以为首要有三个方面: 第一,计较机根本常识是不成或缺的,假如你具有踏实的根本常识,在碰到题目时可以快速熟悉到题目标本质,从而处理题目。我至今在不竭在增强自己计较机根本常识的进修; 第二,大数据框架的技术道理,对于重点框架要重视企业级调优以及源码的进修。 第三,项目实战。进修了大量的技术需要连系项目场景去利用,才能加深你对技术的了解。 大数据是一个进可攻、退可守的偏向。 进可以往野生智能偏向成长,可是需要很是踏实的数学常识。 我很是附和我导师已经跟我说的一句话:“任何题目,终极城市归罪于数学题目”!是以较好的数学才能可以支持你不竭的应战新的题目! 退可以往大数据利用开辟偏向成长,可是需要丰富的框架利用和调优经历。 2.1计较机根本
保举数学是斟酌到一些小伙伴要进一步往 AI 偏向成长,而数学是机械进修的基石。你只要具有了这些底层根本,才能支持你走得更远! 2.2大数据组件全部大数据常识系统进修需要花较长的时候,大数据框架也比力多,下图是我自学大数据的技术栈。我是根据方针企业的招聘要求,挑选以下技术栈进修,还有别的的框架,可以视情况而定,选摘要不要学。 Java是根本工具,我小我是学完JavaSE,重点对调集、多线程以及 今朝企业生产根基利用的是 Linux 系统,把握 Linux 根基道理是未来必备技术。 Hadoop 是分步式系统根本架构,首要处理海量数据的存储和海量数据分析计较题目,包括HDFS,MapReduce,Yarn 三个组件。别的框架在此不作先容了。 大数据组件 针对一个技术框架若何进修,可以参照我下面这个视频!我总结了框架进修要依照阶段去学,循序渐近,而不是一挥而就,深谋远虑会致使你技术学的不够深入不说,更重要的是浪费了你的时候。 2.3项目理论大部分非科班同学城市碰到的痛点,在黉舍没有现实的项目。可是找工作的时辰,简历上最少需要2~3个项目,而且要有1~2个亮点项目。比如在某个项目中,你碰到什么困难,采用什么技术处理的?做了哪些优化? 关于项目这块,前面我有项目实战保举! 3进修材料保举我自己作为一位非科班转型者,深知一份好的入门进修材料可以节俭几多时候。是以,我对自己自学以来的过程,做了一下复盘,而且把我自己的进修线路以及自学的进修材料保举给大师。 希望可以给转行的小伙伴们一点参考。首要包括了计较机根本常识、大数据框架进修、项目实战三个模块相关的入门视频和洽的书籍保举! 倡议零根本同学先进修Java说话根本语法,一个月左右即可以把JavaSE学完,后续找面经查漏补缺! 以后搭建Linux虚拟机平台,为后续大数据框架进修作预备。 由于我的时候比力告急,不但要完成导师安插的使命,还要挤出时候进修。所以,我的计较机根本常识是穿插在大数据框架进修中心,口试前重点刷了一些常见的口试题。以下是我刷的Java口试题博客链接。 最全 Java 口试总结: https://blog.csdn.net/thinkwon/category_9731418.html 3.1根本编程说话根本:Java根本是一切后续大数据进修的基石。我最起头是经过看书进修,看完后没有什么感受,幸亏以后找到了尚书院高淇的300集,这个视频里把每一个常识点都讲的很是周全,也会有具体的案例。假如你是零根本,倡议看视频入门,代码一定要自己敲一遍,切忌眼高手低! 高淇三百集: https://www.bilibili.com/video/BV1oy4y1H7R6?p=16 Java 保举《Java编程思惟》,有在线中文版 此外,还有Scala说话,由于后续要学到 Spark、Flink等框架,这些框架采用Scala编程极为灵活,所以需要进修Scala的编程标准。关于Scala进修,保举尚硅谷教员的视频。 尚硅谷Scala说话入门: https://www.bilibili.com/video/BV1Xh411S7bP?p=50 留意:在这个阶段,Scala 说话可以先不学,可以在进修 Spark 之前进修! 数据结构与算法:激烈保举左神的视频,他讲的内容根基上和企业口试相关,浅显易懂。我那时看的是一个在牛客网上讲视频:其中包括算法低级和进阶。在听这个视频前,最好去领会下根基的数据结构!可以从下面百度网盘中获得视频材料和课件!看完视频后,具有一定的根本了,可以把剑指offer刷完! 数据结构与算法视频链接: https://pan.baidu.com/s/14bGK2Wva2MbyviIKjkhNNQ 提取码:3ojw 假如网盘链接生效,请增加我微信:a934614406,备注【左妙算法】,我重新给你发一遍! 计较机收集与根本:我那时看的是B站方教员讲授的视频,讲的比力周全透彻,而且时候也不是很长,总共42节,每节均匀40分钟左右,一周左右即可以看完,针对非科班同学出格友爱!要留大把时候给前面技术框架进修,听完视频,可以去搜一搜相关的面经,可以查漏补缺。 方教员计较机收集链接: https://www.bilibili.com/video/BV1yE411G7Ma?p=23 操纵系统:操纵系统常识比力多触及到的内容也比力细,假如你的时候丰裕,且不焦急口试找工作的话,你可以去B站搜索哈工大李治军教员的课程,教员会用Linux内核代码得视角帮助你了解操纵系统得道理。 操纵系吐浯接: https://www.bilibili.com/video/BV1d4411v7u7?from=search&seid=15412161143884682127 假如你时候告急,想间接应对口试,这里给你分享一份总结好的操纵系统重点口试常识! 请增加我微信:a934614406,备注【操纵系统】,我给你发一份具体的操纵系统口试常识! 数学理论根本:大数据与野生智能连系,那末数学根本是不成或缺的。可是,数学是学不完的,也没有几小我像数学专业的同学大概博士那样精通数学,所以大师要熟悉到,入门 AI 只要把握数学中的根本常识就好,首要包括:高档数学、线性代数、几率论与数理统计三门课程。这里为大师整理了三篇简易的数学入门文章: 高档数学:https://zhuanlan.zhihu.com/p/36311622 线性代数:https://zhuanlan.zhihu.com/p/36584206 几率论与数理统计:https://zhuanlan.zhihu.com/p/36584335 保举笔记:《机械进修的数学根本》和《斯坦福大学机械进修的数学根本》 3.2大数据框架Linux:不管你做的是后端还是大数据, 国内入门 尚硅谷韩顺平Linux链接: https://www.bilibili.com/video/av21303002 可以连系《Linux就该这么学》这本术一路进修,加深对 Hadoop(重点): 今朝, 任何框架的进修,先搭建好情况,线上跑一个测试案例,以后再深入其道理。 HDFS有伪散布式、完全分步式以及高可用架构模子,重点领会HA架构模子以及各个脚色的职责。 HDFS的架构模子首要包括以下脚色: 虽
我保举大师进修尚硅谷的 尚硅谷 https://www.bilibili.com/video/av21303002 可以连系《Hadoop威望指南》第四版进修。 ZooKeeper: 你可以连系《从Paxos到ZooKeeper》这本书连系一路学,这本书不但论述了 尚硅谷ZooKeeper链接: https://space.bilibili.com/302417610/video?keyword=ZooKeeper 注:视频仅作为初学者入门,要深入进修还需要看书和研讨官方文档。 Hive: 初学者入门 假如你要深入进修其内部道理及调优,可以去读一读《Hive编程指南》和 尚硅谷Hive链接: https://www.bilibili.com/video/BV1EZ4y1G7iL HBase: 尚硅谷HBase链接: https://www.bilibili.com/video/BV1Y4411B7jy 注:可以连系《HBase威望指南》和《HBase实战中文版》两本书,加深对 HBase 的了解。 Redis(重点!): 该组件不管是后端还是大数据,都是必会的一个框架。我进修一个新技术,先是经过视频入门,以后再去看相关书籍和官方文档,深入了解技术细节。
尚硅谷周阳教员 https://www.bilibili.com/video/BV1oW411u75R 2021最新入门到精通 https://www.bilibili.com/video/BV1Rv41177Af?p=4 保举书籍:《Redis设想与实现》和《Redis 深度历险:焦点道理与利用理论》 Kafka(重点!): 作为高吞吐量的分步式公布定阅消息系统,Kafka 可以处置消耗者范围的网站中一切行动流数据。 这里倡议:先领会 Kafka 是处理什么题目标而发生的,再领会其根基架构,最初深入了解焦点实现道理。 下面是 Kafka 入门视频链接: 尚硅谷Kafka入门链接: https://www.bilibili.com/video/BV1a4411B7V9 保举书籍:首推《深入了解 Kafka:焦点设想与理论道理》,想要深入领会 Kafka 源码的,你可以随着《Apache Kafka 源码分解》一路看,可以让你顿悟! Spark(重点!重点!重点!): 别的,计较进程中,假如某一节点出现题目,事务重演的价格远低于
2021 https://www.bilibili.com/video/BV11A411L7CK 注:进修 Spark 之前,一定要先进修 Scala 说话。在编程说话根本中,已经给出了 Scala 的具体进修保举! Flink(重点!重点!重点!): 今朝,国内构成以阿里为首的企业,腾讯,京东,滴滴,携程,美团等,都在利用
尚硅谷Flink链接: https://www.bilibili.com/video/BV1Qp4y1Y7YN 保举书籍:《Flink道理、实战与性能优化》 数据挖掘和机械进修这部份内容,我今朝还没有进修,等后续我学完后,再整理这部份内容给大师作个参考。 3.3项目关于项目,这是我们非科班同学在口试时最亏弱的一环。在黉舍,你几近很难去做一个实实在在的落地项目,由于根基打仗不到相关的项目。 是以,我倡议大师要提早计划练习,经过练习让自己获得项目经历。我是从研二上学期起头自学编程的,本科粗浅的学过一点 C++,算是有一点点根本。 那时,我一边帮导师做自己专业相关的课题项目,一边进修大数据技术。下图是我自学时做的部分笔记。 进修笔记 假如你现在处在大二、研一这个阶段,你可以提早计划练习,在练习公司自动去领会一些相关的落地项目;但假如你行将面临找工作,而且各个技术栈还没有学完,你可以先把根本技术框架过一遍,然后参照我给你保举的下面几个项目。 尚硅谷大数据电商数仓项目链接: https://www.bilibili.com/video/BV1Hp4y1z7aZ 技术选型:Hadoop+ZooKeeper+Hive+Flume+Sqoop+Kafka+Azkaban+Kylin+Spark 这个项目主如果讲授了数据仓库的架构模子,实现了数仓项目标闭环,从数据收集到数仓建模,再到数仓利用等。项目中还触及到一些别的技术,中心可以穿插着进修。 在口试进程中,首先要把项目架构说清楚以及技术选型的缘由,能否有别的替换计划;其次说明你在项目中碰到了什么题目,你用什么方式处理该题目标;最初要清楚的能表述出你负责的部分的代码逻辑。 虽然说,电商数仓项目比力普遍,但在没有项目标情况下,可以作为根本项目。 尚硅谷大数据实时处置( https://www.bilibili.com/video/BV1tp4y1B7qd?spm_id_from=333.788.b_636f6d6d656e74.27 该项目基于SparkStreaming对电商平台的用户行为以及定单营业,经过度歧的目标和维度,停止实时的分析和计较。首要包括数据发生,数据传输,数据计较以及终极的数据可视化。 可以把握SparkStreaming实时计较的流程,还可以把握大数据收集框架、高并发的分步式消息行列、基于内存的高吞吐的实时计较技术、以及海量存储毫秒级查询的数据库。 Flink实时项目:这个项目是我自己私藏的项目,你可以增加我的微信,给你发 Flink 项目材料。 声明:上述说起的一切书籍和进修材料小林大部分都亲身学过,均为小林友谊保举,绝不含任何广告性质! 4口试找工作对于每小我来说都是一项浩荡的工程,我还记得第一次口试时,心中的不安感。我是在研二下学期起头动手预备秋招的,那时由于疫情缘由还没有返校。 假如你在练习且不能转正的,你可以在7月份左右预备各个公司的提早批招聘,但要留意该公司的提早批对秋招招聘能否有影响,由于提早批根基都是仙人打架,我那时只是为了积累口试经历。 对于大部分人来说,最重要的是秋招,大概年头的春招,我给大师从获得招聘信息的路子和口试经历两个方面去分享下我的履历。 4.1若何获得各个公司的内推资历?
根基上,小林秋招首要经过上述方式投递自己的简历,但还需要要留意以下几点:
4.2口试经历我全部秋招投递了100多家公司,见识了各类百般的口试现场。这里激烈倡议大师,在口试后的第一时候,去做下口试总结,以进步自己在某些技术上的不敷。 经过不竭的总结,你会领会到,每个公司技术口试的题目都相差不大,出格对于应届生,要求你计较机的根本常识出格踏实。 固然,还有一个最重要环节,就是自我先容,需要你自己提早按照本身情况去写好,切忌去念简历上已经存在的信息 多去表达一些你自己的履历以及能证实自己才能的工作。要求说话精练,突出你自己最擅长的技术范畴。 例如:以下是我秋招口试时的自我先容 在口试中,一般需要留意以下几个点:
5总结上述给大师分享的进修线路以及进修材料大部分都是我亲身学过一遍的,对于新技术,我根基都是以视频入门,以后再经过书籍和 Google去查漏补缺,深入技术道理 碰到相关题目保举大师去 回首研讨生三年,其中一边帮导师做项目,一边进修,这段时候过得很是充实且布满着压力。不但要顶着导师安插的项目使命压力,一边还要为自己找工作做预备,失实不易。最初,希望每一位小伙伴,可以早日收割自己满足的 |