2025年数据特征工程的含义(数据特征工程的含义是什么)

数据特征工程的含义(数据特征工程的含义是什么)很多同学对数据分析感兴趣 也和自己在国内做数据分析师的朋友聊过 决定未来从事数据分析方向的工作 那么 你了解数据分析师的就业情况吗 没有经验如何入门 职业规划又是怎样的 经验分享一 之前在电商公司做数据专员 仅限于 Excel 确定了数据分析方向后 开始在猴子老师这里系统学习 从初级的 Excel 和分析思维到中级的 sql 后来又学习了 python 基础的部分 边工作边学习

大家好,我是讯享网,很高兴认识大家。



那么,你了解数据分析师的就业情况吗?没有经验如何入门?职业规划又是怎样的?

经验分享一

之前在电商公司做数据专员,仅限于Excel。

确定了数据分析方向后,开始在猴子老师这里系统学习,从初级的 Excel 和分析思维到中级的 sql ,后来又学习了 python 基础的部分。

边工作边学习,准备了两个项目,一个是工作中的自己做的,一个是在猴子老师这里学习到的。

开始投简历的时候,先确定了行业和公司规模,自己的意向是互联网方向的视频平台,电商,互联网金融。选择中等的公司规模,开始投递简历。

用了两周集中面试,每天平均 3 家公司,视频面试和线下面试结合。面试了几次后得出一些经验,靠谱的公司会先打电话做简短的电话沟通,再邀约视频面试或现场面试。

在面试的过程中,随着面试的次数越来越多,自己对简历中项目提到的问题也越来越熟练,查漏补缺在面试中也游刃有余。而且,sql 笔试部分猴子老师的总结的相关高频题目有问到。

入职时间不久,前期是先熟悉公司的业务,了解指标的含义。熟悉业务相关的一些报表,理解逻辑。后面会使用到一些可视化软件 tableau,python相关的应该还用不到。依然会继续深入的学下去,想要去大厂的话,对python,机器学习,abtest要有了解。

经验分享二

现在已入职一家互联网公司做业务数据分析方向的数据分析岗,分享下自己的学习和求职经历。

1、如何学习准备的

主要是分三个模块:分别是SQL、Python和业务思维拆解能力。

SQL我是偶然的机会在网页上刷到猴子老师的SQL教程,学习了一些感觉简单易懂,就算是转行也能通过详细的学习教程学会。

Python 的话因为我本身是算法转行,所以 Python 也会一些,在这我找过几个教程和案例,跟做了一遍,把 pandas 和 matplotlib 常用涉及的操作都跟做了一遍。

事实证明,我求职的业务数据分析现在 Python 应用的还不是特别多。

业务思维拆解能力,这个之前我不是特别重视,也找过其他培训机构的课程,但都没有明确讲述的。后来在名猴子数据分析初级课程之后才有了系统的了解。在业务分析中业务拆解是很重要的。

2、如何投简历和面试经历

我是在两个平台智联招聘和 boss 上投递的简历,因为自己在职找工作,基本就是每天看看打招呼的有没有自己感兴趣的岗,如果有就投一下。

因为我项目写的不是很好,九月份每周大概2-3个面试,我都是先沟通好初试视频面试的。但是在这种高频的面试下才接到两个意向公司。

其中一家工作地点太远拒绝了,另外一家有点国企风,背景调查很严格,因为之前我有合并工作经历(具体这种问题怎么处理,可以看看猴子老师的简历指导)所以也忍痛放弃了。

之后就到了10月份,依然是投了很多,但是机缘下就得到现在这家公司的面试邀约,拿下了offer。

初试技术面也是三个模块拷问的:SQL、机器学习的初级知识,另外一个简单的业务拆解,比如播放量下降如何去分析等。

3、现在刚过入职,但是这个岗还是偏业务分析一些。主要就是了解视频业务的相关知识,之后做一些专题分析。

我本身找工作的周期比较长,一年多吧,其中都是自学,找一些培训课程,我自己承受压力的能力比较弱,但是也坚持下来了,实现目标的感觉很好,所以有目标的同学一定要坚持自己的初衷呀。

经验分享三

答主@秦路

入门和职业规划应该从两个角度考虑:领域和路线。

领域是不少新人常忽略的要素,其实数据分析不会脱离业务存在。你进入哪个行业,很大程度会决定你初期的技能树和技能点。

譬如金融领域的风控模型、营销领域的生命周期、广告领域的点击率预估等,各有各的特色。

如果是一位应届生,不妨多了解自己感兴趣的领域,多积累相关的经验,为面试做准备。

如果已经有一定行业履历,只是想要转岗数据分析师,那么跨岗不跨行,尽量避免跳到一个陌生的领域。

领域经验主要也就三点:1.自己感兴趣的,2.自己擅长的,3.有钱途的。

成为某领域的数据专家,会是一个更好的筹码。

路线大致可以划分成四大方向:

数据分析,数据挖掘,数据产品,数据工程。

数据分析/数据运营/商业分析

这是业务方向的数据分析师。

绝大部分人,都是从这个岗位开始自己的数据之路,也是基数最大的岗位。

因为基数大,所以这类岗位通常鱼龙混杂。有些虽然叫数据分析师,但是每天只需要和 Excel 打交道,完成leader布置的表格整理工作就行。混个几年,成为一位数据分析主管,给下面的新人继续布置 Excel 任务。

又有一种数据分析师,岗位职责要求你掌握常用的机器学习算法,面试首先推导一个决策树或者逻辑回归。都叫数据分析师,其实天差地别。

这里更多指代互联网行业,偏业务的数据分析师,一般属于运营部门。不少公司也称数据运营或者商业分析。

这类岗位的职位描述一般是:

建立和优化指标体系;

监控数据的波动和异常,找出问题;

优化和驱动业务,推动数据化运营;

找出可增长的市场或产品优化空间;

输出专题分析报告;

实际的岗位中,不少业务端的数据分析师,主要工作都是第一点。

别管它用汇总、分析、数据支持什么修饰词,基本是跑SQL,做报表。硬生生活成了业务端的表哥。

这是很常见的情况,也是入门新人的第一个坑。因为从头到尾,这类分析师,都没有解决问题。

业务部门往往更关心,某个指标为什么下跌或者上升。产品的用户是什么样的?怎么能更好的完成自己的KPI。

以活跃指标的下跌举例:

活跃指标下跌了多少?

是属于合理的数据波动,还是突发式?

什么时候开始的下跌?

是整体的活跃用户下跌,还是部分用户?

为什么下跌?

是产品版本,还是运营失误?

怎么解决下跌的问题?

这是一套标准的解决思维。分别对应what、when、who、why、how。

每一部分都不是三言两语可以解释清楚。不要看它很简单,例如你通过多维分析,发现某个地区的活跃下跌了,不要急着把它作为分析的结论,这是不合格的数据分析。某地区的活跃下跌,只是现象,不是原因,把它作为结论提交,肯定会被骂的。


讯享网

你要解决的是,为什么这个地区的活跃下跌了。是该地渠道,是该地竞争对手,是该地市场环境?这些问题都是细化的范畴。并且,它们要能以量化解释,而不是我认为。

做好了这点,才是一个真正的业务端的数据分析师。


数据挖掘/算法专家

这是技术向的数据岗,有些归类在研发部门,有些则单独成立数据部门。

数据挖掘工程师要求更高的统计学能力、数理能力以及编程技巧。

从概念上说,数据挖掘Data mining是一种方式,机器学习Machine learing是一门方法/学科。机器学习主要是有监督和无监督学习,有监督又可划分成回归和分类,它们是从过去的历史数据中学习到一个模型,模型可以针对特定问题求解。

数据挖掘的范围则大得多,即可以通过机器学习,而能借助其他算法。比如协同过滤、关联规则、PageRank等,它们是数据挖掘的经典算法,但不属于机器学习,所以在机器学习的书籍上,你是看不到的。

除此之外,还有一个领域,属于最优化问题的运筹学。现实中的问题往往有很多约束,比如护士排班.

一共有三班(早、中、晚),现在要求每班满足最低护士人数,每位护士尽量不能连班,每位护士不能连续工作5天。每位护士的夜班数要均衡,每位护士每月的班数要均衡…

这些问题很难用机器学习的方法完成,而在最优化领域,则有遗传算法、模拟退火算法、蚁群算法等。

实际的应用场景中,如外卖行业,如何寻找骑手效率最大化的最优路径,同样属于最优化,也是数据挖掘的工作范畴。

数据挖掘工程师,除了掌握算法,同样需要编程能力去实现,不论R、Python、Scala/Java,至少掌握一种。模型的实施,往往也要求Hadoop/Spark的工程实践经验,精通SQL/Hive是必须的。

常见数据挖掘项目的闭环如下:

定义问题

数据抽取

数据清洗

特征选取/特征工程

数据模型

数据验证

迭代优化

单看环节,数据挖掘对分析能力没有业务型那么高。这不代表业务不重要,尤其在特征选取方面,对业务的理解很大程度会影响特征怎么选取,进而影响模型质量。

数据挖掘的业务领域一样可以细分。金融行业的信用模型和风控模型/反欺诈模型、广告模型的点击预估模型、电商行业的推荐系统和用户画像系统。从需求提出到落地,数据挖掘工程师除了全程跟进也要熟悉业务。

因为要求高,所以数据挖掘的平均薪资高于普通的数据分析师。

数据产品经理

这个岗位比较新兴,它有两种理解,一种是具备强数据分析能力的PM,一种是公司数据产品的规划者。

前者,以数据导向优化和改进产品。在产品强势的公司,数据分析也会划归到产品部门,甚至运营也属于产品部。

这类产品经理有更多的机会接触业务,属于顺便把分析师的活也干了,一专多能的典型。

他们会运用不同的数据源,对用户的行为特征分析和挖掘,达到改进产品。最典型的场景就是AB测试。

大到页面布局、路径规划、小到按钮的颜色和样式,均可以通过数据指标评估。

俗话说,再优秀的产品经理也跑不过一半AB测试。此类数据产品经理,更多是注重数据分析能力,擅长用分析进行决策。数据是能力的一部分。

后者,是真正意义上的数据产品经理。在公司迈大迈强后,数据量与日俱增,此时会有不少数据相关的产品项目:包括大数据平台、埋点采集系统、BI、推荐系统、广告平台等。

这些当然也是产品,自然需要提炼需求、设计、规划、项目排期,乃至落地。

我们不妨看几个数据产品经理要求:

负责大数据产品的设计,输出需求文档、产品原型;

负责推荐算法的产品策略,完成相关推荐及个性化推荐产品的需求分析;

负责分析和挖掘用户消费内容的行为数据,为改进算法策略提供依据;

负责客户端数据需求的对接,制定相关埋点规范及口径,相关业务指标验证;

报表展示工具的落地和应用;

和C端注重用户体验不同,数据产品,更注重整体的分析能力和逻辑。除了产品经理最基础的Axure、Visio、MindManager等工具。

往往还需要很多技术型的能力。比如了解BI/DW原理和实施、了解常用的推荐算法、了解机器学习模型等。这也很容易理解,C端要求你了解用户需求,而在数据端,主要用户就是数据。

这当然不是说,用户体验不重要,拿推荐算法来说,除了满足用户最基本的感兴趣,也要考虑时效性,考虑新兴趣的挖掘,考虑无数据时的冷启动问题…这些一样是用户体验,只是解决方案也得从数据出发。

后端的数据产品,如报表,用户往往是你隔壁工位的小秦或小路,设计得丑一点不要紧,要是数据指标口径不统一,那才会分分钟骂街。

虽然数据 PM 需要熟悉各类数据模型、指标、数据挖掘和数据工程的实现,但是聚焦点是把它作为一个项目去实现,而不是考虑技术的细节,故而不用精通。

数据工程

数据工程其实更偏技术,从职业道路上看,程序员走这条道路更开阔。

在很多中小型的公司,一方面数据是无序的、缺失的、原始的,另外一方面各种业务报表又嗷嗷待哺。没办法,分析师只能自己撸起袖子,一个人当两个人用。兼做数据清洗+ETL+BI。

数据分析踏上数据工程的不归路如下:

每天都要从五六张表上join,那么不妨加工成一张中间表;

ETL的依赖关系越来越复杂,尝试kettle/airflow等框架搞定,弄个DAG美滋滋;

运营部门的周报次次都要这几个指标,看看能否做一个自动化BI;

数据量逐日增多,最近T+1的日报需要几个小时完成,研究下查询语句的优化;

等等…

如果分析师在技术方面的灵性不错,那么技能点会往技术栈方向迁移。从最初的SQL,到了解Hadoop集群、了解presto/impala/spark、了解ELK、了解分布式存储和NoSQL……

这也是一个不错的发展方向,因为数据挖掘需要了解算法/模型,理论知识要求过高,不少硕士和博士还过来抢饭碗,如果自己不擅长容易遇到天花板。选择更底层的工程实现和架构,也是出路,薪资也不会低于数据挖掘。

部分公司会将机器学习模型的部署和实现交给数据工程团队,这要求数据工程师熟悉sparkMLlib、Mahout此类框架。

数据工程师,可以从数据分析师的SQL技能,往数据的底层收集、存储、计算、运维拓展。往后发展则是数据总监、或者数据架构师。因为数据分析出身,与纯技术栈的程序员比,思考会更全面一些,虽然技术底子的薄弱需要弥补。

另外,DBA、BI这些传统的数据库从业者,也是能按这条路线进阶,或者选择数据产品经理方向。

 知乎数据分析训练营 

扫下方⬇️海报二维码

免费获取零基础数分课!

小讯
上一篇 2025-05-27 16:36
下一篇 2025-06-17 09:15

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/166160.html