拼多多均会重点考察SQL题
且相比其他大厂,拼多多对SQL的要求较高
所以,请务必熟练熟练再熟练!
模型过拟合怎么处理
★参考答案模型过拟合主要可以从以下几个方面入手
-
获取更多数据,扩大数据量。
-
降低模型复杂度。
-
添加正则项。
-
改为集成学习。
请介绍一下SVM原理
SVM是一种二类分类模型。它的基本模型是在特征空间中寻找间隔最大化的分离超平面的线性分类器。(间隔最大是它有别于感知机)
-
情况①:当训练样本线性可分时,通过硬间隔最大化,学习一个线性分类器,即线性可分支持向量机;
-
情况②:当训练数据近似线性可分时,引入松弛变量,通过软间隔最大化,学习一个线性分类器,即线性支持向量机;
-
情况③:当训练数据线性不可分时,通过使用核技巧及软间隔最大化,学习非线性支持向量机
这类问题碰到一些偏技术向面试官,会揪着细节不断发问,以来考察你的基本功是否扎实,所以还需要对原理进行详细的理解和推导
下面补充两个SVM的衍生问题,供大家参考:
★参考答案
当训练数据线性可分时,存在无穷个分离超平面可以将两类数据正确分开。感知机利用误分类最小策略,求得分离超平面,不过此时的解有无穷多个。线性可分支持向量机利用间隔最大化求得最优分离超平面,这时,解是唯一的。另一方面,此时的分隔超平面所产生的分类结果是最鲁棒的,对未知实例的泛化能力最强。
★参考答案
当样本在原始空间线性不可分时,可将样本从原始空间映射到一个更高维的特征空间,使得样本在这个特征空间内线性可分。
假设拼多多近期GMV下滑严重,请问如何分析
★参考思路
-
问题确认:首先,需要确认该问题是否真实存在,即校验数据的准确性。例如:数据提取是否存在逻辑错误,上游表是否存在重复记录的问题?
-
确认有无外因,举例:
-
环境影响:是否存在外界因素,比如受疫情影响,快递公司无法正常配送。导致线上无法成交。
-
时间因素:是否存在季节性的波动,比如双十一大促属于用户成交高峰期,而非双十一大促成交相对较少。
-
竞品因素:比如竞品淘特/抖音等上线大型补贴活动,势必会对拼多多产生较大的冲击。
-
内因分析拆解,提供一种思路,具体大家可以拓展发挥举例:
-
货-商品维度拆解:例如可设计相关指标(如:贡献度)定位异常行业、店铺等
-
人-用户维度拆解:例如可根据用户的属性,比如地域,年龄,新老客,价值等级等维度进行拆分解析
-
场-场景维度拆解:例如可根据大盘常见场景有无做功能变动、策略迭代等进行拆解确认等等
怎么估算上海外卖员的数量
▶ 指标拆解
外卖员的数量 = 每天订单总数 / 每人每天可配送的订单数
-
每天订单总数 = 目标用户数 / 点单频度
-
目标用户数 = 上海市总人数*点外卖人数占比
-
每人每天可配送的订单数 = 每天工作时间 / 完成一个订单需要的时间
-
完成一个订单需要的时间 = 商家距离/骑手速度+排队等待时间+目的地距离/骑手速度 + 用户等待时间
-
上海市总人数:2500w
-
点外卖人数占比:假设为40%
-
骑手每天工作时间:10H
-
商家距离:假设为3KM
-
骑手速度:25KM/h
-
排队等待时间:0.25H
-
目的地距离:4KM
-
用户等待时间:0H
▶ 计算可得
-
每天的总订单数 = 200w
-
每人每天可配送的订单数 = 18.9单
-
外卖员的数量=10.5万人
以上就是拼多多面试真题解析参考~
为助力大家冲刺心仪offer