客服微信号 MaxStockWe 客服微信2号 MaxTrades 客服Telegram号 MaxMeigu 邮箱 buy@tradesMax.com 电话 (626)378-3637

gold 20 virus

新闻快讯

如何准备Data Science面试2019

作者  |  2019-08-07  |  发布于 新闻快讯

简单介绍一下背景,本科是BJTU的信息与计算科学专业,MSGeorgia TechComputational Science and Engineering专业,毕业后在一家StartupData Scientist,裁员的时候刚好干满一年,刚刚拿到了流媒体公司 Hulu和Yelp DS的职位。

 

之前工作主要集中在两个方面,一是客户与产品分析(customer conversion / churn analysis, product analysis),二是数据分析产品的研发。这次找工目标是Data Scientist,另外也有面过Machine Learning Engineer, Software Engineer。面过的公司里面以high tech公司为主,少部分是传统行业的公司。

Data Scientist面试的基本流程包括了一到两轮电话面试,Homework Assignmentonsite interview(通常四到六轮面试)。电话面试主要是聊聊简历,问问机器学习概率统计,写写代码。Homework Assignment通常是给一个简化但与实际工作相关的问题,根据给出的数据进行建模、分析、完成报告。onsite interview里每一轮面试的侧重点都会有所不同,但是基本上是电话面试的扩展版。

 

面试内容可以归纳为简历,机器学习,概率统计,算法与coding,开放性问题五个方面。

 

简历

由于目前数据行业从业人员背景千差万别,所以不同背景的面试官关注的点可以能不一样,有的侧重于具体的技术细节,有的更看重business impact,所以在准备简历的时候,最好能保证两个方面都照顾到。在聊简历到过程中,常被问到这些问题:一,为什么用某一种方法及与之相关的各种技术细节;二,如果有机会重新做这个项目,有什么可以改进提高的地方等等。

 

聊简历的终极奥义是引导面试官聊你最熟悉的内容,引导面试官问你想让他问的问题(能体现你的水平与思考的)。总的来说,简历从写到聊水很深,有机会单独再详细说。但是最基本的要求,必须熟悉简历上的每一句话,每一个关键字,了解每一个技术点。

 

机器学习

机器学习是Data Scientist面试中非常非常重要的一个部分,因为这是Data Scientist看家吃饭的技能,所以机器学习的面试结果会很大程度上左右最终面试结果。一般公司会从广度,深度,经验三个角度进行考察。

 

从广度上讲,应该对机器学习各个方面(regression, classification, clustering, etc)的算法都有所涉猎,不要求精通,但是至少能够用几句话描述出算法是在怎样的假设下用怎样的步骤解决了怎样的问题,有什么优缺点。

 

从深度上讲,一方面,能完整的掌握几种机器学习的算法。不仅仅知道算法是干什么的,更要知道与之相关的数学推理、技术细节。比如Naive Bayes怎么利用Naive Assumption简化,比如AUC为什么对于数据不平衡问题不敏感等等。另一方面,能够对算法进行横向比较。比如什么情况下Random Forests Gradient Boosting好,什么情况下不如GBM,为什么会这样。

 

从经验上讲,侧重的是考察与实际项目有关但是在课堂或教科书里一般不会涉及的内容。比如如何进行feature engineering,如果数据量比feature量少怎么办,如何解决imbalanced data classification的问题,如果模型的performance没有达到预期应该怎么办等等。

 

概率统计

面试中概率有关的都是一些很经典的问题,比如红白球取某种球的概率,计算条件概率,根据贝叶斯公式计算概率等。

 

统计相关的概念也经常会被问到,比如什么是p值,置信区间,最大似然估计,中心极限定理,大数定律等。如果职位对统计的要求较高,也会涉及一些统计检验方法,比如如何判断两组数是否来自同一分布。AB test也是一个统计的考察点。

 

算法与coding

Data Scientist对于算法和coding的要求相对较低,不需要像Software Engineer那样要求bug free。能搞定leetcode medium难度,明白时间及空间复杂度,知道基本的数据结构,就能应付绝大多数Data Scientist的面试。与data相关的题目被问到的几率相对较高,比如find median from data stream, median of two sorted array等。另外,简化版的k-means, tf-idf等机器学习的算法也有被要求过现场写代码。

 

此外,SQL基本是必考内容,从各种不同的join,再到一些高级技巧都所涉及,基本上过一遍w3school就能解决绝大部分SQL题。

 

开放性问题

我把开放性问题分为三类,一是实际问题的case study,二是“之前的经历中有没有遇到过xxx问题”,三是behavior questions

 

Case study简单来说是对面试官提出的一个工作过程中可能会遇到的问题,要求进行分析建模。这个问题可能是偏技术的,如设计一个推荐系统,开发一个数据有关的功能,也可能是与公司产品、客户、运营有关的business问题,如怎样进行客户流失分析等。我个人的回答思路是首先明确问题并将其转换成建模问题,然后确定需要什么样的数据,之后进行feature的构建及选择,模型评估方法的选择,模型的构建与测试评估,最后谈一下结果的delivery

 

“有没有遇到过xxx问题”也是一类经常被问的问题。这需要注意在工作过程中的积累,平时多思考。如果真的遇到不熟悉的问题也不要慌。这类问题典型的有:有没有遇到过数据不足的情况;有没有缺少可信的labeled data或者数据质量突变的情况;如果数据量太大不能放到内存或者一张硬盘中应该怎么处理等等。

 

Software Engineer面试中很少会涉及到behavior questions,大家都上来直接做题过招。但是Data Scientist面试中这是非常常见的,估计是因为Data Scientist工作中经常需要同时与技术和非技术的同事打交道。除了怎么进行团队合作,遇到意见不一致怎么处理,怎么进行日常交流等常见behavior questions之外,诸如如何向没有数据背景或者没有技术背景的同事解释模型,在business objective不明确或无法实现的情况下如何进行交流沟通这种与日常工作紧密结合的问题也会被问到。

以上就是我的一些小小经验分享,希望能够帮助有需要的同学。将来如果有机会,希望能再开贴详细说说上述的每一步。how to prepare Data Scientist interview 2019

 

Walmart在印度推免费流媒体视频服务

作者  |  2019-08-07  |  发布于 新闻快讯

 

沃尔玛(WMT)和亚马逊(AMZN)对印度在线市场主导地位的争夺战将开辟另一条战线,即在线视频。

  沃尔玛去年收购的大型印度电子商务公司Flipkart周二表示,未来几周将向其移动应用用户推出流媒体视频服务。

  这项名为Flipkart Videos的服务将提供“一系列精选的电影、电视及娱乐节目”,而且是免费放送。

  亚马逊的流媒体服务于2016年在印度推出,是其Prime会员服务的一部分,每月费用为129卢比(合1.80美元)或每年999卢比(合14美元)。

  Flipkart还将与流媒体巨头Netflix(NFLX)和迪士尼(DIS)旗下的Hotstar等大牌公司展开竞争。

  与其他流媒体服务不同,Flipkart视频将不会有单独的平台,而是将在该公司的移动购物应用程序中提供内容。Flipkart希望把观众变成购物者。

  沃尔玛一年前以160亿美元的价格收购了总部位于班加罗尔Flipkart,该公司希望通过提供免费视频服务来吸引“未来的2亿消费者”。

  亚马逊的另一项举措将印度语融入Flipkart应用中,这将吸引更多的用户。根据最新的人口普查,印地语是印度最常用的语言,也是大约5.3亿人的“母语”。

  亚马逊去年推出了其移动应用程序的印地语版本。

  根据研究公司Forrester的最新估计,Flipkart在印度电子商务市场的领先优势略高于亚马逊,市场占有率相差不到一个百分点。

  但亚马逊可能正在采取自己的行动来缩小这一差距。据报道,亚马逊正在洽谈收购印度最大的零售商Reliance Retail,这笔交易将使其能够进入印度全国近1.1万家实体店。

 

迪士尼财报不及预期 盘后下跌4%

作者  |  2019-08-06  |  发布于 新闻快讯

 

迪士尼(DIS)第三季度调整后每股收益1.35美元,上年1.87美元,分析师预估1.75美元(区间1.62美元至1.94美元)。

  第三季度营收202.5亿美元,上年+33%,分析师预估214.4亿美元(区间201.1亿美元至224.6亿美元)。

  第三季度有线电视网络业务营收44.6亿美元,上年+6.6%

  第三季度媒体网络业务营收67.1亿美元,上年+9%

  第三季度主题乐园、体验及消费品业务营收65.8亿美元,上季度+6.6%

  第三季度媒体网络业务运营收益21.4亿美元,上年+17%

  第三季度影视娱乐业务营收38.4亿美元,上年+32%

  第三季度影视娱乐业务运营收益7.92亿美元,上年+12%

  第三季度有线电视网络业务运营收益16.4亿美元,上年+18%

  第三季度主题乐园、体验及消费品业务经营利润17.2亿美元,上季度+14%

  第三季度直接面向消费者和国际业务营收抵消额38.6亿美元,上季度9.55亿美元。

  第三季度5.53亿美元,上季度+41%

  第三季度调整后每股收益1.35美元,估计为1.75美元;收入。

  本季度,本公司录得总额为2.07亿美元的费用,主要用于工作遣散费,与业务整合有关。

  迪士尼股价盘后下跌4.1%136.02美元,成交108万股。

  分析师评级:22买进,9持有,1卖出。

 

Snap:融资10亿美元,增发债券

作者  |  2019-08-06  |  发布于 新闻快讯

Snap宣布将通过发行债券的方式融资10亿美元。其将发行10亿美元的可转换高级债券,截至到202681日到期。

Snap称:“公司将利用此次发行收益来支付与经营业务相关的运营费用。此外,还可能用于收购互补的业务、产品、服务或技术,或用于回购Snap的普通股。”

Snap第二季度财报显示,其该季度营收为3.880亿美元,与去年同期的2.623亿美元相比增长48%;净亏损为2.552亿美元,与去年同期的净亏损3.533亿美元相比收窄28%Snap CEO Evan Spiegel曾表示公司要在2019年最终实现盈利。

财报显示,Snap第二季度每日活跃用户人数为2.03亿人,相比之下2019年第一季度为1.90亿人,2018年第二季度为1.88亿人。Snap在北美、欧洲和世界其他地区的每日活跃用户人数均实现了环比和同比上升,在每个iOSAndroid平台上也均实现了环比和同比上升。

苹果信用卡Apple Card怎么样?

作者  |  2019-08-06  |  发布于 新闻快讯

苹果公司正式面向用户推出了虚拟信用卡Apple Card苹果公司 AAPL 更新了美国地区Apple Card的介绍页面,并向部分苹果用户发出了邮件邀请,收到邀请的用户可通过iPhone的电子钱包应用注册申请开通Apple Card

亚马逊CEO一周内抛售价值28亿美元股票

作者  |  2019-08-06  |  发布于 新闻快讯

 

亚马逊CEO 杰夫·贝索斯正在大量将其所持有的亚马逊 AMZN 股票进行变现。根据亚马逊向SEC提交的文件显示,贝索斯上周四和周五出售了价值9.9亿美元的亚马逊股票。

CNBC称,当周早些时候,贝索斯还抛售了约18亿美元的亚马逊股票。也就是说在一周内,贝索斯共抛售了价值约28亿美元的亚马逊股票。对此原因,亚马逊官方拒绝做出任何评论。

此前,贝索斯曾表示,将每年出售约10亿美元的亚马逊股票来支持Blue Origin,而他目前也在部署Day One Fund。有业内人士认为这或许是贝索斯正在加紧“变现”的原因。

 

搜狐暴跌至16年新低

作者  |  2019-08-05  |  发布于 新闻快讯

 

搜狐(SOHU) 公布二季报显示,营收同比下降2%4.748亿美元,环比增长10%,略低于市场预期的4.82亿美元;归属于搜狐公司的非美国通用会计准则(non-GAAP)净亏损为5000万美元,去年同期净亏损为4900万美元。除门户网站和视频广告收入同比下降29%,其他业务均实现同比增长。

搜狐(SOHU)暴跌20.46%,报9.72美元,暂成交641.7万美元,最新总市值3.83亿美元。盘中最低价9.625美元,创20033月以来新低。搜狗目前跌8.55%

 

BlackLine公司财报后大涨20%

作者  |  2019-08-02  |  发布于 新闻快讯

 

云端金融和会计软件公司BlackLine ( BL ) 在周四盘后发布2019年第二季度财务业绩显示,GAAP总收入为6970万美元,与2018年第二季度相比增长26%。归母净亏损为520万美元,合每股亏损0.09美元;非GAAP归母净利润为610万美元,合每股收益0.10美元,去年同期的非GAAP净收入为50万美元

股价大涨22%

  另外,第二季度新增净新客户106家,截至2019630日总计2813家客户。截至2019630日,公司用户群扩大到236802人。截至2019630日实现以美元为基础的净收入保留率108%

  公司预计,2019年第三季度GAAP总收入在7170万美元至7270万美元之间。非GAAP归母净利润预计将在140万至220万美元,或每股0.02美元至0.04美元。全年GAAP总收入预计在2.81亿美元至2.84亿美元之间。

 

GLUU游戏财报后暴跌40%

作者  |  2019-08-02  |  发布于 新闻快讯

 

手机游戏发行商Glu Mobile发布财报后,股价暴跌40%,公司公布的二季度营收同比增长5.9%9550万美元,不及市场预期。另外,公司预期三季度的客户订单金额为110万至112万美元,而市场预期为120万美元。

GLUU 成立于2001年,总部位于美国加州旧金山,是一家全球领先的手机游戏开发商。

 

IBM裁员5万-10万人

作者  |  2019-08-02  |  发布于 新闻快讯

 

2019731日,前IBM人力资源副总裁阿兰瓦尔德在法庭作证时称:

  为了吸引新一代年轻人,让公司看起来和亚马逊、谷歌一样“新潮炫酷”,IBM在过去几年炒掉的员工数量可能高达10万人。20183月,新闻调查网站ProPublica发布了一份深度调查报告。该站记者拿到许多IBM内部文件,发现IBM在过去5年大约炒掉了2万名40岁以上的美国员工,约占这几年被裁美国员工总数的60%

  在设法查阅了IBM的内部文件、法律文件和公共记录,并采访调查了逾1000IBM前员工后,ProPublica发现,IBM涉嫌绕开美国法律监管,擅自开除年龄较大的员工。

  比如,美国平等就业法规定,被裁员的员工可以要求公司披露本轮被裁员工和留任员工的平均年龄,以便仲裁机构判断公司是否有针对大龄员工的歧视。

  不过,IBM拒绝透露已裁员人数,也拒绝透露决定裁员与否的年龄标准线。IBM不但拒绝向相关员工提供此类信息,还要求他们签字放弃自己的申诉权,以及放弃协同他人寻求赔偿的权力。

  与此同时,IBM还采用种种招数,掩盖自己对大龄员工的歧视:

  即便某些老员工工作表现突出,IBM也会将其列为裁员对象,并以他们不熟悉某些技术为理由挤兑他们;

  把裁员说成退休,并采取种种措施鼓励员工自己辞职。这些举措减少了纸面上的裁员数目,因此不致刺激公众,使其提出披露具体数目的要求;

  一面鼓励裁员对象申请其他职位,一面暗中怂恿经理不要接受他们,同时还要求许多员工培训接班人;

  告诉某些年长的员工说其技能已经过时,然后把他们转为非正式工(类似于派遣工),之后他们往往还做以前的工作,但收入和福利都大不如从前。

  IBM转型急需年轻一代

  “年龄歧视和性骚扰一样,一直是行业公开的秘密。”美国平等就业委员会代理主席利普尼克这样评价IBM的做法。

  在数十年前称霸业界的时代,IBM在美国的员工人数曾一度增至25万。后来IBM不但将种族平等、男女同工同酬等目标逐一纳入规划,而且提供了业界无人能及的高薪和近乎终身雇佣的制度。

  为此,IBM鼓励员工要有主人翁意识,把公司利益当做自己家的利益来考虑。

  直到上世纪八十年代,IBM还在一份员工手册中称:“一旦发生经济衰退或遇生产方向大变,人事就势必变动。某些企业会用裁员来适应新局面,但IBM却会再培训、再分配甚至再安置原有员工。”

  后来,由于接连错失芯片技术革新、移动互联网带来的浪潮,IBM逐渐无法维持原有的员工福利和高薪了。如今,IBM更倾向于用低薪、经验差的年轻员工取代高薪、经验丰富的老员工,以及用敏于接受新事物的员工取代风格固化的员工。

  2014年,IBM公司转型提出CAMS服务,即云服务、大数据、移动、社交媒体。

  在IBM咨询部门做的一张PPT报告中指出,千禧一代非常适合CAMS方面的工作。这份报告后来被当作集体诉讼时的证据,证明IBM早有针对老员工的裁员计划。

  这份报告称,千禧一代有着“数字原生代、追求真实、用于创新、设计天赋”的特点,和CAMS业务所需的特质很契合。

  为此,老员工被视作为裁员目标,在评职时受到更严苛的评估。尽管IBM强调公司一切都符合法律,但是员工想要领取遣散费,就必须接受私下仲裁。

  也就是说,如果员工因为年龄大了感觉自己要被放弃了,必须单独提出并保密,这样才能拿到遣散费。因为保密而增加了外界收集证据的难度。在硅谷,这种做法完全合法并且被广泛运用。

  许多前员工都公开表示,他们曾尝试在IBM公司内部或在新技术领域中寻找新岗位,但仅有少数人找到了工作。许多人都表示,整个行业中年龄歧视的问题普遍存在。

 

Copyright© 2008-2026 Tradesmax.com. All rights reserved.