您现在的位置是:首页 > 人工智能人工智能
Aquarium华人CEO分享:机器学习在自动驾驶中落地,核心不是模型,是管道
cc博主2022-06-01【人工智能】252人已围观
编辑 | 陈彩娴
当我大学毕业后开始第一份工作时,我自认为对机器学习了解不少。我曾在 Pinterest 和可汗学院(Khan Academy)有过两次实习,工作内容是建立机器学习系统。在伯克利大学的最后一年,我展开了计算机视觉深度学习的研究,并在 Caffe 上工作,这是最早流行的深度学习库之一。毕业后,我加入了一家名为“ Cruise ”的小型创业公司,Cruise专门生产自动驾驶汽车。现在我在 Aquarium,帮助多家公司部署深度学习模型来解决重要的社会问题。这些年来,我建立了相当酷的深度学习和计算机视觉堆栈。与我在伯克利做研究的时候相比,现在有更多的人在生产应用程序中使用深度学习。现在他们面临的许多问题,与我2016年在 Cruise 所面临的问题是一样的。我有很多在生产中进行深度学习的经验教训想与你们分享,希望大家可以不必通过艰难的方式来学习它们。将ML模型部署到自动驾驶车上的故事首先,让我谈谈 Cruise 公司有史以来第一个部署在汽车上的ML模型。在我们开发模型的过程中,工作流程感觉很像我在研究时期所习惯的那样。我们在开源数据上训练开源模型,将之集成到公司产品软件堆栈中,并部署到汽车上。经过几个星期的工作,我们合并的最终 PR, 在汽车上运行模型。“任务完成了!”我心想,我们该继续扑灭下一场大火。我不知道的是,真正的工作才刚刚开始。模型投入生产运行,我们的 QA 团队开始注意到它的性能方面的问题。但是我们还有其他的模型要建立,还有其他任务要做,所以我们没有立即去解决这些问题。3个月后,当我们研究这些问题时,我们发现训练和验证脚本已经全部崩溃,因为自我们第一次部署以来,代码库已经发生了变化。经过一个星期的修复,我们查看了过去几个月的故障,意识到在模型生产运行中观察到的许多问题不能通过修改模型代码轻松解决,我们需要去收集和标记来自我们公司车辆的新数据,而不是依靠开放源码的数据。这意味着我们需要建立一个标签流程,包括流程所需要的所有工具、操作和基础设施。又过了3个月,我们运行了一个新的模型,这个模型是根据我们从车上随机选取的数据进行训练的。然后,用我们自己的工具进行标记。但是当我们开始解决简单的问题时,我们不得不对哪些变化可能产生结果变得更加敏锐。大约90% 的问题是通过对艰难或罕见的场景进行仔细的数据整理来解决的,而不是通过深度模型架构变更或超参数调整。例如,我们发现模型在雨天的表现很差(在旧金山很罕见),所以我们标记了更多雨天的数据,在新的数据上重新训练模型,结果模型的表现得到了改善。同样,我们发现该模型在绿色视锥上的性能较差(与橙色视锥相比较少见),因此我们收集了绿色视锥的数据,经过了同样的过程,模型的性能得到了改善。我们需要建立一个可以快速识别和解决这类问题的流程。花费数个星期,这个模型的 1.0 版本组装好了,又用了6个月,新推出一个改进版本模型。随着我们在一些方面(更好地标记基础设施、云数据处理、培训基础设施、部署监控)的工作越来越多,大约每月到每周都能重新训练和重新部署模型。当我们从头开始建立更多的模型管道,并努力改善它们,我们开始看到一些共同的主题。将我们所学到的知识应用到新的管道中,更快更省力地运行更好的型号变得容易了。
保持迭代学习


- 发现数据或模型性能中的问题
- 诊断问题发生的原因
- 改变数据或模型代码以解决这些问题
- 验证模型在重新训练之后变得更好
- 部署新模型并重复
建立反馈回路

自动化和委托
鼓励ML工程师健身
结语总结一下: 在研究和原型开发阶段,重点是建立和发布一个模型。但是,随着一个系统进入生产阶段,核心任务是建立一个系统,这个系统能够以最小的努力定期发布改进的模型。这方面你做得越好,你可以建造的模型就越多!为此,我们需要关注以下方面:
- 以规律的节奏运行模型管道,并专注于比以前更好的运输模型。每周或更短的时间内获得一个新的改进型号投入生产!
- 建立一个良好的从模型输出到开发过程的反馈回路。找出模型在哪些示例上做得不好,并向您的培训数据集中添加更多的示例。
- 自动化管道中特别繁重的任务,并建立一个团队结构,使您的团队成员能够专注于他们的专业领域。特斯拉的Andrej Karpathy称理想的最终状态为“假期行动”。我建议,建立一个工作流程,让你的机器学习工程师去健身房,让你的机器学习管道来完成繁重的工作!

雷峰网(公众号:雷峰网)
雷峰网版权文章,未经授权禁止转载。详情见转载须知。
Tags:ssr订阅
相关文章
- 招商证券:阿里加快推进全球化战略,国际站核心优势品类形成蓝海市场
- 第三批来了!华为正式宣布新成立三大军团、两大系统部,现已组建20个军团
- 升级Infinite Ajax Scroll的方法
- 「反卷斗士」许华哲:以热爱为名,用深度强化学习打造一个「机器厨子」
- 再突破!腾讯“混元”AI大模型登顶视觉常识推理VCR榜单
- 高性能Arm CPU初创公司鸿钧微电子获8亿元融资,前浪潮副总裁创立
- 原京东 AI 开山者周伯文受聘为清华大学电子系长聘教授、惠妍讲席教授
- 唯一中国科技公司!美团新研究获评Robotics顶会ICRA导航领域年度最佳
- 腾讯犀牛鸟开源人才培养计划发布,助力国产开源生态发展
- 安谋科技结束纷争,迎来发展新机遇
猜你喜欢
危机不断,缘何社区团购仍有当下价值?
业界持续性的上海抗疫保供,再一次让社区团购模式及团长火了起来。在刚刚过去的这段特殊时刻,社区团购这种集采集配,更有效率的零售形式,在城市中成为了维持居民正常生活的中坚力量,甚至随着疫情不断反复,社区团购这种商业模式的作用远远超过了市场的想象。所以近段时间以来,对...
阅读更多知网涉嫌垄断被正式立案调查,因续订费用近千万,曾“逼退”北大、中科院众多高校...
业界5月13日雷峰网(公众号:雷峰网)消息,近日市场监管总局根据前期核查,依法对知网涉嫌实施垄断行为立案调查。对此,知网官方发文回应称,将以此次调查为契机,深刻自省,全面自查,彻底整改,依法合规经营,创新发展模式,承担起中国知识基础设施的社会责任。今年4月份,...
阅读更多彻底分家?传Arm为上市转让全部安谋股份
芯片Arm总部与其中国合资公司安谋科技的斗争终于落下帷幕。据外媒tom’s HARDWARE报道,Arm已经与其中国合资公司安谋科技正式分道扬镳。Arm将在安谋中的股份出售给了一个独立实体,使安谋科技能够继续向中国使用Arm架构的公司收取授权许可费用。乘着国内...
阅读更多ICLR 2022 cosFormer:重新思考注意力机制中的Softmax
业界导读:Transformer在自然语言处理、计算机视觉和音频处理方面取得了巨大成功。作为其核心组成部分之一,Softmax Attention模块能够捕捉长距离的依赖关系,但由于Softmax算子关于序列长度的二次空间和时间复杂性,使其很难扩展。针对这点,研究...
阅读更多药物导致性功能障碍
健康问答什么药物导致性功能障碍,很多的朋友在生活当中都会受到性功能障碍这种疾病的困扰,平时的生活当中性功能勃起功能障碍,有可能是男性的阳痿早泄,也有可能是无法射精的障碍,性功能障碍越来越多地出现在我们的生活当中,那么导致性功能障碍的药物有哪些呢,下面我们就一起来看看吧...
阅读更多
热门文章
- 最方便省心的科学上网ssr节点分享,老牌稳定机场v2ray链接更新(2023/11/22)
- 十一月最新ssr节点机场分享-小火箭添加vmess链接更新(2023/11/24)
- 淘宝、阿里云盘等访问故障 阿里云云产品控制台服务异常
- 业内人士:台积电获得主要云服务厂商AI芯片订单 包括微软5nm芯片订单
- 蔚来宣布自建充电桩超已超20000根:中国市场第一
- 宁德时代和Stellantis签署谅解备忘录 在欧洲市场向其供应磷酸铁锂电池
- 白嫖ssr节点机场分享-永久vmess节点链接-每日更新(2023/11/28)
- 马斯克:Cybertruck电动皮卡车正运往北美特斯拉门店
- 特斯拉明年将推出新款高性能版Model 3 已有工程师透露细节
热评文章
十一月最新ssr节点机场分享-小火箭添加vmess链接更新(2023/11/24)
获取免费ssr节点机场分享,永久vmess节点v2ray链接更新(2023/11/26)
最方便省心的科学上网ssr节点分享,老牌稳定机场v2ray链接更新(2023/11/22)
白嫖ssr节点机场分享-永久vmess节点链接-每日更新(2023/11/28)
马斯克:Cybertruck电动皮卡车正运往北美特斯拉门店
特斯拉明年将推出新款高性能版Model 3 已有工程师透露细节
淘宝、阿里云盘等访问故障 阿里云云产品控制台服务异常
宁德时代和Stellantis签署谅解备忘录 在欧洲市场向其供应磷酸铁锂电池
蔚来宣布自建充电桩超已超20000根:中国市场第一
业内人士:台积电获得主要云服务厂商AI芯片订单 包括微软5nm芯片订单