特斯拉人形机器人震撼宣布!
马斯克之前就在强调,这次AI日实际上还是一个大型招聘会。
事不宜迟,一起来看看特斯拉和众多技术高管都公布了什么新消息吧。
AI可以视作一种生物,这种生物是从头开始构建的,包含了合成视觉皮层。而这就是应用在特斯拉汽车中的视觉组件。
特斯拉在设计汽车中的视觉时,是按照人眼感知生物视觉的方式进行建模。
在特斯拉汽车中,每辆车都装有8个摄像头,摄像头的数据会输入到一个三维的矢量空间里。
每个相机获取原始输入后能创建不同的分辨率,以用于各种功能和目的。
这些信息会输入到一个复杂的神经网络中,以生成对自动驾驶套件有用的附加信息。
在过去曾分享过的FSD的视频中可以看出,虽然每个摄像头的检测很好,但事实证明矢量空间是不够的。
如今,特斯拉已经能够在矢量空间进行自动标注,就算行驶过程中视野被遮挡,根据标注的数据,也能够安全、准确地导航。
除此之外,Karpathy还讨论了特斯拉神经网络学习的设计,包括相机校准、缓存、队列和优化,以简化所有任务。
他表示,与超级巡航和Waymo等竞争对手不同,现在特斯拉的FSD战略能让特斯拉汽车在行驶过程中实时绘制地图。
通过结合多个车辆经过同一地点的绘制,就可以得到一个完整的地图。
这些策略最终帮助特斯拉从其FSD和自动驾驶套件中退出雷达,采用纯视觉模型。
特斯拉的模拟(simulation)大有裨益。目前已经帮助特斯拉确定了行人、自行车和车辆检测和运动学。
车辆中的网络已经能够得出3.71亿个模拟图像和4.8亿个立方体。
特斯拉的自动驾驶场景模拟系统能够根据现实视频自动对场景进行标注,重建场景,最后得出合成场景,该系统包括五个部分:
要想让特斯拉汽车应用神经网络,那就需要超级计算机,Project Dojo也就应运而生。
Dojo是一个由网络结构连接的分布式计算架构,有一个大的计算平面,具有极高的带宽和低延迟,以及被分割和映射的大网络。
Dojo是一个纯粹的学习机器,有超过50万个训练节点。每个节点的计算量为9 petaflops,每秒有36兆字节的瓦片外带宽。
Dojo用所有这些力量都被用来做一件事:为自动驾驶汽车赋能。
特斯拉Dojo超级计算机系统的重头戏,莫过于D1芯片。
在现场,还用图表展示其性能对比,英伟达GPU、谷歌TPU都甘拜下风。
一句话概括,比现在市面上任何芯片都强。
除此之外,特斯拉正式宣布进军机器人领域,将会制造一个特斯拉机器人——明年上市。
特斯拉表示,Tesla Bot会替代人类去执行那些危险、重复、无聊的任务。
马斯克表示,机器人将会使用和特斯拉汽车相似的系统。
身高1米73,速度最高可达8千米每小时,载重18千克。
得益于轻量级材料的使用,机器人的体重只有56.7千克。
此外,Tesla Bot还搭载了40个机电执行器 ,人类级别的手和两只脚。
与特斯拉汽车相同,机器人将使用基于视觉的神经网络,AP的摄像头以及FSD的全套计算设备。
同时还会有Dojo超算的加持,为其提供自动标签、以及训练等。