芯片巨头正在偷偷研发这些新AI技术不比EMc易倍·体育拍照有意思

栏目：公司新闻发布时间：2022-07-03

　光就芯片制程来看，从7nm卷到5nm再卷到3nm，已经越来越逼近摩尔极限。　　于是，不少厂商开始试着用AI给芯片性能提供灵感，从神经拟态到用AI设计芯片，各种技术路线都有人在尝试。　　侯纪磊博士毕业于加州大学圣迭戈分校，在高通已经工作了19年，目前是高通公司AI研究项目负责人，负责高通AI研究（Qualcomm AI Research）的技术创新规划。在采访中，侯博士分享了高通AI研究在基础、

　　光就芯片制程来看，从7nm卷到5nm再卷到3nm，已经越来越逼近摩尔极限。

　　于是，不少厂商开始试着用AI给芯片性能提供灵感，从神经拟态到用AI设计芯片，各种技术路线都有人在尝试。

　　侯纪磊博士毕业于加州大学圣迭戈分校，在高通已经工作了19年，目前是高通公司AI研究项目负责人，负责高通AI研究（Qualcomm AI Research）的技术创新规划。在采访中，侯博士分享了高通AI研究在基础、平台和应用三个研究方向的一些首创技术成果。

　　其中，基础研究主要针对前沿性、基础性的AI技术进行研究，例如神经压缩和AI+量子计算相关领域的探索；

　　平台研究则主要是从平台能力和创新的角度，推动AI技术的发展并提升能效、进行端侧学习，例如量化技术和联邦学习；

　　应用研究包括移动端视频AI技术和3D+AI技术等，涵盖智能手机、XR、自动驾驶等各个行业应用领域的技术研究。

　　同时，侯博士还分享了不少“AI落地狂魔”高通，将AI技术快速应用到芯片上的秘诀。一起来看看。

　　虽然高通最广为人知的AI技术是量化，不过要看最新的技术，还得从高通AI研究的顶会论文中去找。

　　从论文来看，高通相对着重的AI基础技术可能是以下四个方向：神经增强、弱监督学习、神经推理和量子AI。先来看看神经增强（neural augmentation）技术，目前高通已经将之用到了无线通信中。

　　平时处理无线通信信号主要有两种方法，一种是用传统滤波器搞一套公式出来，另一种是用AI直接训练并预测结果，前者精度不高，后者训练数据量太大。

　　高通选择将二者结合起来，在保留传统滤波器的基础之上，让AI自己学习调参。

　　没错，就是教会AI自己当调参侠，熟练应用并掌握那些看起来晦涩难懂的公式，类似于应用卡尔曼滤波器的场景中，让AI自己学会调整其中的QR参数。再或者以麦克斯韦方程为例，高通选择保留y=x*H模型的线性，同时采用AI学习H的分布：

　　而神经增强还只是高通神经推理研究的一部分。如果AI真的同时具备了逻辑思维和抽象能力，那距离芯片性能突破也不远了。

　　再说到弱监督学习，这个方向一直是解决长尾问题、以及AI技术落地新场景的一大趋势之一。

　　就像是“让AI自己学习”一样，这项技术旨在避免数据标记错误导致的AI精度下降、以及降低标记成本等，来利用少量标记数据，实现与监督学习接近甚至超过监督学习的精度效果。

　　侯博士介绍了在去年MWC，高通做的一个演示，用弱标记的方法，训练出相对精确度高的定位的模型。

　　而且最令人惊讶的是，这种定位的模型它不是通过视觉的方式，而是通过射频信号来进行定位的学习，使用了弱监督和自监督的学习方法。室内定位场景所需的信号数据标记比较复杂，通过射频感知的方法，使用弱监督学习能比较有效地节省成本、提升效率。

　　嗯，现在老板只需要通过无线信号，就知道你在哪个办公室和同事摸鱼聊天了（手动狗头）。再来看看神经推理（Neural Reasoning）技术。

　　事实上，这里的推理并不是指单纯的模式识别，而更像是教AI学会“逻辑推断”，概念上和Yoshua Bengio之前提到的system2（逻辑分析系统）有些相似。

　　那么，神经推理和芯片有什么关系，可以应用在哪些方向，高通又进展到哪一步了？

　　据侯博士介绍，神经推理是一种将符号推理和神经网络优势结合起来的思路，让模型兼具并行性和串行性，而这个思路对于计算硬件而言同样具有借鉴性，目前高通已经利用自回归语言模型做出了一些首创成果。

　　目前高通主要有进行两个方面的研究，一个是基于AI加速构建量子计算机，另一个是让AI更快在量子计算机上运行的新方法。

　　研究人员通过引进群等变卷积神经网络，提出了一种新的解码方式，比传统解码器运行效率更高、性能也更好。

　　而高通登上ICML 2021的一项新研究，还提出了一种基于量子场论，在光学量子计算中运行神经网络的新思路。如果未来真的能用量子计算运行AI，那大模型快速运算也不是梦了。

　　实际上，高通AI研究关注前沿科技背后，更加重视的是这些技术具体如何落地。

　　例如在早些年AI领域还在关注图像处理的时候，高通就已经在布局视频AI技术的落地了，并产生了不少相应的首创成果。

　　基础研究，涉及量子AI、强化学习、群等变卷积神经网络等，着眼于遥远的未来，通常更具有基础性。

　　平台研究，包括软硬件协同设计、AI模型效率工具包以及模型量化、压缩和神经架构搜索等，来实现最佳的能效、性能和时延。

　　应用研究，是指利用AI基础研究和平台研究的成果在某些特定用例中，包含视频识别与预测、指纹图谱、图形深度学习、视觉质量提升等。一方面，高通一直以平台研究技术带动应用研究的落地。

　　这是高通AI研究这几年钻研的核心技术之一，目的就是给AI模型做个“瘦身”。

　　在实际应用场景中，由于电量、算力、内存和散热能力受限，手机使用的AI模型和PC上的AI模型有很大不同。

　　在PC上，GPU动辄上百瓦功率，AI模型的计算可以使用16或32位浮点数（FP16、FP32）。而手机SoC只有几瓦功率，也难存储大体积AI模型。

　　这时候就需要将FP32模型缩小成8位整数（INT8）乃至4位整数（INT4），同时确保模型精度不能有太大损失。以AI抠图模型为例，我们以电脑处理器的算力，通常能实现十分精准的AI抠图，但相比之下，如果要用手机实现“差不多效果”的AI抠图，就得用到模型量化的方法。

　　值得一提的是，基于模型量化快速部署，高通在2020年开源的AI模型增效工具包（AIMET）。

　　这其中包含了同年以及上年被ICML、ICCV收录的技术方法。量化的结果之一就是，更多应用方向的AI模型被“压缩”并优化，然后加速部署到芯片中。

　　比如视频语义分割上，首次在移动端上以FHD分辨率实现实时街景；神经视频压缩方面，首次在移动端实现了实时高清解码……

　　从这些行业首次落地的成果中可以直观感受到，高通AI研究在结合前沿学术、应用需求上的考量。

　　侯纪磊博士在采访中表示，高通的AI技术从最初发现到形成开源或商业化生态，只需要2-3年时间。另一方面，从应用和平台需求上反过来push基础研究技术的进展，催生出更多交叉领域。

　　比如联邦学习、图像预内核优化，就是基础与平台研究相交叉产生的领域；音视频压缩、面向无线领域和射频感知的AI等，则是基础和应用研究相结合的体现。

　　也就是说，高通在基础、平台、应用三方面上的研究，完整地将AI技术落地所需的算法模型、数据、软硬件、应用场景几大要素囊括其中，以支持边缘AI，走的是全栈AI研究的路线，并首次在移动终端上演示了概念验证。

　　以此，高通希望能通过研究“可以应用并落地的AI”，快速推动技术落地的进程。

　　侯博士表示，其实高通本身在平台和应用上投入比重就会更大，此外在基础研发过程中，产品团队还会深度参与，方便技术人员更加了解应用需求。从AI研究到落地往往非常复杂，需要考虑更多现实世界中的问题（如长尾场景等）。

　　目前，高通光是实现落地的AI首创研究成果，就有这么多：由此可见，高通AI研究在首创技术之外，更致力于将这些成果成功运行到终端上。

　　例如前段时间发布的骁龙X70，就是经过这样的历程问世的。作为全球首款引入AI处理器的5G调制解调器及射频系统系统，骁龙X70预计后续会集成到骁龙年度的8系旗舰平台上。EMc易倍·体育 EMc易倍·体育

上一篇：EMc易倍·体育加强研发筑牢“护城河”方能赢得未来

下一篇：燕之屋坚持创新研发双驱动燕窝肽研究取得进展EMc易倍·体育