什么是低代码?
|
TinyML 示例 以前,设备执行的各种操作必需基于复杂的集成电路。现在,机器学习的硬件“智能”正逐渐抽象为软件,使得嵌入式设备更加简单、轻量级和灵活。
使用嵌入式设备实现机器学习,需解决巨大的挑战,但在该领域也取得了长足的进步。在微控制器上部署神经网络,关键挑战在于低内存占用、功率受限和计算受限。 模型并非越大越好。 本文是 TinyML 系列文章中的第一篇,目的是向读者介绍 TinyML 概念及其未来潜力。本系列的后续文章中,将深入介绍一些特定的应用、具体实现和教程。 引 言 过去的十年中,由于处理器速度的提高和大数据的出现,我们见证了机器学习算法的规模呈指数级增长。最初,模型的规模并不大,在本地计算机中运行,使用 CPU 的一或多个内核。 此后不久,GPU 计算使人们可以处理更大规模的数据集,并且通过基于云的服务,例如 Google Colaboratory 等 SaaS 平台,Amazon EC2 Instances 等 IaaS,GPU 技术变得更易于获取。与此同时,算法仍可在单机上运行。 最近,专用的 ASIC 和 TPU 已可提供大约 8 个 GPU 的处理能力。这些设备的发展,增强了将学习算法分布到多个系统中的能力,满足了规模不断增大的模型需求。 2020 年 5 月发布的 GPT-3 算法,推动模型的规模达到登峰造极的水平。在 GPT-3 的网络架构中,包含了数量惊人的 1750 亿个神经元,是人脑中约 850 亿个神经元的两倍多,也是 Turing-NLG 神经元数量的 10 倍以上。Turing-NLG 发布于 2020 年 2 月,是有史以来的第二大神经网络,其中包含约 175 亿个参数。有人估计,GPT-3 模型的训练成本约为 1000 万美元,使用约 3GWh 的电力,是三个核电站一小时的输出。 尽管 GPT-3 和 Turing-NLG 的成就值得称赞,但它们自然也引发了一些业内人士对人工智能行业日益增长碳足迹的批评。另一方面,它们也激发了人工智能领域对更为节能计算的兴趣。过去数年中,更高效的算法、数据表示和计算等理念,一直是机器学习微型化(TinyML)这一看似毫无关联领域的关注点。 TinyML 是机器学习和嵌入式 IoT 设备的交叉领域,是一门新兴的工程学科,具有革新许多行业的潜力。 TinyML 的主要受益者,是边缘计算和节能计算领域。TinyML 源自物联网 IoT 的概念。物联网的传统做法,是将数据从本地设备发送到云端处理。一些人对这一方式在隐私、延迟、存储和能源效率等方面存在疑虑。
上述问题推动着边缘计算的发展。边缘计算的理念就是在部署在云“边缘”的设备上实现数据处理功能。这些边缘设备在内存、计算和功能方面都高度受限于设备自身的资源,进而需要研发更为高效的算法、数据结构和计算方法。 此类改进同样适用于规模较大的模型,在不降低模型准确率(accuracy)的同时,实现机器学习模型效率数个数量级的提高。例如,Microsoft 开发的 Bonsai 算法 可小到 2 KB,但比通常 40MB 的 kNN 算法或是 4MB 的神经网络具有更好的性能。这个结果听上去可能无感,但如果换句话说——在规模缩小了一万倍的模型上取得同样的准确率,这就十分令人印象深刻了。规模如此小的模型,可以运行在 2KB 内存的 Arduino Uno 上。简而言之,现在可以在售价 5 美元的微控制器上构建此类机器学习模型。 机器学习正处于一个交叉路口,两种计算范式齐头并进,即以计算为中心的计算,和以数据为中心的计算。在以计算为中心的计算范式下,数据是在数据中心的实例上存储和分析的;而在以数据为中心的计算范式下,处理是在数据的原始位置执行的。尽管在目前,以计算为中心的计算范式似乎很快会达到上限,但是以数据为中心的计算范式才刚刚起步。
当前,物联网设备和嵌入式机器学习模型日益普及。预计到 2020 年底,将有超过 200 亿台活跃设备。人们可能并未注意到其中许多设备,例如智能门铃、智能恒温器,以及只要用户说话甚至拿起就可以“唤醒”的智能手机。本文下面将深入介绍 TinyML 的工作机制,以及在当前和将来的应用情况。 (编辑:南昌站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
