- 市场洞察
Flower Labs获得新一轮2,000万美元的融资 | AI母基金动态
- 2024.02.20
Flower Labs是一家创业公司,其推出的开发框架允许开发者在不将训练数据集中收集和存储的情况下,以分布式的方式训练AI模型。公司本轮融资金额2,000万美元,投资方为Felicis Ventures。本轮融资完成后,公司的估值达到1亿美元。华港AI母基金投资的First Spark Ventures的种子基金作为首批投资者在2023年投资了Flower Labs。
Flower Labs的核心产品是一个名叫“Flower”的开发框架,这个框架是基于联邦学习(Federated Learning)理念开发的。联邦学习是机器学习领域的一种理论方法,它允许多个参与者协作训练一个共享的模型,同时保持各自数据的私密性和本地化。
Flower框架是联邦学习理论下最优秀的框架之一。它允许开发者使用敏感和分布式数据训练AI模型,而不需要直接访问数据本身。相反,AI模型的训练在每个设备或每个数据集上以本地的方式进行,只有训练结果(而非原始数据)会被传输及合并以开发全局模型。Flower框架发扬了联邦学习理论对数据和隐私保护的能力,越来越受到医疗、金融和国防等行业的关注。
Flower Labs的三位创始人Daniel Beutel、Taner Topal和Nicholas Lane相识于剑桥大学。Nicholas Lane是机器学习领域的教授,曾任三星剑桥人工智能实验室主任;Daniel Beutel当时正在攻读博士学位;Taner Topal是一名访问研究员。2020年,他们共同创建了基于联邦学习理论的Flower框架,并将其作为一个开源学术项目进行运营。随着该框架大获追捧,三人在2023年3月决定成立一家公司进行创业,即Flower Labs,更好地开发、维护和拓展Flower框架。
据悉,截止目前已有1,100多个项目使用了Flower框架。Flower Labs在Slack 频道上已有3,100个开发者。使用Flower框架的公司包括咨询巨头埃森哲、电信公司Orange和工业巨头西门子。公司计划使用本轮募集到的资金扩大产品的成熟度和知名度,并增加员工人数。Flower Labs目前只有13名员工,均在欧洲各地。公司的产品目前仍是免费和开源的。
Flower框架核心着眼于解决AI大语言模型未来将面临的两个问题:一是公共数据集不足的问题,二是算力瓶颈问题。
目前的AI大语言模型主要通过采集公开数据集进行训练,同时所需数据集的规模急速膨胀。这样的发展模式面临四个问题:第一,公开数据不够用。目前的大语言模型已经在挑战公共数据数量的极限。一旦互联网上的公开数据集被用尽,大语言模型的发展将受到极大挑战;第二,这些用于训练的数据是否得到了或者应该得到应有的许可,将越来越成为人们关注的话题;第三,越来越多的公司正在建立数据保护机制,防止自己的数据被外部获取;第四,监管对于数据的收集和使用的态度可能会更加严格。其实,当今世界上大部分数据是私有和分布式的,这些数据一般无法直接用于人工智能训练。Flower相信,未来的AI大语言模型一定是由全球开发者以私有和分布式数据为基础进行共建的,而不是由单一公司独立开发的。
算力已经成为了制约AI模型发展的最重要因素。公司相信,未来越来越多的人工智能训练将通过"边缘计算"进行,即通过人们的个人手机、笔记本电脑、平板电脑或者在智能汽车进行。目前,大多数智能设备的处理器都已经相当强大,完全可以用于分布式训练。比如,AI大模型公司Inflection宣称自己拥有一个由2.2万个英伟达H100 GPU组成的集群,合计算力约2.9 exaflops (exaflop是根据计算机每秒能进行多少次数学运算来衡量计算机计算能力的指标)。但是仅仅是所有配备了高通骁龙8处理器的三星智能手机的合计计算能力就达到了69.9 exaflops。公司认为,分布式训练是解决未来AI大模型计算能力的核心办法。而利用边缘计算必然涉及到使用边缘数据。边缘计算和边缘数据的结合将可能使每个智能终端都拥有参与AI模型训练甚至是以此获利的能力。