在2024Inclusion·外滩大会上,香港科技大学校董会主席、美国国家工程院外籍院士沈向洋探讨了未来人工智能、大模型如何深入产业的问题。他认为,对于大模型的深入发展,最重要的是算力、算法和数据。
沈向洋分享了一组数据,从2012年开始,每年大模型需要的算力都在增长,一开始几年是六七倍的增长,最近几年稳定下来,每年是四倍左右的增长。而随着大模型的参数越来越大,大模型对算力的要求已经由线性增长进化到平方向的增长。如今,算力已经是大模型落地的门槛。
沈向洋表示,目前整个计算机芯片行业的发展,从原来的摩尔定律变成了黄氏定律。以前是CPU的增长,摩尔定律是指每18-24个月,计算能力翻倍。现在是GPU的算力一年涨4倍。人类社会的计算能力呈现了一种超级跃进趋势。
数据的重要性也得到了突出。GPT3刚出来的时候是2个T的token,GPT4刚出来的时候是12个T左右的数据,后来还在不断地加数据训练。沈向洋给出的猜测是200个T的数据,但如今的互联网要挖出200T的数据已经不容易了。
沈向洋认为,大模型的下一章要从语言模型到多模态发展。尽管Sora已经做得不错,但多模态大模型仍不够强大。他强调,大模型未来一定要往具身智能走,往机器人走,自动驾驶就是一种机器人的特别形态。
随着大模型的发展,沈向洋提出,未来大模型将横扫所有垂直行业。大模型可分为通用大模型、行业大模型、企业大模型和个人大模型。通用大模型大致是万亿参数,万卡训练。行业大模型大致上是千亿参数、千亿卡的训练规模。企业大模型可能只需要100张卡、百亿参数。而个人大模型最被沈向洋期待,比如联想、微软推出的AIPC,苹果号称的Apple Intelligence,利用个性化参数,结合云和端,都被沈向洋视作有意思的尝试。
同时,沈向洋也强调了AI治理的重要性。他表示,目前AI可能对民众、公司、政府监管乃至社会发展的冲击都在引发大众的担忧,接下来全球各个国家一定要做主权人工智能,主权人工智能背后一定要有一个主权云来支持其发展,通过国家支持人工智能基础设施建设,用符合本国文化和思维方式的数据训练大模型,支持本地产品形成生态系统。
而对于业内备受关注的AI agent(智能体),沈向洋的观点是,agent从愿景到落地的过程中,需要始终以需求为圆点,深刻理解模型的能力,并构建一个AI深度参与的工作流程。他判断,AI agent时代的到来,不会是一个神奇而强大的模型突然代替了原有的工作流,它涉及技术、工程与市场的不断磨合,最终以超预期的服务呈现给人类。
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
如有疑问请发送邮件至:bangqikeconnect@gmail.com