最近,AI(人工智能)圈一股以“ChatGPT”为核心的热潮从美国“硅谷”涌入中国。
2022年11月底,初创公司OpenAI发布了名为ChatGPT的对话式聊天机器人模型,一经推出,便在网络上迅速走红。
进入2023年,微软推新,谷歌入局,“ChatGPT”热潮迅速升温,国内的科技巨头也陆续涌入潮中。ChatGPT发布后,包括百度、科大讯飞、京东等在内的多家企业纷纷公布自己在AI领域的布局。
图源:OpenAI官网
中国AI水平与ChatGPT有多大的差距?中国如何训练出这样的GPT大模型?难点又在哪里?
ChatGPT是AIGC的一种实现。在AIGC的大模型建设和应用层面,国内企业在技术基础和创新环境上都存在着相对优势。
首先,国内持续投入大模型研发、技术基础扎实。目前,阿里达摩院的多模态大模型M6参数量已达10万亿,是全球最大的AI预训练模型;华为盘古、百度文心等大模型的参数量都超过了千亿,其中百度文心模型参数量已经达到2600亿,不逊于GPT-3。
图片来源:钛媒体结合东吴证券数据整理而成
其次,国内加快“产业数字化转型”、实现人工智能与实体经济融合等政策为人工智能提供了创新发展环境。近年来,我国发布了一系列政策文件,为人工智能核心技术攻关、产品落地应用以及探索发展新模式新路径提供支持。
把握优势的同时,也要看到目前面临的一些挑战。如AI领军人才相对短缺,AI与实体经济的融合程度仍需进一步加深等等。对此,董晓飞建议,要特别关注一些底层技术的发展,如大模型框架、算法等,还要进一步拓展AI的应用场景。
这场由硅谷率先发起的新一轮“军备竞赛”正式进入风口,但是,对于国内科技公司而言,加入战场之前,真正需要思考的是应用场景的变革。
01 科技大厂竞逐AIGC
2022年11月30日,OpenAI首席执行官山姆·阿尔特曼当天发布了一则推特,“今天我们推出了ChatGPT,尝试在这里与它交谈”,还包括一个链接,任何人都可以点击链接,免费与ChatGPT交谈。
与Siri、小爱同学等语音助手类似,ChatGPT也是人机交互应用的一种。但在与ChatGPT“对话”的过程中,人们发现它的“智慧程度”远超其他的人工智能机器人。除了聊天,ChatGPT被网友们用来写文案、翻译文本、为代码纠错,甚至用来编写代码。
凭借出色的表现,ChatGPT仅用两个月便吸引了超过1亿用户的关注,一跃成为20年来互联网领域增长最快的消费类应用。
北京时间2月7日凌晨,美国科技巨头谷歌紧急入局,宣布基于LaMDA大模型的人工智能对话式机器人“Bard”正在进行内测。次日,微软宣布推出由ChatGPT支持的最新版本Bing搜索引擎和Edge浏览器。脸书也表示,将向OpenAI支付数百万美元,采用ChatGPT为Facebook和Instagram生成创作者内容。亚马逊成立了一个小型工作组,拓展ChatGPT等AI工具对企业的工作职能……
ChatGPT火爆,搜索引擎巨头百度率先坐不住了。
就在谷歌官宣Bard内测的当天下午,百度官宣了大模型新项目“文心一言”(ERNIE Bot),并表示预计在3月完成内测。随后一段时间,阿里巴巴、360、科大讯飞、腾讯等多家国内企业纷纷表示对AI技术发展的关注。2月10日,京东云宣布旗下言犀人工智能应用平台将推出产业版ChatGPT--ChatJD。
可见,大厂的态度十分鲜明:ChatGPT已经是既定的未来,这场新的科技竞技赛哨声响起,谁都不甘落于下风。从科技巨头,到行业龙头,中国企业竞逐AI赛道,AIGC(利用人工智能技术来生成内容)等人工智能概念在股市一路狂飙,虽然在监管出手后很快平息躁动,但涨势依然存在。
ChatGPT在全球的流行正在推动AIGC产业化全面提速,将引领创成式AI新变革。
02 大厂如何应对ChatGPT的挑战?
GPT是OpenAI推出的AI大模型系列。从2018年到2022年,OpenAI先后迭代并推出了GPT-1、GPT-2、GPT-3和InstructGPT,此次发布的ChatGPT就是在GPT-3的基础上通过指令微调后得到的。
图源:OpenAI官网
结果,2022年年底ChatGPT实现了现象级的传播,这出乎制作团队所料。OpenAI用了5年时间在GPT大模型迭代上完成了一场自我革命,在对话的场景中实现爆发。
所以说ChatGPT的成功并非偶然,“OpenAI在GPT系列模型的基础上,对算法、算力、数据等人工智能关键要素都进行了一定的升级和优化。”中国信通院云计算与大数据研究所人工智能部副主任董晓飞说。
算法、算力及数据是人工智能行业发展的三大核心要素。
在算法层面,ChatGPT的基础是世界上最强大的LLM(大语言模型)之一——GPT-3,同时引入了基于人类反馈的强化学习方法,提高了对话的质量。“从GhatGPT的表现上来看,它的精确性和整个性能效果确实提高了。”董晓飞说。
同时,AI的训练和使用也需要强大的算力支持。ChatGPT的训练是在微软云上进行的,在全球云计算市场,微软云的市场份额排名第二。高水平、高市场份额,再加上芯片技术的高速发展,这都为ChatGPT的横空出世奠定了坚实的算力基础。
除了算法和算力,AI大模型的进步迭代,需要大量的数据进行训练。2020年发布的GPT-3,其训练参数量已经达到了惊人的1750亿个,“大量的数据被反复‘喂’给ChatGPT。”
而且,ChatGPT的训练成本支出巨大。据Lambda Labs首席科学官Chuan li介绍,拥有1750亿个参数的GPT-3单次训练成本达到460万美元。在知乎上,网友在讨论ChatGPT时,也都认为它很“烧钱”。因此,可以说ChatGPT是一个靠大算力、高成本,用大规模的数据“喂”出来的AI模型。
03 看清方向,谨慎入局
ChatGPT总共可以分为三个训练阶段:人工“投喂”数据进行标注;类似于奖励模型,对输出的内容进行排序和比较;强化学习,利用上一阶段的内容升级。每一阶段都是“烧钱”换来的,资本的门槛无形隔断了绝大部分企业。
董晓飞指出,基于大模型的聊天机器人成本投入巨大,“企业前期投入需保持一定的谨慎,且需要看清方向。”
“目前来看,国内大模型开发厂商一是布局以大模型为基础的通用对话、生成等能力;二是将其能力整合到搜索引擎、智能客服、智能音箱等产品线中;三是通过能力调用为中小企业满足具体场景落地需求。”董晓飞说。
随着ChatGPT的爆火,随之而来的安全、隐私保护、知识产权等问题也值得关注。“目前国外出现有学生使用ChatGPT写论文作弊的情况。模型使用大量的数据进行训练,也存在使用过程中可能提供他人创作的侵权行为风险。”董晓飞认为,如何防止ChatGPT类产品的滥用对社会产生潜在负面影响亟须得到重视,“更希望我们目前的一些主流企业、科研机构,在生成式AI上发力,能引领新时代的AI发展。”
我爱方案网是一个电子方案开发供应链平台,提供从找方案到研发采购的全链条服务。找方案,上我爱方案网!在方案超市找到合适的方案就可以直接买,没有找到就到快包定制开发。我爱方案网积累了一大批方案商和企业开发资源,能提供标准的模块和核心板以及定制开发服务,按要求交付PCBA、整机产品、软件或IoT系统。
技术服务靳工:15529315703