微软投资的 OpenAI 公司在去年年底推出的 ChatGPT,经过几次迭代迅速在社会面火起来。人们开始惊讶这种 AI 模型对于语言的理解和输出,开始体会到 AI 技术推动到一定阶段对人类社会和发展的帮助作用。
伴随着 4 月份 ChatGPT4.0 的发布,相应的技术水平得到了进一步提升,知识大模型对于人类提出问题的反馈精确程度也进一步得到了证实。
于是很多创业者和互联网的从业者,都开始站在 ChatGPT4 带来的冲击面前感到振奋异常,认为自己可能摸到了未来互联网乃至人类社会技术进步的趋势。
就我所参加的几个讨论 ChatGPT 或者知识大模型的群来看,大家热情很高,都希望在这个风口上成功创业,形成新的互联网巨头。
当然在群内所有人都认为,微软所投资的这家公司以及 ChatGPT 的技术,依然还是要优于国内现在陆续发布的十几个大模型的水平。而且在他们看来,随着硬件投入的不断加大,ChatGPT 的未来发展高度是要远超国内现在已经发布的各个大模型。
我的一位了解大模型的朋友,曾经跟我忧心忡忡地表示,随着美国对中国高科技的打压和芯片的禁售,像英伟达顶级 A100 的 AI 芯片,只能阉割传输效率之后,变成特供中国的 A800 才能出口并向中国销售。从这个角度上讲,在硬件投入方面中国的企业天然要弱于微软扶持的这家公司。
在他看来,现在已经推出大模型的中国,企业硬件基础就比 OpenAI 要弱很多,更何况微软还为 OpenAI 培养了一个庞大的调教团队,并经历了 8 个月的深度调教,才让 ChatGPT 有了现在的水平。在他看来,这不是国内企业几个月就能超越和追赶的。
所以他觉得中国和美国在知识大模型领域的竞争,不是接近了,而是距离在不断拉远。
实话实说,算上金山刚刚正式发布的 WPS AI苹果登录了国外id怎么切换,最近两个月从百度的文新一言开始苹果手机注册美国id账号,中国企业陆续发布的大模型已经超过了 20 个。
我并不否认 ChatGPT4 目前为止依然是全球技术和应用反馈最领先的大模型。而国内几家大模型的发布方实际上或多或少都表示过,目前还处于追赶 ChatGPT3.5 的一个水平苹果id网页注册外区能用吗。

因为根据 OpenAI 的规划,其主要的盈利方式就是 plus 版的付费,大概一个月 20 美元。当下 OpenAI3.5 的接口访问已经到了 10 亿人次的规模,按照一般互联网平台 1% 左右的付费用户转化率,那么就有 1000 万人愿意每个月支付这 20 美元的使用费。从这一点上看,OpenAI 现有收费模式,一年的收入水平是 24 亿美元。
根据微软之前披露的自身技术许可和使用费产品,互联网平台收费的价格来估算,平均一个互联网平台拿到微软承包技术的年使用费是 100 万美元,而在美国,微软这种服务的互联网企业也不过 200 余家。OpenAI 我们认定其马上就能从微软原有客户中获得收益,这部分的收入一年差不多是在 2 亿美元左右。
我特别理解 OpenAI 乃至于微软急于把 ChatGPT 商业化的诉求。
实际上也纠正大家一个概念,大模型并不能像人类大脑一样,学会了什么东西就可以快速的反应出来,形成一个很短的信号连接。ChatGPT 模型是一种自然语言处理(NLP)模型,使用多层变换器(Transformer)来预测下一个单词的概率分布,通过训练在大型文本语料库上学习到的语言模式来生成自然语言文本。
这是中信证券做的一个统计表,现在看 ChatGPT3.5 每次训练成本就超过 1,200 万美元,更别提比他更高级的 ChatGPT4。有专家预计 ChatGPT4 的训练一次会超过 5,000 万美元。对于 ChatGPT 来说,并不是训练完成就解决问题,相应的硬件一次投入之后,每个月还要产生额外的使用费用和拓展费用。
ChatGPT 海量的参数与强大的智能交互能力,离不开算力的支撑。根据 Similarweb 的数据,2023 年 1 月份 ChatGPT 日活约 1300 万人,累计用户已超 1 亿人,创下了互联网最快破亿应用的记录。若 ChatGPT 日活达至 10 亿人,每人平均 1000 字左右的问题,那么需要多大的算力资源支持?中信证券对此做了评估,发现 ChatGPT3.5 如果应对 10 亿人次访问,每人深度使用,平均每日万字问题,那么需要投入英伟达最新 A100 服务器超过 46 万台。
毫不夸张地说,以英伟达现在 掉钱眼里 的特性,单块 A100 芯片卖出的价格已经是天价,而在这种天价基础上组建近 46 万多台的服务器,对于研发和运营团队的压力可想而知。这也是为什么 ChatGPT 还远没达到真正理想状态,微软就已经迫不及待推出一系列依靠其发展的商业产品原因,这也是 OpenAI 正在布局商业化,并且将其作为最重要工作的原因。
现在看微软对 OpenAI 相应技术的商业化就集成在必应新搜索和 office365 中的工具端。必应搜索对应的是谷歌的广告市场,office365 中的工具是额外收费的一种产品。
我不是说 OpenAI 的技术不好,我也不是说中国企业的技术已经赶上了美国最先进的水平。但在企业端应用的水平上,通用大模型不是最合适的,反而训练量放到一定的范围,训练数据也放到一定的范围的行业模型,可能才是最合适的。