“百模大战”正酣!同质化或构成“硬伤”  需从应用入手反哺大模型|直击外滩大会-凯发官网首页

导读 《科创板日报》9月8日讯(记者 黄心怡) 今年以来ai热度持续攀升,近半年内全球近百家公司、机构相继发布大语言模型相关产品。国内也正面...

《科创板日报》9月8日讯(记者 黄心怡) 今年以来ai热度持续攀升,近半年内全球近百家公司、机构相继发布大语言模型相关产品。国内也正面临着“百模大战”,有数据显示,全国有至少130家公司研究大模型产品,其中做通用大模型的有78家。

在外滩大会期间,《科创板日报》记者对话了小冰公司ceo李笛,蚂蚁集团副总裁、蚂蚁基础大模型负责人徐鹏,就大模型的落地前景和挑战进行了探讨。

“现在行业里面最大的问题其实是太雷同了。”李笛对于大模型风潮直言,“大家都沿着同一条路径往前走,没有多样性,这和创新精神是违背的。创新其实不是追赶,而是有新的方法,去实现自己的优势。”

李笛还强调,大模型创业需要慎重。“我觉得大模型作为创业公司来讲,一定要慎重。如果创新是在一个维度的线性发展,那么只要追就可以了。但现在还不知道技术范式是不是这个方向。一旦最后的方向跟现在的方向有夹角,那么你跟得越快,创业公司就会走得越偏。当然,如果原本是一个拥有非常强业务的公司,想尝试用大模型去改变原来的业务,那么是没有任何问题的。但假如你就是吃大模型这碗饭,那这个豪赌是很大的。因为没有人能确定,openai也不能确定,风险很高。”

对于大模型同质化的问题,徐鹏也认为,“现在很多吃大模型这碗饭的,大家做的都是偏雷同的,真正对于扩性本身的发展并不能带来多大的推动作用。”

不过,徐鹏补充说道,雷同从另一个角度看,也是源于中国还处于追赶的阶段,首先要及格,之后才有机会发展的更好。

“比如说百度、腾讯、阿里等等,都要做到跟gpt类似的水平。相信在这之后会有很多创新的点,可以做不一样的东西。只是现阶段还处在追齐gpt能力的阶段。”

金沙江创投主管合伙人张予彤在大会上指出,当前生成式人工智能创业与投资爆发,今年上半年投资额已超过去年全年水平。头部25家生成式ai已吸收170亿美金的融资,估值虽有泡沫,但泡沫中也有颠覆性的机会。生成式ai投资将围绕那些具备护城河的ai原生应用展开。

徐鹏表示,ai应用的生态需要更加繁荣,这样才能反过来推动模型的发展。现在至少看起来应用生态还不够繁荣,应用的场景上面还没有那么丰富。

”还是要从应用入手,应用可以做出来非常多不一样的东西。”徐鹏说,“如今国内外的开源模型,给大家带来了创新上的便利,不用从头开始浪费大量的财力去训练基础模型。所以,如果大家都把力量放在大模型应用的创新上面,会反过来看到大模型在什么地方做得不到位,哪里还有很大的提升空间,反过来能促进大模型技术的发展。”

数据,是决定大模型性能的三大要素之一。用来训练模型的数据,将直接决定模型的质量。李笛判断,中文语料所存在的挑战没有想象中那么大。“中文的语料要好好地清洗,还是可以的。但把语料真正挖清楚、清洗得足够好,这是苦力活。

徐鹏也认同语料清洗确实是一个苦力活。“而且谁都逃不开,但是中文本身的数据量级应该是够的。“

展望大模型的未来,徐鹏称,短期内容易高估技术带来的变化,而长期可能会低估其产生的效应,要冷静地看待长期带来的价值。

“当这样的大潮起来之时,要非常认真地看清它,到底带来的东西是什么,能力边界到底在哪里。既不能盲目做太多不切实际的幻想,但又不能离开这个幻想。因为只有幻想才有动力,才有更多的人愿意做一些看上去不靠谱的事情。我们应有一定的机制支持人们长期在这个方向做进一步的投入,然后找到核心应用场景、真正能够带来变化的东西。然后就可以反哺到人工智能的发展。“

来源:财联社

标签:

免责声明:本文由用户上传,如有侵权请联系删除!
网站地图