一文读懂 Gemini:多模态大模型奠基之作
出处:
mp.weixin.qq.com
作者:
老宋nlp
Google 在昨天发布了 Gemini,效果看起来非常好,多模态大模型再次进入加速期,我本以为多模态大模型的 chatgpt 时刻还需要2年左右的时间,现在看来奇点快到了。 2023年,StableDiffusion 和 Midjounery 大放异彩,但是其和我期待的多模态大模型有所区别,而 Gemini 的发布以及其在多模态下效果评估,更符合我对多模态大模型的直觉。 废话不多说,我们先来看看 Gemini 是如何做的吧(虽然没太多技术细节)本文只提取了我认为有价值的部分一些细节需要各位自己去看了。