麻将胡了2网站谷歌究竟赢了OpenAI一回:测验版本Gemini 1超越5 Pro逾越GPT-4o

发布时间:2024-08-03 14:53:50    浏览:

[返回]

  麻将胡了2近两日,谷歌正在持续揭晓最新商量。继昨日放出最强端侧 Gemma 2 2B 幼模子后,刚才,Gemini 1.5 Pro 实行版本 (0801) 仍然推出。

  既然免费,那咱们帮行家测试一下迩来比力火的比巨细题目。当咱们问 Gemini 1.5 Pro (0801) 9.9 和 9.11 哪个数大时,模子一次就能解答准确,并给出了缘故超越。

  当咱们赓续诘问「Strawberry 单词内里有多少个 r」时,然而 Gemini 1.5 Pro (0801) 却翻车了。正在提示语中施加「咒语」一步一步来,模子理会到第四步就堕落了。

  但是超越,从官方评测来看,Gemini 1.5 Pro (0801) 各项目标如故很能打的。新模子火速夺得出名的 LMSYS Chatbot Arena 排行榜榜首,并具有令人印象深入的 ELO 分数,得分为 1300麻将胡了2网站。

  整体而言,Gemini 1.5 Pro (0801) 正在中文超越、日语、德语超越、俄语方面均展现第一。

  网友纷纷显示,谷歌此次真是出乎一齐人的预念,没有提前官宣就倏地怒放测试最强模子,此次压力给到了 OpenAI。

  固然 Gemini 1.5 Pro (0801) 得到了很高的成就,但它仍处于实行阶段。这意味着该模子正在广大利用之前也许会实行进一步的编削。

  有网友对 Gemini 1.5 Pro (0801) 的实质提取材干、代码天生材干、推理材干等实行了测试,咱们来看下他的测试结果。

  开始,Gemini 1.5 Pro (0801) 的图像新闻提取性能很强,比方输入一张发票图像,将发票细节用 JSON 式样编写出来:

  让 Gemini 1.5 Pro (0801) 天生一个帮帮研习大型讲话模子(LLM)学问的 Python 游戏,该模子直接天生了一整段代码:

  值得一提的是,Gemini 1.5 Pro (0801) 还给出了细致的代码表明,席卷代码中函数的功用、该 Python 游戏的玩法等等。

  这段轨范能够直接正在 Google AI Studio 中运转,而且能够试玩,比方做道合于 Tokenization 界说的拔取题:

  即使感应拔取题太粗略无聊,能够进一步让 Gemini 1.5 Pro (0801) 天生一个更纷乱的游戏:

  为了测试 Gemini 1.5 Pro (0801) 的推理材干,网友提问了一个「吹烛炬」题目,但模子解答舛错:

  本文为倾盆号作家或机构正在倾盆消息上传并揭晓,仅代表该作家或机构见解,不代表倾盆消息的见解或态度超越,倾盆消息仅供给新闻揭晓平台。申请倾盆号请用电脑拜候。麻将胡了2网站谷歌究竟赢了OpenAI一回:测验版本Gemini 1超越5 Pro逾越GPT-4o

搜索