OpenAI给用户推送了o3,o3加入了搜索功能

chatGPT网址2025-02-0531

chatgpt 欢迎访问chatgpt中文教程网,学习chatgpt相关知识,以下是正文内容:

无论是OpenAI计划之中,还是迫于DeepSeek的压力,确实如之前爆料的一样,在周五,OpenAI给用户推送了o3。
其实,我到现在都没想太好怎么建立一个相对客观的标准来比较所谓的“思考模型”,因为这个“思考过程”的评价就是非常主观的。
所以,我也只能在很短的时间里,进行简单尝试,谈一下第一印象,至于更深刻的体会,还需要更多的时间,让模型来“指导”我。
最直观的变化:o3加入了搜索功能。我再次确认了一下,o1是没有的。
可以很清晰的看到,在模型选择o3时,有一个web的图标,表示搜索功能。这就开启了一个新的应用领域:日报,比如每天的市场报告。
既然不能跟o1比较,我就尝试直接跟4o进行对比。下面是4o生成的日报。
除去emoji这些,一个最大的区别是:两个模型同样是进行搜索,但是引用的信息来源是完全不同的。
o3更多引用雅虎财经和路透,4o则来源较多。孰优孰劣不太好评价,背后的不同机制也需要更多时间来去验证。
但是对我而言,在这个场景下,o3的潜力会大很多:我看到了在使用中加入更多“人工干预”的可能性,而这一点其实对于模型应用来讲是非常重要的。
o3第二个改变:可以让用户看到思考过程。
DeepSeek受到好评的一个重要原因是让用户看到思考过程,增加了可信度。如今o3也有了,看起来会更有组织性一点。
思考过程有什么用?至少是两个:1、这个思考过程作为单独输出的话,其实是可以去调用不同的专门模型(Agent)完成具体任务的;2、这个思考过程给出了如何进行“人工干预”的方向。
第三个尝试,对比代码能力。假设我要建立一个站点,分别让o1-pro和o3-mini-high进行尝试。左边o1-pro,右边o3-mini-high。
评价:
o3-mini-high明显用时少很多,节省更多算力;
从对网站结构的理解上,两者几乎一样,不过在没有截图的部分,o3给出了更完整的时间计划安排;
具体到生成的代码上,这一次,我更偏好o1-pro,因为在没有人工干预的情况下,它选择了next.js,而o3-mini-high使用了简单的html和js。有框架和没框架,还是有区别的。当然,我相信,如果给o3指定使用next或者其他框架,它也可以生成的很好,那就勉强算打平吧。
所以,我的第一印象应该是:从现在放出的模型本身而言,o3-mini-high能力大概跟o1-pro在一个水平线上,具体的思考上o3-mini似乎略完整一点。
它的真正意义是大概只使用了五分之一左右的算力。

推荐使用GPT中文版,国内可直接访问:https://ai.gpt86.top 

GPT4代充值

本文链接:https://gptwangzhi.top/chatgpt/1793.html

AI+教育360智脑chatgpt4.0充值续费GPT商店GPTs商店GPTs官网chatGPT商店GPT BuilderGPT Builder创建ChatGPT插件

相关文章

网友评论