OpenAI的12天发布会,都发布了哪些东西呢?
接近年底了,过去一周我非常的忙碌。随着企业客户越来越多,作为我们产品的重度使用者,同时也是服务客户第一线的客户成功。Google SEO培训每天要用我们产品生成内容为自己公司的SEO服务,也要在客户成功群中与客户沟通解决客户的一些产品使用问题以及SEO策略问题。另外每天还要时不时的去我们的AI SEO群参与讨论,还要给一些潜在的客户进行线上演示,所以每天就忙忙碌碌。
过去的一周也是各种AI发布忙碌的一周,首先是OpenAI破天荒的开启了一个连续12天的产品发布会。别的不是,山姆奥特曼在营销方面的确有想法。紧接着,谷歌发布了Gemini 2.0,硬刚OpenAI。而AI coding创业公司Devin也在这周正式GA了自己的产品,让你能聘用Devin来作为自己的软件工程师。
OpenAI的12天发布会
OpenAI的12天发布会已经过去了7天,我们先看看OpenAI都发布了哪些东西:
第1天:o1正式版与ChatGPT Pro
o1正式版:推出了o1的正式版本,相较于预览版,性能提升,支持多模态输入,能够处理图像和文本信息。
ChatGPT Pro:推出高级订阅服务,每月200美元,提供无限制使用o1、o1-mini、GPT-4o和高级语音模式的权限,并引入o1 Pro模式,适用于处理复杂问题。
第2天:强化微调(Reinforcement Fine Tuning,RFT)
强化微调:推出RFT技术,允许用户在自己的数据集上微调o1模型,提升其在特定领域的推理能力。
应用案例:与汤森路透合作,使用RFT微调o1 Mini,开发法律助理AI。
第3天:Sora正式发布
从宣布Sora到Sora正式发布,OpenAI历经了一年时间。在这一年时间里,我们见到了很多的AI生成视频的模型,包括我们国内出的海螺、即梦、可灵等等。而OpenAI也终于千呼万唤始出来,于发布会第三天正式发布了Sora.
Sora的主要功能包括:
文本转视频:用户可以输入文本提示,生成相应的视频内容。
图像动画:将静态图像转化为动态视频,赋予图片生命力。
视频混合:将不同的视频片段融合,创造独特的视觉效果。
订阅与使用:
ChatGPT Plus用户:每月支付20美元,可生成最多50个优先级视频,分辨率最高为720p,时长最长为5秒。
ChatGPT Pro用户:每月支付200美元,可无限制生成视频,分辨率最高为1080p,时长最长为20秒,并可下载无水印视频。
第4天:Canvas
Canvas:正式推出Canvas功能,提供可视化界面,方便用户进行创作和编辑。
第5天:ChatGPT in Apple Intelligence
ChatGPT集成:将ChatGPT集成到苹果的智能系统中,提升用户体验
第6天:Advanced Voice with Video&Santa Mode
高级语音与视频:增强了语音和视频功能,提供更自然的交互体验。
圣诞模式:推出节日主题模式,增加趣味性。
第7天:Projects in ChatGPT
项目管理:在ChatGPT中引入项目管理功能,提升协作效率。
OpenAI的发布会已经发布了7天,还有5天,也就是下周会发布完成,接下来就是美国的圣诞假期了。话说连续12天发布会,不知道国内有多少朋友连续熬夜坚持看了已经发布的发布会。我是周末略微复习了一下,毕竟自己要做的工作要紧。另外,在发布会进行中的这些天,OpenAI的系统也出现了一次大型故障,一度有接近4个小时OpenAI所有的服务都不能响应。看来发布会魔咒是所有科技公司都挺难避免的。
谷歌Gemini 2.0
在OpenAI的12天发布会进行过程中,谷歌也于12月11日发布了最新的人工智能模型-Gemini 2.0。这个模型对于谷歌来讲意义重大,它把AI深度整合到了几乎所有的产品当中。这意味着谷歌将会有更多不同能力的AI agent来在自己的产品中提供服务。Gemini 2.0的主要的特性包括:
主要特性:
多模态能力:Gemini 2.0原生支持图像和音频生成,能够处理和理解视频、音频和物理环境等多种输入形式。
自主代理:引入了能够自主执行任务的AI代理,减少对人类输入的依赖。例如,Project Mariner是一个实验性的Chrome扩展,能够自主浏览网页,完成在线购物等任务。
集成应用:Gemini 2.0已应用于多个项目,包括Project Astra,一个视觉导航系统,以及AI Overviews in Google Search,用于处理复杂的多步骤查询。
开发者工具:推出了名为Jules的开发者工具,这是一个由Gemini 2.0 Flash驱动的编码助手,能够在GitHub中编写代码、修复错误,并创建和执行多步骤计划。
作为在AI生成SEO领域的创业者,我们看到了谷歌把AI能力与搜索引擎的结合,在搜索结果中推出了AI Overview。在这个AI时代,作为大模型算法基础Transformer的提出者,谷歌肯定不会缺席这个时代。
AI程序员Devin
这一轮生成式AI对于大部分有一定重复性劳动的知识工作必然会产生巨大的冲击。比如我们正在做的SEO写作产品对于传统的SEO写手的冲击,而程序员和数据科学家们也忙不迭的在自掘坟墓,利用AI来替换程序员。比如大家都已经知道的Github copilot、Cursor,面向企业客户的Codeium,当然还有Windsurf以及最近刚刚正式GA的Devin。
Devin在今年3月份发布了一些资料,然后就没有了下文。直到这一周Devin终于正式GA了。如图:
Devin的发布把自己定义为一个编码的agent,可以聘用Devin为你的编程实习生,具体到价格嘛,500美金一个月。
Devin正式发布的这两天,就有不少用户开始氪金来雇佣Devin这个编程实习生。如图:
当然,也有劝退的:
然而无论如何,我相信随着AI推理能力的进一步增强。编程这个曾经吸纳白领人数最多、也是相对最高薪的行业,必然会迎来一个巨大的挑战。毕竟相当一部分程序员的日常工作是Ctrl+C,Ctrl+V,以及根据错误日志进行bug fix。在这方面,不知疲倦的AI的优势还是很明显的。
总结
两年前OpenAI发布ChatGPT,让本来已经有些冷寂的AI领域迎来了新的春天。这两年AI生成内容的领域可以说取得了突飞猛进的发展,而随着AI在更多知识工作场景的应用,AI Agent化的趋势也是不可逆转的。工业革命发展到最后是工业自动化,而信息技术革命我相信发展到最后是各种信息和知识的自动化。只不过在这当中,人要找到自己更合适的定位。