OpenAI的12天发布会，都发布了哪些东西呢？

平哥SEO2024-12-16 10:07谷歌SEO培训223

接近年底了，过去一周我非常的忙碌。随着企业客户越来越多，作为我们产品的重度使用者，同时也是服务客户第一线的客户成功。Google SEO培训每天要用我们产品生成内容为自己公司的SEO服务，也要在客户成功群中与客户沟通解决客户的一些产品使用问题以及SEO策略问题。另外每天还要时不时的去我们的AI SEO群参与讨论，还要给一些潜在的客户进行线上演示，所以每天就忙忙碌碌。

过去的一周也是各种AI发布忙碌的一周，首先是OpenAI破天荒的开启了一个连续12天的产品发布会。别的不是，山姆奥特曼在营销方面的确有想法。紧接着，谷歌发布了Gemini 2.0，硬刚OpenAI。而AI coding创业公司Devin也在这周正式GA了自己的产品，让你能聘用Devin来作为自己的软件工程师。

OpenAI的12天发布会

OpenAI的12天发布会已经过去了7天，我们先看看OpenAI都发布了哪些东西：

第1天：o1正式版与ChatGPT Pro

o1正式版：推出了o1的正式版本，相较于预览版，性能提升，支持多模态输入，能够处理图像和文本信息。

ChatGPT Pro：推出高级订阅服务，每月200美元，提供无限制使用o1、o1-mini、GPT-4o和高级语音模式的权限，并引入o1 Pro模式，适用于处理复杂问题。

第2天：强化微调（Reinforcement Fine Tuning,RFT）

强化微调：推出RFT技术，允许用户在自己的数据集上微调o1模型，提升其在特定领域的推理能力。

应用案例：与汤森路透合作，使用RFT微调o1 Mini，开发法律助理AI。

第3天：Sora正式发布

从宣布Sora到Sora正式发布，OpenAI历经了一年时间。在这一年时间里，我们见到了很多的AI生成视频的模型，包括我们国内出的海螺、即梦、可灵等等。而OpenAI也终于千呼万唤始出来，于发布会第三天正式发布了Sora.

Sora的主要功能包括：

文本转视频：用户可以输入文本提示，生成相应的视频内容。

图像动画：将静态图像转化为动态视频，赋予图片生命力。

视频混合：将不同的视频片段融合，创造独特的视觉效果。

订阅与使用：

ChatGPT Plus用户：每月支付20美元，可生成最多50个优先级视频，分辨率最高为720p，时长最长为5秒。

ChatGPT Pro用户：每月支付200美元，可无限制生成视频，分辨率最高为1080p，时长最长为20秒，并可下载无水印视频。

第4天：Canvas

Canvas：正式推出Canvas功能，提供可视化界面，方便用户进行创作和编辑。

第5天：ChatGPT in Apple Intelligence

ChatGPT集成：将ChatGPT集成到苹果的智能系统中，提升用户体验

第6天：Advanced Voice with Video&Santa Mode

高级语音与视频：增强了语音和视频功能，提供更自然的交互体验。

圣诞模式：推出节日主题模式，增加趣味性。

第7天：Projects in ChatGPT

项目管理：在ChatGPT中引入项目管理功能，提升协作效率。

OpenAI的发布会已经发布了7天，还有5天，也就是下周会发布完成，接下来就是美国的圣诞假期了。话说连续12天发布会，不知道国内有多少朋友连续熬夜坚持看了已经发布的发布会。我是周末略微复习了一下，毕竟自己要做的工作要紧。另外，在发布会进行中的这些天，OpenAI的系统也出现了一次大型故障，一度有接近4个小时OpenAI所有的服务都不能响应。看来发布会魔咒是所有科技公司都挺难避免的。

谷歌Gemini 2.0

在OpenAI的12天发布会进行过程中，谷歌也于12月11日发布了最新的人工智能模型-Gemini 2.0。这个模型对于谷歌来讲意义重大，它把AI深度整合到了几乎所有的产品当中。这意味着谷歌将会有更多不同能力的AI agent来在自己的产品中提供服务。Gemini 2.0的主要的特性包括：

主要特性：

多模态能力：Gemini 2.0原生支持图像和音频生成，能够处理和理解视频、音频和物理环境等多种输入形式。

自主代理：引入了能够自主执行任务的AI代理，减少对人类输入的依赖。例如，Project Mariner是一个实验性的Chrome扩展，能够自主浏览网页，完成在线购物等任务。

集成应用：Gemini 2.0已应用于多个项目，包括Project Astra，一个视觉导航系统，以及AI Overviews in Google Search，用于处理复杂的多步骤查询。

开发者工具：推出了名为Jules的开发者工具，这是一个由Gemini 2.0 Flash驱动的编码助手，能够在GitHub中编写代码、修复错误，并创建和执行多步骤计划。

作为在AI生成SEO领域的创业者，我们看到了谷歌把AI能力与搜索引擎的结合，在搜索结果中推出了AI Overview。在这个AI时代，作为大模型算法基础Transformer的提出者，谷歌肯定不会缺席这个时代。

AI程序员Devin

这一轮生成式AI对于大部分有一定重复性劳动的知识工作必然会产生巨大的冲击。比如我们正在做的SEO写作产品对于传统的SEO写手的冲击，而程序员和数据科学家们也忙不迭的在自掘坟墓，利用AI来替换程序员。比如大家都已经知道的Github copilot、Cursor，面向企业客户的Codeium，当然还有Windsurf以及最近刚刚正式GA的Devin。

Devin在今年3月份发布了一些资料，然后就没有了下文。直到这一周Devin终于正式GA了。如图：

Devin的发布把自己定义为一个编码的agent，可以聘用Devin为你的编程实习生，具体到价格嘛，500美金一个月。

Devin正式发布的这两天，就有不少用户开始氪金来雇佣Devin这个编程实习生。如图：

当然，也有劝退的：

然而无论如何，我相信随着AI推理能力的进一步增强。编程这个曾经吸纳白领人数最多、也是相对最高薪的行业，必然会迎来一个巨大的挑战。毕竟相当一部分程序员的日常工作是Ctrl+C,Ctrl+V，以及根据错误日志进行bug fix。在这方面，不知疲倦的AI的优势还是很明显的。

总结

两年前OpenAI发布ChatGPT，让本来已经有些冷寂的AI领域迎来了新的春天。这两年AI生成内容的领域可以说取得了突飞猛进的发展，而随着AI在更多知识工作场景的应用，AI Agent化的趋势也是不可逆转的。工业革命发展到最后是工业自动化，而信息技术革命我相信发展到最后是各种信息和知识的自动化。只不过在这当中，人要找到自己更合适的定位。

阅读剩余的61%