Skip to main content

Author: Chimy

NovaCV – 免费AI简历生成器,自动生成专业求职简历

NovaCV是什么

NovaCV 是基于人工智能技术的在线AI简历生成器,帮助用户快速制作专业、美观的求职简历。集成了领先的 AI 功能,如智能简历助手、一键生成工作描述、AI 润色引擎、智能纠错、中英文翻译等,确保简历内容精准且专业。NovaCV 提供了丰富的专业模板,覆盖主流行业,排版设计符合招聘者喜好,能帮助求职者在众多简历中脱颖而出。NovaCV 提供 API 服务,支持简历智能检查、文本解析和模板生成等功能,满足企业和个人的多样化需求。

NovaCV

NovaCV的主要功能

  • AI 简历助手:用户输入基础信息后,NovaCV 的 AI 助手能自动生成工作描述,通过智能润色引擎优化表达,确保内容精准。
  • 智能纠错与翻译:实时智能纠错功能可避免低级错误,支持中英文智能翻译,助力海外求职。
  • 专业模板与排版:提供 20+ 精美模板,覆盖主流行业,支持一键套用和个性化调整,排版设计专业。
  • 可视化编辑与实时预览:采用“所见即所得”的编辑方式,用户在输入内容时,页面右侧会实时渲染完整简历预览,编辑过程更直观。
  • 高质量导出与分享:支持 PDF、Word 等多种格式导出,提供网页链接分享功能,方便在社交平台或招聘系统中使用。
  • 简历智能检查:基于人力专家模型评估简历竞争力,提供改进建议。
  • 文本解析:将简历文本转换为 JSON 格式,便于进一步处理。
  • 求职攻略:提供专业的简历编写指南和求职建议,帮助用户优化职业规划。

NovaCV的官网地址

NovaCV的应用场景

  • 应届毕业生:应届毕业生缺乏工作经验,对简历的格式和内容把握不准,不知道如何突出自己的优势。AI 简历助手可以根据用户输入的实习经历、项目经验等信息,自动生成专业的工作描述。
  • 更新简历:求职者在跳槽或寻找新机会时,需要更新简历,但可能对新的格式或内容要求不熟悉。AI 助手可以根据最新的求职要求,帮助用户修改和优化简历内容。
  • 跨行业求职者:跨行业求职者需要重新定位自己的技能和经验,适应新的行业要求。根据目标行业的要求,推荐相关的内容模块和关键词,帮助用户突出与新行业相关的技能和经验。
  • HR 和招聘人员:HR 和招聘人员需要快速筛选和评估大量简历,但传统简历格式不规范,信息不完整,增加了筛选难度。帮助 HR 快速评估简历的完整性和竞争力,提供改进建议。
  • 企业内部简历管理:企业需要统一管理员工的简历,方便在内部晋升或项目调配时使用。提供专业的 API 服务,支持简历智能检查、文本解析和模板生成,满足企业内部简历管理的需求。

智谱CoCo实测,全球首个“有记忆”的企业级AI Agent(附邀请码)

智谱coco
前天下午,全球首个“有记忆”的企业级AI Agent,智谱CoCo低调开启内测。

CoCo号称是一款“懂你懂企业、能干能交付”的Agent,不仅仅是帮你“写点什么”或“查点什么”的Agent,而是能完整处理复杂任务,并交付可直接使用的专业成果的Agent

这篇文章,我们就一起来深度体验下CoCo的核心能力,我们将通过三大行业真实场景案例测试,剖析CoCo如何为企业带来效率跃升。

 

01. 企业内通用型功能

 

先看看政务解读。

提示词:国务院最近批复了《加快推进服务业扩大开放综合试点工作方案》,请分析这对我国旅游行业会有哪些影响,帮我生成图文并茂的解读。

和大部分智能体不一样的是,CoCo并不会直接完成任务,而是梳理好清晰、具体的执行规划,等待我编辑、确认后再进行任务

CoCo给出的规划细致且全面,单是分析维度就列出了10条出来,完全是可以直接采用的效果。

CoCo只需要帮我们梳理好清晰、具体的执行规划就好,而我们点击确认按钮这个动作就费心多了阿。

在任务执行过程中,我们可以实时看到任务的进度条,以及CoCo的详细的工作记录

一般的智能体,在搜集信息时,即使提示词要求了确认信息源,还是容易出现幻觉,搜集到的内容,往往需要人工再次一条条审核确认,浪费不少时间。

CoCo对信息搜集的标准是,优先检索“权威”、“真实”的“原文”内容,对信息源的要求很高,自然搜集到的信息质量就也会很高

在规划节点完成后,我们可以直接查看它的数据来源,都是一些比较知名的官媒,好评!

所有规划执行后,CoCo交付了几个文件,每一个都可以点击打开单独查看。

我们直接打开最终生成的网页看看:

页面的整体布局很简约,数据展示很直观。

网页的内容是基于对政策的解读,以及CoCo做的分析报告,内容很丰富。

网页中的一些关键数据,下方都附上了数据来源,点击会直接跳转信息源链接。都是比较权威的官方网站或者媒体。

可以说是“有理有据,让人信服”。

 

02. 各岗位专用型功能

 

我们再试试,让CoCo完成一些具体岗位的工作,比如帮我招聘一位助理编辑。

提示词:我是一名科技自媒体博主,专注AI领域,分享AI干货和玩法,致力于帮助更多人将AI转变为自身生产力。 我希望你帮我招一位助理编辑,辅助公众号的内容产出,城市不限,学历不限,需要对AI有一定的了解和兴趣。

CoCo也是直接列出规划。

这次我想让CoCo做的更多一些,最好能直接把合适的简历塞我手里。于是我在规划里加了一条:

最后,CoCo给我生成了招聘方案的核心思路和岗位说明书以及招聘文案。

内容做的还是很不错的,我并没有描述岗位的具体要求,CoCo直接根据招聘平台的同类岗位和自媒体头部博主的招聘信息,自动帮我梳理了这个岗位的工作内容和招聘要求

但是没有帮我收集简历,可能是我并没有提供/登录各大招聘平台账号。

CoCo在回复中提到,后续如有候选人简历推送需求,根据实际收到的简历材料再行处理。

于是我直接准备了10份简历,让CoCo帮我筛选。

提示词:我收到了这些简历,请帮我从中筛选出合适的人选。

收到简历后,CoCo会先从AI兴趣/经验、内容编辑/运营能力、AI工具应用、文字表达、远程/多平台经验等多个维度横向对比候选人的能力。

最终给我推荐了3位比较合适的候选人。

我看了这三份简历确实是这十份简历中比较匹配的,说明CoCo工作完成的挺不错。

当然,优秀团队的建设,肯定需要各个方面的人才,于是我继续让CoCo给我推荐。

我还需要一名财务和法务,你有合适的人选吗?

这次CoCo的回答是,只有1位高度匹配XX岗位的候选人,回复很准确。

CoCo引入了独特的记忆机制,能够记住每位员工的职能、工作重点等,为不同的员工提供不同的AI服务。

在我测评的过程中,CoCo就正在记录我的工作风格和工作的内容,而且记忆时长可以调整,最长为永久

当我们用不同的用户生成同样的内容是,CoCo给出的结果也是根据记忆中你的岗位和习惯来生成的。

比如,我们不同的两个岗位,比如研发和新媒体运营,各生成一份今日金融日报:

研发人员的金融日报

数据分析师的金融日报

我们可以清楚的看到,这两份份日报都非常有针对性。CoCo把它调整的更适合各个岗位。

在这种独特的记忆模式的加持下,CoCo能连续理解上下文,适应你,用起来感觉更聪明,更懂你。

我们可以把一些要求明确又重复性的工作,交给AI来完成,帮助企业以最低的成本和时间招募到合适的人选。

 

03. 定制个性化工具

 

最让我惊喜的是,针对需要重复执行的任务,CoCo可以一句话生成工作流,并形成可重复调用的MCP服务。

相当于可以按自己的需求一句话定制“小程序”。

比如,再过一段时间,很多友友会有高考志愿填报的需求,我们可以让CoCo生成一个工作流,我们输入成绩等信息,CoCo给我们推荐填报院校和专业。

提示词:帮我做一个工作流,根据选择的科目、所在省份、高考预估分数,按照稳、保、冲各推荐4个院校和专业,根据推荐的学校和专业名单,生成图文并茂的学校及专业介绍。

在跟我确认一些细节后,CoCo会一键生成工作流。

全程不需要自己选节点,不用连线布局…

怎么样?是不是很方便。

搭建好的工作流,我们可以随时在聊天中调用。

比如我们刚才生成的工作流,我给它起名为《我的志愿》,我们需要用到它时,只用在新聊天框输入:

提示词:这是我的高考信息:湖北省,历史,总分470分,用《我的志愿》工具,为我推荐学校和专业。

CoCo就会根据之前的要求,调用这个《我的志愿》工具,给我推荐学校和专业。

一句话让CoCo库库干活,咱也是有属于自己的数字员工了哈哈哈。

 

04. 一些分享

 

CoCo的核心价值,并不是取代某些岗位,而是让每个人发挥出更大的价值,帮助企业降本提效

它还可以结合企业自有的数据库或知识库,产出更多定制型的方案和内容。

CoCo支持完全私有化部署,调用企业本地模型、接入企业内网工具和资源,完全运行于本地环境,充分满足企业的数据安全需求。

不过CoCo目前还在内测阶段,需要邀请码才能使用~

内测地址:

https://aiworker.aminer.cn/ai_worker/verification

免费领取智谱CoCo邀请码,扫码关注文章评论区留言

原文链接:CoCo:全球首个“有记忆”的企业级AI Agent

Powerdrill – AI数据分析平台,快速生成深度数据报告和洞察

Powerdrill是什么

Powerdrill 是先进的AI数据分析平台,将复杂的数据转化为智能的AI Agent。Powerdrill拥有超过120万的全球用户,基于AI数据报告生成器,用户能快速生成深度数据报告,实现高效的数据洞察。简洁的用户界面和强大的数据可视化功能,帮助用户直观理解数据,做出更明智的决策。数据分析师和决策者,使用Powerdrill从海量数据中提取价值,提升工作效率和数据驱动的决策能力。

Powerdrill

Powerdrill的主要功能

  • 快速生成报告:用户用Powerdrill的AI功能,快速生成深度数据报告,节省时间和精力。
  • 智能分析:AI引擎能自动分析数据,识别关键趋势和模式,提供有价值的洞察。
  • 直观展示:基于丰富的图表和可视化工具,用户更直观地理解复杂数据。
  • 定制化视图:用户可以根据自己的需求定制数据视图,突出关键信息。
  • 智能Agent:将数据转化为智能的AI Agent,Agent自动执行数据分析任务,提供实时洞察。
  • 自动化流程:支持自动化数据处理和分析流程,减少人工干预,提高效率。

Powerdrill的官网地址

  • 官网地址:https://powerdrill.ai/

Powerdrill的应用场景

  • 企业数据分析与报告:快速生成深度数据报告,分析销售、市场、客户等多维度数据,助力管理层做出精准决策。
  • 智能决策支持:实时监控业务指标,自动识别问题与机会,为商业智能和风险管理提供即时支持。
  • 数据可视化与展示:用直观图表和仪表板形式展示复杂数据,支持动态监控业务流程,提升团队沟通与协作效率。
  • 行业特定应用:在医疗、教育、制造等行业中,用在优化治疗方案、提升教学质量、改进生产流程等,满足不同领域的专业需求。
  • 个人与团队协作:个人分析财务、健康等数据提升生活管理效率;团队成员共享分析结果,促进信息共享与协作。

Magic Hour – AI视频创作平台,支持AI换脸、对口型

Magic Hour是什么

Magic Hour 是强大的 AI 视频创作平台,专为创作者、营销人员和制作人员设计。平台提供多种功能,包括视频风格转换、换脸、图片转视频、动画制作、文本转视频口型同步等,帮助用户快速生成专业品质的视频内容。平台提供数千种模板和效果,满足不同场景需求。没有经验的用户也能轻松上手,快速完成高质量视频的制作,提升创作效率和内容吸引力。

Magic Hour

Magic Hour的主要功能

  • 视频到视频:支持风格迁移或改变视频中的主体内容,实现视频的快速转换和风格化。
  • 换脸:将用户的面部替换到任何视频中,生成高质量的换脸视频。
  • 图片转视频:将静态图片转换为动态视频,增加视觉吸引力。
  • 动画:创建类似定格动画的流畅动画效果,支持图片转视频功能。
  • 文本转视频:根据文本内容生成真实且连贯的视频。
  • 口型同步:让任何人或角色在视频中说出指定的音频内容。
  • AI 换衣:基于 AI 技术为人物更换服装。
  • AI 面部编辑:对人物面部进行编辑和优化。
  • AI GIF 生成器:将图片或视频转换为 GIF 动画。
  • AI 图像生成:生成高质量的图像内容。

Magic Hour的官网地址

Magic Hour的产品定价

  • Basic Free(基础免费版):永久免费,每月400个积分,视频长度约17秒,分辨率为512像素,有限的视频工具访问权限,带有水印,上传大小限制为100MB,提供API访问。
  • Creator(创作者版):每月75元人民币,每年120,000个积分,视频长度约1小时,分辨率为1024像素,访问所有工具,无水印,上传大小限制为1GB,提供API访问。
  • Pro(专业版):每月375元人民币,每年600,000个积分,视频长度约7小时,分辨率为1472像素,访问所有工具,无水印,上传大小限制为2GB,提供API访问。
  • Business(商业版):每月1,912.5元人民币,每年3,000,000个积分,视频长度约35小时,4K分辨率(可选择模式),访问所有工具,无水印,上传大小限制为3GB,提供API访问。

Magic Hour的应用场景

  • 内容创作:自媒体博主和创意工作者快速生成多样化、有吸引力的视频内容,提升创作效率和观众观看兴趣。
  • 营销与广告:品牌方制作社交媒体广告、品牌宣传视频,融入代言人或虚拟形象,增强品牌传播效果和产品展示吸引力。
  • 教育与培训:教育机构及在线课程制作者,将教学内容转化为生动视频,提高教学趣味性和学生知识理解度。
  • 娱乐与影视:影视制作团队为音乐视频添加特效、制作特效镜头、创作定格动画,节省后期成本,提升视觉效果。
  • 个人与家庭:普通用户制作家庭搞笑视频,用“图片转视频”制作家庭纪念视频,记录和分享生活美好瞬间。

Reor – 开源AI个人知识管理工具,自动连接相关笔记

Reor是什么

Reor是开源的本地化AI个人知识管理应用。应用支持自动连接相关笔记、语义搜索和Q&A功能,用户基于类似Obsidian的Markdown编辑器进行笔记编辑。Reor基于Ollama、Transformers.js和LanceDB等技术,实现LLM和嵌入模型的本地运行,确保数据隐私。Reor提供本地写作助手,帮助用户高效整理和检索知识。Reor支持多平台,包括Mac、Linux和Windows,用户能轻松下载和安装使用。

Reor

Reor的主要功能

  • 自动连接相关笔记:Reor能自动识别和连接具有相似主题或内容的笔记,无需用户手动创建链接。
  • 语义搜索:支持语义搜索,用户无需记住笔记中的确切措辞,只需输入相关关键词,Reor能返回最相关的搜索结果。
  • Q&A 功能:内置大型语言模型(LLM),用户向其提问,LLM基于用户的所有笔记内容提供答案。
  • 本地优先:Reor的所有功能,全部在本地运行和存储,确保数据隐私。
  • 所见即所得的Markdown编辑:支持Markdown编辑,用户用Markdown语法来格式化笔记,编辑器提供所见即所得的体验。
  • 本地写作助手:提供本地写作助手,用户在写作时随时获取相关笔记的建议和提示,帮助用户更流畅地进行写作。
  • 支持本地模型运行:与Ollama集成,支持用户直接在Reor中下载和运行本地模型,或连接到OpenAI兼容的API。
  • 多平台支持:支持Mac、Linux和Windows等多种操作系统,用户能在不同的设备上使用Reor。

Reor的技术原理

  • 向量数据库:用内部矢量数据库,将每条笔记分块并嵌入到数据库中。基于向量相似度计算,自动连接相关笔记。
  • LLM驱动的问答:基于LLM(大型语言模型)进行问答,用检索增强生成(RAG)技术,从笔记语料库中检索相关信息,辅助生成答案。
  • 本地模型运行:Reor支持在本地运行LLMs和嵌入模型,基于Llama.cpp、Transformers.js和LanceDB等技术,确保数据隐私和性能优化。
  • Markdown解析与编辑:Reor用Markdown作为笔记格式,支持WYSIWYG编辑,方便用户快速撰写和整理笔记。
  • 语义搜索技术:基于嵌入模型将文本转换为向量,用向量相似度进行语义搜索,提高搜索的准确性和效率。

Reor的官网地址

Reor的应用场景

  • 个人知识管理:帮助用户整理笔记,基于自动链接和语义搜索快速找到相关内容,提升知识检索效率。
  • 学术研究:便于研究人员整理文献笔记、实验记录,快速关联相关研究内容,辅助论文撰写,整合引用已有成果,提高研究效率。
  • 团队协作:助力团队成员共享知识、整理项目文档,快速找到团队内部相关经验和最佳实践,提升协作效率,支持文档实时协作。
  • 企业知识管理:企业管理内部文档、政策文件,搭建项目知识库,方便员工查找学习,提升整体效率,支持员工培训资料管理。
  • 创意写作:创意工作者管理灵感记录、创意草稿,快速关联激发更多灵感,辅助小说、剧本等创作,整理角色背景、情节线索。

Sam Altman发布《The Gentle Singularity(温和的奇点)》

本篇文章《The Gentle Singularity》由Sam Altman撰写,探讨了人工智能和数字超级智能的发展及其对人类社会的影响。尽管目前人类尚未达到完全的超级智能,但已经在许多领域取得了显著进展,例如GPT-4等系统已经展现出超越人类的智能,并且能够显著提升人类的工作效率。作者 Sam Altman 认为,未来几年内,AI将在更多领域实现突破,如2026年可能出现能够产生新见解的系统,2027年可能会有能够执行现实世界任务的机器人。

The Gentle Singularity

英文版

The Gentle Singularity

We are past the event horizon; the takeoff has started. Humanity is close to building digital superintelligence, and at least so far it’s much less weird than it seems like it should be.

Robots are not yet walking the streets, nor are most of us talking to AI all day. People still die of disease, we still can’t easily go to space, and there is a lot about the universe we don’t understand.

And yet, we have recently built systems that are smarter than people in many ways, and are able to significantly amplify the output of people using them. The least-likely part of the work is behind us; the scientific insights that got us to systems like GPT-4 and o3 were hard-won, but will take us very far.

AI will contribute to the world in many ways, but the gains to quality of life from AI driving faster scientific progress and increased productivity will be enormous; the future can be vastly better than the present. Scientific progress is the biggest driver of overall progress; it’s hugely exciting to think about how much more we could have.

In some big sense, ChatGPT is already more powerful than any human who has ever lived. Hundreds of millions of people rely on it every day and for increasingly important tasks; a small new capability can create a hugely positive impact; a small misalignment multiplied by hundreds of millions of people can cause a great deal of negative impact.

2025 has seen the arrival of agents that can do real cognitive work; writing computer code will never be the same. 2026 will likely see the arrival of systems that can figure out novel insights. 2027 may see the arrival of robots that can do tasks in the real world.

A lot more people will be able to create software, and art. But the world wants a lot more of both, and experts will probably still be much better than novices, as long as they embrace the new tools. Generally speaking, the ability for one person to get much more done in 2030 than they could in 2020 will be a striking change, and one many people will figure out how to benefit from.

In the most important ways, the 2030s may not be wildly different. People will still love their families, express their creativity, play games, and swim in lakes.

But in still-very-important-ways, the 2030s are likely going to be wildly different from any time that has come before. We do not know how far beyond human-level intelligence we can go, but we are about to find out.

In the 2030s, intelligence and energy—ideas, and the ability to make ideas happen—are going to become wildly abundant. These two have been the fundamental limiters on human progress for a long time; with abundant intelligence and energy (and good governance), we can theoretically have anything else.

Already we live with incredible digital intelligence, and after some initial shock, most of us are pretty used to it. Very quickly we go from being amazed that AI can generate a beautifully-written paragraph to wondering when it can generate a beautifully-written novel; or from being amazed that it can make live-saving medical diagnoses to wondering when it can develop the cures; or from being amazed it can create a small computer program to wondering when it can create an entire new company. This is how the singularity goes: wonders become routine, and then table stakes.

We already hear from scientists that they are two or three times more productive than they were before AI. Advanced AI is interesting for many reasons, but perhaps nothing is quite as significant as the fact that we can use it to do faster AI research. We may be able to discover new computing substrates, better algorithms, and who knows what else. If we can do a decade’s worth of research in a year, or a month, then the rate of progress will obviously be quite different.

From here on, the tools we have already built will help us find further scientific insights and aid us in creating better AI systems. Of course this isn’t the same thing as an AI system completely autonomously updating its own code, but nevertheless this is a larval version of recursive self-improvement.

There are other self-reinforcing loops at play. The economic value creation has started a flywheel of compounding infrastructure buildout to run these increasingly-powerful AI systems. And robots that can build other robots (and in some sense, datacenters that can build other datacenters) aren’t that far off.

If we have to make the first million humanoid robots the old-fashioned way, but then they can operate the entire supply chain—digging and refining minerals, driving trucks, running factories, etc.—to build more robots, which can build more chip fabrication facilities, data centers, etc, then the rate of progress will obviously be quite different.

As datacenter production gets automated, the cost of intelligence should eventually converge to near the cost of electricity. (People are often curious about how much energy a ChatGPT query uses; the average query uses about 0.34 watt-hours, about what an oven would use in a little over one second, or a high-efficiency lightbulb would use in a couple of minutes. It also uses about 0.000085 gallons of water; roughly one fifteenth of a teaspoon.)

The rate of technological progress will keep accelerating, and it will continue to be the case that people are capable of adapting to almost anything. There will be very hard parts like whole classes of jobs going away, but on the other hand the world will be getting so much richer so quickly that we’ll be able to seriously entertain new policy ideas we never could before. We probably won’t adopt a new social contract all at once, but when we look back in a few decades, the gradual changes will have amounted to something big.

If history is any guide, we will figure out new things to do and new things to want, and assimilate new tools quickly (job change after the industrial revolution is a good recent example). Expectations will go up, but capabilities will go up equally quickly, and we’ll all get better stuff. We will build ever-more-wonderful things for each other. People have a long-term important and curious advantage over AI: we are hard-wired to care about other people and what they think and do, and we don’t care very much about machines.

A subsistence farmer from a thousand years ago would look at what many of us do and say we have fake jobs, and think that we are just playing games to entertain ourselves since we have plenty of food and unimaginable luxuries. I hope we will look at the jobs a thousand years in the future and think they are very fake jobs, and I have no doubt they will feel incredibly important and satisfying to the people doing them.

The rate of new wonders being achieved will be immense. It’s hard to even imagine today what we will have discovered by 2035; maybe we will go from solving high-energy physics one year to beginning space colonization the next year; or from a major materials science breakthrough one year to true high-bandwidth brain-computer interfaces the next year. Many people will choose to live their lives in much the same way, but at least some people will probably decide to “plug in”.

Looking forward, this sounds hard to wrap our heads around. But probably living through it will feel impressive but manageable. From a relativistic perspective, the singularity happens bit by bit, and the merge happens slowly. We are climbing the long arc of exponential technological progress; it always looks vertical looking forward and flat going backwards, but it’s one smooth curve. (Think back to 2020, and what it would have sounded like to have something close to AGI by 2025, versus what the last 5 years have actually been like.)

There are serious challenges to confront along with the huge upsides. We do need to solve the safety issues, technically and societally, but then it’s critically important to widely distribute access to superintelligence given the economic implications. The best path forward might be something like:

  1. Solve the alignment problem, meaning that we can robustly guarantee that we get AI systems to learn and act towards what we collectively really want over the long-term (social media feeds are an example of misaligned AI; the algorithms that power those are incredible at getting you to keep scrolling and clearly understand your short-term preferences, but they do so by exploiting something in your brain that overrides your long-term preference).
  2. Then focus on making superintelligence cheap, widely available, and not too concentrated with any person, company, or country. Society is resilient, creative, and adapts quickly. If we can harness the collective will and wisdom of people, then although we’ll make plenty of mistakes and some things will go really wrong, we will learn and adapt quickly and be able to use this technology to get maximum upside and minimal downside. Giving users a lot of freedom, within broad bounds society has to decide on, seems very important. The sooner the world can start a conversation about what these broad bounds are and how we define collective alignment, the better.

We (the whole industry, not just OpenAI) are building a brain for the world. It will be extremely personalized and easy for everyone to use; we will be limited by good ideas. For a long time, technical people in the startup industry have made fun of “the idea guys”; people who had an idea and were looking for a team to build it. It now looks to me like they are about to have their day in the sun.

OpenAI is a lot of things now, but before anything else, we are a superintelligence research company. We have a lot of work in front of us, but most of the path in front of us is now lit, and the dark areas are receding fast. We feel extraordinarily grateful to get to do what we do.

Intelligence too cheap to meter is well within grasp. This may sound crazy to say, but if we told you back in 2020 we were going to be where we are today, it probably sounded more crazy than our current predictions about 2030.

May we scale smoothly, exponentially and uneventfully through superintelligence.

中文版

温和的奇点

我们已经越过了事件视界,腾飞已经开始。人类正接近构建数字超级智能,而至少到目前为止,这一切并没有看起来那么奇怪。

机器人还没在街头随处可见,大多数人也还没整天和 AI 交流。人类仍然会死于疾病,去太空依然困难重重,我们对宇宙的理解仍然非常有限。

尽管如此,我们最近已经构建出在许多方面比人类更聪明的系统,并且这些系统能显著放大人类的产出。最不可能的部分已经完成——那些促成 GPT-4 和 o3 等系统诞生的科学突破来之不易,但它们将带我们走得更远。

AI 将在多个方面为世界带来贡献,但 AI 加速科学进步与提升生产力所带来的生活质量提升将是巨大的;未来有望远比现在更加美好。科学进步是整体进步的最大驱动力;一想到我们有可能获得多少更多的成果,就令人振奋。

从某种意义上说,ChatGPT 已经比历史上任何一个人都更强大。每天有数亿人依赖它,且任务越来越重要;一项小的新增能力可能带来极大的正面影响,而一个微小的不匹配在被数亿人使用时,也可能造成很大的负面影响。

2025 年,我们迎来了能够真正进行认知工作的智能代理;编写计算机代码的方式将彻底改变。2026 年,我们很可能会看到能产生原创见解的系统。2027 年,或许会出现能在现实世界中执行任务的机器人。

将有更多人能够创作软件和艺术。但世界对这两者的需求也将大幅上升。专家们如果拥抱这些新工具,可能仍然比新手强得多。总体来看,2030 年一个人完成的事情将远超 2020 年,这种变化将令人瞩目,也会有许多人学会如何从中受益。

在最重要的方面,2030 年代也许不会有太剧烈的变化。人们依然会爱家人,释放创造力,玩游戏,在湖里游泳。

但在仍然非常重要的其他方面,2030年代很可能与以往任何时代都大不相同。我们不知道人类智能的上限有多高,但我们即将找出答案。

到了 2030 年代,智慧和能源——即想法及实现想法的能力——将变得极其丰富。这两者长期以来一直是人类进步的基本限制;如果智慧和能源变得充足(加上良好的治理),理论上我们可以实现一切。

现在我们已经与惊人的数字智能共处,并且在最初的震惊之后,大多数人已渐渐习惯。我们很快会从惊叹 AI 能写出优美段落,变成期待它写出完整小说;从惊讶它能诊断疾病,变成期望它能研发治愈方法;从惊讶它能写出小程序,变成希望它能创建整家公司。这就是「奇点」的方式:奇迹变成日常,然后变成起点。

已经有科学家告诉我们,他们的工作效率是过去的两到三倍。高级AI之所以意义重大,其中一个最关键的原因是我们可以用它来加速 AI 研究本身。我们也许能发现新的计算材料、更好的算法,甚至更多未知的可能。如果我们能用一年、甚至一个月完成十年的研究,进步的速度显然会大不一样。

从现在开始,我们已有的工具将帮助我们发现更多科学洞见,并辅助我们创造更先进的 AI 系统。当然,这还不是AI完全自主地更新自身代码,但这确实是「递归自我改进」的初始形态。

还有其他一些自我强化的循环正在发生。AI 带来的经济价值推动了基础设施建设的飞轮,越来越多的资源正用于运行这些强大的 AI 系统。而能够制造其他机器人的机器人(在某种意义上,还有能建造其他数据中心的数据中心)离我们也不远了。

如果我们必须用传统方式制造出最初的一百万个人形机器人,但它们随后能接手整个供应链——开采和提炼矿物、驾驶卡车、运行工厂等——并制造更多机器人、芯片厂和数据中心,那进步的速度就会截然不同。

随着数据中心的生产逐渐自动化,智能的成本最终应该会接近电力成本。(很多人关心 ChatGPT 每次查询用多少能量;平均每次查询大约耗电 0.34 瓦时,大概相当于烤箱运行一秒多一点,或高效灯泡使用几分钟。此外,每次查询大约用水 0.000085 加仑,约等于十五分之一茶匙。)

科技进步的速度将持续加快,而人类也有很强的适应能力。虽然会有艰难的挑战,比如整类工作消失,但另一方面,世界的财富增长如此之快,以至于我们将有机会认真考虑以前无法实现的新政策。我们可能不会一次性建立一套新的社会契约,但回顾几十年后,会发现逐步变化的累积带来了巨大转变。

如果历史可以作为参考,我们总能找到新事物去做、新欲望去追求,并迅速适应新工具(工业革命后的职业变迁就是个很好的例子)。人们的期望会提升,但能力也会随之快速提升,我们会拥有更好的生活。我们会为彼此创造越来越美妙的事物。相比 AI,人类有一个长期且重要的优势:我们天生在意他人,以及他人怎么想、怎么做,而对机器却没什么感情。

如果一千年前的自给农民看到我们现在的生活,会觉得我们从事的是「假工作」,仿佛只是在自娱自乐,因为我们食物充足、奢华难以想象。我希望我们未来一千年后也能用同样的眼光看待那些工作——觉得它们「非常假」,但毫无疑问,那些人会认为自己的工作极其重要且充实。

未来将涌现出大量的新奇迹。到 2035 年,我们会取得什么突破现在都难以想象;可能今年我们还在解决高能物理问题,明年就开始太空殖民;或今年在材料科学上取得重大突破,明年就实现真正高带宽的脑机接口。很多人会选择继续以当下的方式生活,但也肯定会有人选择「接入系统」。

展望未来,这些事现在听起来难以想象。但真正经历它时,可能会让人惊叹,却仍在可控范围内。从相对论的角度看,奇点是一点点发生的,融合是逐步进行的。我们正攀登那条技术指数增长的长弧线;向前看总觉得是陡峭的垂直,向后看则像是平缓的线,但其实它是一条平滑的曲线。(回想 2020 年,如果那时我们说 2025 年会接近 AGI,听起来会很疯狂,但对比过去五年所发生的一切,也许现在的预测不那么疯狂了。)

当然,我们还面临许多严峻挑战。我们需要在技术上和社会层面解决安全问题,但在那之后,最重要的是确保超级智能能被广泛获取,因为这关系到经济结构。未来的最好路径可能包括以下几个步骤:

首先解决「对齐问题」,也就是我们能有把握地确保 AI 系统长期学会并实现我们集体真正的意愿(比如社交媒体就是对齐失败的例子:推荐算法非常擅长让你不停刷,但它们是通过利用大脑短期偏好来压制你长期目标的)。

接着,重点让超级智能变得便宜、普及,并避免被某个个人、公司或国家高度集中掌控。社会具有韧性、创造力,也能迅速适应。

如果我们能激发集体的意志和智慧,尽管会犯错、也会有失控,但我们会迅速学习与调整,从而最大化收益、最小化风险。在社会广泛设定的框架下,给予用户更多自由将非常关键。世界越早开始关于这些框架及「集体对齐」如何定义的讨论,就越好。

我们(整个行业,不只是 OpenAI)正在为世界构建一个「大脑」。

这个大脑将高度个性化、人人易用;它的极限将取决于我们的好点子。长期以来,技术圈总爱嘲笑那些「只有想法的人」——他们有个点子,却没法实现。而现在,看起来他们的时代终于要到了。

OpenAI 如今做的事情很多,但最根本的身份仍是一个超级智能研究公司。我们还有大量工作要做,但前路已经被照亮,黑暗正迅速退去。我们对能做这些事情感到无比感激。

「智能几乎免费」已近在眼前。也许听起来疯狂,但如果我们在 2020 年告诉你我们将在 2025 年到达现在这个水平,听起来比我们现在对 2030 年的预测更疯狂。

愿我们顺利、指数级、平稳地迈入超级智能时代。

原文链接:the-gentle-singularity

豆包大模型1.6 – 字节跳动推出的多模态深度思考模型

豆包大模型1.6是什么

豆包大模型1.6(Doubao-Seed-1.6)是字节跳动推出的多模态深度思考大模型。模型支持auto、thinking和non-thinking三种思考模式,能处理文字、图片、视频等多种输入形式,支持输出高质量的文字内容。模型具备256k长上下文窗口,最大输入长度可达224k tokens,输出长度支持最大16k tokens,推理能力强大。模型在多个权威测评中表现优异,推理和数学能力显著提升。豆包1.6广泛应用在内容创作、智能对话、代码生成等领域,为企业和开发者提供强大的AI生产力工具。豆包1.6已在火山引擎上线,企业和开发者可调用API体验。

doubao-seed-1-6

豆包大模型1.6的主要功能

  • 推理能力:在推理速度、准确度与稳定性上显著提升,能支撑更复杂的业务场景落地。
  • 边想边搜与DeepResearch:具备边想边搜能力,能基于缺失信息进行搜索,经过多轮思考和搜索给出推荐。DeepResearch功能支持快速生成调研报告。
  • 多模态理解能力:全系列原生支持多模态思考能力,支持理解和处理文本、图像、视频等多种模态数据。
  • 图形界面操作能力(GUI操作):基于视觉深度思考与精准定位,能与浏览器及其他软件进行交互和操作,高效执行各类任务。

豆包大模型1.6的三个模型

  • doubao-seed-1.6:全能综合型模型,是全能型的综合模型,也是国内首个支持 256K 上下文的思考模型。模型具备深度思考、多模态理解及图形界面操作等多项能力。用户根据需求灵活选择开启或关闭深度思考功能,支持自适应思考模式。自适应模式根据提示词的难度自动判断是否开启深度思考,在提升效果的同时,大幅减少 tokens 的消耗。
  • doubao-seed-1.6-thinking:深度思考强化版,是豆包大模型 1.6 系列中专注于深度思考的强化版本。模型在代码编写、数学计算、逻辑推理等基础能力上进行进一步提升,能处理更复杂的任务。同时支持 256K 的上下文,能理解和生成更长的文本内容,适合需要深度分析和复杂推理的场景。
  • doubao-seed-1.6-flash:极速响应版本,是豆包大模型 1.6 系列中的极速版本,具备深度思考和多模态理解能力,支持 256K 上下文。模型的延迟极低,TOPT(Top-of-Pipeline Time)仅需 10ms,能快速响应用户的请求。模型视觉理解能力与友商旗舰模型相当,适合对响应速度要求极高的场景,例如实时交互和视觉任务处理。

豆包大模型1.6的性能表现

  • GPQA Diamond测试:豆包1.6-thinking模型取得81.5分的成绩,达到全球第一梯队水平,是目前最好的推理模型之一。
  • 数学测评AIME25:豆包1.6-thinking模型的成绩达到86.3分,相比豆包1.5深度思考模型提升12.3分。

doubao-seed-1-6

豆包大模型1.6的定价模式

豆包大模型1.6基于统一的定价模式,无论是否开启深度思考模式,无论是文本还是视觉输入,tokens价格均一致。

  • 输入长度0-32K
    • 输入价格:0.8元/百万tokens。
    • 输出价格:8元/百万tokens。
  • 输入长度32K-128K
    • 输入价格:1.2元/百万tokens。
    • 输出价格:16元/百万tokens。
  • 输入长度128K-256K
    • 输入价格:2.4元/百万tokens。
    • 输出价格:24元/百万tokens。
  • 输入32K、输出200 tokens以内
    • 输入价格:0.8元/百万tokens。
    • 输出价格:2元/百万tokens。

如何使用豆包大模型1.6

  • 注册并登录火山引擎平台:访问火山引擎官方网站,按提示完成注册和登录。
  • 开通豆包大模型服务:进入服务页面,找到豆包大模型1.6的服务页面。
  • 开通服务:根据页面提示,开通豆包大模型1.6服务。
  • 选择版本:根据需求选择合适的模型版本(如doubao-seed-1.6、doubao-seed-1.6-thinking或doubao-seed-1.6-flash)。
  • 获取API密钥:在开通服务后,平台提供一个API密钥,用在在调用模型时进行身份验证。
  • 调用模型
    • 使用API接口:豆包大模型1.6基于API接口进行调用。
    • 构建请求:根据需求构建请求数据,包括输入文本、参数设置等。
    • 发送请求:使用HTTP请求将数据发送到模型的API接口。
    • 接收响应:模型处理完成后,返回响应数据,包括生成的文本或其他结果。
  • 示例代码(Python):以下是使用Python调用豆包大模型1.6的示例代码:
import requests
import json

# API密钥和接口地址
api_key = "your_api_key"
api_secret = "your_api_secret"
model_version = "doubao-seed-1.6"  # 或doubao-seed-1.6-thinking、doubao-seed-1.6-flash
api_url = f"https://api.volcengine.com/v1/model/{model_version}"

# 请求数据
data = {
    "input": "你的输入文本",
    "parameters": {
        "max_length": 256,  # 输出的最大长度
        "temperature": 0.7,  # 随机性参数
        "top_p": 0.9,  # 核心采样参数
        "top_k": 50,  # 核心采样参数
        "do_sample": True  # 是否采样
    }
}

# 设置请求头
headers = {
    "Authorization": f"Bearer {api_key}",
    "Content-Type": "application/json"
}

# 发送请求
response = requests.post(api_url, headers=headers, data=json.dumps(data))

# 处理响应
if response.status_code == 200:
    result = response.json()
    print("模型输出:", result["output"])
else:
    print("请求失败,状态码:", response.status_code)
    print("错误信息:", response.text)

豆包大模型1.6的项目地址

豆包大模型1.6的应用场景

  • 内容创作:生成广告文案、新闻报道、故事、小说等,帮助用户快速产出高质量内容。
  • 智能对话:用在智能客服和聊天机器人,提供自然流畅的多轮对话体验,提升用户交互效率。
  • 代码生成:根据需求生成前端代码片段,辅助开发者排查错误,提高开发效率。
  • 教育辅导:解答学科问题,生成教学资源,辅助学生学习和教师备课。
  • 多模态内容生成:结合图片或视频输入,生成相关文字描述或创意内容,助力多媒体创作。

Genspark AI 浏览器 – Genspark公司推出的AI浏览器

Genspark AI 浏览器是什么

Genspark AI 浏览器(Genspark AI Browser) 是 Genspark 公司推出的创新性人工智能浏览器。内置智能助手,能帮助用户查找更优交易、比较产品、分析评论,在各类网站上辅助决策。 AI 自动浏览信息源、收集资料、访问高级数据库,完成复杂网页任务,支持MCP服务,连接 Discord、GitHub、Notion、Slack 等 700 多种工具,实现工作流程自动化。自动屏蔽各种烦人的横幅广告、弹窗和侵入性广告,专注阅读。

Genspark AI Browser

Genspark AI 浏览器的主要功能

  • 全能智能体:内置智能助手,能帮助用户查找更优交易、比较产品、分析评论,在各类网站上辅助决策。
  • 自动驾驶模式:用户可以让 AI 自动浏览信息源、收集资料、访问高级数据库,完成复杂网页任务,无需手动操作。
  • MCP 商店:支持连接 Discord、GitHub、Notion、Slack 等 700 多种工具,实现工作流程自动化,把浏览器变成生产力平台。
  • 广告拦截:自动屏蔽各种烦人的横幅广告、弹窗和侵入性广告,让网页更干净、阅读更专注。

Genspark AI 浏览器的官网地址

Genspark AI 浏览器的应用场景

  • 产品比较:输入产品型号(如手机或电脑),Genspark 会列出价格、性能和用户评价,帮助用户做出购买决策。
  • 行业动态分析:职场人士可以通过输入关键词快速获取行业数据和趋势,方便汇报或分析。
  • 网页任务自动化:支持多标签管理和视觉识别,能自动完成复杂的网页任务,如在线订票、数据抓取和填表。
  • 多源信息整合:自动浏览多个网页和信息源,提取关键信息并交叉验证。
  • 研究报告生成:生成有条理的研究报告和总结,帮助用户快速获取深度信息。

Seedance 1.0 – 字节跳动推出的视频生成模型

Seedance 1.0是什么

Seedance 1.0 是字节跳动Seed团队推出的视频生成基础模型。模型支持文字与图片输入,能生成多镜头无缝切换的1080p高品质视频,具备原生多镜头叙事能力,能进行远中近景画面切换,主体运动稳定,画面自然。Seedance 1.0 支持多种风格创作,如写实、动漫、影视等,且生成速度快,成本低。在第三方评测榜单Artificial Analysis上,Seedance 1.0 文生视频、图生视频两个任务均位居首位,展现了在视频生成领域的强大性能和优势。

Seedance 1.0

Seedance 1.0的主要功能

  • 多镜头叙事能力:支持生成包含多个连贯镜头的叙事性视频,能进行远、中、近景的切换,确保核心主体、视觉风格和整体氛围的高度一致。
  • 流畅稳定的运动表现:模型能生成大幅度运动的视频,从细微的表情到动态场景都能保持高水平的稳定性和物理真实感。
  • 多种风格创作:支持多种风格的视频生成,包括写实、动漫、影视、广告等。
  • 精准的语义理解与指令遵循:模型能精准解析复杂的自然语言指令,稳定控制多主体互动、多重动作组合,支持丰富的运镜选择。
  • 高速推理与低成本:基于对模型结构的优化和推理加速,Seedance 1.0 支持在短时间内完成视频创作。对于5秒1080p分辨率的视频生成任务,实测推理耗时仅41.4秒(基于NVIDIA L20测试),显著低于其他同类模型。

Seedance 1.0的技术原理

  • 多源数据整理与精准描述模型:基于多阶段筛选和均衡,构建了大规模、多样化的视频数据集,涵盖不同主题、场景、风格和镜头运动。训练一个动静态特征融合的密集描述模型,用在生成精准的视频描述(Caption),作为训练数据。模型关注视频中的动作变化与镜头运动,强调画面主要元素的性质特点与场景信息。
  • 高效的预训练框架:构建解耦空间层和时间层的扩散Transformer模型,空间层在单帧内执行注意力聚合,时间层专注于跨帧的注意力计算,提升训练和推理效率。支持视觉token与文本token的交错序列,扩展到多镜头视频的训练,增强模型的多镜头生成能力和多模态理解力。基于二元掩码指示哪些帧应遵循生成中的控制条件,实现文本到图像、文本生视频和图像生视频等任务的统一框架。
  • 后训练优化与复合奖励系统:在微调阶段,用高质量视频-文本对数据集进行训练,确保生成的视频在美学效果和运动动态上表现更佳。构建包括基础奖励模型、运动奖励模型和美学奖励模型在内的复合奖励系统,基于多维度奖励模型提升模型在图文对齐、运动质量和画面美感上的表现。用最大化多个奖励模型奖励值的方法,结合RLHF(Reinforcement Learning from Human Feedback)算法,提升模型在文生视频和图生视频任务中的综合效果。
  • 极致推理加速:基于分段轨迹一致性、分数匹配与人类偏好引导的对抗蒸馏机制,在极低推理步数下实现生成质量与速度的更优协同。用通道结构细化的轻量级VAE解码器,实现视频生成路径中感知质量无损的双倍加速。基于融合算子优化、异构量化稀疏策略、自适应混合并行、异步卸载与VAE并行分解等系统级改造,构建面向长序列视频生成的高效推理路径,实现端到端吞吐与内存效率的更优协同。

Seedance 1.0的性能表现

  • 在第三方评测平台 Artificial Analysis 上,Seedance 1.0 在文生视频(T2V)和图生视频(I2V)两个任务中均位居首位。
  • Seedance 1.0 在内部基准测试中,与行业其他模型的对比,Seedance 1.0 在指令遵循、运动质量和美学表现等多个核心维度表现良好。在 T2V 任务中,指令遵循、运动质量、美学表现等指标获得较高评分。

Seedance 1.0

Seedance 1.0的官方示例

  • 原生多镜头叙事能力
    • Prompt:女孩弹钢琴,多镜头切换,电影质感(I2V)。

Seedance 1.0

  • 更强运动生成效果
    • Prompt:滑雪者在滑雪,他转弯时扬起大片雪雾,沿着山坡逐渐加速,镜头平稳地移动着。

Seedance 1.0

  • 支持高美感的多种风格创作

Seedance 1.0

Seedance 1.0的项目地址

Seedance 1.0的应用场景

  • 影视制作:生成包含多个镜头切换的叙事性视频,支持复杂的叙事结构,提升视频的叙事能力和视觉效果。
  • 广告与营销:快速生成高质量的广告视频,支持多种风格和场景,满足不同品牌和产品的广告需求。
  • 游戏开发:生成游戏中的过场动画和动态场景,提升游戏的叙事性和沉浸感。
  • 教育与培训:生成教育视频和培训材料,帮助学生和员工更好地理解和掌握知识。
  • 新闻与媒体:生成新闻报道和纪录片中的动态内容,增强新闻和纪录片的视觉效果。

话袋AI笔记 – AI笔记应用,支持文字、图片、视频等多形式记录

话袋AI笔记是什么

话袋AI笔记是智能笔记应用,基于先进的AI技术为核心,为用户提供高效、便捷的记录与学习平台。话袋能应对用户灵感闪现的瞬间,日常学习和工作中的点滴记录。话袋AI笔记支持文字、图片、视频、音频等多种形式的记录,能实现设备间的无缝同步。话袋具备问答助手、头脑风暴等功能,激发用户的灵感,帮助用户更好地整理思路。话袋AI笔记为用户提供极致的使用体验,让话袋成为用户生活和学习中的得力助手。

话袋AI笔记

话袋AI笔记的主要功能

  • 多格式记录:支持文字、图片、视频、音频、链接等多种记录形式,满足用户在不同场景下的记录需求。
  • 待办事项管理:方便用户记录和管理日常的待办事项,设置提醒时间,确保重要事项不会遗漏。
  • 跨设备同步:实现移动端、电脑端等设备的无缝同步,支持用户在任何设备上随时查看和编辑笔记。
  • 智能分类与标签:帮助用户对笔记进行分类和标签管理,方便快速查找和整理知识。
  • 搜索功能:强大的搜索功能支持快速定位到用户需要的笔记内容,节省查找时间。
  • 问答助手:基于AI技术,为用户提供智能问答服务,帮助用户快速获取知识和信息。
  • 头脑风暴:激发用户的灵感和创造力,基于AI辅助进行头脑风暴,帮助用户更好地整理思路和拓展思维。

如何使用话袋AI笔记

  • 下载与安装:访问话袋AI笔记官方网站,客户端根据设备类型选择对应的客户端进行下载和安装,网页端直接点击网页版在线使用。
  • 注册与登录:按要求完成注册和登录。
  • 新建笔记:登录后,点击“新建笔记”按钮,进入笔记编辑页面。选择文字、图片、视频、音频、链接等多种格式进行记录。
  • 编辑笔记:在笔记编辑页面,对笔记内容进行编辑,包括修改文字、调整图片位置、添加标签等。
  • 管理笔记:对笔记进行分类和标签管理。基于分类和标签,快速查找和整理笔记。
  • 搜索笔记:在搜索框中输入关键词,点击“搜索”按钮,快速找到相关的笔记。
  • 问答助手:在笔记编辑页面,点击“问答助手”按钮,输入问题,AI自动回答。
  • 头脑风暴:点击“头脑风暴”按钮,输入主题,AI生成相关的想法和建议。
  • 跨设备同步:确保所有设备都登录同一个账号,话袋AI笔记自动同步笔记内容。
  • 备份与恢复:话袋AI笔记自动备份笔记内容到云端,支持用户在设置中手动备份和恢复笔记。

话袋AI笔记的应用场景

  • 学习提升:适用学生记录课堂笔记、备考复习,及语言学习等,帮助用户高效整理知识,提升学习效率。
  • 工作高效:用在会议记录、项目管理和创意构思,助力职场人士快速记录工作要点,合理安排任务,激发团队创意。
  • 生活便捷:方便记录旅行计划、购物清单、食谱等生活点滴,让生活更加有序,随时回顾美好瞬间。
  • 知识管理:便于整理读书笔记、行业动态和个人成长历程,构建个人知识库,实现知识的系统化管理和深度积累。
  • 团队协作:支持团队文档共享、任务分配和知识共享,促进团队成员之间的信息流通和协作,提升团队整体效率。