科技资讯

Sequoia刚刚发布的关于生成式 AI 的年度报告, 报告指出随着生成式 人工智能(AI)技术的飞速发展,我们正迎来一个全新的时代——推理时代。在这个时代,AI将不再仅仅依赖于快速的模式匹配,而是能够进行深入的思考和推理,解决更复杂的问题。

过去两年,生成性AI市场的基础层已经稳定下来,形成了以微软/OpenAI、亚马逊/Anthropic、Meta和谷歌/DeepMind等为主要玩家的市场结构。这些巨头的竞争仍在继续,但他们的稳定为AI的进一步发展奠定了基础。

现在,焦点转向了推理层的开发,这一层的目标是让AI在推理时能够进行深思熟虑的推理和问题解决。OpenAI的最新模型o1(也称为…

加州门洛帕克,2024年9月26日 —— Meta公司在位于加州门洛帕克的总部向媒体展示了其首款增强现实(AR)眼镜Orion。尽管Orion眼镜目前尚未上市,但其展示的技术令人印象深刻,预示着智能手机之后新一代计算平台的到来。

Orion眼镜外观低调,采用黑色框架,但内部集成了复杂的高科技。这款眼镜内置了定制的Micro LED投影器,通过硅碳化物镜片中的波导技术,将图像直接投射到用户视野中。硅碳化物因其耐用性、轻质和高折射率而被选用,以提供更宽广的视野。

Meta公司CEO马克·扎克伯格将Orion视为未来沟通和与AI交互的主要工具。在演示中,Orion展示了其生成式AI能力,…

2024年9月19日 — Qwen团队今日宣布推出Qwen2.5,这是迄今为止最大规模的开源语言模型之一。Qwen2.5系列包括通用、编程和数学优化的模型,覆盖从0.5B到72B不同参数规模,为开发者和研究人员提供了前所未有的灵活性和性能。

全面升级,性能卓越

Qwen2.5在最新的大规模数据集上进行了预训练,涵盖了高达18万亿个token,显著提升了模型的知识获取、编程和数学处理能力。此外,Qwen2.5在遵循指令、生成长文本、理解结构化数据和生成结构化输出方面也展现了卓越的性能。

专家模型,专注领域

Qwen2.5-Coder和Qwen2.5-Math作为专家模型,…

本周是AI和机器人领域的重要一周,众多公司发布了最新动态。

  1. OpenAI发布“o1”模型:OpenAI正式推出了名为“o1”的模型,也称为Project Strawberry/Q*。这个模型通过强化学习和链式思维在回答之前进行“思考”,预示着与GPT-4完全不同的提示方式。

  2. 苹果推出iPhone 16的AI功能:苹果宣布了iPhone 16的Apple Intelligence功能,这将极大地推动消费者AI的普及。特别引人注目的是AI能够访问iPhone的相机,实现对周围环境的“视觉智能”。

  3. Google DeepMind的机器人AI系统:Goo…

Yoto 是一家专注于为儿童提供不依赖屏幕时间的内容的英国初创公司。通过其音频平台,Yoto 为儿童提供了一个更安全的内容消费空间,这个空间不包含任何麦克风、摄像头或广告。

Yoto 的产品独特之处在于,它允许儿童自己选择内容,每张智能卡都是根据儿童发展的需求设计的, 融入了蒙特梭利教育原则。儿童可以根据自己的年龄组选择一张卡片,插入他们的设备中,然后播放音频内容。

Yoto 提供的内容非常全面,包括来自 Beatrix Potter、迪士尼、Julia Donaldson、Ladybird、PAW Patrol 等创作者的内容。列出的类型也非常广泛,包括睡前故事、音乐、学习和冒险故事。 …

自动化提示工程(Automated Prompt Engineering, APE)是一种用于自动化生成和优化大型语言模型(LLM)提示的技术,目的是提高模型在特定任务上的性能。APE的核心思想是将提示工程的过程自动化,类似于传统机器学习中的自动化超参数优化。

APE的工作原理包括以下几个关键步骤:

  1. 初始提示:从一个初始提示开始,将其和数据集一起发送给目标LLM,生成基于数据集的响应。

  2. 评估响应:使用标记数据集的真值来评估LLM生成的响应,确定模型的性能。

  3. 优化提示:基于评估结果,优化器LLM会提出新的提示。

  4. 迭代过程:重复生成…

OpenAI在2024年9月12日发布了一系列新的推理模型,命名为OpenAI o1。这些模型旨在通过更长时间的思考来解决复杂问题,相较于之前的模型,在科学、编程和数学等领域表现出更强的推理能力。

要点

  1. 新模型发布:OpenAI o1系列的第一个模型已经在ChatGPT和API中发布,这是一个预览版,预计将会定期更新和改进。

  2. 工作原理:这些模型被训练成在回答问题前花费更多时间思考,类似于人类的思考过程。它们通过训练学习优化思考过程,尝试不同的策略,并识别错误。

  3. 性能测试:在测试中,新模型在物理、化学和生物学的挑战性基准任务上的…

Oracle宣布推出首个Zettascale云计算集群,搭载NVIDIA Blackwell平台,提供高达131,072个NVIDIA Blackwell GPU。该AI超级计算机提供2.4 ZettaFLOPS的峰值性能,是云中最大的AI超级计算机。

OCI Supercluster支持NVIDIA H100、H200和Blackwell GPU,提供不同规模和性能的AI计算能力。

此外,OCI Supercluster还提供低延迟网络和高性能存储选项。客户如WideLabs和Zoom正在利用OCI的高性能AI基础设施进行AI训练和推理。

要点

  • **Oracle推出首个Ze…

近期经济人的一篇名为“Artificial intelligence is losing hype”[1]文章提到,人工智能的概念正在褪去热度,投资者们开始担心人工智能可能无法带来他们期望的巨大利润。自从上个月股价达到顶峰以来,那些推动AI革命的西方公司的股票价格已经下跌了15%。越来越多的观察者开始质疑大型语言模型的局限性。

业界对 Scaling law 所能带来的性能改善达成共识同时,也基本确定了这条道路是无法直达通用人工智能(AGI) 的。被鸽了又鸽,迟迟没有推出的 GPT-5也让投资人怀疑大模型的天花板可能快到了。个人觉得 GPT-5大概率还是横向的提升,表现为更好的生成质量、 对…

TurboEdit 在少步骤扩散模型的背景下解决了精确图像反演和松散图像编辑的挑战。该方案采用基于编码器的迭代反演技术,使反演网络以输入图像和上一步的重建图像为条件,以校正输入图像的下一个重建。

我们发现,通过详细的文本提示,可以在多步扩散模型中轻松实现松散控制。为了操作反转图像,我们冻结噪声图并修改文本提示中的一个属性,从而生成与输入图像相似的新图像,仅更改了一个属性。

迭代反演技术有助于实时进行逼真的文本引导图像编辑,在反演(一次性成本)中只需要8次功能评估(NFE),每次编辑需要4次NFE。该方法不仅速度快,而且明显优于最先进的多步扩散编辑技术。

要点

  1. **精确图像反…