Claude 3.5 Sonnet在编码领域实现了显著提升,继续保持行业领先地位。而Claude 3.5 Haiku则在成本和速度与前代Haiku相似的情况下,性能与Claude 3 Opus相当,甚至在许多评估中超越了它。
此外,Anthropic公司还推出了一项开创性的公测功能——计算机使用能力。开发者现在可以指导Claude像人类一样使用计算机,包括查看屏幕、移动光标、点击按钮和输入文本。Claude 3.5 Sonnet是首个提供这项公测功能的AI模型。尽管这项功能目前还处于实验阶段,可能会遇到一些困难和错误,但Anthropic公司希望通过开发者的反馈快速改进。
一些公司如Asa…
Sequoia刚刚发布的关于生成式 AI 的年度报告, 报告指出随着生成式 人工智能(AI)技术的飞速发展,我们正迎来一个全新的时代——推理时代。在这个时代,AI将不再仅仅依赖于快速的模式匹配,而是能够进行深入的思考和推理,解决更复杂的问题。
过去两年,生成性AI市场的基础层已经稳定下来,形成了以微软/OpenAI、亚马逊/Anthropic、Meta和谷歌/DeepMind等为主要玩家的市场结构。这些巨头的竞争仍在继续,但他们的稳定为AI的进一步发展奠定了基础。
现在,焦点转向了推理层的开发,这一层的目标是让AI在推理时能够进行深思熟虑的推理和问题解决。OpenAI的最新模型o1(也称为…
加州门洛帕克,2024年9月26日 —— Meta公司在位于加州门洛帕克的总部向媒体展示了其首款增强现实(AR)眼镜Orion。尽管Orion眼镜目前尚未上市,但其展示的技术令人印象深刻,预示着智能手机之后新一代计算平台的到来。
Orion眼镜外观低调,采用黑色框架,但内部集成了复杂的高科技。这款眼镜内置了定制的Micro LED投影器,通过硅碳化物镜片中的波导技术,将图像直接投射到用户视野中。硅碳化物因其耐用性、轻质和高折射率而被选用,以提供更宽广的视野。
Meta公司CEO马克·扎克伯格将Orion视为未来沟通和与AI交互的主要工具。在演示中,Orion展示了其生成式AI能力,…
2024年9月19日 — Qwen团队今日宣布推出Qwen2.5,这是迄今为止最大规模的开源语言模型之一。Qwen2.5系列包括通用、编程和数学优化的模型,覆盖从0.5B到72B不同参数规模,为开发者和研究人员提供了前所未有的灵活性和性能。
全面升级,性能卓越
Qwen2.5在最新的大规模数据集上进行了预训练,涵盖了高达18万亿个token,显著提升了模型的知识获取、编程和数学处理能力。此外,Qwen2.5在遵循指令、生成长文本、理解结构化数据和生成结构化输出方面也展现了卓越的性能。
专家模型,专注领域
Qwen2.5-Coder和Qwen2.5-Math作为专家模型,…
本周是AI和机器人领域的重要一周,众多公司发布了最新动态。
OpenAI发布“o1”模型:OpenAI正式推出了名为“o1”的模型,也称为Project Strawberry/Q*。这个模型通过强化学习和链式思维在回答之前进行“思考”,预示着与GPT-4完全不同的提示方式。
苹果推出iPhone 16的AI功能:苹果宣布了iPhone 16的Apple Intelligence功能,这将极大地推动消费者AI的普及。特别引人注目的是AI能够访问iPhone的相机,实现对周围环境的“视觉智能”。
Google DeepMind的机器人AI系统:Goo…
Yoto 是一家专注于为儿童提供不依赖屏幕时间的内容的英国初创公司。通过其音频平台,Yoto 为儿童提供了一个更安全的内容消费空间,这个空间不包含任何麦克风、摄像头或广告。
Yoto 的产品独特之处在于,它允许儿童自己选择内容,每张智能卡都是根据儿童发展的需求设计的, 融入了蒙特梭利教育原则。儿童可以根据自己的年龄组选择一张卡片,插入他们的设备中,然后播放音频内容。
Yoto 提供的内容非常全面,包括来自 Beatrix Potter、迪士尼、Julia Donaldson、Ladybird、PAW Patrol 等创作者的内容。列出的类型也非常广泛,包括睡前故事、音乐、学习和冒险故事。 …
自动化提示工程(Automated Prompt Engineering, APE)是一种用于自动化生成和优化大型语言模型(LLM)提示的技术,目的是提高模型在特定任务上的性能。APE的核心思想是将提示工程的过程自动化,类似于传统机器学习中的自动化超参数优化。
APE的工作原理包括以下几个关键步骤:
初始提示:从一个初始提示开始,将其和数据集一起发送给目标LLM,生成基于数据集的响应。
评估响应:使用标记数据集的真值来评估LLM生成的响应,确定模型的性能。
优化提示:基于评估结果,优化器LLM会提出新的提示。
迭代过程:重复生成…
OpenAI在2024年9月12日发布了一系列新的推理模型,命名为OpenAI o1。这些模型旨在通过更长时间的思考来解决复杂问题,相较于之前的模型,在科学、编程和数学等领域表现出更强的推理能力。
新模型发布:OpenAI o1系列的第一个模型已经在ChatGPT和API中发布,这是一个预览版,预计将会定期更新和改进。
工作原理:这些模型被训练成在回答问题前花费更多时间思考,类似于人类的思考过程。它们通过训练学习优化思考过程,尝试不同的策略,并识别错误。
性能测试:在测试中,新模型在物理、化学和生物学的挑战性基准任务上的…
Oracle宣布推出首个Zettascale云计算集群,搭载NVIDIA Blackwell平台,提供高达131,072个NVIDIA Blackwell GPU。该AI超级计算机提供2.4 ZettaFLOPS的峰值性能,是云中最大的AI超级计算机。
OCI Supercluster支持NVIDIA H100、H200和Blackwell GPU,提供不同规模和性能的AI计算能力。
此外,OCI Supercluster还提供低延迟网络和高性能存储选项。客户如WideLabs和Zoom正在利用OCI的高性能AI基础设施进行AI训练和推理。
要点
近期经济人的一篇名为“Artificial intelligence is losing hype”[1]文章提到,人工智能的概念正在褪去热度,投资者们开始担心人工智能可能无法带来他们期望的巨大利润。自从上个月股价达到顶峰以来,那些推动AI革命的西方公司的股票价格已经下跌了15%。越来越多的观察者开始质疑大型语言模型的局限性。
业界对 Scaling law 所能带来的性能改善达成共识同时,也基本确定了这条道路是无法直达通用人工智能(AGI) 的。被鸽了又鸽,迟迟没有推出的 GPT-5也让投资人怀疑大模型的天花板可能快到了。个人觉得 GPT-5大概率还是横向的提升,表现为更好的生成质量、 对…