科技资讯

Rerank3: 一种新的高效企业检索基础模型

4/14/2024

近期，Cohere 推出了最新的基础模型——Rerank 3，这款模型专为提升企业搜索和检索增强生成（RAG）系统而设计。Rerank 3 能够与任何数据库或搜索索引兼容，并且可以轻松集成到任何具有原生搜索功能的遗留应用程序中。仅需一行代码，Rerank 3 就能提升搜索性能或降低运行 RAG 应用程序的成本，同时对延迟的影响微乎其微。

Rerank 3 在企业搜索领域提供了先进的功能，包括能够处理长达 4k 的上下文长度，显著提高了长篇文档的搜索质量；能够搜索多方面和半结构化数据，比如电子邮件、发票、JSON 文档、代码和表格；支持 100 多种语言的多语言覆盖；提高的响应速度和更低的总拥…

txt.cohere.com

红衫发布 2024 前 50 强 AI 企业

4/14/2024

近期的趋势显示，生成式人工智能正在极大地提升企业和行业的生产力。企业通用生产力类别的公司数量有了显著增长，而且随着人工智能在各个行业的深入应用，如图像编辑、视频生成和游戏构建等领域，消费者和专业用户之间的界限变得模糊。此外，新的工业领域也开始涌现，例如机器人、工业维护和自动驾驶等，展示了人工智能与硬件结合的潜力。

展望未来，人工智能的发展预示着一场新的生产力革命，它将重塑商业模式和工业未来，就像个人电脑一样。随着人工智能技术的进步，它们将能够协同工作，甚至可能参与到公司构建和管理中，使得公司运营变得更加高效和灵活。未来的公司可能会拥有新的所有权和管理结构，并且对于企业产品的需求也会发生变化，…

www.sequoiacap.com

Patchscopes: 用于检查语言模型隐藏表征的统一框架

4/13/2024

Patchscopes是一个新兴的框架，旨在通过利用大型语言模型（LLMs）自身的语言能力，来统一和解释其内部工作机制的各种先前方法。该框架通过自然语言解释模型内部隐藏的表示方式，提供了直观的理解。

随着大型语言模型的显著进步，人们对其准确性和透明度的担忧也日益增加，因此理解这些模型的工作机制变得尤为重要，尤其是在模型出现错误的情况下。通过探索机器学习模型如何表示其所学习到的内容（即模型的隐藏表示），我们可以更好地控制模型的行为，并深入科学地了解这些模型的实际工作方式。这一点随着深度神经网络的复杂性和规模的增长而变得越来越重要。最近在可解释性研究方面的进展，展示了使用LLMs来解释另一个模型…

research.google

Meta 发布紫羊驼:在生成人工智能的新世界中走向开放的信任和安全

4/13/2024

生成式人工智能（Generative AI）引发了一系列前所未有的创新浪潮。这项技术使我们能够与对话式人工智能进行交流、生成逼真的图像，并通过简单的提示来准确总结大量文档。截至目前，Llama模型已超过1亿次下载，这些创新很大程度上得益于开放模型的推广。

为了推动这一创新浪潮的安全发展，建立信任至关重要，这需要在负责任的人工智能方面进行更多的研究和贡献。开发者不能孤立地面对人工智能的挑战，因此我们希望营造一个开放、共享的环境，创建一个开放信任和安全的中心。

今天，我们宣布推出Purple Llama项目，这是一个旨在随着时间推移，整合工具和评估，帮助社区以开放的生成式AI模型负责任地构建的…

ai.meta.com

李彦宏内部讲话曝光：闭源模型才能“遥遥领先”！

4/12/2024

百度创始人、董事长兼CEO李彦宏在近期一次内部讲话中就当前AI领域的几个热议话题分享了自己的观点。针对“大模型开源还是闭源”的问题，李彦宏解释了百度选择不开源的原因。他认为，市场上已经存在足够多的开源大模型，如国际上的Llama、Mistral和国内的智源、百川、阿里通义等，因此百度开源与否对市场影响不大。此外，他强调闭源模型能够在能力上持续领先，并且不需要维护额外的开源版本，这对百度而言更加经济高效。

李彦宏还指出，模型开源并不如Linux、安卓等软件开源那样能带来集体进步的效应，因为开源模型往往是在小规模和零散的方式下进行验证应用，而没有经过大规模算力的检验。他进一步阐述，闭源模型具备真…

www.infoq.cn

福布斯2023 年的人工智能指数报告

4/10/2024

斯坦福大学人类与AI合作研究所（HAI）最近发布了2023年的人工智能指数报告，这份长达400页的报告通过详尽的数据分析和精心设计的可视化图表，全面审视了人工智能行业的发展状况。报告指出，自2014年以来，产业界在AI发展上已经超越了学术界，到2022年，产业界推出的机器学习模型数量是学术界的10倍以上。这主要是由于创造先进AI系统越来越依赖于大量数据、强大计算能力和充足的资金，而这些正是产业界相对于学术界和非营利组织的优势所在。报告还提到，AI系统在传统基准测试中的表现虽然仍在刷新纪录，但年度改进的幅度却在缩小，性能提升的极限正在加快到来。为了更全面地评估AI性能，出现了如BIG-bench…

aiindex.stanford.edu

澜舟科技的Mengzi3-13B正式开源，支持免费商用。

4/2/2024

澜舟科技的Mengzi3-13B模型已经正式在始智AI的wisemodel.cn开源社区平台上进行发布，并且对学术研究界完全开放使用，同时也支持免费的商业用途。该模型采用了Llama架构，并且选用了来自网页、百科、社交媒体、媒体和新闻等多种渠道的高质量语料，以及一些精选的开源数据集作为训练材料。Mengzi3-13B模型在进行多语言的语料训练时，特别针对万亿级别的tokens进行了深入学习，从而在中文处理能力方面表现卓越，同时也具备了良好的多语言处理能力。在参数量不超过20B的轻量化大型模型中，Mengzi3-13B因其在中英文语言处理方面的出色表现而独树一帜，它不仅具有很高的实用性，而且性价…

mp.weixin.qq.com

« 上一页 1 2 3 4 5 6 7 89下一页 »