这里记录每周值得分享的AI科技内容，周末发布。

本杂志开源（GitHub: aitobox/newsweekly），欢迎提交 issue，投稿或推荐你的项目。

AI资讯

1. Lex Fridman专访Sam Altman

Lex Fridman采访了Sam Altman，这次采访有快两个小时，基本上谈到了所有需要谈的内容。

包括GPT-5、Sora、董事会闹剧、马斯克、Ilya去向以及最重要的AGI。

访谈内容：

计算力将成为未来最宝贵的财富之一,人工智能的发展将是一场巨大的权力斗争。
Sam回顾了在OpenAI董事会经历的困难时刻,称其为职业生涯中最痛苦、混乱和令人沮丧的经历,但这些经历有助于增强韧性。
OpenAI正在寻找新的董事会成员,希望引入具有不同专业背景的人才,包括非营利组织、学习型公司、法律和治理等领域的专家。
董事会需要回应全球的需求,而不仅仅是自身利益。
人们对产品发布策略的反思,认为应该更加迭代地发布,避免突然的更新,以满足用户的需求。
GPT-4是一个重要的里程碑,但并不足以改变世界。真正意义上的AGI应该能够显著提高科学发现的速度。
大部分真正的经济增长来自科学技术的进步。
Sam期望首个AGI系统能够回答关于宇宙统一理论和外星文明存在性等重大科学问题。
没有任何一个个体或机构应该对AGI拥有绝对控制权,需要建立一个强大的治理系统来管理AI的发展。
目前AI安全研究者过于关注某些具体的技术风险,而忽视了其他一些重要的问题。
未来编程可能会以自然语言交互的方式进行,传统的编码方式可能会逐渐减少。
OpenAI在机器人领域有一些进展和规划。
虚拟现实技术以其超逼真和照片般的真实感著称,在虚拟世界中很容易迷失自己。
作者对大自然机械化运作的进化机制赞叹不已,尤其是在亚马逊丛林中的观察。
科技发展非常强大且吓人,但作者对宇宙中存在智慧外星文明非常有信心。
人工智能可能更像是人类之间的支撑和社会联系,而不是单个大脑。
人类共同建立的知识基础赋予了我们无比的能力,这种集体创造让作者对未来抱有希望。
在对人工智能未来的展望中,Sam表达了对人类未来的乐观态度,认为人类社会一直在持续进步。
Sam引用了科幻作家Arthur C. Clark的一句话:”在这个星球上,我们的角色可能不是崇拜上帝,而是创造上帝。
资讯地址:

https://www.youtube.com/watch?v=jvqFAi7vkBc&t=3s

AI服务和工具

1. x.AI宣布开源其大语言模型Grok-1

Grok-1是一个拥有3140亿参数的专家混合模型，由xAI从头开始训练。

模型由8个专家组成，实际激活的参数数量为86B。模型使用了旋转位置嵌入，词汇量达到131,072，与GPT-4相似。

模型详情：

• 参数规模：Grok-1拥有3140亿参数，这是一个指示模型复杂度和处理能力的关键指标。参数越多，模型理解和生成文本的能力通常越强。

• 专家混合模型：这意味着Grok-1利用了一种特定的网络架构，其中25%的权重在处理给定令牌时是激活的。这种设计旨在提高模型的效率和效果，通过专门的“专家”处理特定类型的信息。

• 训练过程：Grok-1由xAI从头开始训练，使用的是在JAX和Rust之上构建的自定义训练堆栈。模型的训练完成于2023年10月，表明它采用了最新的技术和数据。

• MoE层实现：模型中的MoE（Mixture of Experts）层实现并不高效，但这种设计选择是为了避免需要自定义内核以验证模型的正确性。这可能意味着在实际应用中，用户可能需要考虑如何优化或适应其硬件环境。

体验地址

https://github.com/xai-org/grok-1

2. Claude3正式发布：号称性能超 GPT-4

3月4日晚，生成式AI平台Anthropic在官网正式发布了Claude3系列多模态大模型，其中包括Haiku、Sonnet和Opus三个版本，这三个模型目前都支持20万上下文窗口。官方表示，它们也支持100万上下文，只提供给特定用户。

功能特点

据评测报告显示，Opus在研究生水平专家推理、基础数学、本科水平专家知识、代码等10个维度上超过了OpenAI的GPT-4。

除了性能提升，Claude3注重用户体验，Sonnet版本目前可免费使用，Opus版本则需开通会员。同时，Claude API已覆盖159个国家/地区，为用户提供广泛支持。

Claude3不仅在文本和知识检索方面有全面提升，更引入了多模态图像识别提问功能。根据评估报告，Claude3在数学与推理、可视化问答、ANLS等方面超越了GPT-4V。用户可上传图像提问，获得详细解答，展现了强大的多模态处理能力。

不仅如此，Claude3在PDF知识检索方面也表现出色，支持一次性上传多个PDF、txt、Csv格式的文档，并能总结核心内容、解读代码等功能。

Anthropic公司成立于2021年，总部位于美国加利福尼亚州旧金山，由来自OpenAI的ChatGPT开发团队核心成员创立。仅在2023年，Anthropic就获得了近70亿美元融资，其中包括20亿美元来自谷歌、40亿美元来自亚马逊，成为OpenAI最强竞争对手之一。

Anthropic的主打产品是基于Claude系列大模型的AI聊天助手claude.ai，通过文本问答方式可生成各种内容，广泛应用于法律、医疗、营销、人力资源等领域。多家知名企业已基于Anthropic模型开发了产品，包括资产管理公司Bridgewater Associates和旅游出版商Lonely Planet，实现了数据微调并成功打造了各类AI助手。

体验地址

https://claude.ai/chats

3. Suno AI–“音乐界的ChatGPT”

在官网上，Suno AI的应用程序可以免费试用。

只要在框中输入提示，片刻之后，一段完全符合你要求的逼真、高保真的音乐片段就开始自动播放了。

功能特点

更好的音频质量；

更多样化的风格和流派；

更强的提示遵从性，包括更少的幻觉和更优雅的结局。

通过Suno V3，用户现在可以使用免费账户创建两分钟时长的完整歌曲，选择自己喜欢的流派进行音乐创作。

体验地址

https://www.suno.ai/

AI文章

1. 黄仁勋斯坦福大学演讲

2024年3月初，英伟达CEO黄仁勋回到母校美国斯坦福大学，进行了两次演讲，讲述了自己的经历和对 AI 的看法。这是演讲的中文翻译。

详细内容 AI技术缩小了技术差距：黄仁勋提到，目前大约有1000万人因为知道如何编程而有工作，而其他80亿人则相对“落后”。他预测，随着生成式AI逐渐取代编程，编程技术可能变得不那么有价值。

AI算力的增长：黄仁勋强调，在未来10年里，英伟达将把深度学习的计算能力提高100万倍，这将使AI计算机能够不断训练、推理、学习和应用，并持续改进。

液冷技术：他认为液冷技术将成为AI算力的下一个趋势性领域，未来的计算机运算将高度依赖生成而非基于检索。

AGI的测试：黄仁勋表示，如果AGI的定义是通过人类的测试，那么在五年内，我们将会通过所有的测试。

创办英伟达的经历黄仁勋分享了他成为CEO之前的工作经历，包括在LSI Logic做工程师，以及如何说服硅谷投资者投资他的公司。

韧性的重要性：黄仁勋认为，韧性在成功中非常重要，他建议计算机或工程专业的学生应该准备好面对挫折和痛苦。

https://finance.sina.cn/chanjing/gsxw/2024-03-11/detail-inamxtkr1619017.d.html

(完)

AIToBox周刊：第 8 期 – Suno AI–“音乐界的ChatGPT”