site:www.51cto.com - Search News

13h

AI频频刷新基准测试纪录，却算不清「strawberry」里到底有几个字母r，在人类看来很简单的问题却频频出错。这种反差促使创意测评兴起，例如由一名高中生开发的MC-Bench，用Minecraft方块「竞技场」模式评价AI能力。这种新的测评范式，或 ...

13h

就在刚刚，港中文的一位博士生Jie Liu破解了GPT-4o不一般的前端生图秘密：实际上，它很大可能是原生自回归（AR）生成的，甚至我们可以手动改图。无独有偶，CMU博士Sangyun Lee也推测出，GPT-4o的图像生成原理，应该大致如下： ...

13h

AI圈最热的风头莫过于GPT-4o的原生图像，但别急着下定论。Gemini 2.5 Pro正在悄悄反击，在Chatbot竞技场夺冠、IQ测试拿下第一后，它还能解魔方、建模型、创游戏，甚至一键生成3D打印文件！AI的下一个战场，正在从文字转向视觉与空间 ...

14h

最近几天，OpenAI 革新的 GPT-4o 图像功能给大家带来了不少乐趣，各路社交媒体都被「吉卜力」风格的图像、视频刷了屏。机器之心还尝试了制作了《甄嬛传》的名场面（视频如下，制作方法参见《GPT-4o 整活！3 个小时、6 ...

14h

Noland Arbaugh 参与的是 Neuralink 自去年开始的首次人体试验。他在 2016 年的一次潜水事故中脊髓受伤，导致肩部以下瘫痪。2024 年 1 月，他接受了 Neuralink 的脑机芯片植入手术，成为全球首位使用该技术的人。

14h

很多网友猜想 GPT-4o 的图像生成采用了「自回归 + 扩散」的范式。比如 CMU 博士生 Sangyun Lee 在该功能发布后不久就发推猜想 GPT-4o 会先生成视觉 token，再由扩散模型将其解码到像素空间。而且他认为，GPT-4o ...

15h

利用电路追踪方法，团队对Claude 3.5 Haiku在长逻辑推理、多语言、长期规划等任务场景的工作过程进行了观察，发现了其中许多特点：在多语言场景中，作者研究了模型对 “the opposite of ‘small’” ...

15h

科学家正在逃离美国！欧洲、加拿大甚至墨西哥都成了美国科学家的备选地点。美国的人才吸引力断崖式下降。更令人吃惊的是，一位已经在哈佛大学找到工作的科学家，都被中途遣返出境了！特朗普狂砍学术界经费，恶果来了！

14h

传统图像编辑方法一般微调单帧图像扩散模型，这些模型的预训练阶段仅关注单张图像，没有学习到物体动态变化过程中的光影调整。而本文提出的核心创新在于，将物体移动任务视为序列到序列（Sequence-to-Sequence）的预测任务，首次应用了预训练的视频 ...

14h

AI发展越来越快，从最初的简单对话，到后来图片识别、艺术创作，到现在的深度推理，短短两三年，人们对AI的应用愈发全面和得心应手。但，驾驶中的汽车，车速越快，人对方向盘掌控力越弱。

13h

研究发现，6个ECgMLP模块实现了98.61%的最佳准确率，但出于实际原因选择4个模块，此时准确率为98.52%。全局最大池化的准确率达到98.74%，高于全局平均池化的98.52%。

15h

早在2016年，特斯拉以26亿美元收购了家用光伏发电公司SolarCity，这家公司由马斯克的表兄弟Lyndon Rive与Peter Rive创办，马斯克个人出资并担任董事会主席。

Some results have been hidden because they may be inaccessible to you