娜塔莎·雅克(Natasha Jaques)是美国华盛顿大学的助理教授。此前在美国麻省理工学院读博期间,她曾开发一种语言模型微调技术,后被用于 OpenAI 使用基于人类反馈强化学习(RLHF,Reinforcement Learning from ...
当地时间12月5日-20日,人工智能巨头OpenAI完成了连续12个工作日的12场直播,从首日的满血版o1模型重磅发布,再到期待许久的Sora Turbo正式发布,最终又以新一代推理模型o3收官,OpenAI CEO山姆·奥特曼(Sam Altman ...
历史上第一次有公司会连续开12天的产品发布会——当OpenAI宣布这个决定之后,全球科技圈的期待值被拉满了。但直到发布会接近尾声,“就这?就这?”一位AI从业者如此表达他的观感。这似乎代表了某种主流看法:此次OpenAI发布会,亮点不大、低于预期。前 ...
近期,人工智能领域发生了一项重大的技术突破:OpenAI宣布其新的强化微调(Reinforcement Fine-Tuning, ...
在2024年的AI领域,OpenAI宣布了一项令人振奋的技术突破——强化微调API(Reinforcement ...
(来源:MIT News)多巴胺是一种在大脑中起着重要作用的信号分子,影响着我们的情绪、动机、运动等多个方面。这种神经递质对基于奖励的学习至关重要,然而这一功能在许多精神疾病中可能会受到干扰,例如情绪障碍和成瘾等。近期,由 MIT 教授 Ann ...
这场发布会是由OpenAI的首席产品官Kevin Weil和他的两个同事Drew Schuster和Thomas Dimson一起主持的。Kevin Weil在直播里说,现在可以把熟悉的ChatGPT功能都整合到项目里,或者,只单独使用项目功能。