ChatGPT 首次通过神经学考试
ChatGPT 首次通过神经学考试
OpenAI 的 LLM 40 正确回答了美国精神病学和神经病学委员会 85 的问题,这意味着该技术未来可能会有 重大 用途。
OpenAI 最新升级的大型语言模型LLMChatGPT40 在一项概念验证研究中以 85 的正确率通过了临床神经学考试。研究报告的作者认为,经过一些微调后,LLM 在临床神经学中会有 重大应用。
海德堡大学医院和海德堡德国癌症研究中心的一组研究人员于 12 月 7 日公布了实验结果。该测试于 5 月 31 日进行,使用了两个 LLM,即 ChatGPT35 及其后期版本 ChatGPT40。
研究人员使用了美国精神病学和神经病学委员会的神经病学考试题库以及欧洲神经病学委员会的一小部分问题。
旧版本的ChatGPT得分率为668,在1956个问题中答对了1306个,而最新版本的ChatGPT40得分率为85,答对了1662个问题。人类的平均得分是 738。ChatGPT40 在行为、认知和心理相关问题上的表现优于人类用户,并有效地 通过 了神经学考试,因为在教育机构中,70 的正确答案通常被视为及格分数。
币安比特币交易不过,在需要 高阶思维 的任务中,两种模型的表现都比只需要 低阶思维 的问题相对弱一些。
据进行实验的研究小组称,这些结果建议在进行一些修改后将 LLMs 用于临床神经学:
这些研究结果表明,经过进一步完善,大型语言模型可以在临床神经学中得到重要应用。研究人员指出,目前仍有一些保留意见。虽然将 LLMs 应用于文档和决策支持系统的前景明确,但神经学家在实际使用时应谨慎,因为它们在高阶认知任务方面仍不完善。该研究的作者之一 Varun Venkataramani 博士在接受 Cointelegraph 采访时说:
我们认为我们的研究更像是对 LLM 功能的概念验证。LLMs还需要发展,甚至可能需要具体的微调,才能使其正确适用于临床神经学。
人工智能已经在医疗保健领域的一些重大任务中发挥作用,例如为阿斯利康AstraZeneca寻找癌症的治疗方法,或在香港对抗抗生素的过量处方的现象。
BSC发力DEX交易量超过Solana,MEME赛道王者易主?
作者:Frank,PANews近期,BSC链的表现再次引发了市场的关注,8月21至23 日BSC DEX 交易量已连续三天超越Solana ,仅次于Ethereum排名第二,社交媒体上关于BSC链上MEME币的讨论也有增多迹象。此外,币安创始人赵长鹏据称将于9月29日出狱,也将为BSC链生态发展带来利好加成。种种迹象来看,BSC链似乎正暗自发力,将有可能成为新的MEME热土?此消彼长反超Solan...
GameStop 将停虚拟货币钱包功能
Turner Wright 2023年08月02日 GameStop 将停虚拟货币钱包功能 这家零售公司过去主要以实体零售店而闻名,但现在也推出了一个 NFT 市场和即将取消的加密货币钱包系列。 新闻 游戏零售公司 GameStop 以 加密货币领域监管的不确定性 为由,宣布将从 11 月起从市场上撤下其数字钱包。币安交易所&...