除了,在…之外,在…之外,在…之外,在…之外,在…之外,在

自从俄罗斯生理学家伊万·巴甫洛夫(Ivan Pavlov)让狗在期待食物时流口水以来,研究人员已经能够证明,大脑从经验中学习。然而,在此后的100多年里,研究大脑和新兴人工智能(AI)领域的科学家们一直在关注这是如何发生的。在《自然》杂志上发表的一篇新论文《基于多巴胺的强化学习的价值分配代码》(A distribution tional code for value in dopamine-based reinforcement learning)进一步探讨了经验和选择在决策时是如何排序的。

这篇论文的作者之一、细胞和分子生物学教授内田naoshige Uchida解释说,问题的关键在于“回报预测”,即大脑对任何特定行为的风险和回报的预测能力。内田的实验室研究老鼠神经递质多巴胺的产生,追踪化学决策过程:追逐奶酪会导致陷入陷阱吗?走迷宫值得吗?

近年来,人工智能领域取得了惊人的进步,但仍在努力达到人脑的复杂程度。然而,内田说,人工智能研究最近取得了突破。研究人员不再将人工智能决策建立在对“平均”结果的预期上,而是致力于让他们的机器大脑评估更全面的未来风险和回报情景——一种概率分布,考虑到更多的因素。

“如果你能考虑到结果将会有多大的风险,也就是说,如果你能考虑到结果将会有多大的风险,也就是说,如果你能考虑到结果将会有多大的风险。”内田说:“在美国,知道这种分配方式会对你有帮助。“你的风险偏好可能会根据你的情况而改变。例如,如果你真的非常非常饿,如果你现在得不到一点食物,你就会死去,而不是你只是轻度饥饿。“这一系列的因素,而不仅仅是一个特定行为成功的静态平均值,似乎更好地模拟了大脑如何做出决定。”

内田说,这种理解学习的新方法——包括衡量如何做出这些决定的新方法——“本身就是人工智能令人兴奋的发展”。“后来(谷歌(google)旗下人工智能公司)DeepMind的人提出了一个想法,即这种技术可以真正应用于大脑。”

人的因素——内田的一个研究生——提供了一个关键的联系。“我的导师(内田)鼓励我参加上海纽约大学的夏季计算神经科学课程,”18年的神经学家克拉拉·斯塔克韦瑟博士回忆道,她在那里遇到了马修·波特威尼克。总部位于伦敦的DeepMind的神经科学研究主任博特维尼克(Botvinick)一直在做关于分配强化学习的人工智能研究。

斯塔克韦瑟说:“他的团队找到我,用我在老鼠身上收集的数据来验证他们的一些新理论。哈佛医学院的项目。这导致了各种各样的合作,其中人工智能方法被用来帮助分析内田实验室中现实生活中多巴胺的发现。

相关的

Researchers looking at zebrafish

斑马鱼模型如何掌握生物学的钥匙

研究:人工神经网络可用于提供深入了解生物系统

Harvard Professor Barbara Grosz chairs the AI100 Standing Committee, which has released its first report examining how advances in artificial intelligence might affect urban life in 2030.

2030年的人工智能将会是什么样子

最新报告探讨了人工智能可能如何影响城市生活

“我们实际上有相关的数据,因为他们有这个特殊的算法,我们可以用它来测试我们是否可以解码分布。事实就是这样。”内田说道。“这种分布强化学习的观点与多巴胺数据是一致的。”

这些发现为更多关于小鼠和人类如何学习的研究开辟了新的途径。它们也可能对理解情绪障碍有意义,从本质上解释为什么某些大脑会对风险和回报做出某些评估。

斯塔克韦瑟称自己是“一名有抱负的临床科学家”,“与计算神经科学家合作的机会是无价的。”

她说:“理想情况下,实验的目的是验证一个计算假设。”“这让我们不仅可以报告神经元的活动,还可以报告大脑是如何实现计算目标的。”这样,我们就可以开始解释这些计算出错的疾病状态。”

这篇论文的资深作者波特维尼克指出,双方都从中受益,当然,也都有所收获。他说:“在人工智能领域,围绕深度学习和强化学习出现了突飞猛进的进步。”“在神经科学领域,研究方法发生了一场革命,让我们能够接触到新的数据领域。这项研究利用了双方的优势,使用尖端的神经科学技术来测试来自最新人工智能研究的想法。我们对结果感到无比兴奋。”

新闻旨在传播有益信息,英文原版地址:https://news.harvard.edu/gazette/story/2020/02/ai-researchers-share-data-on-how-we-sort-options-make-decisions/

https://petbyus.com/23581/