人類的七情:喜、怒、憂、懼、愛、憎、欲
在迷宮中,喜、怒、憂、懼、愛、憎、欲可以被看作是不同的 reinforcement signal,用於指導下一步的行動。
當收到喜的信號時,可以前進一步,因為這代表著前進的方向對當前狀態有益;
當收到怒的信號時,可以後退一步,因為這代表著前進的方向對當前狀態不利;
當收到憂的信號時,可以選擇其他路線,因為當前路線可能會讓自己迷路;
當收到懼的信號時,可以停在原地觀察,因為這可以幫助自己更好地了解周圍的環境;
當收到愛的信號時,可以探索新路線,因為這可以增加自己的探索範圍;
當收到憎的信號時,可以避開某些路線,因為這可以避免走入不利的方向;
當收到欲的信號時,可以朝向獎勵的方向前進,因為這可以幫助自己獲得更多的獎勵。
總之,在迷宮中,不同的 reinforcement signal 可以用於指導下一步的行動,有助於尋找…
Keep reading with a 7-day free trial
Subscribe to Virtuoso’s Substack to keep reading this post and get 7 days of free access to the full post archives.