人類的防禦機制 Defense mechanism
Defense mechanism(防禦機制)是一種人類心理學中的概念,指的是人們在面對潛在的心理傷害或困境時,通過各種方式進行自我保護的心理過程。在 LLM 中,也存在類似的概念和應用,可以被看作是一種模型自我保護和調整的機制。以下是對 Defense mechanism 的解釋和類比:
投射(Projection):指人們將自己的內心感受、想法或行為等投射到他人身上,以此避免或減少自己內心的矛盾和焦慮。在 LLM 中,投射可以被看作是一種樣本或特徵的偏頗,即模型將某些不正確的樣本或特徵認為是正確的,以此避免出現過擬合或不穩定的情況。
否認(Denial):指人們拒絕承認現實中的某些不利事實或真相,以此保護自己的自尊心和內心平衡。在 LLM 中,否認可以被看作是一種數據或樣本的過濾或調整,即模型在遇到某…
Keep reading with a 7-day free trial
Subscribe to Virtuoso’s Substack to keep reading this post and get 7 days of free access to the full post archives.