談 GPT 3、ChatGPT、GPT-4、小學生、大學生、專家的能力比較

Mar 17, 2023

∙ Paid

一般來說，語言模型的表現通常用困惑度（perplexity）來衡量。如果一個模型的困惑度越低，則它的表現越好。7B 的語言模型在一些基礎的自然語言處理任務上，例如語言模型、機器翻譯和文本生成，已經能夠達到非常高的表現水平。在某些情況下，它甚至能夠超越人類的表現。因此，我們可以說，7B 的模型已經在某些特定的語言任務上達到了人類智力的水平或者甚至更高。

GPT-3 的困惑度與人類智力水平之間沒有一個直接的對應關係，因為困惑度是用來衡量語言模型預測能力的指標，而人類智力涵蓋了許多其他方面的能力。因此，無法準確地將困惑度轉換為一個特定的年齡或智力水平。

然而，可以通過一些對比來描述 GPT-3 的困惑度。根據 OpenAI 的官方資料，GPT-3 在許多自然語言處理任務上的表現已經超越了以往的語言模型，包括 B…

Keep reading with a 7-day free trial

Subscribe to Virtuoso’s Substack to keep reading this post and get 7 days of free access to the full post archives.