人工智能的一个重要应用领域体现在大型语言模型(LLM)上。
这些模型运用无监督机器学习技术,通过海量文本数据训练,来深入理解人类语言的运作机制。为了降低成本,科技公司通常会从互联网上免费抓取这些文本数据,其中包括文章、书籍、网站和论坛内容等。
在训练过程中,LLM 会处理数十亿个单词和短语,以学习它们之间的模式和关系,从而使模型能够基于用户提示生成类似人类的回答。
然而,需要明确的是,这些模型主要是在复制常见的语法模式和词汇配对,尽管这一过程在复杂的层面上进行——但它们的思维方式与人类截然不同,因为它们并不具备理解事实、逻辑或常识的能力。
OpenAI 近期发布的GPT-4在Chatbot Arena排行榜上表现出色。该公司的GPT-4Turbo被认为是目前最先进的LLM之一,而GPT-4作为最大的LLM,据称拥有1.78万亿个参数。ChatGPT可以基于GPT-3.5和GPT-4运行。此外,谷歌开发的同名LLM——Gemini,尽管其参数数量尚未公开,但据估计可能高达175万亿个。
|