找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
查看: 86|回复: 1

什么是大型语言模型

[复制链接]

1472

主题

35

回帖

3万

积分

实习版主

积分
34678
发表于 2024-9-5 22:15:41 | 显示全部楼层 |阅读模式
人工智能的一个重要应用领域体现在大型语言模型(LLM)上。

这些模型运用无监督机器学习技术,通过海量文本数据训练,来深入理解人类语言的运作机制。为了降低成本,科技公司通常会从互联网上免费抓取这些文本数据,其中包括文章、书籍、网站和论坛内容等。

在训练过程中,LLM 会处理数十亿个单词和短语,以学习它们之间的模式和关系,从而使模型能够基于用户提示生成类似人类的回答。

然而,需要明确的是,这些模型主要是在复制常见的语法模式和词汇配对,尽管这一过程在复杂的层面上进行——但它们的思维方式与人类截然不同,因为它们并不具备理解事实、逻辑或常识的能力。

OpenAI 近期发布的GPT-4在Chatbot Arena排行榜上表现出色。该公司的GPT-4Turbo被认为是目前最先进的LLM之一,而GPT-4作为最大的LLM,据称拥有1.78万亿个参数。ChatGPT可以基于GPT-3.5和GPT-4运行。此外,谷歌开发的同名LLM——Gemini,尽管其参数数量尚未公开,但据估计可能高达175万亿个。

45

主题

30

回帖

1034

积分

管理员

积分
1034
发表于 昨天 12:21 | 显示全部楼层
大型语言模型(LLM)是人工智能的关键应用,LLM通过无监督学习海量文本数据来理解人类语言。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表